Elasticsearch (et ELK)

Elasticsearch est similaire à Solr, en ce sens qu'il expose les capacités de Lucene sur le web, en open source.
Elasticsearch est pensé pour le Big Data. Créé par Shay Bannon, Elasticsearch est géré par la société Elastic. Datafari l'intègre pour sa partie analytics, notamment avec ELK.


Dès sa conception, Elasticsearch vise la simplicité d'ajouts de noeuds pour la scalabilité, par une approche REST. Avec sa stack ELK (Elasticsearch + Logstash + Kibana), Elastic se spécialise également dans les outils d'analyse de logs.

Il ne s’agit pas d’un système de recherche complet capable de se connecter aux données et d’afficher les résultats. Il s’agit d’un backbone stable, capable de gérer les montées en charge par répartition sur plusieurs machines, facilement administrable, et supportant les appels en REST.

Device

Vous pouvez obtenir plus d'informations sur le site d'Elasticsearch. Contrairement à Solr, Elasticsearch ne fait pas partie des projets de la fondation Apache, mais utilise la même licence.
En effet, il est sous licence logiciel libre Apache. France Labs vous propose son expertise pour installer, configurer, étendre et maintenir Elasticsearch sur vos systèmes.

Elasticsearch est le moteur de recherche open source rendu populaire avec l'arrivée du big data. Il propose des fonctionnalités avancées, facilement configurable, rivalisant avec les meilleurs logiciels propriétaires. Un moteur de recherche, c’est une brique technologique capable d’ingérer un nombre massif de données, et de les mettre à disposition d’un utilisateur de façon intelligente, en quelques millisecondes.

Historiquement, Elasticsearch est une évolution du projet Apache Lucene. Ce dernier est le cœur du moteur de recherche, mais il ne représente aujourd’hui qu’un sous-ensemble des fonctionnalités d'Elasticsearch. De plus, Lucene est une API Java, il faut donc l’intégrer dans du code source.

ElasticSearch devient l'outil open source de référence pour les startups du web, et possède une large communauté d'utilisateurs.

Cas d'usages d'ElasticSearch

On n’imagine pas forcément les usages d’un moteur comme Elasticsearch, c’est pourquoi nous vous exposons quelques cas d’usages.

  • Big Data : Elasticsearch peut se positionner en complément d'un Hadoop, pour s'y synchroniser et permettre d'y fouiller des données. Son intégration avec Hadoop n'est pas aussi fine qu'un Solr, mais ses capacités et sa simplicité d'usage font qu'il est souvent utilisé. Hadoop fournit les briques de base du big data : le stockage et l’analyse. Mais le « front end », celui qui permet à un utilisateur d’exploiter Hadoop, ne fait pas partie de ses attributions.
    Elasticsearch intervient alors pour permettre à l’utilisateur de fouiller dans les données stockées dans Hadoop. C’est une chose de stocker des péta-octets de données, c’en est une autre d’y retrouver les informations pertinentes.
    Elasticsearch intervient également en front-end pour l’exploitation des résultats des traitements effectués par Hadoop.
    Cas d’usage : Netflix utilise Elasticsearch pour analyser les données stockées dans son Hadoop, pour l'étude des logs et des erreurs.
  • Réseaux sociaux: Elasticsearch est apprécié par les startups webs, grâce à sa capacité de passage à l'échelle de façon simple et stable. Par exemple, Xing l'utilise pour une recherche en quasi temps-réel avec ses 14 millions de membres. ElasticSearch accompagne les startups webs dans leur croissances, pour gérer jusqu'à des milliards d'informations en moins d'une seconde.