Solr

Solr expose les capacités de Lucene sur le web et lui apporte une scalabilité big data, en open source. Solr est une couche web basée sur Lucene. Elle ajoute des fonctionnalités de serveur web, du faceting, ainsi que des pages pour l’administration. Datafari utilise Solr pour son moteur d'indexation et de recherche.


Il ne s’agit pas d’un système de recherche complet capable de se connecter aux données et d’afficher les résultats. Il s’agit d’un backbone stable, capable de gérer les montées en charge par répartition sur plusieurs machines, facilement administrable, et supportant les appels en REST.

Device

Vous pouvez obtenir plus d'informations sur le site technique de Solr. Tout comme Lucene, Solr fait également partie du projet Apache Lucene.
En tant que tel, il est sous licence logiciel libre Apache. France Labs vous propose son expertise pour installer, configurer, étendre et maintenir Solr sur vos systèmes.

Apache Solr est le moteur de recherche open source de référence. Il propose des fonctionnalités avancées, facilement configurable, rivalisant avec les meilleurs logiciels propriétaires. Un moteur de recherche, c’est une brique technologique capable d’ingérer un nombre massif de données, et de les mettre à disposition d’un utilisateur de façon intelligente, en quelques millisecondes.

Historiquement, Apache Solr est une évolution du projet Apache Lucene. Ce dernier est le cœur du moteur de recherche, mais il ne représente aujourd’hui qu’un sous-ensemble des fonctionnalités du projet Apache Lucene/Solr. De plus, Lucene est une API Java, il faut donc l’intégrer dans du code source, tandis que Solr est embarqué dans une servlet, rendant son usage plus simple.

Apache Lucene/Solr est le produit bénéficiant de la plus large communauté de contributeurs, venant de groupes tels que LucidWorks, Shopzilla, Cloudera, Adobe. Solr bénéficie de deux garanties pour sa pérennité. D’une part, la diversité d’origine de ses contributeurs, qui le rend résilient à des changements de stratégies ou de personnes. D’autre part, sa gestion par la fondation Apache, qui lui évite le risque potentiel d’un rachat par un concurrent.

Cas d'usages de Solr

On n’imagine pas forcément les usages d’un Apache Lucene/Solr, c’est pourquoi nous vous exposons quelques cas d’usages.

  • Big Data : Apache Lucene / Solr est le complément idéal d’outils comme Hadoop. Ce n’est pas pour rien que c’est la solution utilisée par MapR et Cloudera. Hadoop fournit les briques de base du big data : le stockage et l’analyse. Mais le « front end », celui qui permet à un utilisateur d’exploiter Hadoop, ne fait pas partie de ses attributions.
    Solr intervient alors pour permettre à l’utilisateur de fouiller dans les données stockées dans Hadoop. C’est une chose de stocker des péta-octets de données, c’en est une autre d’y retrouver les informations pertinentes.
    Lucene/Solr intervient également en front-end pour l’exploitation des résultats des traitements effectués par Hadoop.
    Cas d’usage : Linkedin analyse les relations entre personnes à l’aide d’Hadoop, puis réinjecte les résultats comme données supplémentaires dans le Solr, afin d’afficher instantanément les relations entre personnes, lorsqu’un utilisateur se connecte.
  • eCommerce: Apache Lucene/Solr permet aux sociétés de eCommerce d’améliorer la conversion des clients, grâce à ces fonctions de recherche et de suggestions.
    Elles permettent aux clients de retrouver rapidement les produits qu’ils désirent, et de se voir suggérer des produits annexes. Lucene/Solr est par exemple le moteur utilisé par Disney et la NASA.