# Donner du sens aux données massives


De quoi parle-t-on ?

Le big data est protéiforme, aussi doit-on le définir. Dans notre axe d'innovation, le big data touche aux données textuelles complexes à indexer (par exemple extraction d'entités dans du texte), ainsi qu'aux tailles d'index pour un très grand nombre de documents (plusieurs centaines de millions au minimum).

Nous cherchons à proposer en open source une plateforme aussi accessible que possible, couvrant toute la chaîne de valeur, de la récupération des donnéees massives à leur exploitation par une interface de fouille ergonomique. Cette innovation a un nom: il s'agit de Datafari.

Technologies

Hadoop, ManifoldCF, Datafari, Solr