Big Data
# Donner du sens aux données massives
De quoi parle-t-on ?
Le big data est protéiforme, aussi doit-on le définir. Dans notre axe d'innovation, le big data touche
aux données textuelles complexes à indexer (par exemple extraction d'entités dans du texte), ainsi qu'aux tailles
d'index pour un très grand nombre de documents (plusieurs centaines de millions au minimum).
Nous cherchons à proposer en open source une plateforme aussi accessible que possible, couvrant toute la chaîne de
valeur, de la récupération des donnéees massives à leur exploitation par une interface de fouille ergonomique. Cette
innovation a un nom: il s'agit de Datafari.
Technologies
Hadoop, ManifoldCF, Datafari, Solr