Une plateforme d’analyse de données est un écosystème de services et de technologies permettant d’effectuer des analyses sur des données volumineuses, complexes et dynamiques. Elle permet de récupérer, combiner, explorer et visualiser des données provenant des différentes sources dont dispose une entreprise, et d’interagir avec elles. Une plateforme d’analyse de données complète est dotée de plusieurs outils aux capacités variées : analyse prédictive, visualisation de données, géolocalisation, langage naturel et analyse de contenu. Son objectif principal est de transformer tous les types de données en insights pour obtenir des résultats commerciaux concrets.
Ces plateformes répondent aux demandes des utilisateurs, en particulier ceux qui travaillent avec le Big Data, sur l’inadéquation des systèmes de gestion de bases de données relationnelles (RDBMS) et permettent aux organisations de prendre des décisions commerciales plus éclairées.Concernant le Big Data, Hadoop est le choix préféré pour ce type d’exigence, principalement parce qu’il s’est avéré être une solution fiable, flexible, économique et évolutive. Même si Hadoop est capable de stocker ces grands volumes de données sur HDFS (Hadoop Distributed File System), cela ne signifie pas que c’est la seule solution disponible. Il existe de nombreux autres outils disponibles sur le marché pour analyser ces énormes données, tels que MapReduce, Pig et Hive.
