Abstract:
Les données générer par des millions d'utilisateur du réseau social Facebook ont suscite
l'intérêt de plusieurs entreprise, mais pour exploiter ces gros volume de données il a fallu
trouver une solution pour gérer tous les données.
Hadoop est basé sur une architecture de développement dédiée au stockage distribué et
calculs parallèles, il permet la manipulation des données en tr`es grande quantité, d'o`u
Hadoop est une solution idéale pour les données généré sur Facebook.
Dans cette perspective, L'objectif de notre travail est de développer un Framework qui
sera capable d'extraire les données des pages ou groupes spécialiser dans la maladie
Bipolaire, ensuite nous avons exploité le Framework Hadoop et son écosystème plus
précisément Hive pour effectue nos analyse pour donner un premier diagnostic sur la
maladie bipolaire.