Abstract:
Nous avons traité dans cette thèse la problématique des menaces terroristes sur les réseaux sociaux. Nous nous sommes intéressés aux menaces écrites (publications textuelles) afin de les détecter automatiquement. Pour cela, nous avons proposé 3 contributions, la première est une approche lexicale basé sur la recherche des publications contenant des mots en relation avec le terrorisme même s'ils sont mal orthographiés ; la seconde est basée sur une classification binaire (menaçant ou non menaçant) en utilisant un apprentissage automatique avec SVM, et la troisième est une approche de classification ternaire (positif, négatif ou neutre) en utilisant l'apprentissage par transfert avec un modèles déjà entrainés sur des millions de données auquel nous rajoutons une couche avec nos propres données. Nous avons évalué notre proposition avec un dataset de plus de 12000 tweets manuellement annotés, dans les deux langues Arabe et Anglais. Les résultats obtenus sont très significatifs avec des précisions proches de 90%.