Abstract:
Dans l’intérêt d'aider les administrateurs des systèmes a détecter et prévenir toute violation de
la sécurité d'information dans les organisations, Beaucoup de recherches ont fait des systèmes de
détection d'intrusions (IDS) comme objet. Cette étude est menée dans le but de modéliser un tel
système qui joue un rôle primordial dans ce domaine. Pour cela, nous avons étudie les performances
des méthodes d'apprentissage profond (DL) pour la détection d'intrusions dans les réseaux. Nous
avons implémente 8 modelés pour la multi-classification supervisée, qui se basent sur 8 differentes
techniques de DL, un réseau neuronal profond (DNN), un réseau neuronal convolutif (CNN), deux
variantes de réseau neuronal récurrent RNN : un réseau de longue mémoire a court terme (LSTM)
et un réseau récurrent a portes (GRU). Et des modelés hybrides : (CNN-LSTM), (CNN-GRU),
CNN et bidirectionnel LSTM (CNN-BiLSTM), CNN en combinaison avec bidirectionnel GRU
(CNN-BiGRU). Nous avons evalue ces modeles avec le jeu de donnee NSK-KDD, plus particulierement
KDDTrain+ pour la phase de formation et KDDTest20+ pour le test et validation, deux
sous-ensembles de donnees avec d'echantillons les plus difficiles a detectes. Afin de presente une
etude comparative de performance entre ces differents modeles, des differentes mesures ont ete
appliquee : taux de reussite (Accuracy), Precision, rappel (Recall), moyenne harmonique (F1-Score).
Et deux autres indicateurs importants : taux de vraie detection d'intrusions (TPR) et taux de
fausse detection de non-intrusion (FPR). Les exprimentations ont donne de tres bons resultats, vu
la complexite de dataset. DNN marque le meilleur score en taux de reussite totale de 80.72%,
surpassant CNN-BiLSTM et CNN-BiGRU qui ont montre une amelioration par rapport aux travaux
anterieurs, avec l'avantage d'une excellente precision de 96.36% et FPR=1.51% pour ce dernier ce
qui montrent la bonne efficacité des modelés proposes. Notons que nous avons également entraine et
teste les modelés proposes avec un KDDTest moins complexe et les résultats étaient excellents, ce
que confirme d’efficacité de nos modelés.