Abstract:
Ce mémoire se concentre sur le clustering des séries chronologiques, une technique cruciale pour analyser des données temporelles dans divers domaines. Après une introduction aux séries chronologiques et aux modèles de processus comme les AR, MA, ARMA, ARIMA et SARIMA, le mémoire explore différentes méthodes de clustering, y compris l'algorithme K-means et le clustering hiérarchiqueet le DBSCAN.
Les mesures de similarité pour les séries chronologiques, telles que la distance euclidienne et la distance DTW, ainsi que les outils d'évaluation de la qualité du clustering, comme le coefficient silhouette et l'ARS, sont explorés. Des applications pratiques sont présentées à travers la simulation de séries temporelles, avec une analyse comparative des résultats utilisant diverses distances, notamment celles basées sur les fonctions d'autocorrélation (ACF) et d'autocorrélation partielle (PACF).
Le mémoire se termine en mettant en évidence l'importance du clustering des séries chronologiques pour identifier des structures sous-jacentes et détecter des anomalies, fournissant ainsi des outils puissants pour l'analyse et l'interprétation des données temporelles.