Abstract:
Ce travail vise a développer un systéme de reconnaissance vocale des lettres en langue kabyle, en suivant plusieurs etapes essentielles. Tout d'abord, des données ont été collectés sur le terrain, puis pretraitées en deux phases : avec Audacity pour réduire le bruit et segmenter les signaux audio, et avec Python pour réchantillonner les signaux, les normaliser et réduire davan- étage le bruit. Les caracteristiques essentielles, telles que les coéfficients cepstraux en frequences mel (MFCC), ont été extraites pour capturer les aspects distinctifs des signaux vocaux. Ces caracteristiques ont été utilisées comme entrées pour entraner des modeles de r ` eseaux neu- ronaux recurrents (RNN), en particulier le modéle BLSTM (Bidirectional Long Short-Term ` Memory), qui a été choisi pour sa capacité a capturer les d ` ependances temporelles dans les donnees séquentielles. Le modéle BLSTM a atteint une pr ` ecision de 98,31% pour la transcription des enregistrements vocaux, demontrant une adaptabilité éfficace a differents locuteurs et conditions d'enregistrement.