Abstract:
Dans le cadre de ce travail, notre objectif etait de développer un systéme de reconnaisssance de la parole pour la langue kabyle, en utilisant la platforme kaldi et en se basant sur une etape cruciale qui est la création d'une base des données. Cette approche methodologique est l'étape la plus difficile et importante pour assurer la validite des resultats et ouvre la voie a des analyses approfondies de la richesse linguistique. ` L'installation et la configuration initiales de kaldi ont et particuli érement exigantes, im- ` pliquant l'integration de librairies spécifiques et des mises a jour continue pour assurer la fonctionnalite du systéme. `
Malgre les progrés significatifs et les techniques utilis ` ees pour assurer une represents tivite de tout le systéme phon ` etique berbére (kabyle), on a rencontr ` e un obstacle majeur lors de l'entrainement monophone. Les donnees MFCC, bien que correctementgen erées.
Les defis rencontrés et les solutions apportées ont mis en lumiéres la complexit ` e de la reconnaissance de la parole pour une langue moins representée ainsi que le manque flagrand de data-set, nous soulignons l'importance de creation de data-set et de corpus specialisés pour la langue Amazighe. Les fondations établies et les connaissances acquises constituent une base solide pour les recherches futures et l'amelioration de la reconnaissance de la parole.