Abstract:
Cette etude se concentre sur la reconnaissance automatique hors ligne des caractères latins en langue amazighe. Un système OCR a été développé en utilisant l'apprentissage profond pour identifier les caractères. Un corpus de données a été construit, structuré en trois niveaux : caractères, mots et phrases. La méthodologie adoptée comprend la préparation et le prétraitement des images à l'aide de techniques de binarisation, de reduction du bruit et de squelettisation. Pour l'extraction des caract éristiques et la classification, deux modeles d'apprentissage profond ont été élaborés : un modèle hybride combinant des couches CNN et BiLSTM qui a atteint un taux de reconnaissance de 94%, et un modele basé sur l'architecture DenseNet qui a obtenu un taux de reconnaissance de 97%.
Le resultat final montre une performance avec un taux de reconnaissance de 97% et une bonne précision pour la plupart des caractères étudiés dans ce travail.