Abstract:
Le travail réalisé dans le cadre de cette thèse s’inscrit dans la restauration des anciens manuscrits
arabes. La numérisation est la meilleur solution pour protégé ce type de documents des dégradations physique et
celles liées à la manipulation manuelle. L’indexation et la recherche d’informations dans les images de document
devient une nécessité. Le repérage de mots (word spotting) consiste à repérer dans une collection d’images de
document toutes les occurrences d’un mot de requête donné. La recherche de mots dans les images de document
est très avancée pour les langages Latins mais il y a très peu de travaux pour la recherche de mots dans les
documents arabes. Dans cette thèse nous avant proposé une nouvelle méthode pour la recherche de mots dans les
images de manuscrits arabes. Nous avons contribué dans la phase extraction des caractéristiques par la proposition
d’un nouveau descripteur appelé SDIK (Spatial Distribution of ink at Keypoints). Nous avons d’abord effectué
une étude préliminaire qui a démontré l’efficacité de l’extraction des caractéristiques dans le voisinage des pointsclés. Dans une deuxième étude nous avons élaboré notre méthode d’extraction des caractéristiques (SDIK). Le
descripteur SDIK permet de capturer la répartition spatiale des pixels d’ancre dans le voisinage d’un point-clé.
Nous avons utilisé les voisinages des points terminaux (endpoints) et des points de branchement (branch points)
pour extraire les descripteurs SDIK et nous avons proposé un algorithme pour l’extraction de ces points-clés. Nos
descripteurs SDIK sont des histogrammes de tailles fixes et sont très rapides à comparer. Ainsi notre méthode
compare un mot requête avec des lignes entières du document cible par un algorithme que nous avons proposé.
Par cet algorithme de recherche, nous avons évité la segmentation d’un document arabe en mots qui est une tâche très difficile. Les évaluations de notre méthode effectuées sur des images de document anciens (IBN SINA) et des images de l’écriture moderne (IFN/ENIT) ont démontré l’efficacité de notre descripteur par rapport à la littérature.