Repérage de mots dans les anciens documents Arabes

Tari, Abdelkamel;promoteur; Ghilas, Hamza

dc.contributor.author	Ghilas, Hamza
dc.contributor.author	Tari, Abdelkamel;promoteur
dc.date.accessioned	2022-01-04T13:21:44Z
dc.date.available	2022-01-04T13:21:44Z
dc.date.issued	2021-11-23
dc.identifier.uri	http://hdl.handle.net/123456789/17690
dc.description	Option : Cloud Computing	en_US
dc.description.abstract	Le travail réalisé dans le cadre de cette thèse s’inscrit dans la restauration des anciens manuscrits arabes. La numérisation est la meilleur solution pour protégé ce type de documents des dégradations physique et celles liées à la manipulation manuelle. L’indexation et la recherche d’informations dans les images de document devient une nécessité. Le repérage de mots (word spotting) consiste à repérer dans une collection d’images de document toutes les occurrences d’un mot de requête donné. La recherche de mots dans les images de document est très avancée pour les langages Latins mais il y a très peu de travaux pour la recherche de mots dans les documents arabes. Dans cette thèse nous avant proposé une nouvelle méthode pour la recherche de mots dans les images de manuscrits arabes. Nous avons contribué dans la phase extraction des caractéristiques par la proposition d’un nouveau descripteur appelé SDIK (Spatial Distribution of ink at Keypoints). Nous avons d’abord effectué une étude préliminaire qui a démontré l’efficacité de l’extraction des caractéristiques dans le voisinage des pointsclés. Dans une deuxième étude nous avons élaboré notre méthode d’extraction des caractéristiques (SDIK). Le descripteur SDIK permet de capturer la répartition spatiale des pixels d’ancre dans le voisinage d’un point-clé. Nous avons utilisé les voisinages des points terminaux (endpoints) et des points de branchement (branch points) pour extraire les descripteurs SDIK et nous avons proposé un algorithme pour l’extraction de ces points-clés. Nos descripteurs SDIK sont des histogrammes de tailles fixes et sont très rapides à comparer. Ainsi notre méthode compare un mot requête avec des lignes entières du document cible par un algorithme que nous avons proposé. Par cet algorithme de recherche, nous avons évité la segmentation d’un document arabe en mots qui est une tâche très difficile. Les évaluations de notre méthode effectuées sur des images de document anciens (IBN SINA) et des images de l’écriture moderne (IFN/ENIT) ont démontré l’efficacité de notre descripteur par rapport à la littérature.	en_US
dc.language.iso	fr	en_US
dc.publisher	Université A.mira-Béjaia	en_US
dc.subject	Repérage de mot : Extraction des caractéristiques : Anciens document arabes	en_US
dc.title	Repérage de mots dans les anciens documents Arabes	en_US
dc.type	Thesis	en_US