DSpace Repository

Repérage de mots dans les anciens documents Arabes

Show simple item record

dc.contributor.author Ghilas, Hamza
dc.contributor.author Tari, Abdelkamel;promoteur
dc.date.accessioned 2022-01-04T13:21:44Z
dc.date.available 2022-01-04T13:21:44Z
dc.date.issued 2021-11-23
dc.identifier.uri http://hdl.handle.net/123456789/17690
dc.description Option : Cloud Computing en_US
dc.description.abstract Le travail réalisé dans le cadre de cette thèse s’inscrit dans la restauration des anciens manuscrits arabes. La numérisation est la meilleur solution pour protégé ce type de documents des dégradations physique et celles liées à la manipulation manuelle. L’indexation et la recherche d’informations dans les images de document devient une nécessité. Le repérage de mots (word spotting) consiste à repérer dans une collection d’images de document toutes les occurrences d’un mot de requête donné. La recherche de mots dans les images de document est très avancée pour les langages Latins mais il y a très peu de travaux pour la recherche de mots dans les documents arabes. Dans cette thèse nous avant proposé une nouvelle méthode pour la recherche de mots dans les images de manuscrits arabes. Nous avons contribué dans la phase extraction des caractéristiques par la proposition d’un nouveau descripteur appelé SDIK (Spatial Distribution of ink at Keypoints). Nous avons d’abord effectué une étude préliminaire qui a démontré l’efficacité de l’extraction des caractéristiques dans le voisinage des pointsclés. Dans une deuxième étude nous avons élaboré notre méthode d’extraction des caractéristiques (SDIK). Le descripteur SDIK permet de capturer la répartition spatiale des pixels d’ancre dans le voisinage d’un point-clé. Nous avons utilisé les voisinages des points terminaux (endpoints) et des points de branchement (branch points) pour extraire les descripteurs SDIK et nous avons proposé un algorithme pour l’extraction de ces points-clés. Nos descripteurs SDIK sont des histogrammes de tailles fixes et sont très rapides à comparer. Ainsi notre méthode compare un mot requête avec des lignes entières du document cible par un algorithme que nous avons proposé. Par cet algorithme de recherche, nous avons évité la segmentation d’un document arabe en mots qui est une tâche très difficile. Les évaluations de notre méthode effectuées sur des images de document anciens (IBN SINA) et des images de l’écriture moderne (IFN/ENIT) ont démontré l’efficacité de notre descripteur par rapport à la littérature. en_US
dc.language.iso fr en_US
dc.publisher Université A.mira-Béjaia en_US
dc.subject Repérage de mot : Extraction des caractéristiques : Anciens document arabes en_US
dc.title Repérage de mots dans les anciens documents Arabes en_US
dc.type Thesis en_US


Files in this item

This item appears in the following Collection(s)

Show simple item record

Search DSpace


Advanced Search

Browse

My Account