Apprentissage profond et automatisation de l'extraction d'information des Cvs ( Cas Tech'Instinct ).

Hamami, Athmane Ryane; Aoudia, F. ; promotrice; Aoudia, Z. ;promotrice

Please use this identifier to cite or link to this item: http://univ-bejaia.dz/dspace/123456789/25282

Full metadata record

DC Field	Value	Language
dc.contributor.author	Hamami, Athmane Ryane	-
dc.contributor.author	Aoudia, F. ; promotrice	-
dc.contributor.author	Aoudia, Z. ;promotrice	-
dc.date.accessioned	2024-12-24T08:52:37Z	-
dc.date.available	2024-12-24T08:52:37Z	-
dc.date.issued	2024	-
dc.identifier.other	003MAS/394	-
dc.identifier.uri	http://univ-bejaia.dz/dspace/123456789/25282	-
dc.description	Option : Sciences des données et Aide a la decision	en_US
dc.description.abstract	Dans notre projet d'automatisation de l'extraction d'informations à partir de curriculum vitae (CV), nous avons utilisé une gamme de techniques d'analyse et de traitement des données. Cette dissertation décrit comment nous avons appliqué ces méthodes et technologies pour atteindre nos objectifs. Tout d'abord, nous avons mis l'accent sur l'analyse de la structure des CV afin de mieux comprendre leur organisation et de faciliter l'extraction ciblée des données. Nous avons employé des techniques de détection d'objets, y compris Faster R-CNN et Mask R-CNN, pour identifier visuellement divers éléments structurels des CV. Des algorithmes d'analyse sémantique nous ont aidés à comprendre la hiérarchie et l'organisation des informations dans les CV, permettant une meilleure contextualisation des données extraites. Compte tenu des formats divers des CV (image, PDF, etc.), la reconnaissance optique de caractères (OCR) était cruciale pour extraire le texte brut de ces documents. Nous avons principalement utilisé Tesseract, une bibliothèque OCR open-source, et également évalué EasyOCR et PaddleOCR pour comparer leurs performances et choisir la plus adaptée à notre projet. Le traitement du langage naturel (NLP) a joué un rôle central, nous permettant de saisir le sens et le contexte des informations contenues dans les CV. Les techniques d'analyse sémantique nous ont aidés à comprendre la pertinence des informations, tandis que la reconnaissance d'entités nommées (NER) a permis d'identifier avec précision des éléments clés tels que les noms, les entreprises et les diplômes. Nous avons intégré ces analyses et technologies dans un flux de travail global combinant l'analyse de la structure, l'OCR, le NLP et l'apprentissage profond pour traiter efficacement les CV. Cette dissertation met également en évidence les domaines d'amé- lioration pour les travaux futurs.	en_US
dc.language.iso	fr	en_US
dc.publisher	Université Abderramane Mira-Bejaia	en_US
dc.subject	Analyse Document : OCR : NLP : Faster RCNN : Transformers : Extraction d'informations : NER : Fine Tuning : Apprentissage profond : Reconnaissance de structures	en_US
dc.title	Apprentissage profond et automatisation de l'extraction d'information des Cvs ( Cas Tech'Instinct ).	en_US
dc.type	Thesis	en_US
Appears in Collections:	Mémoires de Master

Files in This Item:

File	Description	Size	Format
Memoire final.pdf		3.5 MB	Adobe PDF	View/Open

Show simple item record

DSpace JSPUI

DSpace preserves and enables easy and open access to all types of digital content including text, images, moving images, mpegs and data sets