Identification de la sémantique dans des documents répartis.

Hamouche, Lamia; Gelgon, Marc;promoteur

Please use this identifier to cite or link to this item: http://univ-bejaia.dz/dspace/123456789/9548

Full metadata record

DC Field	Value	Language
dc.contributor.author	Hamouche, Lamia	-
dc.contributor.author	Gelgon, Marc;promoteur	-
dc.date.accessioned	2018-04-04T14:28:33Z	-
dc.date.available	2018-04-04T14:28:33Z	-
dc.date.issued	2011	-
dc.identifier.uri	http://univ-bejaia.dz/dspace/123456789/9548	-
dc.description	Option : Réseaux et Systèmes Distribués	en_US
dc.description.abstract	Nous abordons dans ce mémoire le problème de la classification non supervisée de documents répartis par des méthodes probabilistes. Notre étude se concentre en particulier sur le modèle de mélange de lois multinomiales avec variables latentes thématiques au niveau des documents. Le travail porte sur l’apprentissage non supervisé distribué permettant de préserver la confidentialité des données en utilisant d’autres résultats de classifications sans avoir recours aux données de ces dernières. L’approche qui sera étudiée sera basée sur des méthodes probabilistes. Ayant une collection de corpus distribués sur plusieurs sites différents, le problème consiste à partitionner chacun de ces corpus en considérant les données locales et les classifications distantes des autres corpus distribués, sans partage de données entre les différents centres. Pour ce faire, nous proposons une approche asynchrone qui se subdivise en deux phases : Une phase locale et une phase de distribuée. La phase locale reviendrait à appliquer un algorithme de classification, dans notre cas c’est la méthode pLSA, localement et indépendamment sur chacun des corpus, ce qui se soldera par l’obtention d’une partition pour chacun de ces corpus. La phase distribuée reviendrait à faire participer chacun des corpus avec toutes les classifications associées aux autres corpus lors de la phase locale. Ainsi, comme résultat on obtient sur chacun des sites une classification proche de la classification qu’on aurait obtenue si on avait fait centraliser tous les corpus en un seul corpus global. A l’issu des deux phases, toutes les classifications locales seront enrichies.	en_US
dc.language.iso	fr	en_US
dc.publisher	université Abderahmane Mira	en_US
dc.subject	Sémantique : Documents : Identification	en_US
dc.title	Identification de la sémantique dans des documents répartis.	en_US
dc.type	Thesis	en_US
Appears in Collections:	Mémoires de Magister

Files in This Item:

File	Description	Size	Format
Identification de la sémantique dans des documents répartis..pdf		3.52 MB	Adobe PDF	View/Open

Show simple item record

DSpace JSPUI

DSpace preserves and enables easy and open access to all types of digital content including text, images, moving images, mpegs and data sets