Modèle Neuronal de Recherche d'Information Augmenté par une Ressource Sémantique

Résumé : De nombreux travaux en recherche d'information (RI) ont montré l'apport de la sémantique des mots pour améliorer l'appariement de document-requête. D'une part, la sémantique symbolique dérivée de ressources externes permet de représenter des entités et leurs relations explicites. D'autre part, la sémantique distributionnelle inférée des corpus permet de représenter les relations sémantiques implicites d'un corpus. Dans cet article, nous proposons de combiner ces deux types de représentations sémantiques. Ainsi, nous présentons un modèle neuronal pour la RI ad-hoc qui exploite les représentations sémantiques latentes des documents et des requêtes en bénéficiant des concepts et des relations exprimés au sein d'une ressource externe. Les évaluations sur deux jeux de données prouvent l'efficacité de notre modèle par rapport aux modèles neuronaux profonds d'appariement de l'état de l'art. ABSTRACT. In information retrieval task, the words semantic has been recognized as significant mean to improve the document-query matching. First, the symbolic semantics extracted from external resources allows to represent entities and their explicit relations. Second, the distributed semantics inferred from the corpus allows to exploit the implicit relations hidden in a corpus. In this paper, we introduce a neural model that leverages the latent semantic representations of documents and queries by taking advantage of the concepts and relations expressed within an external resource. Experimental results obtained on two datasets indicate our model effectiveness in comparison with state-of-the-art deep neural retrieval models.
Document type :
Conference papers
Complete list of metadatas

Cited literature [18 references]  Display  Hide  Download

https://hal.sorbonne-universite.fr/hal-01517032
Contributor : Laure Soulier <>
Submitted on : Tuesday, May 2, 2017 - 3:50:05 PM
Last modification on : Thursday, June 27, 2019 - 4:27:52 PM
Long-term archiving on : Thursday, August 3, 2017 - 1:23:36 PM

File

Coria_2017_GH.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-01517032, version 1

Citation

Gia-Hung Nguyen, Laure Soulier, Lynda Tamine, Nathalie Bricon-Souf. Modèle Neuronal de Recherche d'Information Augmenté par une Ressource Sémantique. Conférence francophone en Recherche d'Information et Applications (CORIA 2017), Mar 2017, Marseille, France. ⟨hal-01517032⟩

Share

Metrics

Record views

336

Files downloads

288