A Document Frequency Constraint for Pseudo-Relevance Feedback Models

Abstract

RÉSUMÉ. Nous étudions dans cet article le comportement de plusieurs modèles de rétropertinence en mettant en avant leurs principales caractéristiques. Ceci nous conduit à introduire une nouvelle contrainte pour les modèles de rétro-pertinence, contrainte liée à la fréquence documentaire (DF) des mots. Nous analysons ensuite, d’un point de vue théorique, différents modèles de rétro-pertinence par rapport à cette contrainte. Cette analyse montre que le modèle de mélange utilisé en rétro-pertinence pour les modèles de langue ne satisfait pas cette contrainte. Nous réalisons ensuite une série d’expériences qui permettent de valider la contrainte DF. Pour cela, nous utilisons tout d’abord un oracle sur la base de documents pertinents, puis utilisons une famile de fonctons de type tf-idf, mais paramétrée de telle sorte que des individus différents de la famille auront des comportements différents par rapport à la contrainte DF. Ces expériences montrent la validité et l’importance de la contrainte DF.

DOI: 10.24348/coria.2011.73

Extracted Key Phrases

3 Figures and Tables

Cite this paper

@inproceedings{Clinchant2011ADF, title={A Document Frequency Constraint for Pseudo-Relevance Feedback Models}, author={St{\'e}phane Clinchant and {\'E}ric Gaussier}, booktitle={CORIA}, year={2011} }