Diversité hiérarchique et utilisation d'arbres de concepts pour la recherche d'images
Abstract
La recherche d'images est de plus en plus efficace, mais les résultats similaires ont tendance à se regrouper. Dans cet article, nous montrons comment améliorer la diversité des résultats en prenant en compte la nature intrinsèquement hiérarchique de la diversité. Afin d'exploiter les différents niveaux de granularité de la diversité, nous utilisons une approche basée sur une classification ascendante hiérarchique (CAH). De plus, nous introduisons une nouvelle approche qui exploite une arborescence de concepts. Pour éviter le conflit entre pertinence et diversité, les différentes approches sont comparées sur un corpus dédié annoté manuellement où tous les documents sont pertinents, et sur un corpus de l'état de l'art (ImageClef photo 2008). Les résultats montrent que l'approche hiérarchique améliore la diversité des résultats.