Représentation temporelle des mots : application au clustering de micro-blogs.

Zeljko Kraljevic 1 Nicolas Baskiotis 1 Benjamin Piwowarski 2 Patrick Gallinari 1
1 MLIA - Machine Learning and Information Access
LIP6 - Laboratoire d'Informatique de Paris 6
2 BD - Bases de Données
LIP6 - Laboratoire d'Informatique de Paris 6
Résumé : Les modèles distribués de mots sont un outil précieux pour la classification, le clustering, et plus généralement la représentation des documents. Pour des collections dynamiques, il est nécessaire de prendre en compte l’évolution temporelle de ces représentations. Dans cet article, nous présentons un modèle qui représente les mots sous la forme de trajectoires dans un espace de représentation, trajectoires qui sont déterminées par les groupes auxquels les mots appartiennent. Des expériences préliminaires en clustering sur des micro-blogs montrent l’intérêt de ce type de modèle.
Type de document :
Communication dans un congrès
Conférence en Recherche d'Infomations et Applications, Mar 2016, Toulouse, France. pp.531-544, 2016
Liste complète des métadonnées

https://hal.sorbonne-universite.fr/hal-01358679
Contributeur : Benjamin Piwowarski <>
Soumis le : jeudi 1 septembre 2016 - 11:25:36
Dernière modification le : vendredi 31 août 2018 - 09:25:57

Identifiants

  • HAL Id : hal-01358679, version 1

Collections

Citation

Zeljko Kraljevic, Nicolas Baskiotis, Benjamin Piwowarski, Patrick Gallinari. Représentation temporelle des mots : application au clustering de micro-blogs.. Conférence en Recherche d'Infomations et Applications, Mar 2016, Toulouse, France. pp.531-544, 2016. 〈hal-01358679〉

Partager

Métriques

Consultations de la notice

192