Représentation temporelle des mots : application au clustering de micro-blogs.

Zeljko Kraljevic 1 Nicolas Baskiotis 1 Benjamin Piwowarski 2 Patrick Gallinari 1
1 MLIA - Machine Learning and Information Access
LIP6 - Laboratoire d'Informatique de Paris 6
2 BD - Bases de Données
LIP6 - Laboratoire d'Informatique de Paris 6
Résumé : Les modèles distribués de mots sont un outil précieux pour la classification, le clustering, et plus généralement la représentation des documents. Pour des collections dynamiques, il est nécessaire de prendre en compte l’évolution temporelle de ces représentations. Dans cet article, nous présentons un modèle qui représente les mots sous la forme de trajectoires dans un espace de représentation, trajectoires qui sont déterminées par les groupes auxquels les mots appartiennent. Des expériences préliminaires en clustering sur des micro-blogs montrent l’intérêt de ce type de modèle.
Document type :
Conference papers
Complete list of metadatas

https://hal.sorbonne-universite.fr/hal-01358679
Contributor : Benjamin Piwowarski <>
Submitted on : Thursday, September 1, 2016 - 11:25:36 AM
Last modification on : Thursday, March 21, 2019 - 1:21:23 PM

Identifiers

  • HAL Id : hal-01358679, version 1

Citation

Zeljko Kraljevic, Nicolas Baskiotis, Benjamin Piwowarski, Patrick Gallinari. Représentation temporelle des mots : application au clustering de micro-blogs.. Conférence en Recherche d'Infomations et Applications, Mar 2016, Toulouse, France. pp.531-544. ⟨hal-01358679⟩

Share

Metrics

Record views

237