Skip to Main content Skip to Navigation
Theses

Algorithmes de bandits pour la collecte d'informations en temps réel dans les réseaux sociaux

Résumé : Dans cette thèse, nous nous intéressons au problème de la collecte de données en temps réel dans les médias sociaux. En raison des différentes limitations imposées par ces médias, mais aussi de la quantité très importante de données, il n’est pas envisageable de collecter la totalité des données produites par des sites tels que Twitter. Par conséquent, pour être en mesure de récolter des informations pertinentes, relativement à un besoin prédéfini, il est nécessaire de se focaliser sur un sous-ensemble des données existantes. Dans ce travail, nous considérons chaque utilisateur d’un réseau social comme une source de données pouvant être écoutée à chaque itération d’un processus de collecte, en vue de capturer les données qu’elle produit. Ce processus, dont le but est de maximiser la qualité des informations récoltées, est contraint à chaque pas de temps par le nombre d’utilisateurs pouvant être écoutés simultanément. Le problème de sélection du sous-ensemble de comptes à écouter au fil du temps constitue un problème de décision séquentielle sous contraintes, que nous formalisons comme un problème de bandit avec sélections multiples. Dans cette optique, nous proposons plusieurs modèles visant à identifier en temps réel les utilisateurs les plus pertinents. Dans un premier temps, le cas du bandit dit stochastique, dans lequel chaque utilisateur est associé à une distribution de probabilité stationnaire, est étudié. Par la suite, nous étudions deux modèles de bandit contextuel, l’un stationnaire et l’autre non stationnaire, dans lesquels l’utilité de chaque utilisateur peut être estimée de façon plus efficace en supposant une certaine structure, permettant ainsi de mutualiser l’apprentissage. En particulier, la première approche introduit la notion de profil, qui correspond au comportement moyen de chaque utilisateur. La seconde approche prend en compte l’activité d’un utilisateur à un instant donné pour prédire son comportement futur. Pour finir, nous nous intéressons à des modèle permettant de prendre en compte des dépendances temporelles complexes entre les utilisateurs, grâce à des transitions entre états cachés du système d’une itération à la suivante. Chacune des approches proposées est validée sur des données artificielles et réelles.
Mots-clés : bandit
Complete list of metadatas

Cited literature [177 references]  Display  Hide  Download

https://hal.sorbonne-universite.fr/tel-02320864
Contributor : Thibault Gisselbrecht <>
Submitted on : Saturday, October 19, 2019 - 5:15:02 PM
Last modification on : Tuesday, June 16, 2020 - 3:31:35 AM
Document(s) archivé(s) le : Monday, January 20, 2020 - 1:17:25 PM

File

ManuscritTheseGisselbrechtThib...
Files produced by the author(s)

Identifiers

  • HAL Id : tel-02320864, version 1

Citation

Thibault Gisselbrecht. Algorithmes de bandits pour la collecte d'informations en temps réel dans les réseaux sociaux. Informatique [cs]. Sorbonne Université / Université Pierre et Marie Curie - Paris VI, 2017. Français. ⟨tel-02320864⟩

Share

Metrics

Record views

97

Files downloads

91