Apprentissage en temps réel pour la collecte d'information dans les réseaux sociaux
Résumé
Dans cet article nous nous intéressons à la collecte d’information dans les réseaux sociaux. Cette tâche, primordiale pour de nombreuses applications, se heurte souvent à diverses contraintes liées aux ressources à disposition ou à des restrictions imposées par les API des médias considérés. Nous formulons cette tâche comme un problème de sélection dynamique de sources, pour lequel nous proposons une méthode d’apprentissage pour orienter la collecte vers les données les plus pertinentes en fonction d’un besoin spécifié. Notre méthode est basée sur une extension d’un algorithme de bandit combinatoire récemment proposé. Nous fournissons des garanties théoriques sur le comportement de l’algorithme, que nous évaluons ensuite sur différents jeux de données Twitter, à la fois hors ligne et en ligne, pour différents besoins de données exprimés.