Apprentissage Distribué à Grande Échelle des Embeddings d’Ontologies avec OWL2Vec
Résumé
OWL2Vec est un algorithme conçu pour apprendre les embeddings d'ontologies en se basant sur des marches aléatoires afin de générer des séquences de mots, et en utilisant Word2Vec pour calculer les embeddings. Bien que cet algorithme soit capable de produire des embeddings de haute qualité pour des tâches ultérieures, il présente actuellement une limitation en termes de scalabilité, car il traite de grandes ontologies sur une seule machine. Dans cette étude, nous visons à surmonter cette limitation en distribuant l'algorithme. Pour ce faire, nous partitionnons le graphe de connaissances, effectuons des marches aléatoires sur les sous-graphes, calculons les embeddings localement, puis réconcilions les différents espaces d'embeddings.