Extraction de la voix dans un signal audio par factorisation en matrices non-négatives semi-supervisée
Résumé
Ce rapport de stage de 2ème année de master a pour sujet la factorisation en matrices non- négatives pour la séparation de sources audio appliquée à la voix. La contribution principale de ce stage est la réalisation d’une méthode semi-supervisée de séparation de la parole, basée sur un modèle source/filtre et l’intégration de contraintes pour informer la factorisation en matrices non-négatives sur les spécificités du signal de parole.
Tout d’abord, un état de l’art sur les méthodes de séparation de parole est présenté, et en parti- culier à propos des méthodes de factorisation en matrices non-négatives et de la spécification de connaissances sur la parole à l’intérieur de ce cadre. Puis, après un rappel des enjeux du stage, la méthode d’apprentissage du modèle de voix et les contraintes intégrées à la factorisation en matrices non-négatives sont présentées ainsi que la structure de l’algorithme proposé. Enfin, les contributions proposées sont évaluées et comparées aux méthodes de l’état de l’art sur une tâche de séparation de la parole en environnement bruité.