Extraction de la voix dans un signal audio par factorisation en matrices non-négatives semi-supervisée

Bouvier Damien

Rapport Année : 2015

Extraction de la voix dans un signal audio par factorisation en matrices non-négatives semi-supervisée

(1)

Bouvier Damien

Fonction : Auteur
PersonId : 11864
IdHAL : damien-bouvier

Analyse et synthèse sonores [Paris]

Résumé

Ce rapport de stage de 2ème année de master a pour sujet la factorisation en matrices non- négatives pour la séparation de sources audio appliquée à la voix. La contribution principale de ce stage est la réalisation d’une méthode semi-supervisée de séparation de la parole, basée sur un modèle source/filtre et l’intégration de contraintes pour informer la factorisation en matrices non-négatives sur les spécificités du signal de parole. Tout d’abord, un état de l’art sur les méthodes de séparation de parole est présenté, et en parti- culier à propos des méthodes de factorisation en matrices non-négatives et de la spécification de connaissances sur la parole à l’intérieur de ce cadre. Puis, après un rappel des enjeux du stage, la méthode d’apprentissage du modèle de voix et les contraintes intégrées à la factorisation en matrices non-négatives sont présentées ainsi que la structure de l’algorithme proposé. Enfin, les contributions proposées sont évaluées et comparées aux méthodes de l’état de l’art sur une tâche de séparation de la parole en environnement bruité.

Mots clés

débruitage de la parole factorisation en matrices non- négatives (NMF) modèle source/filtre NMF sous contraintes Séparation de la parole

Domaines

Traitement du signal et de l'image [eess.SP] Machine Learning [stat.ML]

Nicolas Obin : Connectez-vous pour contacter le contributeur

https://hal.sorbonne-universite.fr/hal-01264830

Soumis le : vendredi 29 janvier 2016-16:54:15

Dernière modification le : vendredi 24 mars 2023-14:53:01

Dates et versions

hal-01264830 , version 1 (29-01-2016)

Identifiants

HAL Id : hal-01264830 , version 1

Citer

Bouvier Damien. Extraction de la voix dans un signal audio par factorisation en matrices non-négatives semi-supervisée. [Stage] STMS - Sciences et Technologies de la Musique et du Son UMR 9912 IRCAM-CNRS-UPMC. 2015. ⟨hal-01264830⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UPMC CNRS IRCAM STMS LARA SORBONNE-UNIVERSITE SU-SCIENCES

268 Consultations

0 Téléchargements

Extraction de la voix dans un signal audio par factorisation en matrices non-négatives semi-supervisée

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager