Conversion d'Identité de la Voix Chantée par Sélection et Concaténation d'Unités Spectrales

Nicolas Obin; Pascal Pham; Axel Roebel

Communication Dans Un Congrès Année : 2018

Conversion d'Identité de la Voix Chantée par Sélection et Concaténation d'Unités Spectrales

(1) , (1) , (1)

Nicolas Obin

Fonction : Auteur
PersonId : 7042
IdHAL : nicolas-obin
ORCID : 0000-0002-5236-5306
IdRef : 157523799

Analyse et synthèse sonores [Paris]

Pascal Pham

Fonction : Auteur

Analyse et synthèse sonores [Paris]

Axel Roebel

Fonction : Auteur
PersonId : 4527
IdHAL : axel-roebel
ORCID : 0000-0001-6136-4391
IdRef : 227186079

Analyse et synthèse sonores [Paris]

Résumé

Cet article présente un algorithme de sélection d'unités spectrales pour la conversion de l'identité de la voix chantée à partir de bases de données non parallèles. Les algorithmes de conversion basés sur des unités de parole présentent des avantages importants pour la conversion de l'identité vocale: la conversion vocale par sélection d'unités permet la préservation des caractéristiques originales de la voix cible, en utilisant des unités réelles; et la segmentation en unités linguistiques permet d'apprendre la conversion à partir d'enregistrements de la voix cible non nécessairement alignés avec ceux de la voix source. La contribution principale de cet article est de réaliser la sélection des unités spectrales de la voix cible en fonction de plusieurs facteurs: acoustique, linguistique (phonèmes) et musicaux (hauteur, intensité et durée). Pour ce faire, la sélection de la séquence d'unités d'enveloppe spectrale est établie comme un problème d'optimisation à partir d'une fonction de coût multiple qui comprend la distorsion spectrale des chanteurs source et cible ainsi que les différences de hauteur, d'intensité et de durée des unités spectrales correspondantes. L'objectif est de guider la sélection vers des enveloppes spectrales du chanteur cible partageant un contexte musical similaire avec celles du chanteur source. Il est montré lors d'une expérience perceptive que l'algorithme proposé améliore le naturel de la conversion et la similarité avec la voix cible.

Mots clés

voice conversion singing voice non-parallel conversion unit-selection multi-target optimization

Domaines

Traitement du signal et de l'image [eess.SP] Machine Learning [stat.ML]

Fichier principal

conversion-identite-voice-chantee.pdf (327.46 Ko)

Origine	Fichiers produits par l'(les) auteur(s)

Nicolas Obin : Connectez-vous pour contacter le contributeur

https://hal.sorbonne-universite.fr/hal-01795649

Soumis le : vendredi 18 mai 2018-16:20:02

Dernière modification le : mercredi 30 octobre 2024-13:28:22

Archivage à long terme le : mardi 25 septembre 2018-12:48:54

Dates et versions

hal-01795649 , version 1 (18-05-2018)

Identifiants

HAL Id : hal-01795649 , version 1

Citer

Nicolas Obin, Pascal Pham, Axel Roebel. Conversion d'Identité de la Voix Chantée par Sélection et Concaténation d'Unités Spectrales. Journées d'Etude de la Parole, Jun 2018, Aix-en-Provence, France. ⟨hal-01795649⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

CNRS IRCAM STMS SORBONNE-UNIVERSITE SU-SCIENCES

153 Consultations

203 Téléchargements

Conversion d'Identité de la Voix Chantée par Sélection et Concaténation d'Unités Spectrales

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager