Optimiser le choix des exemples pour la traduction automatique augmentée par des mémoires de traduction

Maxime Bouthors; Josep Crego; François Yvon

Communication Dans Un Congrès Année : 2024

Optimiser le choix des exemples pour la traduction automatique augmentée par des mémoires de traduction

(1, 2) , (2) , (1)

1
2

Maxime Bouthors

Fonction : Auteur
PersonId : 1328527
IdHAL : maxime-bouthors

Machine Learning and Information Access

ChapsVision

Josep Crego

Fonction : Auteur

ChapsVision

François Yvon

Fonction : Auteur
PersonId : 5347
IdHAL : francois-yvon
ORCID : 0000-0002-7972-7442
IdRef : 057593531

Machine Learning and Information Access

Résumé

La traduction neuronale à partir d'exemples s'appuie sur l'exploitation d'une mémoire de traduction contenant des exemples similaires aux phrases à traduire. Ces exemples sont utilisés pour conditionner les prédictions d'un décodeur neuronal. Nous nous intéressons à l'amélioration du système qui effectue l'étape de recherche des phrases similaires, l'architecture du décodeur neuronal étant fixée et reposant ici sur un modèle explicite d'édition, le Transformeur multi-Levenshtein. Le problème considéré consiste à trouver un ensemble optimal d'exemples similaires, c'est-à-dire qui couvre maximalement la phrase source. En nous appuyant sur la théorie des fonctions sous-modulaires, nous explorons de nouveaux algorithmes pour optimiser cette couverture et évaluons les améliorations de performances auxquels ils mènent pour la tâche de traduction automatique.

Mots clés

Traduction Automatique Recherche d'Information Mémoires de Traduction Fonctions Sous-Modulaires Traduction à partir d'Exemples

Domaines

Informatique et langage [cs.CL]

Fichier principal

4837.pdf (473 Ko)

Origine	Fichiers éditeurs autorisés sur une archive ouverte

Matthieu Labeau : Connectez-vous pour contacter le contributeur

https://inria.hal.science/hal-04623042

Soumis le : lundi 1 juillet 2024-09:13:22

Dernière modification le : mercredi 30 octobre 2024-13:28:35

Dates et versions

hal-04623042 , version 1 (01-07-2024)

Licence

Paternité

Identifiants

HAL Id : hal-04623042 , version 1

Citer

Maxime Bouthors, Josep Crego, François Yvon. Optimiser le choix des exemples pour la traduction automatique augmentée par des mémoires de traduction. 35èmes Journées d'Études sur la Parole (JEP 2024) 31ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2024) 26ème Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RECITAL 2024), Jul 2024, Toulouse, France. pp.582-604. ⟨hal-04623042⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

CNRS ISIR GENCI SORBONNE-UNIVERSITE SU-SCIENCES TALN-RECITAL ISIR_MLIA JEP-TALN-RECITAL2024

95 Consultations

55 Téléchargements

Optimiser le choix des exemples pour la traduction automatique augmentée par des mémoires de traduction

Résumé

Mots clés

Domaines

Dates et versions

Licence

Identifiants

Citer

Relations

Exporter

Collections

Partager