Skip to Main content Skip to Navigation
Theses

Méthodes d'acquisition terminologique en arabe : Application au domaine médical

Résumé : L'objectif de cette thèse est de lever les verrous que constituent le manque de disponibilité de ressources ou d'outils TAL pour la langue arabe dans les domaines de spécialité en proposant des méthodes permettant l'extraction de termes à partir de textes en arabe standard moderne. Dans ce contexte, nous avons d'abord construit un corpus parallèle anglais-arabe dans un domaine de spécialité. Il s'agit d'un ensemble de textes médicaux produits par la bibliothèque nationale de médecine américaine (NLM). Par la suite, nous avons proposé des méthodes d'acquisition terminologique, permettant d'extraire des termes ou d'acquérir des relations entre ces termes, pour la langue arabe en se basant sur: i)adaptation d'un extracteur terminologique existant pour la languefrançaise ou anglaise, ii) l'exploitation de la translittération des termes anglais en caractères arabes et iii) l'application de la la notion de transfert translingue. Appliqué au niveau terminologique, le transfert consiste à mettre en œuvre un processus d'extraction de termes ou d'acquisition de relations entre termes sur des textes d'une langue source (ici, le français ou l'anglais) puis à transférer les informations extraites sur des textes d'une langue cible (ici, l’arabe standard moderne) pour ainsi identifier le même type d'informations terminologiques. Nous avons évalué les listes de termes monolingues et bilingues obtenues lors des différentes expériences que nous avons réalisées, suivant une méthode transparente, directe et semi-automatique: les termes candidats extraits sont confrontés à une terminologie de référence avant d'être vérifiés manuellement. Cette évaluation suit un protocole que nous avons proposé.
Complete list of metadatas

Cited literature [114 references]  Display  Hide  Download

https://tel.archives-ouvertes.fr/tel-02326714
Contributor : Abes Star :  Contact
Submitted on : Tuesday, October 22, 2019 - 3:37:07 PM
Last modification on : Wednesday, June 24, 2020 - 2:30:09 PM
Document(s) archivé(s) le : Thursday, January 23, 2020 - 9:16:50 PM

File

75818_NEIFAR_2019_archivage.pd...
Version validated by the jury (STAR)

Identifiers

  • HAL Id : tel-02326714, version 1

Citation

Wafa Neifar. Méthodes d'acquisition terminologique en arabe : Application au domaine médical. Informatique et langage [cs.CL]. Université Paris-Saclay; Université de Sfax (Tunisie). Faculté des Sciences économiques et de gestion, 2019. Français. ⟨NNT : 2019SACLS085⟩. ⟨tel-02326714⟩

Share

Metrics

Record views

168

Files downloads

207