Classification multilabel de concepts médicaux pour l’identification du profil clinique du patient - Sorbonne Université Access content directly
Conference Papers Year : 2021

Classification multilabel de concepts médicaux pour l’identification du profil clinique du patient

Abstract

La première tâche du Défi fouille de textes 2021 a consisté à extraire automatiquement, à partir de cas cliniques, les phénotypes pathologiques des patients regroupés par tête de chapitre du MeSH-maladie. La solution présentée est celle d’un classifieur multilabel basé sur un transformer. Deux transformers ont été utilisés : le camembert-large classique (run 1) et le camembert-large fine-tuné (run 2) sur des articles biomédicaux français en accès libre. Nous avons également proposé un modèle « bout-enbout », avec une première phase d’extraction d’entités nommées également basée sur un transformer de type camembert-large et un classifieur de genre sur un modèle Adaboost. Nous obtenons un très bon rappel et une précision correcte, pour une F1-mesure autour de 0,77 pour les trois runs. La performance du modèle « bout-en-bout » est similaire aux autres méthodes.
Fichier principal
Vignette du fichier
68.pdf (1.05 Mo) Télécharger le fichier
Origin : Publisher files allowed on an open archive

Dates and versions

hal-03265917 , version 1 (23-06-2021)

Identifiers

  • HAL Id : hal-03265917 , version 1

Cite

Christel Gérardin, Pascal Vaillant, Perceval Wajsbürt, Clément Gilavert, Ali Bellamine, et al.. Classification multilabel de concepts médicaux pour l’identification du profil clinique du patient. Traitement Automatique des Langues Naturelles, 2021, Lille, France. pp.21-30. ⟨hal-03265917⟩
194 View
135 Download

Share

Gmail Facebook Twitter LinkedIn More