Classification multilabel de concepts médicaux pour l’identification du profil clinique du patient - Sorbonne Université
Communication Dans Un Congrès Année : 2021

Classification multilabel de concepts médicaux pour l’identification du profil clinique du patient

Résumé

La première tâche du Défi fouille de textes 2021 a consisté à extraire automatiquement, à partir de cas cliniques, les phénotypes pathologiques des patients regroupés par tête de chapitre du MeSH-maladie. La solution présentée est celle d’un classifieur multilabel basé sur un transformer. Deux transformers ont été utilisés : le camembert-large classique (run 1) et le camembert-large fine-tuné (run 2) sur des articles biomédicaux français en accès libre. Nous avons également proposé un modèle « bout-enbout », avec une première phase d’extraction d’entités nommées également basée sur un transformer de type camembert-large et un classifieur de genre sur un modèle Adaboost. Nous obtenons un très bon rappel et une précision correcte, pour une F1-mesure autour de 0,77 pour les trois runs. La performance du modèle « bout-en-bout » est similaire aux autres méthodes.
Fichier principal
Vignette du fichier
68.pdf (1.05 Mo) Télécharger le fichier
Origine Fichiers éditeurs autorisés sur une archive ouverte

Dates et versions

hal-03265917 , version 1 (23-06-2021)

Identifiants

  • HAL Id : hal-03265917 , version 1

Citer

Christel Gérardin, Pascal Vaillant, Perceval Wajsbürt, Clément Gilavert, Ali Bellamine, et al.. Classification multilabel de concepts médicaux pour l’identification du profil clinique du patient. Traitement Automatique des Langues Naturelles, 2021, Lille, France. pp.21-30. ⟨hal-03265917⟩
243 Consultations
200 Téléchargements

Partager

More