Classification multilabel de concepts médicaux pour l’identification du profil clinique du patient

La première tâche du Défi fouille de textes 2021 a consisté à extraire automatiquement, à partir de cas cliniques, les phénotypes pathologiques des patients regroupés par tête de chapitre du MeSH-maladie. La solution présentée est celle d’un classifieur multilabel basé sur un transformer. Deux transformers ont été utilisés : le camembert-large classique (run 1) et le camembert-large fine-tuné (run 2) sur des articles biomédicaux français en accès libre. Nous avons également proposé un modèle « bout-enbout », avec une première phase d’extraction d’entités nommées également basée sur un transformer de type camembert-large et un classifieur de genre sur un modèle Adaboost. Nous obtenons un très bon rappel et une précision correcte, pour une F1-mesure autour de 0,77 pour les trois runs. La performance du modèle « bout-en-bout » est similaire aux autres méthodes.

Mots clés

classification multilabel Transformer extraction d’entités nommées concepts médicaux

Domaines

Informatique et langage [cs.CL]

Fichier principal

68.pdf (1.05 Mo)

Origine	Fichiers éditeurs autorisés sur une archive ouverte

Yannick Parmentier : Connectez-vous pour contacter le contributeur

https://hal.science/hal-03265917

Soumis le : mercredi 23 juin 2021-23:52:20

Dernière modification le : jeudi 7 novembre 2024-14:22:02

Archivage à long terme le : vendredi 24 septembre 2021-19:24:53

Dates et versions

hal-03265917 , version 1 (23-06-2021)

Identifiants

HAL Id : hal-03265917 , version 1

Citer

Christel Gérardin, Pascal Vaillant, Perceval Wajsbürt, Clément Gilavert, Ali Bellamine, et al.. Classification multilabel de concepts médicaux pour l’identification du profil clinique du patient. Traitement Automatique des Langues Naturelles, 2021, Lille, France. pp.21-30. ⟨hal-03265917⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

INSERM UNIV-PARIS13 IPLESP LIMICS SORBONNE-UNIVERSITE SU-MEDECINE SU-SCIENCES SORBONNE-PARIS-NORD TALN-RECITAL TALN-RECITAL2021 ACT-R

243 Consultations

200 Téléchargements