Classification multi-label de cas cliniques avec CamemBERT - Conférences TALN RECITAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2021

Classification multi-label de cas cliniques avec CamemBERT

Alexandre Bailly
  • Fonction : Auteur
  • PersonId : 1102678
Corentin Blanc
  • Fonction : Auteur
  • PersonId : 1102679
Thierry Guillotin
  • Fonction : Auteur
  • PersonId : 1102680

Résumé

La quantité de documents textuels médicaux allant grandissant, la nécessité d’en extraire automatiquement des informations concernant des patients devient de plus en plus grande. La prédiction du profil clinique permet de gagner du temps pour le praticien tout en extrayant l’essentiel de l’information concernant un patient. Avec l’explosion du nombre de documents (médicaux ou non), des modèles pré-entraînés tels que BERT pour l’anglais ou CamemBERT pour le français ont émergé. L’utilisation de ces modèles permet d’encoder contextuellement du texte afin de l’utiliser dans des réseaux neuronaux pour notamment prédire des profils cliniques. Cet article vise à comparer différentes méthodes de prédiction de profil clinique en se basant sur l’utilisation de CamemBERT. Dans un premier temps, uniquement du texte provenant de documents médicaux a été utilisé. Dans un second temps, des entités nommées ont été injectées en plus du texte par concaténation ou par sommation pondérée. Les résultats ont montré un succès limité et dépendant de la prévalence des chapitres à prédire dans le corpus ainsi qu’une dégradation des performances lors de l’ajout des entités nommées.
Fichier principal
Vignette du fichier
71.pdf (190.18 Ko) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte

Dates et versions

hal-03265920 , version 1 (23-06-2021)

Identifiants

  • HAL Id : hal-03265920 , version 1

Citer

Alexandre Bailly, Corentin Blanc, Thierry Guillotin. Classification multi-label de cas cliniques avec CamemBERT. Traitement Automatique des Langues Naturelles, 2021, Lille, France. pp.14-20. ⟨hal-03265920⟩
525 Consultations
133 Téléchargements

Partager

Gmail Facebook X LinkedIn More