Impact de la structure logique des documents sur les modèles distributionnels : expérimentations sur le corpus TALN - Conférences TALN RECITAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2020

Impact of document structure on distributional semantics models: a case study on NLP research articles

Impact de la structure logique des documents sur les modèles distributionnels : expérimentations sur le corpus TALN

Résumé

Nous présentons une expérience visant à mesurer en quoi la structure logique d'un document impacte les représentations lexicales dans les modèles de sémantique distributionnelle. En nous basant sur des documents structurés (articles de recherche en TAL) nous comparons des modèles construits sur des corpus obtenus par suppression de certaines parties des textes du corpus : titres de section, résumés, introductions et conclusions. Nous montrons que malgré des différences selon les parties et le lexique pris en compte, ces zones réputées particulièrement informatives du contenu d'un article ont un impact globalement moins significatif que le reste du texte sur la construction du modèle.
Fichier principal
Vignette du fichier
44.pdf (833.44 Ko) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte
Loading...

Dates et versions

hal-02784760 , version 1 (04-06-2020)
hal-02784760 , version 2 (18-06-2020)
hal-02784760 , version 3 (23-06-2020)

Identifiants

  • HAL Id : hal-02784760 , version 3

Citer

Ludovic Tanguy, Cécile Fabre, Yoann Bard. Impact de la structure logique des documents sur les modèles distributionnels : expérimentations sur le corpus TALN. Actes de la 6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition), Jun 2020, Nancy, France. pp.122-135. ⟨hal-02784760v3⟩
173 Consultations
86 Téléchargements

Partager

Gmail Facebook X LinkedIn More