Classification de relations pour l'intelligence économique et concurrentielle - Méthodes et Ingénierie des Langues, des Ontologies et du Discours Accéder directement au contenu
Communication Dans Un Congrès Année : 2020

Classification de relations pour l'intelligence économique et concurrentielle

Résumé

Relation extraction aims at identifying semantic relations that may hold between entities in raw text. This task has been widely studied in the litterature focusing either on extracting generic relations like hyperonymy or domain-dependent relations like those linking genes and proteins. In this paper, we aim at extracting business relations between two organizations from web textual contents. In particular, we propose BIZREL, the first French annotated dataset for business relations as well as a supervised approach based on several neural architectures to classify these relations. Our results are encouraging and constitute a first step towards economic and competitive intelligence from French texts.
L’extraction de relations reliant des entités par des liens sémantiques à partir de texte a fait l’objet de nombreux travaux visant à extraire des relations génériques comme l’hyperonymie ou spécifiques comme des relations entre gènes et protéines. Dans cet article, nous nous intéressons aux relations économiques entre deux entités nommées de type organisation à partir de textes issus du web. Ce type de relation, encore peu étudié dans la littérature, a pour but l’identification des liens entre les acteurs d’un secteur d’activité afin d’analyser leurs écosystèmes économiques. Nous présentons B IZ R EL, le premier corpus français annoté en relations économiques, ainsi qu’une approche supervisée à base de différentes architectures neuronales pour la classification de ces relations. L’évaluation de ces modèles montre des résultats très encourageants, ce qui est un premier pas vers l’intelligence économique et concurrentielle à partir de textes pour le français.
Fichier principal
Vignette du fichier
120.pdf (560.18 Ko) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte
Loading...

Dates et versions

hal-02784753 , version 1 (07-06-2020)
hal-02784753 , version 2 (18-06-2020)
hal-02784753 , version 3 (23-06-2020)

Licence

Paternité

Identifiants

  • HAL Id : hal-02784753 , version 3

Citer

Hadjer Khaldi, Amine Abdaoui, Farah Benamara, Grégoire Sigel, Nathalie Aussenac-Gilles. Classification de relations pour l'intelligence économique et concurrentielle. 27ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2020), ATALA (Association pour le Traitement Automatique des Langues), Jun 2020, Nancy, France. pp.27-39. ⟨hal-02784753v3⟩
344 Consultations
230 Téléchargements

Partager

Gmail Facebook X LinkedIn More