Annotation d’expressions polylexicales verbales en français - Laboratoire d'informatique fondamentale de Marseille Accéder directement au contenu
Communication Dans Un Congrès Année : 2017

Annotation d’expressions polylexicales verbales en français

Résumé

Nous décrivons la partie française des données produites dans le cadre de la campagne multilingue PARSEME sur l’identification d’expressions polylexicales verbales (Savary et al., 2017). Les expressions couvertes pour le français sont les expressions verbales idiomatiques, les verbes intrinsèquement pronominaux et une généralisation des constructions à verbe support. Ces phénomènes ont été annotés sur le corpus French-UD (Nivre et al., 2016) et le corpus Sequoia (Candito & Seddah, 2012), soit un corpus de 22 645 phrases, pour un total de 4 962 expressions annotées. On obtient un ratio d’une expression annotée tous les 100 tokens environ, avec un fort taux d’expressions discontinues (40%).
Fichier principal
Vignette du fichier
taln17-parseme-st-frenchdata-finale.pdf (162.53 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01537880 , version 1 (16-06-2017)

Identifiants

  • HAL Id : hal-01537880 , version 1

Citer

Marie Candito, Mathieu Constant, Carlos Ramisch, Agata Savary, Yannick Parmentier, et al.. Annotation d’expressions polylexicales verbales en français. 24e conférence sur le Traitement Automatique des Langues Naturelles (TALN), Jun 2017, Orléans, France. pp.1-9. ⟨hal-01537880⟩
427 Consultations
507 Téléchargements

Partager

Gmail Facebook X LinkedIn More