Évolution phonétique des langues et réseaux de neurones : travaux préliminaires - Conférences TALN RECITAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2020

Sound change and neural networks: preliminary experiments

Évolution phonétique des langues et réseaux de neurones : travaux préliminaires

Résumé

Cognate prediction is a key task in historical linguistics that presents a number of similarities withmachine translation. However, although neural methods are now widespread in machine translation,they are still largely unused in historical linguistics. In this paper, we study the performance ofneural methods (more specifically encoder-decoder networks) for the task of cognate prediction. Wefocus in particular on the types of data that can be used for this task, and compare the performanceof statistical and neural methods. We show that sound correspondances can only be learned usingcognate datasets, and that statistical and neural methods seem to have complementary strengths andweaknesses regarding what they learn about the data.
La prédiction de cognats est une tâche clef de la linguistique historique et présente de nombreuses similitudes avec les tâches de traduction automatique. Cependant, alors que cette seconde discipline a vu fleurir l’utilisation de méthodes neuronales, celles-ci restent largement absentes des outils utilisés en linguistique historique. Dans ce papier, nous étudions donc la performance des méthodes neuronales utilisées en traduction (les réseaux encodeur-décodeur) pour la tâche de prédiction de cognats. Nous nous intéressons notamment aux types de données utilisables pour cet apprentissage et comparons les résultats obtenus, sur différents types de données, entre des méthodes statistiques et des méthodes neuronales. Nous montrons que l’apprentissage de correspondances phonétiques n’est possible que sur des paires de cognats, et que les méthodes statistiques et neuronales semblent avoir des forces et faiblesses complémentaires quant à ce qu’elles apprennent des données.
Fichier principal
Vignette du fichier
183.pdf (425.84 Ko) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte
Loading...

Dates et versions

hal-02786192 , version 1 (07-06-2020)
hal-02786192 , version 2 (17-06-2020)
hal-02786192 , version 3 (23-06-2020)

Identifiants

  • HAL Id : hal-02786192 , version 3

Citer

Clémentine Fourrier. Évolution phonétique des langues et réseaux de neurones : travaux préliminaires. JEP-TALN-RECITAL 2020 - 33ème Journées d’Études sur la Parole, 27ème Conférence sur le Traitement Automatique des Langues Naturelles, 22ème Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues, Jun 2020, Nancy / Virtuel, France. pp.110-122. ⟨hal-02786192v3⟩
209 Consultations
109 Téléchargements

Partager

Gmail Facebook X LinkedIn More