Accéder directement au contenu Accéder directement à la navigation
Rapport

Utilisation de ressources lexicales et terminologiques en traduction neuronale

François Yvon 1 Sadaf Abdul Rauf 1
1 TLP - Traitement du Langage Parlé
LIMSI - Laboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur
Abstract : La traduction automatique (TA) neuronale a conduit à une amélioration perceptible de la qualité de traduction et de l'utilisabilité des textes ainsi produits dans un nombre varié de contextes. Cette technologie repose sur l'exploitation d'algorithmes qui fonctionnent en boite noire, ce qui rend difficile le contrôle fin du processus de traduction. En particulier, alors que la génération antérieure de modèles de traduction (statistique) permettait assez directement d'injecter des ressources dictionnairiques ou terminologiques, l'hybridation de la TA neuronale par des méthodes à base de dictionnaires ou de règles s'avère plus délicate. Ceci est parfois vécu comme une régression, en particulier dans des contextes de traduction assistée par ordinateur (TAO) ou de post-édition (PE), ou encore dans les contextes ou domaines pour lesquels il existe peu de données parallèles. Dans ce rapport, nous proposons une revue critique des tentatives récentes pour intégrer des lexiques bilingues en TA neuronales, pour constater que la plupart peuvent s'interpréter comme des essais pour adapter au cadre de la TA neuronale des méthodes anciennes. Nous discutons également diverses pistes qui restent à explorer pour rendre cette hybridation de la TA plus prédictible et plus transparente.
Liste complète des métadonnées

https://hal.archives-ouvertes.fr/hal-02895535
Contributeur : François Yvon <>
Soumis le : vendredi 21 août 2020 - 18:19:14
Dernière modification le : samedi 10 octobre 2020 - 03:25:54

Fichier

d2-1.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-02895535, version 2

Collections

Citation

François Yvon, Sadaf Abdul Rauf. Utilisation de ressources lexicales et terminologiques en traduction neuronale. [Rapport de recherche] 2020-001, LIMSI-CNRS. 2020, 54 p. ⟨hal-02895535v2⟩

Partager

Métriques

Consultations de la notice

50

Téléchargements de fichiers

51