- Cours (CM) -
- Cours intégrés (CI) -
- Travaux dirigés (TD) 18h
- Travaux pratiques (TP) -
- Travail étudiant (TE) -
Langue de l'enseignement : Français
Description du contenu de l'enseignement
- Histoire de la traduction automatique et paradigmes : À base de règles, statistique et neuronale.
- Évaluation : mesures manuelles et automatiques, intrinsèques et extrinsèques
- Corpus alignés et corpus comparables.
- Alignement de phrases et de segments
- Extraction d'un corpus aligné à partir de sites web bi- ou multilingues
- Extraction de ressources linguistiques lexicales ou grammaticales à partir de corpus comparables et alignés.
- Extraction de lexiques bilingues
- Extraction de paraphrases
- Traduction statistique (SMT)
- Systèmes à base de segments (PBMT)
- Systèmes factorisés
- Pratique avec l'outil Moses
- Deep learning et réseaux de neurones pour la traduction automatique
- Introduction au TAL neuronal
- Introduction a la traduction neuronale
- Modèles encodeur-décodeur : sequence to sequence (seq2seq) avec attention
- Exemples avec plusieurs librairies : Keras, TensorFlow, OpenNMT
- Le modèle Transformer
- Modèles encodeur-décodeur : sequence to sequence (seq2seq) avec attention
Compétences à acquérir
- Maîtriser les outils d’alignement de corpus
- Maîtriser les outils d’extraction de ressources linguistiques à partir de corpus alignés
- Maîtriser les outils d’exploration de corpus parallèles et comparables
- Développer un modèle de traduction automatique neuronale