- Cours (CM) -
- Cours intégrés (CI) -
- Travaux dirigés (TD) 12h
- Travaux pratiques (TP) -
- Travail étudiant (TE) -
Langue de l'enseignement : Français
Description du contenu de l'enseignement
LT41GM23 – Outils d’annotation automatique
Mme TODIRASCU
Annotation automatique vs annotation manuelle. Accord inter-annotateurs. Annotations morphosyntaxiques, syntaxiques, sémantiques : définition, enjeux, problèmes. Outils d’annotation morphosyntaxique : étiquetage (TreeTagger, Unitex), lemmatisation (Flemm). Outils d’annotation syntaxique (analyse en dépendances par Bohnet, Talismane, ou Mind the Gap). Projets d’annotation : Multext, Universal POS, Universal Dependencies.
Mme TODIRASCU
Annotation automatique vs annotation manuelle. Accord inter-annotateurs. Annotations morphosyntaxiques, syntaxiques, sémantiques : définition, enjeux, problèmes. Outils d’annotation morphosyntaxique : étiquetage (TreeTagger, Unitex), lemmatisation (Flemm). Outils d’annotation syntaxique (analyse en dépendances par Bohnet, Talismane, ou Mind the Gap). Projets d’annotation : Multext, Universal POS, Universal Dependencies.
Compétences à acquérir
- Maîtrise des outils d'étiquetage et d'annotation syntaxique automatique;
- savoir créer des corpus annotés fiables (accord inter-annotateurs);
- connaître des projets d'annotations récents (Universal Dependency, Multext).
Contact
Responsable
Amalia Todirascu