- Cours (CM) -
- Cours intégrés (CI) -
- Travaux dirigés (TD) 24h
- Travaux pratiques (TP) -
- Travail étudiant (TE) -
Langue de l'enseignement : Français
Description du contenu de l'enseignement
Cet enseignement aborde le traitement des documents numériques (définition, formats divers, encodage et manipulation), la définition et les critères de constitution d'un corpus, les bases textuelles et les corpus disponibles sur Internet. Dans ce cours seront présentés les outils d'exploration de corpus (concordanciers) disponibles en ligne (Frantext, FrWaC, SketchEngine), mais également indépendants (AntConc, TXM). Les mesures statistiques utilisées par les outils d'exploration de corpus seront abordés (information mutuelle, Loglikelihood). Une dernière partie du cours présente des outils d'exploitation des corpus étiquetés et annotés (TXM).
Compétences à acquérir
- Maîtriser les outils d’exploration de corpus
- Connaître les principes de base de la constitution de corpus
- Connaître les principes de base de la constitution de corpus
Contact
Responsable
Amalia Todirascu
Intervenants
Daniela Capin