Linguistique de corpus

  • Cours (CM) -
  • Cours intégrés (CI) -
  • Travaux dirigés (TD) 24h
  • Travaux pratiques (TP) -
  • Travail étudiant (TE) -

Langue de l'enseignement : Français

Description du contenu de l'enseignement

Cet enseignement aborde le traitement des documents numériques (définition, formats divers, encodage et manipulation), la définition et les critères de constitution d'un corpus, les bases textuelles et les corpus disponibles sur Internet. Dans ce cours seront présentés les outils d'exploration de corpus (concordanciers) disponibles en ligne (Frantext, FrWaC, SketchEngine), mais également indépendants (AntConc, TXM). Les mesures statistiques utilisées par les outils d'exploration de corpus seront abordés (information mutuelle, Loglikelihood). Une dernière partie du cours présente des outils d'exploitation des corpus étiquetés et annotés (TXM).

Compétences à acquérir

- Maîtriser les outils d’exploration de corpus
- Connaître les principes de base de la constitution de corpus

Contact

Faculté des langues

22, rue René Descartes
67084 STRASBOURG CEDEX

Formulaire de contact

Responsable

Amalia Todirascu

Intervenants

Daniela Capin