Linguistique de corpus

  • Cours (CM) -
  • Cours intégrés (CI) -
  • Travaux dirigés (TD) 12h
  • Travaux pratiques (TP) -
  • Travail étudiant (TE) -

Langue de l'enseignement : Français

Enseignement proposé en : en présence

Description du contenu de l'enseignement

LT41EM33 – Linguistique de corpus [obligatoire / choisir un groupe]
Gr. 1 Mme TODIRASCU
Gr. 2 Mme TODIRASCU
Outils informatiques et statistiques. Rappel des notions de corpus et de la méthodologie de constitution de corpus, des notions de métadonnées. Corpus étiquetés et annotés. Traitement statistique de données. Exemple : les corpus FrWaC/Europarl.

Habert, B., Nazarenko, A., Salem, A., 1997, Les linguistiques de corpus, Armand-Colin.
Muller,C., 1977,Principes et méthodes de statistique lexicale, Hachette.
Mayaffre, D., 2005, Rôle et place des corpus en linguistique:réflexions introductives,Texto![en ligne], vol. X, n°4.
Sinclair, J.,1991,Corpus, Concordance, Collocation, Oxford University Press.

Compétences à acquérir

- connaître les notions de corpus étiquétés et annotés;
- connaître les bases du langage CQP (Corpus Query Processing);
- savoir exploiter un corpus étiqueté (FrWaC);

Contact

Faculté des lettres

14, rue René Descartes - BP 80010
67084 STRASBOURG CEDEX

Formulaire de contact

Responsable

Amalia Todirascu