Algorithmes du texte et recherche d’information

  • Cours (CM) -
  • Cours intégrés (CI) 26h
  • Travaux dirigés (TD) -
  • Travaux pratiques (TP) 4h
  • Travail étudiant (TE) -

Langue de l'enseignement : Français

Description du contenu de l'enseignement

Cette UE est un cours avancé sur les données du texte en informatique. Elle est divisée en 2 parties: Algorithmes du texte (2/3) et Recherche díinformation (1/3).
Les thèmes étudiés sont :
- Automates de localisation : arbre d'un dictionnaire, automate-dictionnaire, automate simple et optimisé avec fonction de suppléance, automate avec successeur par défaut.
- Alignement de mots : distance d'édition et similarité, graphe d'édition, alignement global, plus long sous-mot commun, alignement avec brèches, alignement local.
- Recherche approchée de mots : mots à jokers, mots avec distance, mots avec inégalités.
- Traitement Automatique des Langues : notions de base en traitement automatique des langues, extraction d'information (reconnaissance d'entités nommées et de relations entre entités), analyse thématique, résumé automatique, mode de fonctionnement des moteurs de recherche (crawling, prétraitement et indexation des documents, traitement des requêtes utilisateur).

Compétences à acquérir

À l'issue de cette UE, un étudiant est capable de :
- comprendre les concepts et les principaux algorithmes de recherche de mots dans un texte ou une base de données
- mettre en œuvre des solutions informatiques pour différentes catégories d’applications liées au texte telles que la recherche d’information par interrogation de textes à l'aide de concepts, mots-clés, sujets.
- savoir extraire des informations d’un texte
 

Pré-requis obligatoires

Éléments de base en théorie des langages, graphes, structures de données, algorithmes et programmations.


 

Contact

UFR de mathématique et d'informatique

7, rue René Descartes
67084 STRASBOURG CEDEX
0368850200

Formulaire de contact