- Cours (CM) -
- Cours intégrés (CI) 26h
- Travaux dirigés (TD) -
- Travaux pratiques (TP) 4h
- Travail étudiant (TE) -
Langue de l'enseignement : Français
Description du contenu de l'enseignement
Cette UE est un cours avancé sur les données du texte en informatique. Elle est divisée en 2 parties: Algorithmes du texte (2/3) et Recherche díinformation (1/3).
Les thèmes étudiés sont :
- Automates de localisation : arbre d'un dictionnaire, automate-dictionnaire, automate simple et optimisé avec fonction de suppléance, automate avec successeur par défaut.
- Alignement de mots : distance d'édition et similarité, graphe d'édition, alignement global, plus long sous-mot commun, alignement avec brèches, alignement local.
- Recherche approchée de mots : mots à jokers, mots avec distance, mots avec inégalités.
- Traitement Automatique des Langues : notions de base en traitement automatique des langues, extraction d'information (reconnaissance d'entités nommées et de relations entre entités), analyse thématique, résumé automatique, mode de fonctionnement des moteurs de recherche (crawling, prétraitement et indexation des documents, traitement des requêtes utilisateur).
Les thèmes étudiés sont :
- Automates de localisation : arbre d'un dictionnaire, automate-dictionnaire, automate simple et optimisé avec fonction de suppléance, automate avec successeur par défaut.
- Alignement de mots : distance d'édition et similarité, graphe d'édition, alignement global, plus long sous-mot commun, alignement avec brèches, alignement local.
- Recherche approchée de mots : mots à jokers, mots avec distance, mots avec inégalités.
- Traitement Automatique des Langues : notions de base en traitement automatique des langues, extraction d'information (reconnaissance d'entités nommées et de relations entre entités), analyse thématique, résumé automatique, mode de fonctionnement des moteurs de recherche (crawling, prétraitement et indexation des documents, traitement des requêtes utilisateur).
Compétences à acquérir
À l'issue de cette UE, un étudiant est capable de :
- comprendre les concepts et les principaux algorithmes de recherche de mots dans un texte ou une base de données
- mettre en œuvre des solutions informatiques pour différentes catégories d’applications liées au texte telles que la recherche d’information par interrogation de textes à l'aide de concepts, mots-clés, sujets.
- savoir extraire des informations d’un texte
- comprendre les concepts et les principaux algorithmes de recherche de mots dans un texte ou une base de données
- mettre en œuvre des solutions informatiques pour différentes catégories d’applications liées au texte telles que la recherche d’information par interrogation de textes à l'aide de concepts, mots-clés, sujets.
- savoir extraire des informations d’un texte
Pré-requis obligatoires
Éléments de base en théorie des langages, graphes, structures de données, algorithmes et programmations.
Contact
UFR de mathématique et d'informatique
7, rue René Descartes67084 STRASBOURG CEDEX
0368850200
Formulaire de contact