- Cours (CM) -
- Cours intégrés (CI) -
- Travaux dirigés (TD) 18h
- Travaux pratiques (TP) -
- Travail étudiant (TE) -
Langue de l'enseignement : Français
Description du contenu de l'enseignement
- Historique des moteurs de recherche.
- Mode de fonctionnement (crawling, pré-traitement et indexation des documents, traitement des requêtes utilisateur)
- Paradigmes de recherche :
- Recherche booléenne
- Modèles vectoriels : pondération des termes, calculs de similarité entre requête et document
- Modèles probabilistes (notions)
- Evaluation en recherche d'information
- Création d'un moteur de recherche avec la librairie Solr
- Configuration de l'index
- Options linguistiques pour le français (lemmatisation)
- Indexation
- Affichage des résultats de recherche
- Configuration de l'index
- Enrichissement de la recherche avec des métadonnées obtenues par le TAL (entités nommées, motifs lexicaux, …)
- Exploitation d'annotations obtenues par le TAL pour la recherche par facettes dans Solr
- Recherche web
- Référencement naturel (SEO) et critères de positionnement.
- Algorithme PageRank
- Chatbots et agents conversationnels :
- À base de règles, à base de corpus, agents conversationnels à base de frames
- Pratique d'entraînement d'un chatbot
Compétences à acquérir
- Connaître le mode de fonctionnement des moteurs de recherche
- Développer un moteur de recherche pour données textuelles en utilisant des bibliothèques existantes
- Connaître les principes de base du référencement naturel (SEO)