Page begin -
Logo DISCO
|
Go to the Highly accessible area
|
Go to the Content page
|
Go to the End of content
|
Go to the Main menu
|
Go to the Navigation Bar (location)
|
Go to the Navigation menu (tree)
|
Go to the Commands list
|
Go to the Further readings
|
Go to the Bottom Menu
|
Logo Ateneo
   
Enrolled
Information Retrieval

Docenti: G. Pasi

Crediti: 6 CFU

Prerequisiti: Nessuno in particolare. E' utile la conoscenza di nozioni di base di Statistica. Il corso presenta punti di contatto con il corso di Basi di Dati.

Conoscenze e Abilità: L'obiettivo del corso è fornire un'introduzione ai concetti fondamentali, ai modelli formali, e alle tecniche per la realizzazione di sistemi per il reperimento automatico di documenti in forma digitale (sistemi di "Information Retrieval", detti Motori di Ricerca quando i documenti da reperire sono costituiti da pagine Web. In questo contesto il principale problema da affrontare è quello della valutazione della pertinenza (rilevanza) dei documenti rispetto alle necessità informative dell'utente.
Il corso introdurrà un insieme di tecniche per il progetto di tali sistemi.
In particolare saranno presentate tecniche di indicizzazione di testi (con un accenno a indicizzazione di documenti multimediali) e alcuni modelli quantitativi per la determinazione di una stima (grado, o probabilità) di rilevanza di un documento rispetto alle necessità informative dell'utente.
Come sviluppo recente dell'IR sono analizzati ii motori di ricerca su web.
Il corso introdurrà inoltre alcune applicazioni avanzate di IR, come la
classificazione e il filtraggio automatico di documenti in forma digitale.
Lo studente acquisirà la capacità di comprendere e definire algoritmi di indicizzazione e retrieval di documenti.

Programma del corso

  1. Introduzione all l'Information Retrieval (IR).
  • Documenti e necessità informative, e loro rappresentazione.
  • Il concetto di rilevanza. Probabilità e parzialità.
  • Efficienza, efficacia, specificità ed esaustività.
  • Relevance feedback e riformulazione dell'interrogazione.
  • Valutazione dell'efficacia di un sistema di IR e sperimentazione

2. Il problema della rappresentazione di documenti: tecniche diindicizzazione
3. Modelli di sistemi di Information Retrieval e relative funzioni di
matching
4. I motori di ricerca
5. Temi ``avanzati'' di Information Retrieval

  • Information retrieval in presenza di documenti strutturati.
  • Multimedia information retrieval
  • Information retrieval multilingue
  • Categorizzazione automatica di documenti.
Further readings
(C) Copyright 2016 - Dipartimento Informatica Sistemistica e Comunicazione - Viale Sarca, 336
20126 Milano - Edificio U14
redazioneweb@disco.unimib.it - last update of this page 28/03/2011