Codice insegnamento F9201P013
Docente:
Gabriella Pasi
Mutuato dal Corso di laurea magistrale in Informatica
Finalità corso:
Concetti fondamentali, modelli formali e tecniche per la realizzazione di sistemi per il reperimento automatico di documenti pertinenti a specifiche necessità informative. Tali sistemi sono noti con il nome di sistemi di "Information Retrieval", detti Motori di Ricerca quando i documenti da reperire sono costituiti da pagine Web. Il corso introdurrà un insieme di tecniche per il progetto di tali sistemi. In particolare saranno presentate tecniche di indicizzazione di testi (con un accenno a indicizzazione di documenti multimediali) e alcuni modelli quantitativi per la determinazione di una stima (grado o probabilità) di rilevanza di un documento rispetto alle necessità informative dell'utente. Come sviluppo recente dell'IR sono analizzati i motori di ricerca su web.
Argomenti corso:
- Introduzione all'Information Retrieval (IR): Documenti e necessità informative, loro rappresentazione • Il concetto di rilevanza. Probabilità e parzialità • Efficienza, efficacia, specificità ed esaustività • Relevance feedback e riformulazione automatica di query • Valutazione dell'efficacia di un sistema di IR e sperimentazione.
- Il problema della rappresentazione di documenti: tecniche di indicizzazione.
- Modelli di sistemi di Information Retrieval
- I motori di ricerca.
Bibliografia:
La bibliografia d'esame sarà resa nota a lezione e pubblicata sul sito del docente e sulla guida on-line.
Modalità d'esame:
Esame scritto con domande concernenti il programma.