Inizio della pagina -
Logo DISCO
|
Visita la Versione ad elevata leggibilità
|
Vai al Contenuto della pagina
|
Vai alla Fine dei contenuti
|
Vai al Menu Principale
|
Vai alla Barra di navigazione (sei in)
|
Vai al Menu di navigazione (albero)
|
Vai alla Lista dei comandi
|
Vai alla Lista degli approfondimenti
|
Vai al Menu inferiore
|
Logo Ateneo
   
Per gli Studenti
Information Retrieval

Codice ins.

Insegnamento

CFU ins.

Tipo ins.

Anno

Sem.

SSD ins.

Responsabile insegnamento

F1801Q110

Information Retrieval

6

OBS

2

1

INF/01

PASI Gabriella

 

Information Retrieval

 

 

 

 

 

 

Contenuti:
L'obiettivo del corso è fornire un'introduzione ai concetti fondamentali, ai modelli formali, e alle tecniche per la realizzazione di sistemi per il reperimento automatico di documenti in forma digitale (sistemi di "Information Retrieval", detti Motori di Ricerca o Motori di Ricerca su Web quando i documenti da reperire sono costituiti da pagine Web). In questo contesto il principale problema da affrontare è quello della valutazione della rilevanza dei documenti rispetto alle necessità informative dell'utente. Al termine del corso lo studente sarà in grado di progettare tecniche di indicizzazione di testi semi-strutturati, e di utilizzare software "open source" per definizione di applicazioni di Information Retrieval.

Testi di riferimento:
Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press. 2008.

Obiettivi formativi:
Il corso introdurrà un insieme di tecniche per il progetto di tali sistemi.
In particolare saranno presentate tecniche di indicizzazione di testi, con accenni a indicizzazione di documenti multimediali; saranno inoltre presentati alcuni modelli quantitativi per la determinazione della stima (grado, o probabilità) di rilevanza di un documento rispetto alle necessità informative dell'utente. Tra i modelli avanzati verranno presentati i “Language Model”.
Come sviluppo recente dell'IR saranno analizzati i motori di ricerca su Web. Il corso introdurrà inoltre alcune applicazioni avanzate di IR, come l’IR multimediale e tecniche di personalizzazione della ricerca.

Prerequisiti:
Nozioni di base di Statistica e di Algebra Lineare.

Metodi didattici:
Il corso prevede lezioni in aula, ed esercitazioni in laboratorio. Sono previsti seminari tenuti da esperti del settore a livello nazionale ed internazionale.

Programma esteso:

  1. Introduzione all'Information Retrieval (IR).
  • Documenti e necessità informative, e loro rappresentazione.
  • Il concetto di rilevanza. Probabilità e parzialità.
  • Efficienza, efficacia; valutazione dell'efficacia di un sistema di IR.
  • Relevance feedback e riformulazione dell'interrogazione.

2. Le tecniche di indicizzazione di testi

3. Modelli di sistemi di Information Retrieval: accenni ai modelli base (Boolean, Vettoriale, Probabilistici). I Language Models.

4. I motori di ricerca su Web

5. Temi ``avanzati'' di Information Retrieval

  • Information retrieval di documenti strutturati.
  • Multimedia information retrieval
  • Categorizzazione automatica di documenti.

Personalizzazione della ricerca.
Tipo esame:
Scritto e orale separati

Tipo valutazione:
Voto finale

Prerequisites:

Basic knowledge of statistics and linear algebra.

Suggested Texbook:
Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press. 2008.

Contents:

This course aims at introducing the basic concepts, the formal models and the main techniques to define and design Information Retrieval Systems (called Web Search Engines  when working on the Web to the aim of retrieving Web pages). In this context the main problem is the assessment of the relevance of documents with respect to the information needs formulated in a user’s query. Students will acquire the capability of understanding and defining algorithms for document processing and retrieval, and to use open source software to implement ad hoc search engines.

Objectives:
The course will introduce the main techniques for modeling and designing such software systems.
In particular, text and multimedia indexing techniques will be presented, as well as basic and advanced information retrieval models, among which the language models.
Web search engines will be introduced, and some advanced techniques will be presented, such as multimedia IR, and techniques for personalized search.

Teaching method:
The course will be composed of lessons introducing the main topics as well as of a laboratory where  exercises will be done, and the usage of an open source software for the implementation of search engines will be explained. 

Program

1.Introduction to Information Retrieval (IR).

  • Documents and information needs, and their representation.
  • The notion of relevance.
  • Efficiency and effectiveness. Evaluation of the effectiveness of an IRS.
  • Relevance feedback techniques.

2. Text Indexing techniques.
3. Information Retrieval models: basic models. Language Models.4. Web Search Engines.
5. Advanced Information Retrieval topics:

  • XML retrieval.
  • Multimedia information retrieval
  • Document categorization.

Personalised search

 

 

 

Approfondimenti

Google Translate
Translate to English Translate to French Translate to German Translate to Spanish Translate to Chinese Translate to Portuguese Translate to Arabic
Translate to Albanian Translate to Bulgarian Translate to Croatian Translate to Czech Translate to Danish Translate to Dutch Translate to Finnish Translate to Greek Translate to Hindi
Translate to Hungarian Translate to Irish Translate to Japanese Translate to Korean Translate to Norwegian Translate to Polish Translate to Romanian Translate to Russian Translate to Serbian
Translate to Slovenian Translate to Swedish Translate to Thai Translate to Turkish

(C) Copyright 2016 - Dipartimento Informatica Sistemistica e Comunicazione - Viale Sarca, 336
20126 Milano - Edificio U14
redazioneweb@disco.unimib.it - ultimo aggiornamento di questa pagina 27/09/2012