Page begin -
Logo DISCO
|
Go to the Highly accessible area
|
Go to the Content page
|
Go to the End of content
|
Go to the Main menu
|
Go to the Navigation Bar (location)
|
Go to the Navigation menu (tree)
|
Go to the Commands list
|
Go to the Further readings
|
Go to the Bottom Menu
|
Logo Ateneo
   
Enrolled
Data mining

Codice corso E3101Q037

Docente:
Enrico Fagiuoli

PROGRAMMA

Obiettivi e contenuti:
Il corso ha l’obiettivo di fornire agli studenti conoscenze di base per risolvere problemi di classificazione e associazione, con esempi tratti da vari contesti applicativi. Inoltre apprenderà a modellare relazioni di causa-effetto, e a usare sistemi software per il Data Mining.

Programma:
1) Introduzione al Data mining; 2) Preprocessing; 3) Classificazione supervisionata: alberi di decisione, classificatori bayesiani, metodi d’insieme; 4) Reti bayesiane: cenni di teoria, breve  introduzione agli algoritmi; 5) Classificazione non supervisionata: clustering; 6) Metodi di associazione.

Risultati di apprendimento previsti:
Lo studente acquisirà competenze specifiche che gli consentiranno di formulare e risolvere problemi di classificazione e di associazione, e di modellare complesse reti causali. Sarà in grado di utilizzare modelli computazionali ed algoritmi per il Data Mining e sistemi software per l’estrazione automatica di conoscenza a partire da dati strutturati, in specifici domini, quali a titolo esemplificativo; medicina, bioinformatica, business, commercio elettronico e sicurezza informatica.

Prerequisiti:
Ricerca operativa, calcolo delle probabilità e statistica.

PROGRAM

Aims and contents:
The course aims to provide the student with basic skills to solve of problems of classification, with examples drawn by various application contexts, and problems of association. Besides, he will learn basic concepts for modeling cause-effect relationships,  and to use Data mining software systems.

Program details:
1) Introduction to Data Mining; 2) Preprocessing; 3) Supervised classification: Decision trees, Bayesian classifiers, ensemble methods; 4) Bayesian nets: basic theory, brief review of algorithms; 5) Non supervised classification: Clustering; 6) Association methods.

Learning outcomes:
The student will acquire specific skills which allow him/her to formulate and to solve  problems of classification and association and to build complex causal models. Furthermore, the students will be capable to use computational algorithms for Data Mining  and software systems for automatic knowledge extraction from structured data in specific domains, such as medicine, bioinformatics, business, e-commerce and computer security.

Prerequisites:
Operation research, probability and statistics.

Tipo esame:                 
Scritto e orale

Tipo valutazione:           
Voto finale

Examination:               
Written and oral

Evaluation Type:           
Final mark

Further readings
(C) Copyright 2016 - Dipartimento Informatica Sistemistica e Comunicazione - Viale Sarca, 336
20126 Milano - Edificio U14
redazioneweb@disco.unimib.it - last update of this page 11/11/2013