Inizio della pagina -
Logo DISCO
|
Visita la Versione ad elevata leggibilità
|
Vai al Contenuto della pagina
|
Vai alla Fine dei contenuti
|
Vai al Menu Principale
|
Vai alla Barra di navigazione (sei in)
|
Vai al Menu di navigazione (albero)
|
Vai alla Lista dei comandi
|
Vai alla Lista degli approfondimenti
|
Vai al Menu inferiore
|
Logo Ateneo
   
Didattica
Data and Text Mining

Codice ins.

Insegnamento

CFU ins.

Tipo ins.

Anno

Sem.

SSD ins.

Responsabile insegnamento

F1801Q105

Data and Text Mining

6

OBS

2

1

INF/01

STELLA Fabio

 

 

 

 

 

 

 

 

Contenuti:
Metodologie per l’analisi di dati strutturati, semi-strutturati e non strutturati. Modelli di classificazione, supervisionata e non supervisionata. Modelli grafico probabilistici, generativi e discriminativi, per l’analisi di dati testuali. Metodi di valutazione della performance previsiva dei modelli. Progettazione ed implementazione del ciclo di data e text mining. Ambienti software, dati e risorse computazionali.
Methodology for analyzing structured, semi-structured and un-structured data. Supervised and un-supervised classification models. Probabilistic graphical models, generative and discriminative, for analyzing text. Performance evaluation methods for supervised and un-supervised classification. Design and development of the data and text mining cycles.Software environments, dataand computational resources.

Obiettivi formativi:

Progettazione di studi di data e text mining. Progettazione ed implementazione di pipeline di data e text mining. Organizzazione e gestione di progetti di analisi dei dati. Utilizzo di risorse computazionali distribuite per il deployment di progetti di data e text mining. Redazione di report di analisi dei dati. Presentazione dei risultati di un progetto di data e text mining.
Design of data and text mining analysis projects.Design an implementation of data and text mining pipelines. Management of data analysis projects.Use of distributed computational resources for data and text mining projects deployment.Preparation of data analysis reports.Organization of data and text mining results for a data analysis project.

Prerequisiti:

Nessuno

Metodi didattici:
Materiale organizzato e realizzato per rendere autonomo lo studio da parte dello studente. Lezioni frontali (circa il 60% del corso) ed esercitazioni (40%) a calcolatore con ambienti software open source su problemi realistici in ambito medico, finanziario, pubblicitario, social networking, ...
Lectures and material are organized to enhance the student autonomy. Classroom lectures (about 60%) andhands on training (40%) withdifferent open source software environments on a set of realistic data analysis problems, including but not limited to medicine, finance, advertisment, social networking, …

Programma esteso:

  • Ciclo del data e text mining
  • Esplorazione dati
  • Classificatori probabilistici
  • Classificatori basati su vettori di supporto
  • Classificatori pigri
  • Classificatori basati su reti neurali
  • Valutazione dei classificatori
  • Metodi di clustering di partizionamento
  • Metodi di clustering gerarchici
  • Mappe autorganizzanti
  • Valutazione dei risultati del clustering
  • Regole di associazione
  • Algoritmo Apriori
  • Modelli probabilistici generativi
  • Text pre-processing
  • Ambienti software per data e text mining
  • Risorse; dati, informazioni, associazioni e capacità computazionale

 

  • Data and text mining cycle
  • Data exploration
  • Probabilistic classifiers
  • SVM
  • Lazy learners
  • ANNs
  • Performance measures and evaluation
  • Clustering, partitional and hierarchical
  • SOM
  • Performance of clustering
  • Association rules
  • Generative and discriminative probabilistic graphical models
  • Text pre-processing
  • Software environments for data and text mining
  • Resources; data, information

Testi di riferimento:
[1] Vercellis C., (2009) Business intelligence – Data Mining and Optimization for Decision Making, WILEY.
[2] Weiss SM., Indurkhya N, Zhang T., (2010), Fundamentals of Predictive Text Mining, SPRINGER
[3] Slide e materiale proprietario del docente.

Modalità di verifica dell'apprendimento:
Tipo esame:
Prova pratica

Tipo valutazione:
Voto finale

Approfondimenti

Google Translate
Translate to English Translate to French Translate to German Translate to Spanish Translate to Chinese Translate to Portuguese Translate to Arabic
Translate to Albanian Translate to Bulgarian Translate to Croatian Translate to Czech Translate to Danish Translate to Dutch Translate to Finnish Translate to Greek Translate to Hindi
Translate to Hungarian Translate to Irish Translate to Japanese Translate to Korean Translate to Norwegian Translate to Polish Translate to Romanian Translate to Russian Translate to Serbian
Translate to Slovenian Translate to Swedish Translate to Thai Translate to Turkish

(C) Copyright 2016 - Dipartimento Informatica Sistemistica e Comunicazione - Viale Sarca, 336
20126 Milano - Edificio U14
redazioneweb@disco.unimib.it - ultimo aggiornamento di questa pagina 27/09/2012