21810366 - BIG DATA AND MACHINE LEARNING

Il corso intende fornire allo studente le conoscenze metodologiche e applicative necessarie per risolvere problemi relativi all’apprendimento automatico e analizzare insiemi di dati potenzialmente grandi.
Lo studente acquisisce capacità teoriche e pratiche che gli consentono di utilizzare e sviluppare strumenti di machine-learning per analizzare dati di grandi dimensioni.

scheda docente | materiale didattico

Programma

Caratteristiche dei big data – Approcci MapReduce: Hadoop, Spark e google MapReduce – Approcci di tipo: subsampling, divide and conquer e online updating - Inferenza statistica e big data – Algoritmi di machine learning – modelli statistici per big data

Testi Adottati


Slides fornite dal docente

Jared Dean. Big Data, Data Mining, and Machine Learning: Value Creation for Business Leaders and Practitioners, 2014, Wiley.

Materiale supplementare (software e dati) sarà pubblicato sulla pagina web del docente.

Bibliografia Di Riferimento

Ankam, Venkat. Big data analytics. Packt Publishing Ltd, 2016. Dietrich D.. Data Science and Big Data Analytics: Discovering, Analyzing, Visualizing and Presenting Data. Wiley, 2015.

Modalità Erogazione

L'insegnamento consta di 36 ore (6 cfu) di didattica frontale (senza obbligo di frequenza) suddivise tra lezioni teoriche ed esercitazioni.

Modalità Valutazione

Ill raggiungimento degli obiettivi dell’insegnamento è certificato mediante il superamento di un esame con valutazione in trentesimi. L’esame prevede una prova orale che valutata in trentesimi e si intende superata con un voto minimo di 18/30. La prova orale, della durata di 25 minuti circa, consiste in un colloquio, con domande e discussione sui contenuti teorici e metodologici indicati nel programma. Si valuteranno in particolar modo la capacità di applicare correttamente i metodi trattati, il rigore e la capacità espositiva.