21810762 - BIG DATA AND MACHINE LEARNING

Il corso intende fornire alle studentesse e agli studenti le conoscenze metodologiche e applicative necessarie per risolvere problemi relativi all’apprendimento automatico e analizzare insiemi di dati potenzialmente grandi.

Le studentesse e gli studenti acquisiscono capacità teoriche e pratiche che consentono loro di utilizzare e sviluppare strumenti di machine-learning per analizzare dati di grandi dimensioni.

scheda docente | materiale didattico

Programma

Caratteristiche dei big data - Modelli di programmazione per i big data: Hadoop MapReduce e Apache Spark - Algoritmi di machine learning – Apache Spark con R: sparklyr, dplyr, ggplot2.

Testi Adottati

Slides fornite dal docente

Jared Dean. Big Data, Data Mining, and Machine Learning: Value Creation for Business Leaders and Practitioners, 2014, Wiley.

Materiale supplementare (software e dati) sarà pubblicato sulla pagina web del docente.

Bibliografia Di Riferimento

Ankam, Venkat. Big data analytics. Packt Publishing Ltd, 2016. Dietrich D.. Data Science and Big Data Analytics: Discovering, Analyzing, Visualizing and Presenting Data. Wiley, 2015.

Modalità Erogazione

L'insegnamento consta di 36 ore (6 cfu) di didattica frontale (senza obbligo di frequenza) suddivise tra lezioni teoriche ed esercitazioni.

Modalità Frequenza

Non è necessaria ma fortemente consigliata la frequenza.

Modalità Valutazione

Ill raggiungimento degli obiettivi dell’insegnamento è certificato mediante il superamento di un esame con valutazione in trentesimi. L’esame prevede una prova orale che valutata in trentesimi e si intende superata con un voto minimo di 18/30. La prova orale, della durata di 25 minuti circa, consiste in un colloquio, con domande e discussione sui contenuti teorici e metodologici indicati nel programma. Si valuteranno in particolar modo la capacità di applicare correttamente i metodi trattati, il rigore e la capacità espositiva.