Vinaora Nivo Slider 3.xVinaora Nivo Slider 3.xVinaora Nivo Slider 3.xVinaora Nivo Slider 3.xVinaora Nivo Slider 3.xVinaora Nivo Slider 3.x

BIG DATA ENGINEERING

SCHEDA DELL'INSEGNAMENTO (SI)
SSD ING-INF/05

 

LAUREA MAGISTRALE IN INGEGNERIA INFORMATICA

ANNO ACCADEMICO: 2022-2023

 

INFORMAZIONI GENERALI - DOCENTE

DOCENTE: VINCENZO MOSCATO
TELEFONO: 0817683835
EMAIL: Questo indirizzo email è protetto dagli spambots. È necessario abilitare JavaScript per vederlo.

 

INFORMAZIONI GENERALI - ATTIVITÀ

INSEGNAMENTO INTEGRATO (EVENTUALE): 
MODULO (EVENTUALE):
CANALE (EVENTUALE):
ANNO DI CORSO (I, II, III): II
SEMESTRE (I, II): II
CFU: 6

 

INSEGNAMENTI PROPEDEUTICI

(se previsti dall'Ordinamento del CdS)

...................................................................................................................................................

 

EVENTUALI PREREQUISITI

...................................................................................................................................................

 

OBIETTIVI FORMATIVI

Scopo dell’insegnamento è quello di fornire in forma specialistica le caratteristiche peculiari delle Architetture per il Big Data Processing e la Big Data Analytics, con riferimento alla progettazione di sistemi per la gestione dati di grandi dimensioni e complessi, e all’implementazione dei processi di modellizzazione, acquisizione, condivisione, analisi e visualizzazione delle informazioni presenti nei Big Data. In particolare, verranno approfonditi le tecnologie, i framework ed i tool più diffusi per la memorizzazione, elaborazione ed analisi dei Big Data, fornendo allo studente tutte le conoscenze necessarie sia allo sviluppo di applicazioni pratiche per l’applicazione dei Big Data alla cosiddetta XInformatics, sia alla comprensione e gestione delle relative infrastrutture tecnologiche. Verranno infine trattate le problematiche ingegneristiche relative alla realizzazione di analytics su massive dataset sia per applicazioni batch sia real-time, con riferimento a quelle che sono le applicazioni emergenti dei Big Data (es. Social Network Analysis, Cyber-Security, Smart Cities, etc.).

 

RISULTATI DI APPRENDIMENTO ATTESI

(Descrittori di Dublino)

Conoscenza e capacità di comprensione
Il percorso formativo intende fornire agli studenti le conoscenze specialistiche e tutti gli strumenti metodologici e tecnologici per la gestione di Big Data, con particolare riferimento alle caratteristiche delle moderne architetture informatiche per il Big Data Processing e la Big Data Analitycs. In particolare, tali strumenti consentiranno agli studenti, a seconda del tipo di applicazione, da un lato, di sapere definire quelli che sono i processi più adeguati di modellizzazione, acquisizione, condivisione, analisi e visualizzazione delle informazioni relative ai Big Data, dall’altro di individuare i requisiti hardware e software dei sistemi informatici di supporto.


Capacità di applicare conoscenza e comprensione
Il percorso formativo è orientato a trasmettere le capacità e gli strumenti metodologici ed operativi necessari ad applicare concretamente le conoscenze relative alla gestione di Big Data in contesi applicativi reali. In particolare, lo studente deve dimostrare di essere in grado di progettare e implementare in forma prototipale, sfruttando i framework tecnologici ed i tool esistenti, sistemi per il Big Data Processing e la Big Data Analitycs in grado di supportare differenti applicazioni sia batch sia real-time.

 

PROGRAMMA-SYLLABUS

1. Introduzione ai Big Data: Definizione e caratteristiche di un Sistema Big Data.
2. L’ecosistema Hadoop: HDFS, Hadoop, Yarn.
3. Analisi di Big Data: Pig, Hive, Giraph, Spark, GraphX. MLib.
4. Basi di Dati NoSQL: Key-value - Column-family, Graph, Document Database systems. Proprietà BASE vs transazioni. Teorema CAP. Cenni alle Basi di Dati NewSQL.
5. Big Data Analytics (BDA): BDA Lifecycle: knowledge discovery in database, data preparation, model planning, model building, data visualization.
6. Analisi real-time di Big Data: Architetture Lambda e Kappa, Apache Flume, Apache Kafka, Spark Streaming.
7. Applicazioni emergenti dei Big Data: Social Network Analysis, Cyber-Security, Smart-Cities.
8. Servizi Cloud per Big Data: AWS, Microsoft Azure.

 

MATERIALE DIDATTICO

- Appunti del docente, Lucidi, Articoli scientifici.
- Manuali dei vari tools presentati.
- Libri di testo consigliati:
o "Big Data: Architettura, tecnologie e metodi per l’utilizzo di grandi basi di dati”,
o A. Rezzani, APOGEO, 2013. “Business intelligence. Modelli matematici e sistemi per le decisioni”,
o C. Vercelli, MacGraw-Hill Companies,2006 “Mining of Massive Datasets”, J. Leskovec, A. Rajarman, J.D.Ullman, 2014 (on line book)

 

MODALITÀ DI SVOLGIMENTO DELL'INSEGNAMENTO

Il docente utilizzerà lezioni frontali per circa il 60% delle ore totali, ed in aggiunta esercitazioni al calcolatore, sia assistite sia personali, per approfondire praticamente gli aspetti teorici ed i tool (software specialistico) introdotti, e seminari di approfondimento per le rimanenti ore. Il tutto sarà supportato da materiale didattico multimediale disponibile on-line.

 

VERIFICA DI APPRENDIMENTO E CRITERI DI VALUTAZIONE

a) Modalità di esame:

L'esame si articola in prova:
 Scritta e orale  
 Solo scritta   
 Solo orale  
 Discussione di elaborato progettuale 
 Altro  

 

In caso di prova scritta i quesiti sono (*):
 A risposta multipla  
 A risposta libera   
 Esercizi numerici  

  

Ogni studente dovrà sviluppare durante il corso 2 Homeworks, in aggiunta all’elaborato progettuale finale, comprendenti l’uso delle tecniche e de tools presentati.

b) Modalità di valutazione:
Durante la discussione dell’elaborato progettuale saranno richiesti approfondimenti teorici relativi a parti dell’elaborato stesso, ed il tutto concorrerà alla valutazione finale.

 

Utilizziamo i cookie sul nostro sito Web. Alcuni di essi sono essenziali per il funzionamento del sito, mentre altri ci aiutano a migliorare questo sito e l'esperienza dell'utente (cookie di tracciamento). Puoi decidere tu stesso se consentire o meno i cookie. Ti preghiamo di notare che se li rifiuti, potresti non essere in grado di utilizzare tutte le funzionalità del sito.