SCHEDA DELL'INSEGNAMENTO (SI)
SSD ING-INF/03
LAUREA MAGISTRALE IN INGEGNERIA DELLE TELECOMUNICAZIONI E DEI MEDIA DIGITAL
ANNO ACCADEMICO: 2022-2023
INFORMAZIONI GENERALI - DOCENTE
DOCENTE: LUISA VERDOLIVA
TELEFONO: 0817683929
EMAIL: Questo indirizzo email è protetto dagli spambots. È necessario abilitare JavaScript per vederlo.
INFORMAZIONI GENERALI - ATTIVITÀ
INSEGNAMENTO INTEGRATO (EVENTUALE):
MODULO (EVENTUALE):
CANALE (EVENTUALE):
ANNO DI CORSO (I, II, III): I-II
SEMESTRE (I, II): II
CFU: 9
(se previsti dall'Ordinamento del CdS)
...................................................................................................................................................
EVENTUALI PREREQUISITI
...................................................................................................................................................
OBIETTIVI FORMATIVI
Obiettivo dell’insegnamento è di fornire la conoscenza dei concetti di base e degli algoritmi per l’elaborazione di immagini digitali e presentare le principali tecniche per la codifica di immagini fisse e sequenze video, con particolare attenzione agli standard più comuni. Oltre a fornire gli strumenti matematici e concettuali per trattare analiticamente questi argomenti, il corso si propone di dare le conoscenze necessarie per sviluppare in Python i principali algoritmi per l’elaborazione delle immagini.
(Descrittori di Dublino)
Conoscenza e capacità di comprensione
Lo studente deve dimostrare di conoscere e saper comprendere gli strumenti metodologici per l’analisi e l’elaborazione delle immagini. Tali strumenti consentiranno agli studenti di risolvere problemi più complessi sia nel dominio dello spazio che nel dominio della frequenza.
Capacità di applicare conoscenza e comprensione
Lo studente deve dimostrare di saper ragionare sulle problematiche riguardo l’analisi e l’elaborazione di immagini e di saper scegliere la tecnica più adatta per la risoluzione di un problema pratico.
PROGRAMMA-SYLLABUS
Enhancement di immagini. Enhancement nel dominio spaziale. Trasformazioni basilari dell’intensità: operazioni puntuali lineari e non lineari. Equalizzazione dell’istogramma. Bit-plane slicing. Operazioni aritmetiche. Operazioni geometriche. Basi del filtraggio spaziale. Filtri di smoothing e di sharpening. Filtro mediano. Operazioni morfologiche. Enhancement nel dominio frequenziale. Trasformata di Fourier bidimensionale. DFT-2D. Esempi di filtro passa-basso e passa-alto. Filtraggio in frequenza: filtri ideali, filtri di Butterworth e filtri gaussiani.
Rappresentazione del colore. Cenni sul sistema visivo umano. Coni e bastoncelli. Sensibilità relativa dei coni di tipo S, M e L. Teoria tricromatica dei colori. Color matching. Gli spazi di colore (RGB, HSI). Pigmenti: colorazione sottrattiva, sistemi di stampa CMY, CMYK (quadricromia).
Segmentazione. Tecniche edge based. Point detection e line detection. Gradienti di Roberts, Prewitt e Sobel. Thresholding del gradiente. Zero-crossing del Laplaciano. Canny edge detector. Tecniche class-based. Algoritmo K-means.
Compressione di immagini. Codifica di sorgente. Generalità sulla compressione dati. La quantizzazione. Quantizzazione uniforme e non uniforme. Codifica predittiva. Schema del codificatore e decodificatore. Quantizzazione predittiva. Codifica mediante trasformata. Compattazione dell'energia e allocazione ottima delle risorse. Le trasformate lineari. Trasformata di Karhunen-Loéve e sue proprietà. Trasformata coseno discreta. Lo standard JPEG.
Codifica video. Generalità sul segnale video. Compressione spaziale e temporale. Conditional replenishment e compensazione del movimento. Il codificatore ibrido. Cenni allo standard MPEG-1 e MPEG-2. La scalabilità in risoluzione e in frame-rate
Trasformata Wavelet. Localizzazione tempo-frequenza. Wavelet continua (CWT). Mother Wavelet. Analisi multirisoluzione, funzione di scaling. Equazioni MRA. Estensione al caso bidimensionale. Implementazione della trasformata wavelet discreta (DWT). Banco di filtri di analisi e sintesi. Codifica mediante Wavelet. Algoritmo EZW.
Applicazioni. Esempi di applicazioni avanzate per l’elaborazione di immagini: denoising, super-risoluzione, riconoscimento di volti o oggetti, classificazione mediante descrittori locali, segmentazione semantica, riconoscimento di manipolazioni nelle immagini e nei video anche con tecniche basate sull’apprendimento (cenni alle reti neurali convoluzionali).
MATERIALE DIDATTICO
Libri di testo consigliati:
• R.C.Gonzalez, R.E.Woods: “Digital image processing”, 3nd edition, Prentice Hall, 2008.
• A.Bovik: “The essential guide to image processing”, Academic Press, 2009.
• K.Sayood: “Introduction to data compression”, 2nd edition, Morgan Kaufmann, 2000.
Appunti del corso di Elaborazione di Segnali Multimediali: http://wpage.unina.it/verdoliv/esm/
MODALITÀ DI SVOLGIMENTO DELL'INSEGNAMENTO
La didattica è erogata: a) per circa il 70% con lezioni frontali; b) per circa il 30% con esercitazioni guidate in laboratorio per lo sviluppo di applicazioni software in Python per comprendere al meglio le tecniche studiate.
Gli argomenti delle lezioni frontali e delle esercitazioni sono esposti con l’ausilio di lavagne elettroniche e/o trasparenze dettagliate, messe a disposizione dello studente nel materiale didattico tramite il sito web ufficiale del docente. E’ anche prevista la registrazione delle lezioni.
VERIFICA DI APPRENDIMENTO E CRITERI DI VALUTAZIONE
a) Modalità di esame:
L'esame si articola in prova: | |
Scritta e orale | |
Solo scritta o intercorso a metà | |
Solo orale | |
Discussione di elaborato progettuale | |
Altro |
In caso di prova scritta i quesiti sono (*): | |
A risposta multipla | |
A risposta libera | |
Esercizi numerici |
L’esame si articola in una prova scritta e una orale. La prova scritta, che consiste di tre algoritmi da sviluppare in Python al calcolatore, può essere sostituita dallo sviluppo di un progetto pratico in Python su un’applicazione avanzata di elaborazione di immagini. La prova orale consiste in due domande su problemi/algoritmi esposti al corso.