Esercitazioni/attività di laboratorio possono anche venire anche supportate dal prof. Marco Dalai, e dal Dott. Alessandro Gnutti (marco.dalai@unibs.it, alessandro.gnutti@unibs.it)
PROGRAMMA ESTESO
Introduzione: Differenza tra sistema di comunicazione classico / sistema di comunicazione multimediale. Sistemi di acquisizione / Video progressivo e video interallacciato / Rappresentazione tricromatica delle immagini. Formati di immagini numeriche / Formati video numerici. Formati di segnali audio: musicale/parlato.
Principi di compressione e descrizione di segnali multimediali: Riduzione di ridondanza. Irrilevanza della quantizzazione (percettiva/del supporto di riproduzione). Rate versus Distortion.
Modelli percettivi: fisiologia del sistema visivo umano, psicovisione, percezione e modellizzazione del colore. Sistema uditivo umano.
Analisi di Fourier per segnali multidimensionali: Spettro di un segnale multidimensionale. Esempio: spettro di una sinusoide 2D. Proprietà della Trasformata di Fourier multidimensionale. Rappresentazione dello spettro di un segnale dopo cambio del sistema di riferimento. Riferimento con shear, quincunx, riscalatura rettangolare, riferimento esagonale, rotazione del sistema di riferimento. Trasformata di Fourier su Grafi.
Campionamento di segnali multimediali: Campionamento con reticoli cartesiani: spettro del segnale campionato. Condizione di assenza di aliasing. Campionamento con reticoli qualsiasi. Spettro del segnale campionato. Condizione di assenza di aliasing. Campionamento di immagini su reticoli quincunx, esagonali, shear. Campionamento di segnali video progressivi / di segnali video interallacciati. Campionamento shear nell'inseguimento di oggetti in movimento...
Filtraggio di sequenze multidimensionali: Filtraggio di tipo IIR. Funzione di trasferimento multidimensionale... Trasformata Z multidimensionale: Definizione, Regioni di Convergenza, Proprietà. Condizione di stabilità di un filtro IIR multidimensionale.
Metodi predittivi: Modelli AR di ordine 1. Autocorrelazione e densità spettrale del processo AR. Modelli mono- e multidimensionali...Modelli AR di ordine superiore; predizione lineare; predittori ottimi: equazione di Wiener-Hopf (casi separabile e non). Applicazione alla codifica predittiva di immagini e sequenze di immagini. Metodi con predizione a moto-compensazione.
Metodi trasformati: Trasformazioni lineari a blocchi monodimensionali e multidimensionali. Trasformata di Karhunen-Loeve. Trasformata DCT. Quantizzazione e codifica entropica. Scansione a zigzag.
Metodi di codifica basati su scomposizione mediante banchi di filtri: Trasformate LOT. Formule di decimazione/interpolazione numerica per segnali multidimensionali su reticoli rettangolari. Filtraggio in sotto-bande mono-, multi-dimensionali. Trasformata wavelet mono- e multidimensionali. Principi di codifica dei segnali filtrati in sottobande. Algoritmi di compressione Zerotree e SPIHT.
Quantizzazione vettoriale: Principio di codifica/decodifica. Quantizzazione vettoriale: Llyod Max Quantizer. Quantizzazione vettoriale: Quantizzatori TVQ, LVQ.
Codifica frattale di segnali. Trasformate Contrattive. Iterated Function Systems. Mosaic Theorem. Metodi di codifica basati su rappresentazioni ad oggetto: contorni-tessiture, testa-spalle, SNHC, codifica tramite animazione facciale.
Introduzioni agli standard di codifica audio, immagini, video: Famiglie ISO/JPEG. Famiglie ISO/MPEG + ITU/H.26x
Metodologie di descrizione di informazione visiva: descrittori e sistemi di descrizione, feature SIFT.