Doc. B Padova

Transcript

Doc. B Padova
MINISTERO DELL'ISTRUZIONE DELL'UNIVERSITÀ E DELLA RICERCA
DIREZIONE GENERALE DELLA RICERCA
PROGRAMMI DI RICERCA SCIENTIFICA DI RILEVANTE INTERESSE NAZIONALE
RICHIESTA DI COFINANZIAMENTO (DM n. 1407 del 4 dicembre 2008)
PROGETTO DI UNITÀ DI RICERCA - MODELLO B
Anno 2008 - prot. 2008C59JNA_002
1 - Area Scientifico-disciplinare
09: Ingegneria industriale e dell'informazione 100%
2 - Coordinatore Scientifico
OLMO
GABRIELLA
Professore Associato confermato
Politecnico di TORINO
Facoltà di INGEGNERIA III
Dipartimento di ELETTRONICA
3 - Responsabile dell'Unità di Ricerca
CALVAGNO
GIANCARLO
Professore Associato confermato
03/05/1962
CLVGCR62E03L736D
049 827 7699
(Numero fax)
[email protected]
Università degli Studi di PADOVA
Dipartimento di INGEGNERIA DELL'INFORMAZIONE
049 827 7731
(Prefisso e telefono)
4 - Curriculum scientifico
Testo italiano
Giancarlo Calvagno è nato a Venezia nel 1962. Ha conseguito la Laurea in Ingegneria Elettronica presso l'Università di Padova nel 1986, e il titolo di Dottore di
Ricerca in Ingegneria Elettronica e dell'Informazione nel 1990. Dal 1988 al 1990 è stato presso il Coordinated Science Laboratory of the University of Illinois at
Urbana-Champaign come "Visiting Scholar". Dal 1990 al 1998 ha svolto la propria attività presso il Dipartimento di Ingegneria dell'Informazione dell'Università di
Padova come Ricercatore. Dal 1998 è Professore Associato presso lo stesso Dipartimento, dove attualmente insegna i corsi di "Segnali e Sistemi" e "Teoria dei
Segnali".
Ha partecipato a mumerosi progetti di ricerca nazionali del MiUR e del CRN riguardanti la codifica e l'elaborazione di immagini e sequenze video.
Ultimamente ha partecipato al progetto PRIN 2005 "Trasmissione multimediale affidabile su reti non affidabili: tecniche evolute di codifica sorgente/canale" in cui
ha svolto il ruolo di responsabile scientifico locale dell'unità di ricerca di Padova.
Ha partecipato al progetto di ricerca FIRB del MiUR "Piattaforme riconfigurabili per comunicazioni radiomobili a larga banda - PRIMO", in cui ha rivestito il ruolo
di responsabile per l'Unità di Ricerca dell'Università di Padova del Work Package "Reliable delivery of multimedia data".
E' stato responsabile scientifico del Progetto di Ricerca biennale di Ateneo "Codifica congiunta sorgente canale basata su turbocodici e sue applicazioni alla
trasmissione robusta di immagini e video" finanziato dall'Università di Padova nel 2005.
Ha partecipato ai progetti di ricerca europei IST-1999-20859 "MetaVision" e IST-2004-506969 "MetaCamera" in cui si è occupato di problemi di compressione
lossless e near-lossless di segnali video ad alta definizione.
E' membro di IEEE dal 1992.
Ha svolto e svolge attività di revisore per le riviste:
- IEE Electronics Letters;
- IEE Proceedings: Vision, Image and Signal Processing;
- IEEE Journal on Selected Areas in Communications;
- IEEE Signal Processing Letters;
- IEEE Transactions on Circuits and Systems, Part II;
- IEEE Transactions on Circuits and Systems for Video Technology;
- IEEE Transactions on Image Processing;
- IEEE Transactions on Signal Processing;
- International Journal of Imaging Systems and Technology;
- Optical Engineering;
MIUR - BANDO 2008 - MODELLO B
-1-
Ministero dell'Istruzione dell'Università e della Ricerca
- Signal Processing (Elsevier);
- Signal, Image and Video Processing (Springer).
Ha fatto parte del "Technical Program Committee" di IEEE International Conference on Image Processing (ICIP).
I suoi principali interessi di ricerca si inquadrano nell'area generale della elaborazione dei segnali sia a tempo continuo che a tempo discreto e della analisi e
codifica dei segnali multidimensionali, con particolare riferimento ai sistemi di trasmissione di immagini e sequenze di immagini.
Nello specifico, i temi affrontati sono i seguenti:
- progetto di filtri FIR, IIR, e a minimo rumore di calcolo mono e multidimensionali;
- interpolazione di segnali a banda limitata a partire da campioni non uniformemente distribuiti;
- codifica di immagini e sequenze di immagini sia lossless che lossy;
- modelli statistici per i coefficienti di scomposizioni in sottobande;
- progetto di banchi di filtri di ricostruzione ottimi per sistemi di codifica a sottobande;
- progetto di algoritmi di demosaicking per immagini a colori acquisite mediante color filter array;
- sviluppo di techniche di trasmissione video robusta su reti non affidabili.
Testo inglese
Giancarlo Calvagno was born in Venezia, Italy, in 1962. He received the "Laurea in Ingegneria Elettronica" degree from the University of Padova in 1986, and the
Doctorate degree in "Ingegneria Elettronica e dell'Informazione" from the University of Padova in 1990. From 1988 to 1990 he was at the Coordinated Science
Laboratory of the University of Illinois at Urbana-Champaign as a Visiting Scholar. From 1990 to 1998 he was with the Dipartimento di Ingegneria
dell'Informazione of the University of Padova as a "Ricercatore". Since 1998 he has been an Associate Professor in the same Department were he presently teaches
the courses "Signals and Systems" and "Signal Theory".
He contributed to many research programs funded by MiUR and CNR concerning the coding and processing of still images and video sequences.
Recently he participated to the PRIN 2005 research program "Reliable multimedia transmission over non-reliable networks: advanced source/channel coding
techniques", where he was associated investigator of the research unit of the University of Padova.
He participated to the FIRB research program "Reconfigurable platforms for wideband wireless communications - PRIMO" funded by MiUR, where he was
coordinator of the Work Package "Reliable delivery of multimedia data" for the research unit of the University of Padova.
He was principal investigator of the two-year research program "Joint source/channel coding based on turbocodes and its application to robust transmission of
images and video sequences" funded by the University of Padova in 2005.
He has been involved in the European research projects IST-1999-20859 "MetaVision" and IST-2004-506969 "MetaCamera", where he worked on lossless and
near-lossless compression of high-definition video sequences.
He is member of the IEEE since 1992.
He is reviewer for the following journals:
- IEE Electronics Letters;
- IEE Proceedings: Vision, Image and Signal Processing;
- IEEE Journal on Selected Areas in Communications;
- IEEE Signal Processing Letters;
- IEEE Transactions on Circuits and Systems, Part II;
- IEEE Transactions on Circuits and Systems for Video Technology;
- IEEE Transactions on Image Processing;
- IEEE Transactions on Signal Processing;
- International Journal of Imaging Systems and Technology;
- Optical Engineering;
- Signal Processing (Elsevier);
- Signal, Image and Video Processing (Springer).
He was in the "Technical Program Committee" of the IEEE International Conference on Image Processing (ICIP).
His main research interests are in the areas of digital signal processing, signal reconstruction, and multidimensional signal analysis and coding, with special
emphasis on the transmission of images and video sequences.
In particular, he carried out research in the following topics:
- design of mono- and multidimensional FIR, IIR, and minimum noise filters;
- interpolation of bandlimited signals from nonuniformly spaced samples;
- lossless and lossy coding of images and video sequences;
- statistical models of subband coefficients;
- optimal filterbank design for subband coding systems;
- demosaicking of color images;
- robust video transmission over unreliable networks.
5 - Pubblicazioni scientifiche più significative del Responsabile dell'Unità di Ricerca
1. ANDRIANI S, CALVAGNO G. (2008). Lossless Compression of Color Sequences Using Optimal Linear Prediction Theory. IEEE
TRANSACTIONS ON IMAGE PROCESSING, vol. 17; p. 2102-2111, ISSN: 1057-7149
2. MENON D, CALVAGNO G. (2008). A Regularization Approach to Demosaicking. In: SPIE Proc. Visual Communications and Image Processing
(VCIP2008). San Jose, CA, Jan. 28-31, 2008
3. MENON D, ANDRIANI S, CALVAGNO G. (2007). Demosaicing with directional filtering and a posteriori decision. IEEE TRANSACTIONS ON
IMAGE PROCESSING, vol. 16; p. 132-141, ISSN: 1057-7149
4. ANDRIANI S, CALVAGNO G. (2007). Lossless Compression of Colour Video Sequence using Optimal Prediction Theory - Octopus. In: 2007
Data Compression Conference (DCC 2007). Snowbird, Utah, March 27-29, 2007, p. 375
5. MENON D, CALVAGNO G. (2007). Demosaicing Based on Wavelet analysis of the Luminance Component. In: 2007 International Conference
on Image Processing (ICIP 2007). San Antonio, Texas, September 16-19, 2007
6. MILANI S, CALVAGNO G. (2007). A Distributed Video Coder Based on the H.264/AVC Standard. In: XV European Signal Processing
Conference (EUSIPCO 2007). Poznan, Poland, September 3-7, 2007
7. ANDRIANI S, CALVAGNO G., MENON D (2006). Lossless Compression of Bayer Mask Images Using An Optimal Vector Prediction Technique.
In: XIV European Signal Processing Conference (EUSIPCO 2006). Firenze, Italy, September 4-8, 2006
8. CAMPANA O, CATTANI A, DE GIUSTI A, MILANI S, ZANDONA' N, CALVAGNO G. (2006). Multiple Description Coding Schemes for the
H.264/AVC Coder. In: International Conference on Wireless Reconfigurable Terminals and Platforms (WiRTeP). Rome, Italy, April 10-12, 2006,
p. 217-221
9. MENON D, ANDRIANI S, CALVAGNO G. (2006). A Novel Technique For Reducing Demosaicing Artifacts. In: XIV European Signal Processing
MIUR - BANDO 2008 - MODELLO B
-2-
Ministero dell'Istruzione dell'Università e della Ricerca
Conference (EUSIPCO 2006). Firenze, Italy, September 4--8, 2006
10. ANDRIANI S., CALVAGNO G., MIAN G.A. (2005). Lossless Image Compression Using Vector Prediction Based on Spectral Correlation. In:
2005 International Conference on Image Processing (ICIP 2005), September 11-14
11. ANDRIANI S., CALVAGNO G., MIAN G.A. (2005). Lossless Video Compression using a Spatio-Temporal Optimal Predictor. In: XIII European
Signal Processing Conference (EUSIPCO 2005), September 4-8
12. MENON D., ANDRIANI S., CALVAGNO G., ERSEGHE T. (2005). On the Dependency Between Compression and Demosaicing in Digital
Cinema. In: 2nd IEE European Conference on Visual Media Production (CVMP2005), November 30-December 1, p. 104-111
13. CALVAGNO G., FANTOZZI F, RINALDO R, VIAREGGIO A (2004). Model-based global and local motion estimation for videoconference
sequences. IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, vol. 14; p. 1156-1161, ISSN: 1051-8215
14. ANDRIANI A., CALVAGNO G., ERSEGHE T., MIAN G.A., DURIGON M., RINALDO R., KNEE M., WALLAND P., KOPPETS M. (2004).
Comparison of Lossy to Lossless Compression techniques for Digital Cinema. In: 2004 International Conference on Image Processing (ICIP
2004), October 24-27
15. ANDRIANI S., CALVAGNO G., MIAN G.A. (2004). A Lossles Image Coding Technique Exploiting Spectral Correlation on the RBG Space. In:
XII European Signal Processing Conference (EUSIPCO 2004), September 6-10
16. BRUNELLO D, CALVAGNO G., MIAN GA, RINALDO R (2003). Lossless compression of video using temporal information. IEEE
TRANSACTIONS ON IMAGE PROCESSING, vol. 12; p. 132-139, ISSN: 1057-7149
17. BRUNELLO D., CALVAGNO G., DURIGON M., RINALDO R. (2003). Optimal Weighted 3D Prediction for Lossless Video Coding. In: 2003
IEEE-EURASIP Workshop on Nonlinear Signal and Image Processing (NSIP 2003), June 8-11, p. 250-254
18. BRUNELLO D., CALVAGNO G., MIAN G.A., RINALDO R. (2002). Lossless Video Coding Using Optimal 3D Prediction. In: 2002 IEEE
International Conference on Image Processing (ICIP 2002), September 22-25, p. 89-92
19. CALVAGNO G., MIAN GA, RINALDO R, TRABUCCO W (2001). Two-dimensional separable filters for optimal reconstruction of JPEG-coded
images. IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, vol. 11; p. 777-787, ISSN: 1051-8215
20. CALVAGNO G., FANTOZZI F., RINALDO R. (2001). Feature based global and local motion estimation for videoconference sequences. In: 2001
IEEE International Conference on Image Processing (ICIP 2001), October 7-10, p. 102-105
21. CALVAGNO G., MIAN G.A., RINALDO R. (2001). JPEG Decoding via Two-Dimensional Optimal Separable Filters. In: 2001 IEEE
International Conference on Image Processing (ICIP 2001), October 7-10, p. 451-454
22. BOLOGNA G, CALVAGNO G., MIAN GA, RINALDO R (2000). Wavelet packets and spatial adaptive intraband coding of images. SIGNAL
PROCESSING-IMAGE COMMUNICATION, vol. 15; p. 891-906, ISSN: 0923-5965
23. CALVAGNO G., MIAN GA, RINALDO R (2000). Synthesis filter bank optimization in two-dimensional separable subband coding systems. IEEE
TRANSACTIONS ON IMAGE PROCESSING, vol. 9; p. 1497-1508, ISSN: 1057-7149
24. CALVAGNO G., MIAN G.A., RINALDO R. (2000). 3D Motion Estimation for Frame Interpolation and Video Coding. In: 10th International
Workshop pn Packet Video (PV2000), May 1-2, p. 1-10
25. CALVAGNO G., RINALDO R, SBAIZ L (1998). Three-dimensional motion estimation of objects for video coding. IEEE JOURNAL ON
SELECTED AREAS IN COMMUNICATIONS, vol. 16; p. 86-97, ISSN: 0733-8716
26. CALVAGNO G., GHIRARDI C, MIAN GA, RINALDO R (1997). Modeling of subband image data for buffer control. IEEE TRANSACTIONS ON
CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, vol. 7; p. 402-408, ISSN: 1051-8215
27. CALVAGNO G., RINALDO R (1997). Multiresolution vector quantization for video coding. MULTIDIMENSIONAL SYSTEMS AND SIGNAL
PROCESSING, vol. 8; p. 129-150, ISSN: 0923-6082
28. RINALDO R, CALVAGNO G. (1997). Hybrid vector quantization for multiresolution image coding. IEEE TRANSACTIONS ON IMAGE
PROCESSING, vol. 6; p. 753-758, ISSN: 1057-7149
29. CALVAGNO G., MIAN GA, RINALDO R (1996). Computation of the coding gain for subband coders. IEEE TRANSACTIONS ON
COMMUNICATIONS, vol. 44; p. 475-487, ISSN: 0090-6778
30. RINALDO R, CALVAGNO G. (1995). IMAGE-CODING BY BLOCK PREDICTION OF MULTIRESOLUTION SUBIMAGES. IEEE
TRANSACTIONS ON IMAGE PROCESSING, vol. 4; p. 909-920, ISSN: 1057-7149
6 - Elenco dei partecipanti all'Unità di Ricerca
6.1 - Componenti
Componenti della sede dell'Unità di Ricerca
nº Cognome
Nome
Università/Ente
Qualifica
Disponibilità
temporale
indicativa
prevista
1°
anno
1.
CALVAGNO
Giancarlo
Università degli Studi di PADOVA
TOTALE
Professore Associato confermato
2°
anno
6
6
6
6
Componenti di altre Università / Enti vigilati
Nessuno
MIUR - BANDO 2008 - MODELLO B
-3-
Ministero dell'Istruzione dell'Università e della Ricerca
Titolari di assegni di ricerca
nº Cognome
Nome
Università/Ente
Disponibilità
temporale
indicativa
prevista
1°
anno
2°
anno
1.
CAPPELLARI
Lorenzo
Università degli Studi di PADOVA
6
6
2.
MILANI
Simone
Università degli Studi di PADOVA
6
6
12
12
TOTALE
Titolari di borse
Nessuno
6.1 bis Vice-responsabile
6.2 - Altro personale
Nessuno
6.3 - Personale a contratto da destinare a questo specifico Progetto
nº Tipologia di contratto
1. Assegnista
TOTALE
Costo
previsto
Disponibilità Note
temporale
indicativa
prevista
1° anno 2° anno
40.000
11
11 Assegno di ricerca per dottore di ricerca o laureato con specifiche
competenze su tecniche di codifica video
40.000
11
11
6.4 - Dottorati a carico del PRIN da destinare a questo specifico Progetto
Nessuno
7 - Titolo specifico del Progetto svolto dall'Unità di Ricerca
Testo italiano
Tecniche di codifica scalabile e robusta per trasmissione video su reti peer-to-peer
Testo inglese
Scalable and robust coding techniques for video streaming over peer-to-peer networks
8 - Abstract del Progetto svolto dall'Unità di Ricerca
Testo italiano
Al giorno d'oggi, le tecniche di codifica audio-video sono mature a tal punto che utenti dotati di accesso ad Internet a larga banda hanno la possibilità di scaricare
flussi audio-video a qualità più che soddisfacente durante la loro navigazione. Con la diffusione di massa dell'accesso ad Internet ad alta velocità, la domanda
relativa a servizi di streaming di contenuti audio-video sta perciò crescendo vertiginosamente e gli utenti stessi si stanno trasformando in fornitori. Dato che il
paradigma Peer-to-Peer (P2P) viene ormai utilizzato con successo in risposta a simili domande per il semplice scambio di file, l'estensione di tale concetto allo
streaming video basato sull'Internet Protocol (IP) appare estremamente stimolante.
Data la notevole sensibilità alle perdite di pacchetto, nessuno degli attuali standard di codifica video è però adatto alla trasmissione su IP. Inoltre, è possibile che gli
utenti della rete dispongano di dispositivi eterogenei, ai quali tali standard non sono in grado di adattarsi facilmente. Per queste ragioni la ricerca attuale,
riguardante lo Scalable Video Coding (SVC), la Multiple Description Coding (MDC) ed i codici Forward Error Correction (FEC), persegue anche altri obiettivi oltre
MIUR - BANDO 2008 - MODELLO B
-4-
Ministero dell'Istruzione dell'Università e della Ricerca
all'efficienza di compressione.
Con la codifica SVC si vuole dare un'unica rappresentazione compressa di un segnale dalla quale poter ottenere diversi bitstream che consentano la ricostruzione del
segnale a diverse risoluzioni spazio-temporali e diversi rapporti segnale-rumore. In questo modo è possibile non solo adattarsi alla diversità dei dispositivi, ma anche
contrastare la perdita dei pacchetti. Mentre il primo standard SVC, H.264/AVC Annex G (H.264/SVC), è basato sulla trasformazione DCT a blocchi, si stanno
esplorando anche approcci basati su wavelet, che offrono intrinsecamente il grado desiderato di adattabilità.
Nelle tecniche MDC uno stesso segnale viene codificato in flussi differenti (descrizioni), correlati fra loro. Così, nel caso in cui si riceva una sola descrizione, dalla
quale le altre sono stimate, è possibile una ricostruzione a bassa qualità, mentre la qualità aumenta all'aumentare del numero di descrizioni ricevute.
I codici FEC sono invece utilizzati per ridurre la sensibilità dei flussi compressi alle perdite di pacchetto. Data l'impossibilità di utilizzare tecniche di ritrasmissione,
a livello di pacchetto risultano applicabili solamente i codici a correzione d'errore (FEC). Aggiungendo ai dati compressi una certa ridondanza, tali codici
permettono una parziale correzione degli errori prima della decodifica video vera e propria.
Riteniamo che tutte queste tecniche necessitino di essere ulteriormente analizzate per permettere l'utilizzazione del video streaming nel previsto scenario P2P. In
particolare, intendiamo occuparci dei problemi di SVC a bassa complessità, di MDC scalabile, e di tecniche cross-layer basate su FEC, sia per SVC che per MDC,
secondo le linee guida che seguono.
L'attività di ricerca sarà organizzata in tre fasi. Poiché è necessaria una descrizione delle necessità dei protocolli P2P in termini di scalabilità e di banda utilizzata,
la prima fase sarà focalizzata su questo aspetto. Si analizzerà inoltre lo stato dell'arte degli schemi di trasmissione robusta e cross-layer per codificatori SVC. I
risultati di questa prima fase verranno utilizzati per pianificare in modo più dettagliato le fasi successive.
Durante la seconda fase verranno effettivamente sviluppate tecniche innovative di codifica video per P2P. In particolare, per garantire la cooperazione degli utenti
con terminali aventi limitate risorse di calcolo con gli altri utenti della rete P2P, desideriamo analizzare soluzioni di codifica SVC a basso costo computazionale e
confrontarne le prestazioni con altre soluzioni SVC e MDC. Prevediamo di utilizzare algoritmi basati sullo schema di tipo 2D+t+2D, attualmente utilizzato nelle
tecniche wavelet più promettenti apparse in letteratura. Si analizzerà inoltre l'applicazione di algorithmi di Distributed Source Coding (DSC) agli schemi a
Descrizioni Multiple al fine di migliorare la qualità delle sequenze ricevute.
Verranno poi proposte ed analizzate tecniche di ottimizzazione cross-layer per il codificatore H.264/SVC e strategie cross-layer per la codifica MDC scalabile, tali
da permettere un facile adattamento alle condizioni variabili della rete.
Nell'ultima fase ci focalizzeremo sull'integrazione e/o sul confronto delle tecniche sviluppate con quelle oggetto di esplorazione da parte delle altre Unità di Ricerca.
Si prevede di ottenere risultati innovativi in termini di algoritmi SVC che siano efficienti sia dal punto di vista della compressione che della complessità
computazionale, e che siano sufficientemente robusti per l'utilizzo in un tipico scenario P2P. Simulazioni e test finali saranno effettuati nell'ambito di un dimostratore
comune in grado di realizzare lo streaming di lezioni di dottorato tra le varie unità coinvolte.
Testo inglese
Nowadays, users that have access to high speed connections to the Internet can have quite satisfactory and pleasant audio-video streaming experiences during their
web browsing sessions. For this reason, the mass deployment of broadband access to the Internet is boosting the demand for more and more streaming services, and
users are progressively becoming content providers theirselves. Considering that in response to similar service needs for simple file sharing the Peer-to-Peer (P2P)
concept has been successfully employed, the extension of this concept to video streaming over the Internet Protocol (IP) is worth to be investigated.
Unfortunately, the traditional video coding technologies are not tailored for IP-based video streaming, mainly because they are sensible to packet losses. In addition,
the end-users are expected to be very heterogeneous and possibly use terminals with different characteristics in terms of resolution and available bandwidth, but such
degree of adaptation is not yet supported by the current standards. Then, further aspects in addition to compression efficiency are being addressed by current
research, which focuses on Scalable Video Coding (SVC), Multiple Description Coding (MDC) and Forward Error Correction (FEC) Resiliency.
SVC aims at giving a single compressed representation of the video content at the highest quality, from which it is possible to obtain different bit streams that permit
reconstructing the original sequence with different spatio-temporal resolutions and signal-to-noise ratios. Not only SVC enables easy terminal and bandwidth
adaptation, but also it is efficient against data losses. While the first SVC standard, namely H.264/AVC Annex G (H.264/SVC), is based on the block-based DCT
transform, other wavelet-based approaches that inherently offer the desired flexibility of adaptation are still under investigation.
In MDC, the video content is coded into multiple streams (descriptions) that are correlated with each other. A basic quality is achieved if one of such descriptions is
received, from which the missing ones are estimated, while quality increases if more descriptions are received.
FEC codes are employed to reduce the sensibility of the compressed video to data losses. At the packet level, since the typical retransmission techniques against data
losses used for file sharing cannot be employed, error resiliency can only be obtained by means of error-correction codes. By adding some redundancy, the FEC
codes allow for partial error correction at the decoder before the actual decoding operation.
We believe that further research in all of these areas is needed in order to allow video streaming to be effectively employed in the foreseen P2P scenario. In
particular, we intend to address the issues of low-complexity SVC, scalable MDC, and cross-layer FEC techniques for both SVC and MDC according to the following
development plan.
The activity of this Research Unit will be organized in three phases. Since a formal description of the P2P video coding requirements in terms of scalability and
bandwidth is mandatory, the first phase will be focused on this aspect. Investigation of the state-of-the-art about robust transmission and cross-layer solutions for
SVC will be addressed as well. The results of these activities will be eventually used to define a more detailed plan for the following phases.
In phase two, the focus will be on the analysis and on the development of techniques for P2P video streaming. In particular, in order to permit users with
battery-operated devices to successfully cooperate with the other nodes of a P2P network, we want to explore the utilization of low-complexity SVC algorithms and
compare them with other SVC and MDC solutions, in terms of both coding efficiency and computational complexity.
We plan to analyze a coding algorithm belonging to the same multi-scale pyramid 2D+t+2D family to which the most promising wavelet-based solutions belong.
We will also analyze the application of Distributed Source Coding (DSC) algorithms to Multiple Description schemes in order to improve the quality of the received
sequence. Cross-layer optimization algorithms for the H.264/SVC coder and cross-layer strategies for scalable MDC that allow to optimally adapt to bandwidth
constraints at a reasonable computational complexity will be then devised, analyzed and validated.
In the last phase of the project, we will focus on the integration and/or comparison of the developed techniques with the ones investigated by the other Research Units.
The expected result is the release of SVC algorithms that are efficient in terms of compression and in terms of complexity, and which are suitable for utilization in a
typical P2P scenario. Final simulations and tests will be carried out in the common framework of a demonstrator that will enable the streaming of Doctorate lectures
among the involved Research Units.
9 - Settori di ricerca ERC (European Research Council)
PE Mathematics, physical sciences, information and communication, engineering, universe and earth sciences
PE5 Information and communication: informatics and information systems,computer science, scientific computing, communication technology, intelligent
systems
PE5_15 Signals, Speech and Image Processing
MIUR - BANDO 2008 - MODELLO B
-5-
Ministero dell'Istruzione dell'Università e della Ricerca
PE5_11 Multimedia
10 - Parole chiave
Testo italiano
CODIFICA VIDEO SCALABILE
CODIFICA VIDEO ROBUSTA
Testo inglese
SCALABLE VIDEO CODING
ROBUST VIDEO CODING
11 - Stato dell'arte
Testo italiano
In origine, si accedeva ad Internet per leggere la posta elettronica e per ottenere informazioni di tipo testuale. Anche se fossero esistiti dei fornitori di servizi
audio-video, il loro utilizzo sarebbe stato difficile a causa della limitata efficienza dei primi sistemi di compressione e della bassa velocità di connessione.
Attualmente, le tecniche di compressione sono mature a tal punto che la trasmissione di segnali audio-video è possibile (seppur a bassa qualità) anche con
connessioni di tipo dial-up. Utenti che dispongano di accesso ad Internet a larga banda hanno invece la possibilità di fruire contenuti audio-video a qualità più che
soddisfacente durante la loro navigazione.
Con la diffusione di massa dell'accesso ad Internet ad alta velocità, la domanda per servizi audio-video di tipo streaming sta perciò crescendo vertiginosamente e gli
utenti stessi si stanno trasformando in fornitori. L'estensione del concetto Peer-to-Peer (P2P), attualmente utilizzato per il semplice scambio di file, alla trasmissione
video basata sull'Internet Protocol (IP) appare quindi estremamente utile [Kha03].
Fino ad una decina di anni or sono, il principale obiettivo nella progettazione di un codificatore video era l'efficienza di compressione. Si è così giunti allo standard
H.264/AVC [WSBL03, ITU07], che migliora notevolmente [WSJ+03] gli standard precedenti MPEG-2 [ITUISO94], H.263 [ITU98] ed MPEG-4 [ISO04]. Data la
notevole sensibilità alle perdite di pacchetto, nessuno di questi standard è però adatto alla trasmissione su IP. Internet è infatti una rete di tipo best-effort, in cui vi
sono perdite di pacchetti causate da congestioni e da errori di trasmissione; in più, i tradizionali meccanismi di ritrasmissione usati per il trasferimento di file non
sono utilizzabili in quanto i pacchetti non arriverebbero qin tempo utile per la decodifica. È inoltre possibile che gli utenti della rete dispongano e di larghezze di
banda diverse e di dispositivi con caratteristiche assai differenti in termini di risoluzione, ai quali gli standard menzionati non sono in grado di adattarsi facilmente.
Per queste ragioni, oltre all'efficienza di compressione, nella codifica video si stanno considerando altri obiettivi come ad esempio i seguenti.
1. Scalable Video Coding (SVC).
Con la codifica scalabile [Ohm05] si vuole dare una rappresentazione compressa ad alta qualità ed alto rate di un segnale dalla quale poter ottenere, tramite
semplici operazioni di "estrazione", anche altri stream con diversi valori di rate e distorsione (in termini di risoluzione spazio-temporale e di rapporto
segnale-rumore). In questo modo, è possibile non solo l'adattamento alla diversità dei dispositivi, ma anche il contrasto alla perdita dei pacchetti. Nel caso in cui i
pacchetti relativi al cosiddetto base-layer siano ricevuti correttamente (ad esempio perché maggiormente protetti contro gli errori [KMA03]) sarebbe almeno
possibile la ricostruzione a bassa qualità del segnale.
Il gruppo MPEG (ISO/IEC) pubblicò già nel 2003 una call-for-proposals per lo SVC [ISO03], ed assieme al gruppo VCEG (ITU-T) è giunto recentemente alla
definizione del primo standard SVC, H264/AVC Annex G (H.264/SVC) [SMW07, ITU07]. Come il nome suggerisce, H.264/SVC è basato su H.264/AVC: per
codificare in modo differenziale l'informazione relativa ai punti di lavoro desiderati vengono infatti usati i medesimi strumenti.
In alternativa, si stanno esplorando anche approcci di tipo open-loop basati su wavelet, che offrono intrinsecamente il grado desiderato di adattabilità [AMC07,
ASL07, WHR+08].
2. Multiple Description Coding (MDC).
Le tecniche a descrizioni multiple [Goy01] sfruttano il fatto che in una rete un nodo può ricevere contemporaneamente dati da più nodi. In MDC, uno stesso segnale
viene codificato in flussi differenti (descrizioni) fra loro correlati, ed ognuno di questi viene trasmesso a destinazione su un diverso percorso in modo da indurre un
certo grado di diversità fra le caratteristiche di perdita di pacchetto nelle varie descrizioni.
Così, nel caso in cui si riceva una sola descrizione (dalla quale le altre vengono stimate) è possibile una ricostruzione a bassa qualità, mentre la qualità aumenta
all'aumentare del numero di descrizioni ricevute. Nell'ambito della codifica video, le descrizioni possono essere ottenute utilizzando quantizzazione a descrizioni
multiple [VMG+06] oppure mediante un campionamento polifase della sequenza video originale [FFLT05].
3. Forward Error Correction (FEC) Resiliency.
I flussi video compressi sono molto sensibili alle perdite di pacchetto a causa delle tecniche di predizione utilizzate. Se un pacchetto viene perso, tutti i dati che
dipendono da esso diventano non decodificabili. A livello di codifica video, alcuni standard come H.264/AVC offrono la possibilità di migliorare la capacità di
ripristino da errori modificando i parametri di compressione (ad esempio utilizzando la tecnica delle slice ridondanti, del flexible macroblock ordering o il
partizionamento dei dati [SHW03]). Invece, a livello di pacchetto, data l'impossibilità di utilizzare tecniche di ritrasmissione, risultano applicabili i soli codici a
correzione d'errore (FEC). Aggiungendo ai dati compressi una certa ridondanza, tali codici permettono una parziale correzione degli errori prima della decodifica
vera e propria [ZEP+04].
4. Classificazione dei pacchetti e specificazione di diversi livelli di QoS.
Al giorno d'oggi le infrastrutture di rete danno la possibilità di specificare diverse classi di Qualità di Servizio (QoS), che consentono di variare le politiche di
ritrasmissione, i livelli di protezione mediante FEC e le priorità dei pacchetti [IEEE802.11.e]. Ne segue che pacchetti appartenenti a classi diverse sono affetti da
probabilità di perdita diverse. Dato che gli effetti della perdita di pacchetti dipendono dalle caratteristiche del segnale video trasmesso, risulta possibile migliorare la
qualità della sequenza ricostruita al ricevitore differenziando, nel processo di codifica, le classi di QoS per i pacchetti più importanti dalle classi di QoS per i
pacchetti meno significativi [MCBR08].
Testo inglese
Originally, people accessed to the Internet mainly for website and e-mail browsing. Even if there had been some providers of audio and video content, the utilization
of these services would have been very difficult due to both the limited compression efficiency of the first digital audio-video coding systems and the low speed of the
early connections to the web.
Nowadays, the audio-video coding technology is instead mature for low rate transmission and it has even become possible to access to (low quality) video content
over dial-up connections. On the other side, users that have access to high speed connections to the Internet can have quite satisfactory and pleasant audio-video
streaming experiences during their web browsing sessions.
For this reason, the mass deployment of broadband access to the Internet is boosting the utilization and the demand for more and more streaming services, and users
are progressively becoming content providers theirselves. The extension of the Peer-to-Peer (P2P) file sharing concept to video streaming over the Internet Protocol
(IP) would be then extremely useful for this new scenario [Kha03].
Until about ten years ago, the design of a coding system was focused on compression efficiency only. The latest result in this direction is represented by the video
coding standard H.264/AVC [WSBL03, ITU07], that showed a remarkable improvement [WSJ+03] over previous standards such as MPEG-2 [ITUISO94], H.263
[ITU98] and MPEG-4 [ISO04]. However, these traditional coding technologies are not directly tailored to IP-based video streaming because they are sensible to
packet losses. The Internet is in fact a best effort network, and typically data get lost because of congestions and transmission errors. The retransmission mechanisms
used for the lost packets in applications like file download cannot be longer used in video streaming since retransmitted data would arrive too late. In addition, the
end-users are expected to be very heterogeneous and possibly use terminals with different characteristics in terms of resolution and available bandwidth, but such
MIUR - BANDO 2008 - MODELLO B
-6-
Ministero dell'Istruzione dell'Università e della Ricerca
degree of adaptation is not supported by the traditional coding systems.
To cope with these problems, current research is considering additional aspects in addition to compression efficiency, such as the following.
1. Scalable Video Coding (SVC).
SVC [Ohm05] aims at giving a single compressed representation of a video content at the highest rate and quality, from which it is possible to obtain other
rate-distortion points at reduced rate and quality (in terms of spatio-temporal resolution and signal-to-noise ratio) by means of simple "extraction" operations. Not
only SVC permits adapting easily to the different user terminals and bandwidth, but also it can be efficient against data losses. In case the packets relative to the
so-called base layer are correctly received (e.g. by increasing their protection level [KMA03]), it is possible to reconstruct at least a low quality version of the video
signal.
The MPEG group (ISO/IEC) issued a call for proposals for SVC technologies in the late 2003 [ISO03], and developed the first SVC standard, namely H.264/SVC
[SMW07, ITU07], jointly with the VCEG (ITU-T). As the name suggests, H.264/SVC is based on H.264/AVC: the same tools of H.264/AVC are used to differentially
encode the information relative to the desired working points with reference to previously decoded layers.
Wavelet-based approaches, that inherently offer the desired flexibility in an open-loop fashion, are being explored as well as alternative approaches [AMC07, ASL07,
WHR+08].
2. Multiple Description Coding (MDC).
MDC [Goy01] takes advantage of the fact that in a network the data can be received at the same time from different nodes. In MDC, the video content is coded into
multiple streams (descriptions) that are correlated with each other.
Each description is transmitted to the decoder through a different path to provide a certain diversity between loss patterns. A basic quality is achieved if one such
description is received (from which the missing ones are estimated), while quality increases if more descriptions are received. In video applications, multiple
descriptions can be created by means of multiple description quantization [VMG+06] or downsampling with different shifts the same video sequence [FFLT05].
3. Forward Error Correction (FEC) Resiliency.
Compressed video is very sensible to data losses because of its typical prediction structure. If a packet gets lost, all data that depends on that packet cannot be
decoded. At the video coding layer, standards like H.264/AVC provide some tools for error resiliency (such as for example redundant slices, data partitioning or
flexible macroblock ordering [SHW03]). At the packet layer, instead, since the typical retransmission techniques against data losses cannot be employed, error
resiliency can be only obtained by means of error-correction codes. By adding some redundancy, the FEC codes allow for partial error correction at the decoder
before the actual decoding [ZEP+04].
4. Packet classification and specification of different QoS levels.
Nowadays network infrastructures specify different classes of Quality-of-Service, which permit varying the retransmission policies, the FEC protection levels, and the
packet priorities [IEEE802.11e]. As a result, packets belonging to different classes are affected by different packet loss probabilities. Since the effects of packet losses
depend on the characteristics of the carried video information, it is possible to improve the quality of the sequence reconstructed at the receiver by differentiating the
QoS class for the most important packets in the video coding process from the QoS class for the least important packets [MCBR08].
12 - Riferimenti bibliografici
[AMC07] E. Akyol, A.M. Tekalp, M.R. Civanlar. A Flexible Multiple Description Coding Framework for Adaptive Peer-to-Peer Video Streaming. IEEE J. Selected
Topics Signal Processing, 1(2):231-245, Aug. 2007.
[ASL07] N. Adami, A. Signoroni, R. Leonardi. State-of-the-art and trends in scalable video compression with wavelet-based approaches. IEEE Trans. CSVT,
17(9):1238-1255, Sept. 2007.
[BDR+07] R. Bernardini, M. Durigon, R. Rinaldo, P. Zontone, A. Vitali. Real-Time Multiple Description Video Streaming Over QoS-BasedWireless Networks. Proc.
ICIP 2007, Sept. 2007.
[CN06] L. Cappellari, T. Nguyen. An alternative framework for spatio-temporal scalability in video coding. Proc. WiRTeP Workshop, Rome, April 2006.
[CN07] O. Campana, T. Nguyen. Protection Enhanced Scalable Video Coding. Proc. EUSIPCO 2007, Poznan, Sept. 2007.
[FFLT05] N. Franchi, M. Fumagalli, R. Lancini, S. Tubaro. Multiple description video coding for scalable and robust transmission over IP. IEEE Trans. CSVT,
15(3):321-334, March 2005.
[Goy01] V.K. Goyal. Multiple description coding: compression meets the network. IEEE Signal Proc. Mag., 18(5):74-93, Sept. 2001.
[IEEE802.11e] IEEE 802.11/D13.0, Part 11, Wireless LAN medium access control (MAC) and physical layer (PHY) specifications: Medium access control (MAC)
enhancements for Quality of Service (QoS), Jan. 2005.
[ISO03] ISO/IEC: JTC1/SC29/WG11. Call for proposals on scalable video coding technology. MPEG document N6193, ISO/IEC, Dec. 2003.
[ISO04] ISO/IEC: JTC1/SC29/WG11. Coding of audio-visual objects - Part 2: Visual. ISO/IEC 14496-2 (MPEG-4), 2004.
[ITU07] ITU-T Recommendation H.264: Advanced video coding for generic audiovisual services, Nov. 2007.
[ITU98] ITU-T Recommendation H.263: Video coding for low bit rate communication, 1998.
[ITUISO94] ITU-T and ISO/IEC: JTC1/SC29/WG11. Generic coding of moving pictures and associated audio information: Video. ITU-T Recommendation H.262,
ISO/IEC 13818-2 (MPEG-2), 1994.
[Kha03] S. Khan. Multiple Description Streaming in Peer-to-Peer and Content Delivery Networks. Proc. Australian Telecommunications, Networks and Applications
Conference (ATNAC 2003). Dec. 2003.
[KEZ+05] A.K. Katsaggelos, Y. Eisenberg, F. Zhai, R. Berry, T.N. Pappas. Advances in Efficient Resource Allocation for Packet-Based Real-Time Video
Transmission. Proc. IEEE, 93(1):135-147, Jan. 2005.
[KKK02] J.-G. Kim, J. Kim, C.-C.J. Kuo. Internet video packet categorization with enhanced end-to-end QoS performance. Proc. SPIE-VCIP 2002, vol. 4671, pp.
58-68, Jan. 2002.
[KMA03] J. Kim, R.M. Mersereau, Y. Altunbasak. Error-resilient image and video transmission over the Internet using unequal error protection. IEEE Trans. Image
Proc., 12(2): 121-131, Feb. 2003.
[KN08] M.-P. Kao, T. Nguyen, Fully Scalable Motion Model for Scalable Video Coding, IEEE Trans. Image Proc., 17(6): 908-923, June 2008.
[MCBR08] S. Milani, G. Calvagno, R. Bernardini, R. Rinaldo, "A Low-Complexity Packet Classification Algorithm for Multiple Description Video Streaming over
IEEE802.11e Networks", Proc. 2008 IEEE International Conference on Image Processing (ICIP 2008), San Diego, CA, Oct. 2008.
[MCM08] S. Milani, L. Celetto, and G. A. Mian, "A Rate Control Algorithm for the H.264 Encoder", IEEE Trans. on Circuits and Systems for Video Technology, vol.
18, no. 2, Feb. 2008, pag. 257-262.
MIUR - BANDO 2008 - MODELLO B
-7-
Ministero dell'Istruzione dell'Università e della Ricerca
[MC09] S. Milani, G. Calvagno. A Low-Complexity Cross-Layer Optimization Algorithm for Video Communication Over Wireless Networks. To appear on IEEE
Trans. Multimedia.
[MMC05] S. Milani, G.A. Mian, L. Celetto. Joint Optimization of Source-Channel Video Coding Using the H.264 Encoder and FEC Codes. Proc. EUSIPCO 2005,
Antalya, Sept. 2005.
[Ohm05] J.-R. Ohm. Advances in scalable video coding. Proc. IEEE, 93(1): 42-56, Jan. 2005.
[RZR01] S. Regunathan, R. Zhang, K. Rose. Scalable video coding with robust mode selection. Signal Processing: Image Communication, 16(8):725-732, May 2001.
[SHW03] T. Stockhammer, M.M. Hannuksela, T. Wiegand. H.264/AVC in wireless environments. IEEE Trans. CSVT, 13(7): 657-673, July 2003.
[SMW05] H. Schwarz, D. Marpe, T. Wiegand. Comparison of MCTF and closed-loop hierarchical B pictures. JVT document P059, ISO/IEC and ITU-T, July 2005.
[SMW07] H. Schwarz, D. Marpe, T. Wiegand. Overview of the scalable video coding extension of the H.264/AVC standard. IEEE Trans. CSVT, 17(9): 1103-1120,
Sept. 2007.
[Tau00] D. Taubman. High performance scalable image compression with EBCOT. IEEE Trans. Image Proc., 9(7): 1158-1170, 2000.
[TBAD07] M. Tesanovic, D.R. Bull, D. Agrafiotis, A. Doufexi. Comparison of standard-based H.264 error-resilient techniques and multiple-description coding for
robust MIMO-enabled video transmission. Proc. SPIE-VCIP 2007, San Jose, Feb. 2007.
[TL06] J.R. Taal, L. Lagendijk. Hybrid Temporal-SNR Multiple Description Coding for Peer-to-Peer Television. Proc. Picture Coding Symposium (PCS 2006),
Beijin, China, Apr. 2006.
[TM02] D. S. Taubman, M.W.Marcellin. JPEG2000 Image Compression Fundamentals, Standard and Practice. Kluwer, 2002.
[TW98] J. Tian, R.O. Wells. Embedded image coding using wavelet difference reduction. In Wavelet Image and Video Compression, vol. 450 of The Int. Series in
Eng. and Computer Science, pp. 289-302. Kluwer, 1998.
[VMG+06] F. Verdicchio, A. Munteanu, A.I. Gavrilescu, J. Cornelis, P. Schelkens. Embedded multiple description coding of video. IEEE Trans. Image Proc., 15(10):
3114-3130, Oct. 2006.
[WRH+08] Y. Wu, K. Hanke, T. Rusert, J.W. Woods, Enhanced MC-EZBC Scalable Video Coder, IEEE Trans. CSVT, 18(10):1432-1436, Oct. 2008.
[WSBL03] T. Wiegand, G.J. Sullivan, G. Bjøntegaard, A. Luthra. Overview of the H.264/AVC video coding standard. IEEE Trans. CSVT, 13(7):560-576, July 2003.
[WSJ+03] T. Wiegand, H. Schwarz, A. Joch, F. Kossentini, G.J. Sullivan. Rate constrained coder control and comparison of video coding standards. IEEE Trans.
CSVT, 13(7):688-703, July 2003.
[ZEP+04] F. Zhai, Y. Eisenberg, T.N. Pappas, R. Berry, A.K. Katsaggelos. Rate distortion optimized product code forward error correction for video transmission
over IP-based wireless networks. In Proc. IEEE ASSP 2004, vol. 5, pp. 857-860, May 2004.
[ZZZ04] Q. Zhang, W. Zhu, Y.-Q. Zhang. Channel-Adaptive Resource Allocation for Scalable Video Transmission Over 3G Wireless Network. IEEE Trans. CSVT,
14(8):1049-1063, Aug. 2004.
13 - Descrizione del programma e dei compiti dell'Unità di Ricerca
Testo italiano
Questa Unità di Ricerca si occuperà dell'analisi, sviluppo e confronto di tecniche di streaming video Peer-to-peer (P2P) che utilizzano Scalable Video Coding (SVC),
Multiple Description Coding (MDC) e codici Forward Error Correction (FEC). Riteniamo infatti che sia interessante una ulteriore analisi di queste tecniche per i
seguenti motivi.
Primo, perché nello scenario P2P è indispensabile l'adattamento all'eterogeneità, ottenibile interamente solo con tecniche di codifica scalabile, che
contemporaneamente offrono anche una certa capacità di recupero da errori.
Secondo, perché le tecniche a descrizioni multiple si accoppiano perfettamente con lo scenario in cui ogni nodo può ottenere informazioni da più nodi. In particolare,
oltre a sfuttare la capacità di recupero da errori della MDC, pensiamo sia possibile ottenere anche l'adattamento all'eterogeneità aggiungendo scalabilità ad ogni
singola descrizione.
Terzo, perché le tecniche di correzione basate sui codici FEC non solo rendono più affidabile la trasmissione, ma permettono anche un ottimo adattamento al rate
desiderato con un ragionevole carico computazionale.
In particolare, in ognuna delle aree elencate, la nostra ricerca seguirà le linee guida di seguito descritte. Si noti che la fase finale per tutte le aree prevede
simulazioni e test comparativi. Valutazioni e validazioni delle techniche di codifica sviluppate saranno effettuate nell'ambito di un framework comune che prevede lo
streaming P2P di lezioni di dottorato fra le varie Unità di Ricerca afferenti al progetto.
Codifica Scalabile a Bassa Complessità
L'utilizzo di tecniche di codifica video scalabile è senza dubbio auspicabile in uno scenario P2P. Attualmente, la ricerca su SVC si divide in due aree.
La prima si focalizza sull'ottenimento della scalabilità attraverso la stratificazione dell'informazione usando ad esempio tecniche di codifica tradizionali (non
scalabili) [TL06]. Il gruppo JVT (ISO/ITU-T) conduce ricerca in questo campo dal 2003 [ISO2003], e ha recentemente finalizzato il primo standard SVC, H264/AVC
Annex G (H.264/SVC) [SMW07], basato sull'ultimo standard di codifica video H.264/AVC [ITU07].
La seconda invece esplora l'ottenimento della scalabilità con l'utilizzo di tecniche intrinsecamente scalabili basate su wavelet [AMC07]. Nonostante in origine gli
approcci di questo tipo sembrarono meno promettenti di quelli basati su H.264/AVC, bisogna sottolineare che gran parte della differenza di prestazioni proveniva, al
tempo, prevalentemente dal fatto che le wavelet erano state molto meno esplorate rispetto alle tecniche di codifica tradizionali. Oggi, tali tecniche sono mature al
punto che le loro prestazioni non sono lontane da quelle di H.264/SVC [ASL07, WRH+08].
In entrambe le aree, il principale obiettivo perseguito è l'efficacia della soluzione, con una ridotta considerazione per il carico computazionale (che è invece un
aspetto critico, per esempio, se i dispositivi utilizzati sono alimentati a batteria). Viste le proposte in letteratura che danno invece importanza a questo aspetto
[CN06], pensiamo che sia interessante esplorare la possibilità della loro applicazione nello scenario P2P, in modo tale da far cooperare proficuamente con gli altri
nodi della rete anche gli utenti con terminali aventi limitate risorse di calcolo.
L'obiettivo della nostra ricerca è quindi l'adattamento della soluzione proposta in [CN06, KN08] al caso P2P in esame ed il successivo confronto con altre soluzioni.
Tale schema può considerarsi uno schema di tipo 2D+t+2D simile a quello utilizzato dalle tecniche wavelet più promettenti in letteratura [ASL07], ma con un
diverso meccanismo di predizione inter-scala.
In confronto a queste ultime, la riduzione della complessità è garantita dalla rimozione dell'operazione di filtraggio temporale e dall'utilizzo di una più semplice
codifica entropica. Da un lato, il filtraggio temporale non è strettamente necessario [SMW05]; dall'altro, esistono anche codificatori entropici semplici che offrono
buone prestazioni [TW98].
In particolare, pianifichiamo (i) di adattare l'architettura alle necessità del P2P, (ii) di valutare l'utilizzo di un base-layer H.264/AVC e (iii) di proporre tecniche che
permettano l'utilizzo combinato con la MDC. La ricerca seguirà la seguente scansione temporale.
1. Requisiti del P2P (mesi 1-3).
Per sviluppare un codificatore che possa trovare applicazione in un contesto P2P, è necessario che venga data una descrizione dei requisiti che devono essere
MIUR - BANDO 2008 - MODELLO B
-8-
Ministero dell'Istruzione dell'Università e della Ricerca
soddisfatti in termini di scalabilità, di banda e di complessità computazionale. La prima fase del progetto di ricerca sarà focalizzata su questo aspetto e porterà alla
definizione più dettagliata del piano di sviluppo delle attività seguenti.
2. Sviluppo del codificatore (mesi 4-15).
Questa attività comprende lo sviluppo software del codificatore 2D+t+2D basato su decomposizione gerarchica dei fotogrammi e su decomposizione spaziale
mediante wavelet. Sarà presa in considerazione anche la possibilità di utilizzare un opportuno modello di moto scalabile [KN08] al fine di massimizzare le
prestazioni in condizioni di rate e complessità limitati.
Saranno valutati sia l'utilizzo di un base-layer H.264/AVC che, in cooperazione con le attività condotte nell'ambito della MDC, l'utilizzo di soluzioni basate su
descrizioni multiple.
3. Test stand-alone (mesi 16-17).
L'obiettivo di questa attività è di condurre dei test preliminari per verificare le prestazioni del codificatore SVC sviluppato precedentemente. In particolare, saranno
analizzate le configurazioni del codificatore in grado di ottimizzarne le prestazioni (con o senza base-layer H.264/AVC, usando o no le descrizioni multiple).
4. Test finali e confronti (mesi 18-24).
L'attività finale consisterà nell'integrazione e/o nel confronto delle tecniche sviluppate con quelle oggetto di esplorazione da parte delle altre Unità di Ricerca.
I risultati attesi, in questa area di ricerca, sono rappresentati da un software SVC che sia efficiente sia dal punto di vista della compressione che della complessità
computazionale, e che sia adatto all'utilizzo in uno scenario P2P.
Codifica a Descrizioni Multiple Scalabili
Nella codifica video tradizionale i frame predetti temporalmente necessitano di riferimenti validi per poter essere ricostruiti correttamente. In caso di errori di
trasmissione, il loro effetto non è limitato al frame corrotto ma si propaga anche in quelli successivi. Tra le varie soluzioni proposte, le tecniche di Multiple
Description Coding (MDC) [Goy01] aumentano la robustezza dividendo il segnale di ingresso in porzioni di informazione (dette descrizioni) che vengono compresse
e trasmesse indipendentemente. Se tutte le descrizioni giungono correttamente al ricevitore si riesce a ricostruire il segnale originario, mentre se si verificano degli
errori di trasmissione l'informazione persa viene stimata dalle descrizioni ricevute e viene decodificata un'approssimazione del segnale originale.
Anche gli schemi di Scalable Video Coding (SVC) sono basati sulla compensazione del moto e necessitano quindi di protezione aggiuntiva, esattamente come i
codificatori non scalabili.
Poiché molti schemi SVC si basano su un estrattore del bitstream, l'adozione di codici a correzione di errore non è facilmente applicabile. Infatti i codici Forward
Error Correction (FEC) vengono applicati a pacchetti di bit raggruppati in matrici e non è possibile calcolare a priori tutte le possibili combinazioni dei pacchetti e
le corrispondenti matrici, soprattutto quando sono presenti dei vincoli di esecuzione in tempo reale.
Pensiamo che lo streaming video su reti P2P possa trarre diversi benefici dall'adozione degli schemi MDC [Kha03]. Infatti MDC non assicura solo maggiore
robustezza sfruttando la diversità dei canali di trasmissione, ma può essere utilizzata anche per fornire una scalabilità più fine. Con le tecniche di MDC è possibile
introdurre nuovi livelli di qualità non vincolati ad un fattore di campionamento spaziale e temporale interi, ma il decodificatore può decidere di decodificare anche
solo parzialmente un livello di qualità superiore. Questo è particolarmente utile nel caso di video su reti P2P perché questo tipo di reti sono caratterizzate da una
topologia altamente variabile che altrimenti costringerebbe i client a decodificare sempre il livello di qualità minore.
Sebbene siano già stati proposti alcuni schemi di MDC applicata a SVC [TL06, VMG+06], è necessario sviluppare le conoscenze teoriche per garantire un ottimale
accoppiamento delle due tecniche. Proponiamo di studiare questo approccio sia teoricamente che praticamente. In particolar modo intendiamo analizzare
l'applicazione di schemi di codifica SVC alle architetture di codifica video a Descrizioni Multiple. Inoltre, verranno progettati e testati diversi algoritmi per
l'ottimizzazione dei parametri di codifica e di trasmissione.
La ricerca si articolerà nel modo seguente.
1. Applicazione dei paradigmi di codifica scalabile a schemi tradizionali MDC quali quelli basati sul sottocampionamento polifase e loro ottimizzazione (mesi 1-8).
La prima parte del lavoro consisterà nell'integrare le soluzioni SVC esistenti (ad esempio H.264.SVC) negli schemi di codifica a descrizioni multiple al fine di
ottenere flussi scalabili MDC compatibili con lo standard. Nel corso di questa fase si lavorerà inoltre sulla messa a punto dei parametri di codifica al fine di adattare
lo stream video alle effettive capacità trasmissive della rete.
2. Ottimizzazione dei parametri di trasmissione per i flussi MDC (mesi 9-12).
Verrano sviluppati algoritmi di ottimizzazione per l'allocazione delle risorse di rete in modo da massimizzare la qualità video in ricezione. In questa fase di lavoro
verranno considerati schemi di Unequal Error Protection mediante FEC, ritrasmissione di pacchetti e classificazione per differenziare la QoS dei vari pacchetti.
3. Applicazione di tecniche di Distributed Source Coding (DSC) alle soluzioni MDC (mesi 13-24).
In questa fase considereremo l'applicazione di schemi DSC alla Codifica a Descrizioni Multiple al fine di migliorare la qualità delle sequenze ricostruite. Gli schemi
DSC consentono una decodifica corretta dell'informazione predetta anche nel caso in cui i dati di riferimento vengano persi, purché siano disponibili altri dati di
riferimento sufficientemente correlati. In tal modo risulta possibile mitigare la distorsione introdotta nella sequenza ricostruita dagli algoritmi di error concealment
MDC. La nostra Unità di ricerca considererà l'applicazione di queste tecniche a schemi MDC basati sul sottocampionamento polifase e ne confronterà le prestazioni
con altre soluzioni MDC e SVC.
Robustezza mediante codici FEC
Gli schemi SVC precedentemente citati costituiscono delle soluzioni efficienti per la trasmissione video su reti P2P, ma si rivelano estremamente poco robusti in
presenza di perdite di informazione sul canale. Infatti, la mancata ricezione di alcuni pacchetti appartenenti allo stream di base rende impossibile una corretta
decodifica di tutta la sequenza anche se gli stream di raffinamento vengono ricevuti correttamente. Di conseguenza, uno dei problemi cruciali che si pone è garantire
una trasmissione robusta dello stream video scalabile.
Alcune delle soluzioni proposte in letteratura cercano di selezionare i parametri e le scelte di codifica del codificatore SVC in modo da creare uno stream video
robusto adatto alle caratteristiche del canale [RZR01]. Altre soluzioni cercano di garantire un certo livello di Quality-of-Service (QoS) effettuando una Unequal
Error Protection (UEP) dei pacchetti trasmessi in modo da modulare la probabilità di perdita del pacchetto a seconda della sua importanza nel processo di
decodifica. In [KKK02] gli autori stimano la distorsione introdotta dal canale nella sequenza ricostruita tramite un modello parametrico e introducono una strategia
di classificazione dei pacchetti al fine di massimizzare la qualità della sequenza ricostruita al decoder. In [ZZZ04] gli autori affrontano il problema di trasmettere
una sequenza video SVC su una rete 3G allocando le risorse di rete in maniera adattiva a seconda delle caratteristiche della sequenza codificata e delle condizioni
della rete. L'algoritmo adottato combina tecniche di Automatic Repeat reQuest (ARQ) e codici di tipo Forward Error Correction (FEC) al fine di migliorare la
qualità della sequenza video fruita dall'utente finale.
Negli ultimi anni queste diverse tecniche di protezione sono state utilizzate in algoritmi di ottimizzazione cross-layer, i quali cercano di ottimizzare i parametri di
codifica e trasmissione dei vari layer del modello OSI in modo congiunto [KEZ+05]. Tuttavia, la complessità di questi approcci aumenta significativamente quando
essi vengono applicati alla codifica scalabile a causa dell'aumento dei gradi di libertà nella codifica. Di conseguenza la progettazione di tecniche di ottimizzazione
congiunta per codificatori SVC risulta un'ambito di ricerca stimolante.
Tecniche UEP simili sono state proposte anche in relazione alla codifica MDC al fine di ridurre la probabilità di perdite di informazione contemporanee su più
descrizioni nel caso in cui i canali non siano sufficientemente scorrelati. In [BDR+07] Bernardini et al. analizzano le prestazioni di uno schema di codifica MDC
applicato su una rete che supporta diversi livelli di QoS, mentre in [TBDA07] vengono valutate le prestazioni di uno schema MDC applicato ad un canale MIMO.
Tali risultati evidenziano l'efficacia delle soluzioni cross-layer nelle comunicazioni multimediali e hanno focalizzato l'interesse della comunità scientifica sullo studio
di architetture che armonizzino MDC, UEP e SVC in uno schema adattivo unico.
In questo ambito, l'Unità di Ricerca si propone di studiare degli algoritmi di ottimizzazione cross-layer al fine di permettere una trasmissione robusta dello stream
H.264/SVC attraverso una rete P2P.
Il problema è già stato parzialmente analizzato con riferimento al codificatore non-scalabile H.264/AVC [MMC05, MCM08, MC09], ma le nuove problematiche
introdotte dalla sua estensione scalabile (H.264/SVC) aprono nuovi stimolanti ambiti di ricerca, che verranno affrontati secondo la scansione temporale seguente.
1. Analisi dello stato dell'arte (mesi 1-3).
La prima parte del lavoro di ricerca sarà incentrata sulla definizione dello stato dell'arte degli schemi di trasmissione robusta e cross-layer per codificatori SVC. I
risultati di questa prima fase verranno utilizzati per pianificare in modo più dettagliato le fasi successive.
MIUR - BANDO 2008 - MODELLO B
-9-
Ministero dell'Istruzione dell'Università e della Ricerca
2. Ottimizzazione cross-layer per il codificatore H.264/SVC (mesi 4-12).
Questa parte del progetto sarà dedicata all'adattamento di tecniche di trasmissione error-resilient studiate per H.264/AVC al codificatore H264/SVC. In particolare,
l'attività di ricerca sarà volta alla progettazione di tecniche cross-layer per il controllo congiunto dei parametri di trasmissione e codifica al fine di garantire un certo
livello di QoS.
3. Strategie cross-layer per la codifica MDC scalabile (mesi 13-20).
Questa Unità di Ricerca si prefigge di combinare le tecniche UEP cross-layer e le soluzioni MDC precedentemente descritte in un unico schema di codifica capace di
adattarsi ai vincoli di banda e alle condizioni variabili della rete. Il prodotto finale sarà un codificatore software che verrà testato in condizioni differenti utilizzando
dei simulatori di rete.
4. Test finali e confronto (mesi 21-24).
La fase finale del progetto sarà focalizzata sull'integrazione e il confronto delle diverse soluzioni sviluppate.
Testo inglese
This Research Unit will be focused on the analysis, development and comparison of multimedia Peer-to-Peer (P2P) streaming techniques using Scalable Video
Coding (SVC), Multiple Description Coding (MDC) and Forward Error Correction (FEC) codes.
We believe that further research in these areas is advisable for the following reasons. First, in the foreseen P2P scenario we feel that it will be very important to be
able to adapt to the heterogeneity of the network. This can be fully accomplished only using scalable coding techniques, which on the other hand turn out to be also
useful for error resiliency.
Second, multiple descriptions are very well tailored for streaming purposes in a network, where each node can download data from several other nodes. In addition to
their potential resiliency to errors, we expect to be able to reach a perfect terminal adaptation by adding scalability features to the various descriptions.
Third, we think that forward error correction strategies not only allow to send compressed video streams in a reliable manner, but also permit to achieve optimal rate
adaptation with a reasonable computational load.
In the following our development plan for each one of the targeted research areas is outlined. Note that the final task of all areas involves simulations and
comparisons. Eventually, assessment and validation of the developed coding techniques will be carried out within the common framework of P2P streaming of
Doctorate lectures, accordingly to the main aim of this research project.
Low-complexity Scalable Video Coding
The application at hand, namely video streaming over P2P networks, would certainly benefit from the utilization of scalable coding techniques. Currently, the
research on SVC can be divided into two main areas.
The first focuses on the implementation of scalability by means of layering, i.e. using the same tools of a well established traditional (non-scalable) video coding
standard [TL06]. In particular, the ISO/ITU-T JVT group has been conducting the research in this area since 2003 [ISO03], and has recently finalized the first SVC
standard, namely H.264/AVC Annex G (H.264/SVC) [SMW07], that is based on the latest video coding standard H.264/AVC [ITU07].
The second investigates the application of wavelet-based techniques to achieve an inherent scalability in all directions [AMC07]. Despite in its origin such
approaches turned out to give a lower performance than the H.264/AVC based ones, it must be emphasized that at that time most of the differences between the two
approaches came mainly from the fact that wavelets had been less investigated than the other coding tools. Nowadays, instead, wavelet-based technologies are
becoming more mature and able to reach a coding performance similar to H.264/SVC [ASL07, WRH+08].
In both cases, emphasis is on the efficacy of the proposed solution, with limited consideration for the required computational load, that in certain cases can become a
critical aspect (e.g. for battery-operated mobile devices). In literature, some light solutions [CN06] have been instead proposed that are more suitable for this
scenario. We think that they should be further explored for the foreseen P2P scenario as well, in order to permit users with limited computational resources to
successfully cooperate with the other nodes of the network.
Hence, we want to explore the adaptation of the scheme outlined in [CN06, KN08] to the application at hand and compare it with other solutions, in terms of both
coding efficiency and computational complexity demands. Roughly speaking, the scheme can be considered as belonging to the same multi-scale pyramid 2D+t+2D
family to which the most promising wavelet-based solutions belong [ASL07], with some differences in the inter-scale prediction mechanisms.
With respect to the other 2D+t+2D solutions, computational complexity savings come from the removal of the temporal filtering operation and from a more light
entropy coder. On one side, in fact, the temporal filtering operation is not strictly necessary for coding performance [SMW05]. On the other side, there are entropy
coders that achieve reasonable compression ratios without resorting to demanding tools such as arithmetic coding [TW98].
In particular, we plan to (i) adapt the architecture to match the specific P2P requirements, (ii) add the possibility to resort to a H.264/AVC compatible base-layer and
(iii) devise ways that enable scalable multiple description coding using this technology. The proposed development plan is composed of the following tasks.
1. P2P Requirements (months 1-3).
In order to develop a scalable video codec that fulfils the needs of P2P multimedia streaming, it will be necessary to give a formal description of the requirements in
terms of scalability, bandwidth, and complexity that must be satisfied. The first phase of the project will be focused on this aspect and will lead to the definition of a
more detailed plan for the following activities.
2. Coder Development (months 4-15).
This task represents the core of the research project. It will be concerned with the software development of the proposed 2D+t+2D solution based on hierarchical
frame organization and wavelet decomposition. We will take into consideration the possibility to choose a suitable scalable motion model [KN08] in order to
maximize the performances at the low rate and complexity. The possibility to utilize a H.264/AVC base-layer will be analyzed and included as well. In cooperation
with the Scalable Multiple Description Coding task, solutions for implementing multiple description coding with this technology will be devised, analyzed and
validated.
3. Stand-alone tests (months 16-17).
The goal of this task is to carry out the necessary preliminary stand-alone tests in order to assess the performance of the proposed SVC solution. In particular, the
operational parameters that optimize the performance will be found and described for all possible setups (with or without H.264/AVC compatibility, using or not
multiple description coding).
4. Final test and comparison (months 18-24).
The final task focuses on the integration and/or comparison of the developed techniques with the ones investigated by the other Research Units.
The expected result, in this research area, is the release of a scalable coding software which is efficient both in terms of compression and in terms of complexity
demands, and which is suitable for utilization in a P2P video streaming scenario.
Scalable Multiple Description Coding
In a typical motion-compensated video codec, temporally-predicted frames need valid references to be correctly reconstructed. Whenever transmission errors occur,
they do not only affect the currently decoded frame but also those depending on it. Among several possible approaches, Multiple Description Coding (MDC)
techniques [Goy01] try to add reliability by partitioning the input signal into several chunks of data called descriptions. At the receiver, in case of successful
transmission, all descriptions are merged together to obtain the original signal, while in case of packet losses the corrupted information is estimated by exploiting the
correlation shared between the descriptions.
Scalable Video Coding (SVC) codecs are based on motion compensation too, therefore they need to add protection to the produced bitstream as well as non-scalable
video codec.
Since many SVC schemes rely on a bitstream extractor which selects the desired information from the high-quality compressed bitstream, traditional solutions based
on Forward Error Correction (FEC) codes might not be suitable. In fact, FEC codes are usually applied to matrix of packed packets and therefore it is not always
possible to evaluate all of them a priori when the high quality bitstream is produced, especially in case of real-time or computational resources constraints.
We feel that a P2P video streaming framework can benefit from the adoption of MDC in several ways [Kha03]. In fact, MDC not only provides error resilience by
exploiting the transmission channel diversity, but it can be used to provide finer scalability. Traditional scalable video codecs provide scalability by temporally
subsampling frames or by transmitting at different resolutions or qualities. With MDC the same resolution or the same framerate can be further divided and the
decoder can decide to decode an approximation of a high-quality sequence instead of having to reproduce a low quality sequence. This is particularly useful in case
of P2P video streaming, because in a scenario characterized by nodes which frequently connect and disconnect, the information transmitted to clients needs several
MIUR - BANDO 2008 - MODELLO B
- 10 -
Ministero dell'Istruzione dell'Università e della Ricerca
scalability layers to guarantee smooth quality variations at the decoder.
Even if there have been some previous approaches to apply the MDC concept to scalable transmission [TL06, VMG+06], theoretical work is still needed to obtain the
optimal coupling of the two techniques. We propose to investigate the feasibility of such approach both theoretically and practically.
In particular, we will investigate the application of SVC coding schemes to existing multiple description video coding architectures. Moreover, different algorithms
for the optimization of coding and transmission parameters will be designed and tested. More precisely, the proposed research will be carried on as follows.
1) Application of scalable coding paradigms to traditional MDC schemes such as those based on polyphase subsampling and their optimization (months 1-8).
The first part of the work will consist in integrating the existing SVC solutions (such as H.264/SVC) into the multiple description coding schemes in order to obtain
scalable standard-compliant MDC streams. During this phase, we will also investigate an optimal tuning of the coding parameters in order to adapt the coded video
streams to the actual transmission capabilities of the network.
2) Optimization of transmission parameters for the MDC streams (months 9-12).
We will investigate optimization algorithms that allocates the network resources so that the video quality at the receiver is maximized. In this part of the work, we will
consider Unequal Error Protection FEC schemes, packet retransmission and classification to differentiate the QoS for the different packets.
3) Application of distributed source coding (DSC) techniques to MDC solutions (month 13-24).
In this phase we will consider the application of DSC schemes to Multiple Description Coding in order to improve the quality of the reconstructed sequence. DSC
schemes permit a correct decoding of predicted information even if the reference data have been lost, provided that other sufficiently-correlated reference data are
available. In this way, it is possible to mitigate the distortion introduced in the recovered sequence by the MDC error concealment algorithm. Our research unit will
consider the application of this technique to MDC scheme based on polyphase-subsampling and will compare its performance with other MDC and SVC solutions.
FEC-based resiliency
Despite scalable frameworks are effective solutions for P2P video transmission in a heterogeneous scenario, their efficiency can be significantly reduced by the
presence of losses in the channel. A loss in the base layer stream could inhibit a correct decoding of the whole sequence independently of the fact that the
enhancement layers have been correctly received. Therefore, the problem of enabling robust scalable video transmission is one of the hottest research fields for video
coding designers.
Some of the presented approaches aim at creating an error-resilient layered bit stream by selecting the coding parameters according to the channel characteristics
[RZR01]. However, many solutions try to guarantee a certain QoS level by performing an Unequal Error Protection (UEP) of video packets in order to vary the loss
probability according to their significance in the decoding process. In [KKK02] the authors derive a model for a layered codec in order to estimate the channel
distortion in the reconstructed sequence and present a classification strategy that assigns packets to different classes in order to maximize the video quality at the
decoder under given cost constraints. In [ZZZ04] Zhang et al. face a similar problem of enabling a scalable video transmission over a 3G wireless network by
adaptively allocating the network resources according to the characteristics of the coded sequence and the network conditions. The adopted protection technique
combines Automatic Repeat reQuest (ARQ) and Forward Error Correction (FEC) codes in order to improve the quality experienced by the end-user.
During the last years we have assisted to the convergence of such protection techniques into cross-layer coding schemes that try to optimize the coding and
transmission parameters at all the levels of the protocol stack [KEZ+05]. In relation to a scalable video coder, the problem gets more and more complex since the
number of degrees of freedom increases. This makes the design of joint optimization techniques to a scalable video coder an interesting investigation field.
Similar UEP techniques have also been applied to Multiple Description Coding (MDC) schemes in order to reduce the probability of multiple losses on more than one
description in case the MD channels are not sufficiently uncorrelated. In [BDR+07] Bernardini et al. investigate the effects of transmitting a Multiple Description
stream over a QoS-based wireless network, while other works (see [TBAD07]) evaluate the performance of MDC on a MIMO-enabled network.
These results underline the efficiency of cross-layer designs in multimedia transmission and are focusing the research interest of video community on investigating
syncretic architectures that jointly optimize MDC, UEP and scalable coding.
Within this research scope, this Research Unit aims at investigating novel cross-layer optimization strategies to enable the robust transmission of H.264/SVC streams
across a P2P network.
The problem has been already addressed in these last years investigating resource allocation [MCM08] and joint optimization solution for the video coder
H.264/AVC [MMC05, MC09]. The new technical challenges that are posed by the emerging standard H.264/SVC make the adaptation of these cross-layer techniques
a challenging research activity that will be developed according to the following steps.
1. Definition of the state-of-the-art (months 1-3).
The first part of the research work will be focused on investigating the state-of-the-art about robust transmission and cross-layer solutions for scalable video coding.
The results of this activity will be used to define a more detailed planning for the following activities.
2. Cross-layer optimization algorithms for H.264/SVC coder (months 4-12).
This part of the project will be devoted to adapt the error-resilient techniques designed for H.264/AVC to the H.264/SVC coder. More specifically, we will focus on
cross-layer algorithms that tune the coding and transmission parameters according to a joint optimization strategy to satisfy given QoS constraints.
3. Cross-layer strategies for a scalable Multiple Description coder (months 13-20).
Within this phase, the unit aims at combining cross-layer UEP techniques and Multiple Description Coding solutions described in the previous section into one single
coding architecture that optimally adapts itself to the network conditions and bandwidth constraints at a reasonable computational complexity. The final product of
the research work will be a software coder that will be tested using a network simulator under different experimental scenarios.
4. Final tests and comparison (months 21-24).
The final task focuses on the integration and/or comparison of the developed techniques.
14 - Descrizione delle attrezzature già disponibili ed utilizzabili per la ricerca proposta
Testo italiano
Nessuna
Testo inglese
Nessuna
15 - Descrizione delle Grandi attrezzature da acquisire (GA)
Testo italiano
Nessuna
Testo inglese
MIUR - BANDO 2008 - MODELLO B
- 11 -
Ministero dell'Istruzione dell'Università e della Ricerca
Nessuna
16 - Mesi persona complessivi dedicati al Progetto
Numero
Disponibilità
temporale indicativa
prevista
1° anno
2° anno
Componenti della sede dell'Unità di Ricerca
Componenti di altre Università/Enti vigilati
Titolari di assegni di ricerca
Titolari di borse
Dottorato
Post-dottorato
Scuola di Specializzazione
Personale a contratto
Assegnisti
Borsisti
Altre tipologie
Dottorati a carico del PRIN da destinare a questo specifico progetto
Altro personale
1
0
2
0
0
0
1
0
0
0
0
TOTALE
4
Totale
mesi
persona
6
6
12
12
12
24
11
11
22
0
0
0
29
29
58
17 - Costo complessivo del Progetto dell'Unità articolato per voci
Voce di spesa
Materiale inventariabile
Grandi Attrezzature
Materiale di consumo e
funzionamento
(comprensivo di eventuale quota
forfettaria)
Spese per calcolo ed elaborazione
dati
Personale a contratto
Dottorati a carico del PRIN da
destinare a questo specifico progetto
Servizi esterni
Missioni
Spesa
in
Euro
Descrizione dettagliata
(in italiano)
4.000 Due workstation multimediali.
Descrizione dettagliata
(in inglese)
Two multimedia workstations.
0
7.000 Spese dipartimentali di funzionamento. Manutenzione e Departmental expenses. Hardware maintenance
riparazioni hardware.
and repairing.
1.000 Canoni di rete dipartimentale e licenze software.
Fees for departmental network and software
licenses.
40.000 Assegno di ricerca per dottore di ricerca o laureato con Research grant for a PhD or an engineer with
specifiche competenze su tecniche di codifica video.
specific expertise on video coding techniques.
0
8.000 Partecipazioni a riunioni del progetto, conferenze e
Partecipation to project meetings, scientific
workshop scientifici. Brevi periodi di permanenza presso conferences and workshops. Short transfers to
altre unita' di ricerca.
other research units.
Pubblicazioni (*)
3.000 Iscrizione a conferenze e workshop scientifici.
Partecipazione / Organizzazione
convegni (*)
Altro (voce da utilizzare solo in caso
di spese non riconducibili alle voci
sopraindicate)
63.000
Subtotale
0
Costo convenzionale
63.000
Totale
Tutti gli importi devono essere espressi in Euro arrotondati alle centinaia
Registration fees for scientific conferences and
workshops.
(*) sono comunque rendicontabili le spese da effettuare per pubblicazioni e presentazione dei risultati finali della ricerca nei dodici
mesi successivi alla conclusione del progetto, purché le relative spese siano impegnate entro la data di scadenza del progetto e purché
le pubblicazioni e la presentazione dei risultati avvengano entro nove mesi dalla conclusione del progetto.
MIUR - BANDO 2008 - MODELLO B
- 12 -
Ministero dell'Istruzione dell'Università e della Ricerca
18 - Prospetto finanziario dell'Unità di Ricerca
Voce di spesa
a.1) finanziamenti diretti, disponibili da parte di
Università/Enti vigilati di appartenenza dei ricercatori
dell'unità operativa
a.2) finanziamenti diretti acquisibili con certezza da parte di
Università/Enti vigilati di appartenenza dei ricercatori
dell'unità operativa
a.3) finanziamenti connessi al costo convenzionale
b.1) finanziamenti diretti disponibili messi a disposizione da
parte di soggetti esterni
b.2) finanziamenti diretti acquisibili con certezza, messi a
disposizione da parte di soggetti esterni
c) cofinanziamento richiesto al MIUR
(max 70% del costo complessivo)
Totale
Importo in Euro
5.200
13.700
0
44.100
63.000
19 - Certifico la dichiarata disponibilità e l'utilizzabilità dei finanziamenti a.1) a.2) a.3) b.1) b.2)
SI
Firma _____________________________________
I dati contenuti nella domanda di finanziamento sono trattati esclusivamente per lo svolgimento delle funzioni istituzionali del
MIUR. Incaricato del trattamento è il CINECA- Dipartimento Servizi per il MIUR. La consultazione è altresì riservata al MIUR D.G. della Ricerca -- Ufficio IV -- Settore PRIN, alla Commissione di Garanzia e ai referee scientifici. Il MIUR potrà anche
procedere alla diffusione dei principali dati economici e scientifici relativi ai progetti finanziati. Responsabile del procedimento è il
coordinatore del settore PRIN dell'ufficio IV della D.G. della Ricerca del MIUR.
Firma _____________________________________
MIUR - BANDO 2008 - MODELLO B
Data 09/02/2009 ore 12:17
- 13 -
Ministero dell'Istruzione dell'Università e della Ricerca
ALLEGATO
Curricula scientifici dei componenti il gruppo di ricerca
Testo italiano
1.
CAPPELLARI Lorenzo
Curriculum:
Lorenzo Cappellari e` nato a Pieve di Cadore (BL) nel 1977. Ha conseguito la Laurea (V.O., con Lode) ed il Dottorato di Ricerca in Ingegneria delle
Telecomunicazioni presso l'Universita` di Padova, rispettivamente nel 2002 e nel 2006. Dal 2004 e` membro dell'IEEE.
Durante il 2001, ha trascorso un trimestre presso la University of California, San Diego, nell'ambito del programma "Exchange Abroad Program"
dell'Universita` della California. Sotto la supervisione del Prof. T.Q. Nguyen e del Prof. G.A. Mian ha qui lavorato sulla sua Tesi di Laurea "An Algorithm
for Blocking Artifact Removal in Low Bit Rate Video Sequence Decoding".
Nel 2002, ha collaborato con il Laboratorio di Tecnologie e Telecomunicazioni Multimediali dell'Universita` di Padova; in particolare, ha implementato un
algoritmo di decodifica per lo standard ISO/IEC JPEG2000.
Nel 2003, ha iniziato gli studi di dottorato sotto la supervisione del Prof. G.A. Mian, conclusi poi con la discussione della tesi "Traditional and Scalable
Coding Techniques for Video Compression".
Durante l'anno accademico 2004-2005, ha visitato il "Videoprocessing Laboratory" della University of California, San Diego in qualita` di "visiting Ph.D.
Student". Durante questo periodo, ha lavorato su algoritmi a bassa complessita` computazionale per codifica video scalabile ed e` stato assunto come TA
("Teaching Assistant") per due corsi di laurea in elaborazione numerica dei segnali.
Nel 2005, ha partecipato alla "39th IEEE Asilomar Conference on Signals, Systems and Computers" (Pacific Grove, CA, USA), dove il suo lavoro "Optimal
motion compensation for low bit rate wavelet based error frame coding" e` stato selezionato tra i migliori 10 articoli scritti da studenti.
Dal 2006, e` titolare di un assegno di ricerca presso il Dipartimento di Ingegneria dell'Informazione dell'Universita` di Padova. In particolare, si occupa di
algoritmi di codifica video robusti e scalabili per applicazioni di videoconferenza.
I suoi principali interessi di ricerca riguardano l'elaborazione numerica dei segnali, la codifica scalabile di immagini e video, la codifica distribuita, e la
teoria dell'informazione.
Pubblicazioni:
CAPPELLARI L., CRUZ-REYES C, CALVAGNO G, KARI J (2009). Lossy to Lossless Spatially Scalable Depth Map Coding with Cellular Automata. In:
Data Compression Conference. Snowbird, UT, U.S.A, 16-18 Mar. 2009
CAPPELLARI L. (2008). Statistical Model-Aided Decoding of Continuous-Valued Syndromes for Source Coding with Side Information. In: European
Signal Processing Conf. (EUSIPCO). Lausanne, Switzerland, 25-29 Aug. 2008
CAPPELLARI L. (2007). An approach to code generation for trellis-coded quantization based on geometrically uniform codebooks. In: Workshop Toni
Mian. Padova, Italy, 26/10/2007
CAPPELLARI L. (2007). Wavelet-Domain Distributed Video Coding Based on Continuous-Valued Syndromes. In: European Signal Processing Conf.
(EUSIPCO). Poznan, Poland, 3-7 Sept. 2007, p. 1422-1426
CAPPELLARI L., MIAN G.A (2006). A practical algorithm for distributed source coding based on continuous-valued syndromes. In: European Signal
Processing Conf. (EUSIPCO), 4-8 Sept. 2006
CAPPELLARI L., MIAN G.A (2006). An Algorithm for Intra-Frame Video Coding Based on Continuous-Valued Syndromes. In: 40th IEEE Asilomar Conf.
on Signals, Syst. and Comput., 29 Oct.-1 Nov. 2006, p. 1090-1094
CAPPELLARI L., NGUYEN T.Q. (2006). An alternative framework for spatio-temporal scalability in video coding. In: Wireless Reconfigurable Terminals
and Protocols (WiRTeP) Workshop, 10-12 Apr. 2006, p. 192-196
CAPPELLARI L., NGUYEN T.Q. (2005). Low complexity wavelet based scalable video coding. In: Intl. Workshop Very Low Bit-Rate Video-Coding
(VLBV), 15-16 Sept. 2005
CAPPELLARI L., NGUYEN T.Q. (2005). Optimal motion compensation for low bit rate wavelet based error frame coding. In: 39th IEEE Asilomar Conf. on
Signals, Syst. and Comput., 30 Oct.-2 Nov. 2005, p. 751-755
CAPPELLARI L., MIAN G.A. (2004). Analysis of joint predictive-transform coding for still image compression. SIGNAL PROCESSING, vol. 84; p.
2097-2114, ISSN: 0165-1684
CAPPELLARI L., MIAN G.A. (2003). Analysis of joint predictive-transform coding. In: Sixth Baiona Workshop on Signal Processing in Communications,
8-10 Sept. 2003, p. 301-306
CAPPELLARI L., NGUYEN T.Q. (2003). Deblocking of video sequences with lapped embedded IDCT. In: IEEE Intl. Conf. on Acoust., Speech and Signal
Processing, 6-10 Apr. 2003, vol. 3, p. 737-740
2.
MILANI Simone
MIUR - BANDO 2008 - MODELLO B
- 14 -
Ministero dell'Istruzione dell'Università e della Ricerca
Curriculum:
Simone Milani si è laureato con lode in Ingegneria delle Telecomunicazioni (vecchio ordinamento) presso l'Università degli studi di Padova nel dicembre
2002.
Nel 2003 ha ottenuto una borsa di ricerca dal titolo "Algoritmi di rate control per il codificatore H.264/AVC" nell'ambito del progetto ministeriale FIRB
PRIMO.
Nel 2004 è entrato nel corso di Dottorato in Ingegneria Elettronica e delle Telecomunicazioni presso il Dipartimento di Ingegneria dell'Informazione (DEI)
dell'Università di Padova sotto la supervisione del prof. G.A. Mian. La sua attività di ricerca è stata focalizzata sullo studio e l'analisi di soluzioni per la
codifica di sorgente video e la trasmissione video su reti affette da perdita. Ha anche collaborato con STMicroelectronics di Agrate Brianza (MI) dal 2003 al
2006 progettando algoritmi di ottimizzazione per il codificatore H.264/AVC.
Da agosto 2005 a giugno 2006 è stato presso la University of California - Berkeley, Berkeley, CA, USA, nell'ambito del programma di scambio EAP
collaborando con il prof. K. Ramchandram su tematiche di codifica di sorgente video distribuita (DSC).
Nel gennaio 2007 ha iniziato a lavorare con il prof. G. Calvagno nell'ambito del progetto ministeriale PRIN 2005 "Reliable
Multimedia Transmission over non-Reliable Networks" in collaborazione con l'Università di Udine e l'Università di Genova.
Da Agosto a Dicembre 2008 e' stato assegnista di ricerca presso l'Università di Udine collaborando con il prof. R. Rinaldo e il DR. R. Bernardini e
progettando strategie di ottimizzazione cross-layer della trasmissione video su reti IEEE 802.11e. Nel giugno 2008 ha vinto il Premio "Francesco Carassa"
per il miglior lavoro nel settore "Elaborazione dei Segnali e Telerilevamento" nell'ambito della Riunione annuale GTTI 2008.
Attualmente e' assegnista di ricerca presso l'Università di Padova nell'ambito del progetto di ricerca "Analisi e realizzazione di un codificatore video
scalabile per la trasmissione su reti eterogenee e affette da perdite basato sui principi della codifica distribuita" sotto la supervisione del prof. G. Calvagno.
La sua ricerca è principalmente focalizzata sull'elaborazione e trasmissione di segnali multimediali digitali, sulla codifica congiunta di sorgente-canale, sulla
trasmissione video robusta, sulla codifica di sorgente distribuita. È membro della IEEE Information Theory Society e della IEEE Signal Processing Society.
Ha inoltre effettuato revisioni per diverse riviste e conferenze internazionali.
Ha inoltre curato le esercitazioni di laboratorio nei corsi di Elaborazione Numerica dei Segnali del prof. G. A. Mian (Autunno 2004) e del prof G. M.
Cortelazzo (Autunno 2006).
Pubblicazioni:
MILANI S., CRUZ-REYES C, KARI J, CALVAGNO G (2009). A Binary Image Scalable Coder Based on Reversible Cellular Automata Transform and
Arithmetic Coding. In: Proc. of the 2009 Data Compression Conference (DCC 2009). Snowbird, UT, USA, Mar. 16-18, 2009
MILANI S. (2008). A Belief-Propagation Based Fast Intra Coding Algorithm for the H.264/AVC FRExt coder. In: Proc. of the 16th European Signal
Processing Conference (EUSIPCO 2008). Lausanne, Switzerland, Aug. 25-29, 2008
MILANI S., CALVAGNO G, BERNARDINI R, RINALDO R (2008). A Low-Complexity Packet Classification Algorithm for Multiple Description Video
Streaming over IEEE802.11e Networks. In: Proc. of the 2008 IEEE International Conference on Image Processing (ICIP 2008). San Diego, CA, USA, Oct.
2008
MILANI S., CALVAGNO G, BERNARDINI R, ZONTONE P (2008). Cross-Layer Joint Optimization of FEC Channel Codes and Multiple Description
Coding for Video Delivery over IEEE 802.11e Links. In: Proc. of the 2008 IEEE International Conference on Future Multimedia Networks (FMN 2008)
(co-located with NGMAST2008). Cardiff, Wales, GB, Sep. 17-18, 2008
MILANI S., CELETTO L, MIAN G.A (2008). An Accurate Low-Complexity Rate Control Algorithm Based on (rho,Eq)-Domain. IEEE TRANSACTIONS ON
CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, vol. 18; p. 257-262, ISSN: 1051-8215, doi: 10.1109/TCSVT.2007.913965
MILANI S., ZONTONE P (2008). Cross-layer Optimization Strategies for Video Transmission Over IEEE 802.11e Networks. In: Proc. of the 2008 GTTI
Annual Meeting. Firenze, June 16-18, 2008
MILANI S., CALVAGNO G (2007). A Distributed Video Coder Based on the H.264/AVC Standard. In: Proceedings of the 15th European Signal Processing
Conference (EUSIPCO 2007). Poznan, Poland, Sept. 3-7, 2007
MILANI S., CALVAGNO G (2007). Cross-Layer Optimization Based On rho-Domain: When Bit Rate, QoS, and Complexity Meet On A Common Ground.
In: Workshop. Padova, Italy, Oct. 26, 2007
MILANI S., J. WANG, K. RAMCHANDRAN (2007). Achieving high compression efficiency with distributed video coding. In: Proc. of IS&T/SPIE Annual
Symposium on Electronic Imaging Science and Technology - Visual Communications and Image Processing (VCIP 2007). San Jose, CA, USA, Jan. 2007
MILANI S., G.A. MIAN (2006). An Improved Context Adaptive Binary Arithmetic Coder for the H.264/AVC standard. In: Proc. of European Signal
Processing Conference (EUSIPCO 2006). Florence, Italy, Sept. 2006
MILANI S., G.A. MIAN, L. CELETTO (2006). A rho-Domain Based Joint Optimization of Source-Channel Video Coding. In: Proc. of Wireless
Reconfigurable Terminals and Protocols (WiRTeP 2006). Rome, Italy, Apr. 10-12, 2006
O. CAMPANA, A. CATTANI, A. DE GIUSTI, MILANI S., N. ZANDONA' AND G. CALVAGNO (2006). Multiple Description Coding Schemes for the
H.264/AVC Coder. In: Proc. of Wireless Reconfigurable Terminals and Protocols (WiRTeP 2006). Rome, Italy, Apr. 10-12, 2006
MILANI S., G.A. MIAN, L. CELETTO (2005). Joint optimization of source-channel video coding using the H.264 coder and FEC codes. In: Proc. of the
13th European Signal Processing Conference (EUSIPCO 2005). Antalya, Turkey, Sept. 4-8, 2004
N. ZANDONA', MILANI S., A. DE GIUSTI (2005). Motion-Compensated Multiple Description Video Coding. In: Proc. of the International conference on
Multimedia, Image Processing, and Computer Vision 2005 (IADAT-micv2005). Madrid, Spain, Mar. 30th - Apr. 1st, 2005
CAMPANA O, MILANI S. (2004). A Multiple Description Coding Scheme For The H.264/AVC Coder. In: Proc. of the International Conference on
Telecommunication and Computer Networks (IADAT-tcn2004). San Sebastian, Spain, Dec. 2004, p. 191-195
L. CELETTO, D. ALFONSO, D. BAGNI, MILANI S. (2004). Constant Bit-Rate Control Efficiency With Fast Motion Estimation in H.264/AVC Video
Coding Standard. In: Proc. of the 12th European Signal Processing Conference (EUSIPCO 2004),. Wien, Austria, Sept. 6-10, 2004
MILANI S., G. A. MIAN, L. CELETTO, D. ALFONSO (2004). A (rho,Eq)-Domain Based Low-Cost Rate-Control Algorithm for the H.264 Video Coder. In:
Proc. of the Seventh International Symposium on Wireless Personal Multimedia Communications (WPMC 2004). Abano Terme (PD), Italy, Sept. 2004, vol.
V1, p. 137-142
MILANI S., L. CELETTO, G. A. MIAN (2003). A Rate Control Algorithm for the H.264 encoder. In: Proceedings of the Sixth Baiona Workshop on Signal
Processing in Communications. Baiona, Spain, Sept. 2003, p. 390-396
MIUR - BANDO 2008 - MODELLO B
- 15 -
Ministero dell'Istruzione dell'Università e della Ricerca
Testo inglese
1.
CAPPELLARI Lorenzo
Curriculum:
Lorenzo Cappellari was born in Pieve di Cadore, Italy, in 1977. He received the "Laurea" degree (with honors) and the Ph.D. degree in Telecommunications
Engineering from the University of Padova, Italy, respectively in 2002 and 2006. Since 2004, he is a Member of the IEEE.
During 2001, he participated to the "Exchange Abroad Program" of the University of California and spent a quarter at the University of California, San
Diego. Under the supervision of Prof. T.Q. Nguyen and Prof. G.A. Mian he worked towards his Laurea thesis titled "An Algorithm for Blocking Artifact
Removal in Low Bit Rate Video Sequence Decoding".
In 2002, he was with the "Laboratorio di Tecnologie e Telecomunicazioni Multimediali" of the University of Padova, where he implemented a decoding
algorithm for the standard ISO/IEC JPEG2000.
In 2003, he began the studies towards his Ph.D. degree under the supervision of Prof. G.A. Mian, with a Ph.D. thesis titled "Traditional and Scalable Coding
Techniques for Video Compression".
During the academic year 2004-2005, he was with the Videoprocessing Laboratory of the University of California, San Diego as a visiting Ph.D. student.
During this period, he worked on low complexity algorithms for scalable video coding and served as TA (Teaching Assistant) for two undergraduate-level
classes in digital signal processing.
In 2005, he participated to the 39th IEEE Asilomar Conference on Signals, Systems and Computers (Pacific Grove, CA, USA), where his work titled "Optimal
motion compensation for low bit rate wavelet based error frame coding" was selected amongst the best 10 student-authored papers.
Since 2006, he is employed as a research contractor by the Dept. of Information Engineering, University of Padova. He is working on robust scalable video
coding algorithms for videoconferencing applications.
His main research interests are in the fields of digital signal processing, scalable image and video coding, distributed source coding, and information theory.
Pubblicazioni:
CAPPELLARI L., CRUZ-REYES C, CALVAGNO G, KARI J (2009). Lossy to Lossless Spatially Scalable Depth Map Coding with Cellular Automata. In:
Data Compression Conference. Snowbird, UT, U.S.A, 16-18 Mar. 2009
CAPPELLARI L. (2008). Statistical Model-Aided Decoding of Continuous-Valued Syndromes for Source Coding with Side Information. In: European
Signal Processing Conf. (EUSIPCO). Lausanne, Switzerland, 25-29 Aug. 2008
CAPPELLARI L. (2007). An approach to code generation for trellis-coded quantization based on geometrically uniform codebooks. In: Workshop Toni
Mian. Padova, Italy, 26/10/2007
CAPPELLARI L. (2007). Wavelet-Domain Distributed Video Coding Based on Continuous-Valued Syndromes. In: European Signal Processing Conf.
(EUSIPCO). Poznan, Poland, 3-7 Sept. 2007, p. 1422-1426
CAPPELLARI L., MIAN G.A (2006). A practical algorithm for distributed source coding based on continuous-valued syndromes. In: European Signal
Processing Conf. (EUSIPCO), 4-8 Sept. 2006
CAPPELLARI L., MIAN G.A (2006). An Algorithm for Intra-Frame Video Coding Based on Continuous-Valued Syndromes. In: 40th IEEE Asilomar Conf.
on Signals, Syst. and Comput., 29 Oct.-1 Nov. 2006, p. 1090-1094
CAPPELLARI L., NGUYEN T.Q. (2006). An alternative framework for spatio-temporal scalability in video coding. In: Wireless Reconfigurable Terminals
and Protocols (WiRTeP) Workshop, 10-12 Apr. 2006, p. 192-196
CAPPELLARI L., NGUYEN T.Q. (2005). Low complexity wavelet based scalable video coding. In: Intl. Workshop Very Low Bit-Rate Video-Coding
(VLBV), 15-16 Sept. 2005
CAPPELLARI L., NGUYEN T.Q. (2005). Optimal motion compensation for low bit rate wavelet based error frame coding. In: 39th IEEE Asilomar Conf. on
Signals, Syst. and Comput., 30 Oct.-2 Nov. 2005, p. 751-755
CAPPELLARI L., MIAN G.A. (2004). Analysis of joint predictive-transform coding for still image compression. SIGNAL PROCESSING, vol. 84; p.
2097-2114, ISSN: 0165-1684
CAPPELLARI L., MIAN G.A. (2003). Analysis of joint predictive-transform coding. In: Sixth Baiona Workshop on Signal Processing in Communications,
8-10 Sept. 2003, p. 301-306
CAPPELLARI L., NGUYEN T.Q. (2003). Deblocking of video sequences with lapped embedded IDCT. In: IEEE Intl. Conf. on Acoust., Speech and Signal
Processing, 6-10 Apr. 2003, vol. 3, p. 737-740
2.
MILANI Simone
Curriculum:
Simone Milani received his Laurea Degree (5 years course) with honors from the University of Padova, Italy, on December 2002. In 2003 he won a research
scholarship within the MiUR project FIRB PRIMO to investigate about the topic "Rate Control algorithms for the H.264/AVC coder".
In 2004 he was enrolled in the Ph.D. course in Electronics and Telecommunication Engineering at the Department of Information Engineering (DEI) of the
University of Padova under the supervision of G. A. Mian. His research was focused on video source coding and video transmission over lossy networks. He
also collaborated with STMicroelectronics, Agrate Brianza (MI), Italy, investigating optimization algorithms for the H.264/AVC coder. On August 2005 he
joined the "Education Abroad Program" of the University of California and spent ten months at the University of California - Berkeley, Berkeley, CA, USA. In
this period, he joined the research group of prof. K. Ramchandran and worked on Distributed Source Coding applied to robust video transmission.
MIUR - BANDO 2008 - MODELLO B
- 16 -
Ministero dell'Istruzione dell'Università e della Ricerca
On December 2006 he finished his Ph.D. course, and he started working with prof. G. Calvagno within the PRIN project 2005 "Reliable Multimedia
Transmission over non-Reliable Networks" in collaboration with the University of Udine, Italy, and the University of Genova, Italy. On August 2007, he won
a position as research associate at the University of Udine, Udine, Italy, for the research project "Robust transmission using cross-packet FEC coding",
which concluded the PRIN 2005 work. He was enrolled at the University of Udine until December 2007 working with prof. Roberto Rinaldo and dott.
Riccardo Bernardini on cross-layer optimization strategies for the video transmission over IEEE 802.11e networks. On June 2008 he won the "Francesco
Carassa" Best Paper Award within the Signal Processing and Remote Sensing Session at the 2008 GTTI Annual Meeting.
At the moment, he is enrolled as research associate at the University of Padova within the research project "Analysis and implementation of a scalable video
coder for transmission over heterogeneous unreliable networks based on distributed coding principles" under the supervision of prof. Giancarlo Calvagno.
His main research topics are digital signal processing, source coding, joint source-channel coding, robust video transmission over lossy packet networks,
distributed source coding. He is also a IEEE member of Information Theory and Signal Processing Societies and he has also been a reviewer for several
international magazines and conferences.
He also taught lab exercise sessions for the Digital Signal Processing course with prof. G.A. Mian (Autumn 2004) and prof. G.M. Cortelazzo (Autumn 2006)
Pubblicazioni:
MILANI S., CRUZ-REYES C, KARI J, CALVAGNO G (2009). A Binary Image Scalable Coder Based on Reversible Cellular Automata Transform and
Arithmetic Coding. In: Proc. of the 2009 Data Compression Conference (DCC 2009). Snowbird, UT, USA, Mar. 16-18, 2009
MILANI S. (2008). A Belief-Propagation Based Fast Intra Coding Algorithm for the H.264/AVC FRExt coder. In: Proc. of the 16th European Signal
Processing Conference (EUSIPCO 2008). Lausanne, Switzerland, Aug. 25-29, 2008
MILANI S., CALVAGNO G, BERNARDINI R, RINALDO R (2008). A Low-Complexity Packet Classification Algorithm for Multiple Description Video
Streaming over IEEE802.11e Networks. In: Proc. of the 2008 IEEE International Conference on Image Processing (ICIP 2008). San Diego, CA, USA, Oct.
2008
MILANI S., CALVAGNO G, BERNARDINI R, ZONTONE P (2008). Cross-Layer Joint Optimization of FEC Channel Codes and Multiple Description
Coding for Video Delivery over IEEE 802.11e Links. In: Proc. of the 2008 IEEE International Conference on Future Multimedia Networks (FMN 2008)
(co-located with NGMAST2008). Cardiff, Wales, GB, Sep. 17-18, 2008
MILANI S., CELETTO L, MIAN G.A (2008). An Accurate Low-Complexity Rate Control Algorithm Based on (rho,Eq)-Domain. IEEE TRANSACTIONS ON
CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, vol. 18; p. 257-262, ISSN: 1051-8215, doi: 10.1109/TCSVT.2007.913965
MILANI S., ZONTONE P (2008). Cross-layer Optimization Strategies for Video Transmission Over IEEE 802.11e Networks. In: Proc. of the 2008 GTTI
Annual Meeting. Firenze, June 16-18, 2008
MILANI S., CALVAGNO G (2007). A Distributed Video Coder Based on the H.264/AVC Standard. In: Proceedings of the 15th European Signal Processing
Conference (EUSIPCO 2007). Poznan, Poland, Sept. 3-7, 2007
MILANI S., CALVAGNO G (2007). Cross-Layer Optimization Based On rho-Domain: When Bit Rate, QoS, and Complexity Meet On A Common Ground.
In: Workshop. Padova, Italy, Oct. 26, 2007
MILANI S., J. WANG, K. RAMCHANDRAN (2007). Achieving high compression efficiency with distributed video coding. In: Proc. of IS&T/SPIE Annual
Symposium on Electronic Imaging Science and Technology - Visual Communications and Image Processing (VCIP 2007). San Jose, CA, USA, Jan. 2007
MILANI S., G.A. MIAN (2006). An Improved Context Adaptive Binary Arithmetic Coder for the H.264/AVC standard. In: Proc. of European Signal
Processing Conference (EUSIPCO 2006). Florence, Italy, Sept. 2006
MILANI S., G.A. MIAN, L. CELETTO (2006). A rho-Domain Based Joint Optimization of Source-Channel Video Coding. In: Proc. of Wireless
Reconfigurable Terminals and Protocols (WiRTeP 2006). Rome, Italy, Apr. 10-12, 2006
O. CAMPANA, A. CATTANI, A. DE GIUSTI, MILANI S., N. ZANDONA' AND G. CALVAGNO (2006). Multiple Description Coding Schemes for the
H.264/AVC Coder. In: Proc. of Wireless Reconfigurable Terminals and Protocols (WiRTeP 2006). Rome, Italy, Apr. 10-12, 2006
MILANI S., G.A. MIAN, L. CELETTO (2005). Joint optimization of source-channel video coding using the H.264 coder and FEC codes. In: Proc. of the
13th European Signal Processing Conference (EUSIPCO 2005). Antalya, Turkey, Sept. 4-8, 2004
N. ZANDONA', MILANI S., A. DE GIUSTI (2005). Motion-Compensated Multiple Description Video Coding. In: Proc. of the International conference on
Multimedia, Image Processing, and Computer Vision 2005 (IADAT-micv2005). Madrid, Spain, Mar. 30th - Apr. 1st, 2005
CAMPANA O, MILANI S. (2004). A Multiple Description Coding Scheme For The H.264/AVC Coder. In: Proc. of the International Conference on
Telecommunication and Computer Networks (IADAT-tcn2004). San Sebastian, Spain, Dec. 2004, p. 191-195
L. CELETTO, D. ALFONSO, D. BAGNI, MILANI S. (2004). Constant Bit-Rate Control Efficiency With Fast Motion Estimation in H.264/AVC Video
Coding Standard. In: Proc. of the 12th European Signal Processing Conference (EUSIPCO 2004),. Wien, Austria, Sept. 6-10, 2004
MILANI S., G. A. MIAN, L. CELETTO, D. ALFONSO (2004). A (rho,Eq)-Domain Based Low-Cost Rate-Control Algorithm for the H.264 Video Coder. In:
Proc. of the Seventh International Symposium on Wireless Personal Multimedia Communications (WPMC 2004). Abano Terme (PD), Italy, Sept. 2004, vol.
V1, p. 137-142
MILANI S., L. CELETTO, G. A. MIAN (2003). A Rate Control Algorithm for the H.264 encoder. In: Proceedings of the Sixth Baiona Workshop on Signal
Processing in Communications. Baiona, Spain, Sept. 2003, p. 390-396
MIUR - BANDO 2008 - MODELLO B
- 17 -