In Implicit Neural Representations (INRs) a discrete signal is interpreted as a continuous function from coordinates to samples and a neural network is then overfit to represent this function. The resulting network parameters can be compressed to reduce the dimensionality, serving as an alternative paradigm to traditional codecs. Although such approach is in its early stage, it has been already successfully employed to encode various data modalities and has recently gained the attention of the research community. In this thesis, we propose a set of INR-based codecs for media content and evaluate their application in various multimedia-based systems such as image compression and video streaming, comparing them to other existing and more traditional approaches and discussing their most interesting properties and how it could be possible to overcome their current limitations in future research.

Nelle rappresentazioni neurali implicite (INR) un segnale discreto viene interpretato come una funzione continua dalle coordinate ai campioni e una rete neurale viene poi allenata per approssimare questa funzione. I parametri della rete risultante possono essere compressi per ridurre la dimensionalità, fungendo da paradigma alternativo ai codec tradizionali. Sebbene questo approccio sia in fase embrionale, è già stato impiegato con successo per codificare diverse modalità di dati e ha recentemente guadagnato l'attenzione della comunità di ricerca. In questa tesi, proponiamo una serie di codec basati sull'INR per i contenuti multimediali e valutiamo la loro applicazione in vari sistemi multimediali, come la compressione di immagini e lo streaming video, confrontandoli con altri approcci esistenti e più tradizionali e discutendo le loro proprietà più interessanti e il modo in cui potrebbe essere possibile superare i loro limiti attuali nella ricerca futura.

Implicit Neural Representations for Multimedia Compression [Rappresentazioni neurali implicit per la Compressione di Multimedia]

CATANIA, LORENZO
2025

Abstract

In Implicit Neural Representations (INRs) a discrete signal is interpreted as a continuous function from coordinates to samples and a neural network is then overfit to represent this function. The resulting network parameters can be compressed to reduce the dimensionality, serving as an alternative paradigm to traditional codecs. Although such approach is in its early stage, it has been already successfully employed to encode various data modalities and has recently gained the attention of the research community. In this thesis, we propose a set of INR-based codecs for media content and evaluate their application in various multimedia-based systems such as image compression and video streaming, comparing them to other existing and more traditional approaches and discussing their most interesting properties and how it could be possible to overcome their current limitations in future research.
10-feb-2025
Inglese
Nelle rappresentazioni neurali implicite (INR) un segnale discreto viene interpretato come una funzione continua dalle coordinate ai campioni e una rete neurale viene poi allenata per approssimare questa funzione. I parametri della rete risultante possono essere compressi per ridurre la dimensionalità, fungendo da paradigma alternativo ai codec tradizionali. Sebbene questo approccio sia in fase embrionale, è già stato impiegato con successo per codificare diverse modalità di dati e ha recentemente guadagnato l'attenzione della comunità di ricerca. In questa tesi, proponiamo una serie di codec basati sull'INR per i contenuti multimediali e valutiamo la loro applicazione in vari sistemi multimediali, come la compressione di immagini e lo streaming video, confrontandoli con altri approcci esistenti e più tradizionali e discutendo le loro proprietà più interessanti e il modo in cui potrebbe essere possibile superare i loro limiti attuali nella ricerca futura.
ALLEGRA, DARIO
BATTIATO, SEBASTIANO
Università degli studi di Catania
Catania
File in questo prodotto:
File Dimensione Formato  
Tesi_di_Dottorato.pdf

embargo fino al 10/02/2026

Licenza: Tutti i diritti riservati
Dimensione 45.66 MB
Formato Adobe PDF
45.66 MB Adobe PDF Visualizza/Apri

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14242/285205
Il codice NBN di questa tesi è URN:NBN:IT:UNICT-285205