The integration of Spatiotemporal Neural Networks in Portfolio Optimization

Komis, Diana Akthem Na'Em

I strongly believe in the strength of the mixture between Spatiotemporal Neural Networks and the graph theory in financial econometrics , and this is the aim of my PhD thesis where I advance financial econometrics by developing and applying spatiotemporal neural network architectures to solve key challenges in multivariate return and covariance forecasting. My work directly improves portfolio optimization and risk management. I contribute in three main areas: innovating deep learning methods tailored for finance, empirically testing market efficiency hypotheses, and enhancing portfolio construction techniques with practical applications. Chapter 1: A spatiotemporal RNN for predicting Realized Covariance In this chapter I address a key gap in financial econometrics: accurately predicting high dimensional realized covariance matrices that are crucial for risk management and asset allocation. Traditional approaches such as multivariate GARCH and linear factor models do not capture the complex, nonlinear interdependencies among asset volatilities, especially during regime changes and periods of market stress. I use the Adaptive Graph Convolutional Recurrent Network (AGCRN) a model that was used for traffic forecasting to overcome these limits through two innovations: (1) Node Adaptive Parameter Learning (NAPL), which generates asset-specific filter parameters while keeping the number of parameters under control via weight factorization, and (2) Data Adaptive Graph Generation (DAGG), which learns the latent correlation network directly from high-frequency data instead of relying on static or ad hoc graphs. On a panel of 50 S&P 500 stocks, AGCRN delivers superior predictive accuracy, achieving the lowest Frobenius, Euclidean, and Procrustes norms relative to LSTM, RNN, VAR, and random walk benchmarks. Giacomini–White tests and the Model Confidence Set procedure show that AGCRN belongs to the set of superior models across multiple loss functions, providing strong evidence of the robustness of this approach. Chapter 3: Maximum Spanning Tree Portfolio Construction with Predicted Covariance Matrices I use this chapter to connect my forecasting work to practical portfolio management and to tackle what Michaud calls the “Markowitz Enigma” – the extreme sensitivity of mean–variance optimization to input errors. Instead of feeding noisy covariance forecasts directly into Markowitz optimization, I build portfolios with a Maximum Spanning Tree (MaxST) approach, using distance matrices derived from predicted realized covariances. This network-based method filters noise through metric properties and keeps only the strongest diversification links, that is, the highest distances and lowest correlations. With this MaxST–AGCRN framework, I obtain the highest Sharpe Ratio (0.091757), Sortino Ratio (0.147984), and Information Ratio (0.071559) among all competing strategies, including mean variance, Global Minimum Variance, Black–Litterman, and other machine-learning-based approaches. The resulting portfolios keep maximum drawdowns under control, maintain strong diversification, and adapt to changing market structures. This shows that combining advanced forecasting with network-based portfolio construction yields portfolios that are both theoretically well-founded and empirically superior. Chapter 4: Spatiotemporal Covariance Neural Networks for Asset Return Forecasting In this paper and after seeing how the results of the spatiotemporal neural networks have addressed the challenges of forecasting the realized covariances I have experienced another model by predicting asset returns despite the Efficient Market Hypothesis. My Spatiotemporal coVariance Neural Network (STVNN) transforms time-varying covariance matrices into dynamic graph structures, allowing me to capture both spatial dependencies across assets and temporal return patterns within a unified framework. Unlike models that treat assets in isolation, I use realized covariance matrices as evolving graph adjacency operators to let the network learn conditional market behavior patterns. On a panel of 50 S&P 500 stocks, STVNN delivers superior predictive accuracy, achieving the lowest Euclidean and Mean Squared ErrorS relative to LSTM, RNN, VAR, spatial GARCH and random walk benchmarks. Giacomini–White tests and the Model Confidence Set procedure show that AGCRN belongs to the set of superior models across multiple loss functions, providing strong evidence of the robustness of this approach.

Sono fermamente convinto della forza della combinazione tra Reti Neurali Spatiotemporali e teoria dei grafi nell'econometria finanziaria, e questo è l'obiettivo della mia tesi di dottorato dove avanzo l'econometria finanziaria sviluppando e applicando architetture di reti neurali spatiotemporali per affrontare sfide chiave nella previsione multivariata di rendimenti e matrici di covarianza. Il mio lavoro migliora direttamente l'ottimizzazione del portafoglio e la gestione del rischio. Contribuisco in tre aree principali: innovazione dei metodi di deep learning personalizzati per la finanza, test empirici delle ipotesi di efficienza di mercato e miglioramento delle tecniche di costruzione del portafoglio con applicazioni pratiche. Capitolo 2: Una RNN Spatiotemporale per la Previsione della Covarianza Realizzata In questo capitolo affronto un vuoto chiave nell'econometria finanziaria: prevedere accuratamente matrici di covarianza realizzata ad alta dimensionalità che sono cruciali per la gestione del rischio e l'allocazione degli asset. Gli approcci tradizionali come i modelli GARCH multivariati e i modelli fattoriali lineari non catturano le interdipendenze complesse e non lineari tra le volatilità degli asset, specialmente durante cambi di regime e periodi di stress del mercato. Utilizzo la Rete Ricorrente Convoluzionale Adattiva su Grafi (AGCRN), un modello inizialmente sviluppato per le previsioni di traffico, per superare questi limiti attraverso due innovazioni: (1) Node Adaptive Parameter Learning (NAPL), che genera parametri di filtro specifici per ogni asset mantenendo il numero di parametri sotto controllo attraverso la fattorizzazione dei pesi, e (2) Data Adaptive Graph Generation (DAGG), che apprende la rete di correlazione latente direttamente dai dati ad alta frequenza invece di affidarsi a grafi statici o ad hoc. Su un panel di 50 titoli dell'S&P 500, AGCRN fornisce accuratezza predittiva superiore, raggiungendo le norme di Frobenius, euclidea e Procrustes più basse rispetto ai benchmark LSTM, RNN, VAR e random walk. I test di Giacomini–White e la procedura del Model Confidence Set mostrano che AGCRN appartiene all'insieme dei modelli superiori su molteplici funzioni di perdita, fornendo forte evidenza della robustezza di questo approccio. Capitolo 3: Costruzione di Portafoglio con Albero di Estensione Massimo utilizzando Matrici di Covarianza Previste Utilizzo questo capitolo per collegare il mio lavoro di previsione alla gestione pratica del portafoglio e per affrontare quello che Michaud chiama l'"Enigma di Markowitz" – l'estrema sensibilità dell'ottimizzazione media-varianza agli errori di input. Invece di alimentare direttamente le previsioni rumorose di covarianza nell'ottimizzazione di Markowitz, costruisco portafogli con un approccio di Albero di Estensione Massimo (MaxST), utilizzando matrici di distanza derivate dalle covarianze realizzate previste. Questo metodo basato su reti filtra il rumore attraverso proprietà metriche e mantiene solo i legami di diversificazione più forti, cioè le distanze più elevate e le correlazioni più basse. Con il framework MaxST–AGCRN, ottengo lo Sharpe Ratio più elevato (0.091757), Sortino Ratio (0.147984) e Information Ratio (0.071559) tra tutte le strategie concorrenti, inclusi media-varianza, Global Minimum Variance, Black–Litterman e altri approcci basati su machine learning. I portafogli risultanti mantengono i drawdown massimi sotto controllo, mantengono forte diversificazione e si adattano ai cambiamenti nelle strutture di mercato. Ciò dimostra che combinare previsioni avanzate con costruzione di portafoglio basata su reti produce portafogli che sono sia teoricamente ben fondati che empiricamente superiori. Capitolo 4: Reti Neurali Convoluzionali Spatiotemporali per la Previsione dei Rendimenti degli Asset In questo documento, dopo aver visto come i risultati delle reti neurali spatiotemporali hanno affrontato le sfide della previsione delle covarianze realizzate, ho sperimentato un altro modello per la previsione dei rendimenti degli asset nonostante l'Ipotesi di Mercato Efficiente. La mia Rete Neurale Convoluzionale Spatiotemporale (STVNN) trasforma matrici di covarianza variabili nel tempo in strutture di grafi dinamici, permettendomi di catturare sia le dipendenze spaziali tra gli asset che i pattern temporali di rendimento all'interno di un unico framework. A differenza di modelli che trattano gli asset isolatamente, utilizzo matrici di covarianza realizzata come operatori di adiacenza di grafi in evoluzione per permettere alla rete di apprendere pattern di comportamento condizionato del mercato. Su un panel di 50 titoli dell'S&P 500, STVNN fornisce accuratezza predittiva superiore, raggiungendo le norme euclidee e Mean Squared Errors più basse rispetto ai benchmark LSTM, RNN, VAR, GARCH spaziale e random walk. I test di Giacomini–White e la procedura del Model Confidence Set mostrano che AGCRN appartiene all'insieme dei modelli superiori su molteplici funzioni di perdita, fornendo forte evidenza della robustezza di questo approccio. Contributi della Ricerca e Innovazioni Attraverso questa ricerca, sto vedendo i risultati di questa combinazione che spingono i confini dell'econometria finanziaria. La mia ricerca sfida il pensiero convenzionale in tre modi: • Superamento dell'Alta Dimensionalità: Questa combinazione ha affrontato la maledizione della dimensionalità affrontata dai modelli tradizionali come GARCH multivariato e modelli fattoriali utilizzando reti neurali su grafi che scalano a portafogli di grandi dimensioni. • Riconciliazione dell'Efficienza di Mercato con la Prevedibilità: Ha riconciliato l'efficienza di mercato con la prevedibilità, non affermando arbitraggio privo di rischio, ma scoprendo pattern condizionati da effetti di microstructure di mercato, spillover informativi e break strutturali transitori—risultati coerenti con idee moderne di mercato efficiente che creano ancora valore economico. • Riduzione del Rischio di Stima dei Parametri: Utilizzando la teoria dei grafi ho ridotto il rischio di stima dei parametri sfruttando il design dei parametri fattorizzati di AGCRN e il potere di filtraggio del rumore di MaxST, che insieme domano l'enigma dell'ottimizzazione di Markowitz che dipende eccessivamente dalle stime puntuali di medie e covarianze.