Bayesian learning of latent discrete structures: graphs, clusters and features allocation

Colombi, Alessandro

Discrete random structures play a central role in modern statistics, as they provide powerful tools to represent hidden aspects of complex phenomena. This thesis develops Bayesian methodologies for the analysis of three fundamental classes of latent discrete structures: graphs, which describe the network of conditional dependencies among random variables; clusters, which represent groups of observations sharing common characteristics; and dynamic features, which correspond to collections of latent attributes that may evolve over time. Across these domains, a unifying challenge lies in the combinatorial explosion of possible configurations, which makes exhaustive enumeration and direct evaluation infeasible. Within the Bayesian framework, this difficulty is addressed through the careful design of prior distributions and through efficient inferential strategies that allow learning in high-dimensional discrete spaces. The thesis is organized into two main parts. The first focuses on graphical models, introducing a block-structured approach with an application to spectrometric data. The second part, on Bayesian nonparametrics, extends the analysis to infinite-dimensional settings, moving beyond the classical exchangeable framework to address more complex scenarios such as clustering and species sampling across multiple populations, as well as dynamic feature allocation, where latent characteristics can appear, disappear, and reappear over time.

Le strutture aleatorie discrete svolgono un ruolo centrale nella statistica moderna, poiché forniscono strumenti potenti per rappresentare aspetti nascosti di fenomeni complessi. Questa tesi sviluppa metodologie bayesiane per l’analisi di tre classi fondamentali di strutture latenti discrete: i grafi, che descrivono la rete di dipendenze condizionali tra variabili casuali; i cluster, che rappresentano gruppi di osservazioni che condividono caratteristiche comuni; e le feature dinamiche, che corrispondono a insiemi di attributi latenti che possono evolvere nel tempo. In tutti questi ambiti, una sfida unificante risiede nel fatto che la dimensione dello spazio delle possibili configurazioni cresce in maniera combinatoria con il numero delle osservazioni, il che rende impraticabile una valutazione esatta di ogni possibile stato. Nel contesto bayesiano, tale difficoltà viene affrontata attraverso la costruzione di distribuzioni a priori specifiche per descrivere particolari proprietà e lo sviluppo di strategie inferenziali efficienti. Insieme, queste consentono l'esplorazione e l'apprendimento delle proprietà statistiche in spazi discreti ad alta dimensionalità. La tesi è organizzata in due parti. La prima è dedicata ai modelli grafici e introduce un approccio a blocchi, con un’applicazione a dati spettrometrici. La seconda parte, incentrata sulla bayesiana non parametrica, estende l’analisi a contesti di dimensione infinita, andando oltre il quadro classico della scambiabilità per affrontare scenari più complessi, come il clustering e il campionamento di specie in popolazioni multiple, nonché l’allocazione dinamica di feature, in cui le caratteristiche latenti possono apparire, scomparire e riapparire nel tempo.