Per decenni, lo studio di reti complesse è stato limitato da difficoltà nella raccolta dei dati e computazionali. L’avvento di nuove tecnologie, tanto nelle scienze biologiche quanto nella nostra vita quotidiana, ha enormemente facilitato la raccolta di dati relazionali, alimentando un interesse nello studio di reti complesse senza precedenti. La comprensione delle relazioni rappresentate in reti complesse, tuttavia, è ancora oggi una sfida impegnativa, che richiede lo sviluppo di metodi statistici innovativi, in grado di riassumere e semplificare le informazioni contenute in reti complesse. In questa tesi discutiamo la possibilità di interpretare una rete attraverso lo studio delle relazioni fra gruppi di nodi. La trattazione comincia da NEAT, un test per lo studio delle relazioni fra gruppi di geni in reti biologiche. NEAT estende i test di gene enrichment analysis sfruttando informazioni sulle relazioni fra geni rappresentate tramite una rete, risolvendo al contempo le limitazioni dei test per network enrichment analysis preesistenti. Inoltre, proponiamo due estensioni di modelli stocastici a blocchi per lo studio delle relazioni fra gruppi di individui in reti sociali e l’utilizzo di metodi di inferenza penalizzata per derivare un grafo ridotto che sintetizzi le relazioni fra blocchi di nodi. L’applicazione di tali modelli a reti di cosponsorizzazione delle proposte di legge nel Parlamento Italiano ci consente di ricostruire le collaborazioni fra i partiti politici italiani dal 2001 al 2015. Infine, proponiamo una nuova strategia di clustering per sequenze di grafi basata su misture di modelli lineari generalizzati. Tale metodologia consente non solo di individuare sottopopolazioni di grafi in popolazioni di reti, ma anche di caratterizzare ciascuna di esse per mezzo delle componenti che formano la mistura.

Inferring Community-driven Structure in Complex Networks

SIGNORELLI, MIRKO
2017

Abstract

Per decenni, lo studio di reti complesse è stato limitato da difficoltà nella raccolta dei dati e computazionali. L’avvento di nuove tecnologie, tanto nelle scienze biologiche quanto nella nostra vita quotidiana, ha enormemente facilitato la raccolta di dati relazionali, alimentando un interesse nello studio di reti complesse senza precedenti. La comprensione delle relazioni rappresentate in reti complesse, tuttavia, è ancora oggi una sfida impegnativa, che richiede lo sviluppo di metodi statistici innovativi, in grado di riassumere e semplificare le informazioni contenute in reti complesse. In questa tesi discutiamo la possibilità di interpretare una rete attraverso lo studio delle relazioni fra gruppi di nodi. La trattazione comincia da NEAT, un test per lo studio delle relazioni fra gruppi di geni in reti biologiche. NEAT estende i test di gene enrichment analysis sfruttando informazioni sulle relazioni fra geni rappresentate tramite una rete, risolvendo al contempo le limitazioni dei test per network enrichment analysis preesistenti. Inoltre, proponiamo due estensioni di modelli stocastici a blocchi per lo studio delle relazioni fra gruppi di individui in reti sociali e l’utilizzo di metodi di inferenza penalizzata per derivare un grafo ridotto che sintetizzi le relazioni fra blocchi di nodi. L’applicazione di tali modelli a reti di cosponsorizzazione delle proposte di legge nel Parlamento Italiano ci consente di ricostruire le collaborazioni fra i partiti politici italiani dal 2001 al 2015. Infine, proponiamo una nuova strategia di clustering per sequenze di grafi basata su misture di modelli lineari generalizzati. Tale metodologia consente non solo di individuare sottopopolazioni di grafi in popolazioni di reti, ma anche di caratterizzare ciascuna di esse per mezzo delle componenti che formano la mistura.
2017
Inglese
network; graph; community structure; NEAT; stochastic blockmodel; EMSAGC
Università degli studi di Padova
File in questo prodotto:
File Dimensione Formato  
signorelli_mirko_thesis.pdf

accesso aperto

Dimensione 971.41 kB
Formato Adobe PDF
971.41 kB Adobe PDF Visualizza/Apri

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14242/110904
Il codice NBN di questa tesi è URN:NBN:IT:UNIPD-110904