Nella ricerca applicata, i dati dipendenti sono molto frequenti. Nella regressione quantile sono stati proposti diversi approcci per tenere in considerazione la dipendenza tra le osservazioni. Uno dei metodi più utilizzato è il cluster bootstrap, sebbene sia generalmente inefficiente e computazionalmente dispendioso, soprattutto quando il numero di cluster è elevato. Quando l'interesse principale è sui quantili marginali, sono state proposte delle equazioni di stima che modellizzano l'associazione tra i segni dei residui di regressione attraverso il coefficiente di correlazione di Pearson. Tuttavia, questa misura è inadeguata per la dipendenza tra variabili binarie, poichè il suo range dipende dalle loro probabilità marginali. Nella prima parte della tesi viene proposta una matrice di dipendenza definita attraverso gli odds ratios. Le diverse strutture di associazione possono essere stimate attraverso modelli di regressione logistica e possono essere parametrizzate per dipendere da covariate e gruppi. Attraverso uno studio di simulazione viene mostrato che l'efficienza degli stimatori aumenta quando la matrice di associazione è vicina a quella vera. Nella seconda parte della tesi si estende questo metodo ad equazioni di stima penalizzate, che sono utilizzate per ridurre automaticamente la complessità del modello stimato. In quest'ultima parte del lavoro si concentra l'attenzione sui modelli con penalità smoothly clipped absolute deviation per la selezione automatica dei predittori e sulle spline penalizzate tramite riduzione di rango. Attraverso uno studio di simulazione mostriamo che questi metodi hanno performance migliori rispetto a quelli senza penalizzazione. Quando la struttura di associazione è vicina a quella vera l'efficienza dello stimatore aumenta, analogamente al metodo proposto nella prima parte della tesi. I metodi discussi nella tesi sono stati applicati ad un dataset proveniente da uno studio sul comportamento cognitivo in pazienti con disturbi ossessivi-compulsivi; inoltre, per mostrare il massimo potenziale dei metodi penalizzati, si è provveduto a modificare il dataset originale in alcune analisi.
Extensions of marginal quantile regression to the analysis of dependent data
BOSSOLI, DAVIDE
2017
Abstract
Nella ricerca applicata, i dati dipendenti sono molto frequenti. Nella regressione quantile sono stati proposti diversi approcci per tenere in considerazione la dipendenza tra le osservazioni. Uno dei metodi più utilizzato è il cluster bootstrap, sebbene sia generalmente inefficiente e computazionalmente dispendioso, soprattutto quando il numero di cluster è elevato. Quando l'interesse principale è sui quantili marginali, sono state proposte delle equazioni di stima che modellizzano l'associazione tra i segni dei residui di regressione attraverso il coefficiente di correlazione di Pearson. Tuttavia, questa misura è inadeguata per la dipendenza tra variabili binarie, poichè il suo range dipende dalle loro probabilità marginali. Nella prima parte della tesi viene proposta una matrice di dipendenza definita attraverso gli odds ratios. Le diverse strutture di associazione possono essere stimate attraverso modelli di regressione logistica e possono essere parametrizzate per dipendere da covariate e gruppi. Attraverso uno studio di simulazione viene mostrato che l'efficienza degli stimatori aumenta quando la matrice di associazione è vicina a quella vera. Nella seconda parte della tesi si estende questo metodo ad equazioni di stima penalizzate, che sono utilizzate per ridurre automaticamente la complessità del modello stimato. In quest'ultima parte del lavoro si concentra l'attenzione sui modelli con penalità smoothly clipped absolute deviation per la selezione automatica dei predittori e sulle spline penalizzate tramite riduzione di rango. Attraverso uno studio di simulazione mostriamo che questi metodi hanno performance migliori rispetto a quelli senza penalizzazione. Quando la struttura di associazione è vicina a quella vera l'efficienza dello stimatore aumenta, analogamente al metodo proposto nella prima parte della tesi. I metodi discussi nella tesi sono stati applicati ad un dataset proveniente da uno studio sul comportamento cognitivo in pazienti con disturbi ossessivi-compulsivi; inoltre, per mostrare il massimo potenziale dei metodi penalizzati, si è provveduto a modificare il dataset originale in alcune analisi.File | Dimensione | Formato | |
---|---|---|---|
tesi_definitiva_Davide_Bossoli.pdf
accesso aperto
Dimensione
865.65 kB
Formato
Adobe PDF
|
865.65 kB | Adobe PDF | Visualizza/Apri |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14242/174484
URN:NBN:IT:UNIPD-174484