I modelli dell'Item Response Theory (Lord e Novick 1968; Rasch 1960) sono una particolare classe di modelli matematico - probabilistici la cui diffusione ਠlegata al crescente utilizzo, in particolare in ambito psicometrico e sociale, del questionario come strumento fondamentale per la misurazione di uno o pi๠costrutti latenti. L'idea di base ਠquella di tradurre le informazioni, ottenute a partire dalle risposte osservate, in misurazioni oggettive del tratto latente, alla stregua di quanto avviene nelle scienze fisiche. Il modello di Rasch, tra i pi๠noti nella classe dei modelli IRT, rispetta i criteri relativi al concetto di misura e presuppone che la probabilità di risposta corretta ad un item, da parte di un soggetto, sia funzione della differenza tra due parametri: l'abilità del soggetto e la difficoltà dell'item. In particolari contesti applicativi, quale quello dell'Educational Assessment, ਠfrequente che tale classe di modelli venga applicata a matrici di dati incomplete, per le quali ਠipotizzabile che il meccanismo generatore del dato mancante sia non ignorabile (Rubin 1976), determinando distorsioni nelle stime dei parametri dei modelli IRT. A tale proposito, il modello proposto da Holman e Glas (2005) tiene conto del meccanismo generatore del dato mancante considerando, oltre all'abilità , una seconda dimensione latente, la propensione alla risposta, la quale, in caso di dati MNAR (Missing Not At Random), ਠcorrelata alla prima dimensione. Obiettivo principale di questo lavoro di ricerca ਠstato quello di dimostrare che ਠpossibile, nonchà© equivalente, definire il modello proposto da Holman e Glas utilizzando il linguaggio e le potenzialità dei modelli grafici (Lauritzen 1996) rendendo evidenti, mediante grafo diretto aciclico, le relazioni di indipendenza condizionata tra le variabili manifeste, e non, del modello. In particolare, si ਠdefinito un modello di Rasch bidimensionale, in ottica between items (Adams, Wilson e Wang 1997). L'approccio bayesiano ha arricchito, in termini di flessibilità , la rappresentazione grafica consentendo di attribuire, a tutti i nodi stocastici del modello, una distribuzione di probabilità a priori. La struttura dei dati, un campione italiano dell'indagine PISA 2006, ha suggerito l'introduzione di un ulteriore elemento di complessità : la caratteristica dei dati di essere †œannidati†� in livelli, o gerarchie, ha spinto la ricerca a considerare l'estensione dei modelli, prima descritti, al caso multilivello (secondo la formulazione che fa riferimento ai modelli GLAMM). L'analisi dei risultati ਠcaratterizzata dal confronto tra le stime del modello bivariato (che tiene conto della correlazione tra abilità e propensione alla risposta) e quelle ottenute a partire da altri due modelli, l'uno che ha supposto un meccanismo MAR, l'altro che ha utilizzato una matrice completa in cui al posto dei dati mancanti ਠstato imputato lo zero (la risposta sbagliata). A corredo dell'analisi, si ਠaggiunto lo studio delle covariate con l'intento di valutare l'impatto delle stesse su entrambi i processi: l'obiettivo ਠvalutare quali caratteristiche, legate allo studente e al suo background socio - familiare, influenzino le fasi dell'apprendimento e, in questo caso particolare, anche la strategia di risposta. In ultimo, per completare l'analisi e lo studio delle distorsioni sui parametri d'interesse, si ਠconsiderata l'analisi del Differential Item Functioning (DIF); lo scopo à¨, ancora, di comparazione tra i tre modelli al fine di verificare quali ripercussioni si possano avere sull'analisi del DIF qualora il meccanismo generatore del dato mancante non sia ignorabile. In generale, quindi, gli scopi della ricerca in questione sono stati molteplici e interconnessi; si sono combinate le proprietà dei modelli grafici, in ottica bayesiana, e quelle dei modelli IRT multilivello con l'ulteriore obiettivo di comparazione tra tre diversi approcci al trattamento dei dati mancanti. L'applicazione al campione dei dati italiani, considerando la stratificazione in gruppi regionali, ha reso pi๠interessante e particolare lo studio confermando, anche in relazione a questa analisi, le forti differenze e sperequazioni, territoriali e sociali, che caratterizzano, da secoli, la nostra penisola.
Modelli grafici gerarchici e Item Response Theory : un'applicazione ai dati PISA 2006
2013
Abstract
I modelli dell'Item Response Theory (Lord e Novick 1968; Rasch 1960) sono una particolare classe di modelli matematico - probabilistici la cui diffusione ਠlegata al crescente utilizzo, in particolare in ambito psicometrico e sociale, del questionario come strumento fondamentale per la misurazione di uno o pi๠costrutti latenti. L'idea di base ਠquella di tradurre le informazioni, ottenute a partire dalle risposte osservate, in misurazioni oggettive del tratto latente, alla stregua di quanto avviene nelle scienze fisiche. Il modello di Rasch, tra i pi๠noti nella classe dei modelli IRT, rispetta i criteri relativi al concetto di misura e presuppone che la probabilità di risposta corretta ad un item, da parte di un soggetto, sia funzione della differenza tra due parametri: l'abilità del soggetto e la difficoltà dell'item. In particolari contesti applicativi, quale quello dell'Educational Assessment, ਠfrequente che tale classe di modelli venga applicata a matrici di dati incomplete, per le quali ਠipotizzabile che il meccanismo generatore del dato mancante sia non ignorabile (Rubin 1976), determinando distorsioni nelle stime dei parametri dei modelli IRT. A tale proposito, il modello proposto da Holman e Glas (2005) tiene conto del meccanismo generatore del dato mancante considerando, oltre all'abilità , una seconda dimensione latente, la propensione alla risposta, la quale, in caso di dati MNAR (Missing Not At Random), ਠcorrelata alla prima dimensione. Obiettivo principale di questo lavoro di ricerca ਠstato quello di dimostrare che ਠpossibile, nonchà© equivalente, definire il modello proposto da Holman e Glas utilizzando il linguaggio e le potenzialità dei modelli grafici (Lauritzen 1996) rendendo evidenti, mediante grafo diretto aciclico, le relazioni di indipendenza condizionata tra le variabili manifeste, e non, del modello. In particolare, si ਠdefinito un modello di Rasch bidimensionale, in ottica between items (Adams, Wilson e Wang 1997). L'approccio bayesiano ha arricchito, in termini di flessibilità , la rappresentazione grafica consentendo di attribuire, a tutti i nodi stocastici del modello, una distribuzione di probabilità a priori. La struttura dei dati, un campione italiano dell'indagine PISA 2006, ha suggerito l'introduzione di un ulteriore elemento di complessità : la caratteristica dei dati di essere †œannidati†� in livelli, o gerarchie, ha spinto la ricerca a considerare l'estensione dei modelli, prima descritti, al caso multilivello (secondo la formulazione che fa riferimento ai modelli GLAMM). L'analisi dei risultati ਠcaratterizzata dal confronto tra le stime del modello bivariato (che tiene conto della correlazione tra abilità e propensione alla risposta) e quelle ottenute a partire da altri due modelli, l'uno che ha supposto un meccanismo MAR, l'altro che ha utilizzato una matrice completa in cui al posto dei dati mancanti ਠstato imputato lo zero (la risposta sbagliata). A corredo dell'analisi, si ਠaggiunto lo studio delle covariate con l'intento di valutare l'impatto delle stesse su entrambi i processi: l'obiettivo ਠvalutare quali caratteristiche, legate allo studente e al suo background socio - familiare, influenzino le fasi dell'apprendimento e, in questo caso particolare, anche la strategia di risposta. In ultimo, per completare l'analisi e lo studio delle distorsioni sui parametri d'interesse, si ਠconsiderata l'analisi del Differential Item Functioning (DIF); lo scopo à¨, ancora, di comparazione tra i tre modelli al fine di verificare quali ripercussioni si possano avere sull'analisi del DIF qualora il meccanismo generatore del dato mancante non sia ignorabile. In generale, quindi, gli scopi della ricerca in questione sono stati molteplici e interconnessi; si sono combinate le proprietà dei modelli grafici, in ottica bayesiana, e quelle dei modelli IRT multilivello con l'ulteriore obiettivo di comparazione tra tre diversi approcci al trattamento dei dati mancanti. L'applicazione al campione dei dati italiani, considerando la stratificazione in gruppi regionali, ha reso pi๠interessante e particolare lo studio confermando, anche in relazione a questa analisi, le forti differenze e sperequazioni, territoriali e sociali, che caratterizzano, da secoli, la nostra penisola.I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14242/282610
URN:NBN:IT:UNIROMA3-282610