I processi di valutazione degli stimoli ambientali e di decisione sono comuni nella vita quotidiana e in tante situazioni di carattere sociale ed economico. Questi processi sono generalmente descritti dalla letteratura scientifica utilizzando modelli di scelta multi-attributo. Tali modelli assumono che la valutazione di uno stimolo descritto da più attributi sia il risultato di un processo a più stadi (Anderson, 1981; Lynch, 1985): valutazione degli attributi, integrazione dei valori e valutazione esplicita dello stimolo. Comunemente, in questo campo, le situazioni sperimentali richiedono la valutazione di un set di stimoli costruiti combinando diversi attributi. Un soggetto valutatore esamina gli attributi di ogni stimolo; usando il solo modello “mentale” di scelta (Oral e Kettani, 1989), assegna un valore agli attributi e formula un giudizio globale. Infine, il soggetto esprime la sua opinione in termini di ordinamento, preferenze a coppie, valori su una scala numerica e così via. Questa cosiddetta valutazione multi-attributo soffre di una fondamentale difficoltà nel misurare i valori di ogni attributo di uno stimolo partendo dalle valutazioni complessive di ogni soggetto. Fondamentalmente, il problema è derivare ogni valore decomponendo il giudizio complessivo (cioè la risposta in output). Questa difficoltà di misurazione è tipica di molte delle spesso complementari tradizioni dei modelli multi-attributo, come la Conjoint Analysis (Luce e Tukey, 1964; Krantz e Tversky, 1971; Green e Rao, 1971) o la Teoria dell’Integrazione delle Informazioni (IIT: Anderson, 1970, 1981, 1982). Secondo la IIT di Anderson, il sistema cognitivo fornisce un valore soggettivo a ogni caratteristica di uno stimolo, e tali valori vengono combinati in un giudizio complessivo utilizzando una specifica funzione d’integrazione. La IIT descrive le modalità d’integrazione utilizzando differenti regole matematiche, e la misurazione funzionale è la metodologia proposta per determinare e misurare la funzione d’integrazione. La misurazione funzionale si serve di esperimenti fattoriali, selezionando alcuni attributi di uno stimolo e combinandoli in piani fattoriali. Solitamente, le valutazioni dei soggetti per ogni cella del disegno sperimentale sono riportate su una category scale, e ogni soggetto ripete la valutazione per più prove. Partendo dalle valutazioni soggettive, la misurazione funzionale mira a quantificare il valore di ogni livello dei fattori e la sua importanza nel giudizio complessivo, per ogni soggetto valutatore o gruppo di soggetti. La teoria di Anderson suggerisce che le regole d’integrazione più ampiamente utilizzate sono di tre fondamentali e semplici tipologie: additiva, moltiplicativa e di media ponderata (averaging). Tecniche statistiche come l’analisi della varianza possono essere utilizzare per individuare la regola d’integrazione sulla base della bontà dell’adattamento. La regola averaging in particolare è in grado di tenere in considerazione gli effetti d’interazione tra i fattori, scindendo la valutazione in due componenti: valore di scala e peso, che possono essere identificati e misurati separatamente (Zalisnki e Anderson, 1989). Se il valore di scala rappresenta il posizionamento del livello del fattore sulla scala di risposta, il peso rappresenta la sua importanza nel giudizio complessivo. Il modello averaging fornisce una via molto utile per gestire gli effetti d’interazione tra i fattori, superando l’assunto d’indipendenza sul quale molte applicazioni dei modelli di scelta multi-attributo sono basate. Tuttavia, il modello presenta alcuni punti critici relativi alla questione della stima, e per questo motivo il suo potenziale non è stato pienamente sfruttano fin’ora. In questo lavoro di ricerca viene proposto un nuovo metodo per la stima dei parametri del modello averaging. Il metodo consente di selezionare il miglior set di parametri per adattare i dati, e mira a superare alcuni problemi che ne hanno limitato l’uso. Secondo questo nuovo metodo, chiamato R-Average (Vidotto e Vicentini, 2007; Vidotto, Massidda e Noventa, 2010), la scelta del miglior modello è fatta in accordo al cosiddetto “principio di parsimonia”: il miglior modello è quello più “semplice”, che trova il miglior compromesso tra spiegazione del fenomeno (varianza spiegata) e complessità strutturale (numero di parametri di peso diversi). Il processo di selezione usa in combinazione due indici di bontà dell’adattamento: l’Akaike Information Criterion (AIC; Akaike, 1974) e il Bayesian Information Criterion (BIC; Schwartz, 1978). Entrambi gli indici sono ricavati partendo dal logaritmo della varianza residua pesata per il numero di osservazioni, e penalizzando i modelli con parametri aggiuntivi. AIC e BIC differiscono nella funzione di penalizzazione – dato che il BIC impone una penalità maggiore ai modelli con più parametri – e sono molto utili per la comparazione fra modelli. In questo lavoro di ricerca vengono presentate due versioni del metodo R-Average. Queste due versioni sono una l’evoluzione dell’altra, ed entrambi i metodi sono strutturati in diverse procedure per eseguire la stima. Fondamentalmente, R-Average consta di tre procedure: procedura EAM, procedura DAM e procedura Information Criteria (IC). EAM, DAM e IC differiscono nei vincoli imposti sui pesi durante il processo di ottimizzazione. La procedura EAM vincola tutti i pesi all’interno di ogni fattore a essere uguali, stimando un modello a pesi uguali. Questo modello è il migliore in termini di parsimonia, perché presenta il minor numero di parametri (uno unico per ogni fattore). Infatti, si definisce come “parsimonioso” un modello semplice, nel quale i pesi sono uguali. Diversamente, la procedura DAM non impone alcun vincolo sui pesi, lasciandoli liberi di variare. Così, questa procedura può potenzialmente convergere verso un modello averaging a pesi completamente diversi (dove cioè tutti i pesi dei livelli di ogni fattore sono diversi). Il cuore del metodo R-Average è la procedura Information Criteria. Questa procedura è basata sull’idea che, da un punto di vista psicologico, un modello semplice è più plausibile di un modello complesso. Per questo motivo, l’algoritmo di stima non è volto alla ricerca dei parametri che spiegano la maggior quota di varianza, ma cerca un compromesso tra varianza spiegata e complessità del modello. Un modello complesso sarà valutato come migliore di uno più semplice solo se permette di ottenere un grado significativamente superiore di spiegazione del fenomeno. La procedura IC cerca il modello provando a tenere (nella versione “forward”) o a rendere (nella versione “backward”) tutti i pesi uguali. Nella versione forward, la procedura parte dal modello EAM e passa in rassegna tutte le possibili combinazioni di pesi, modificandole: inizialmente uno a uno, poi due a due, poi tre a tre e così via. Per ogni combinazione, la procedura prova a diversificare i pesi. Di volta in volta, utilizzando gli indici BIC e AIC, la procedura seleziona il miglior set di parametri e assume il modello selezionato come rifermento per il passo successivo (se un’evidenzia di miglioramento viene trovata). Nella versione backward, la procedura parte dal modello DAM e passa in rassegna tutte le possibili combinazioni di pesi, provando a renderli uguali. Gli indici BIC e AIC sono utilizzati per comparare i nuovi modelli con quelli di riferimento: se un nuovo modello viene individuato come migliore di quello di riferimento, sarà utilizzato come nuovo riferimento per i passi successivi. Infine, tutti i modelli stimati dalle procedure vengono comparati, e il quello migliore sulla base dei criteri dell’informazione viene scelto. La formulazione originale del modello averaging è stata modificata nell’evoluzione del metodo R-Average di base. Questa riformulazione considera il peso non come semplice parametro w ma come w = exp(t). Questa trasformazione esponenziale conduce a una soluzione del classico problema di unicità che affligge la formulazione averaging (Vidotto, 2011). Inoltre, essa giustifica l’applicazione di algoritmi di cluster analysis sui parametri di peso, necessari per le procedure di raggruppamento dei soggetti sperimentali sulla base delle loro similarità. Infatti, la distanza tra due valori t può essere valutata in termini di semplice differenza. Diversamente, la distanza tra due valori w può essere valutata solo in termini di rapporto tra loro. Ciò consente l’uso di algoritmi di raggruppamento dei soggetti basati su matrici di prossimità fra i parametri. La performance di R-Average è stata testata utilizzando studi Monte Carlo e applicazioni pratiche in tre differenti campi di ricerca: nel marketing, nella teoria delle decisioni economiche e nella fiducia interpersonale. I risultati degli studi Monte Carlo mostrano una buona capacità del metodo di identificare i parametri del modello averaging. I parametri di scala sono in generale ben stimati. Diversamente, la stima dei pesi è un po’ più critica. La stima puntuale del valore reale del peso non è precisa come quella dei valori di scala, in particolare all’aumento della deviazione standard della componente d’errore dei dati. Nonostante questo, le stime appaiono attendibili, e le uguaglianze fra i pesi sono identificate. L’aumento del numero di replicazioni sperimentali può aiutare la selezione del modello quando gli errori presentano una grande deviazione standard. In sintesi, R-Average si configura come uno strumento molto utile per selezionare il miglior modello all’interno della famiglia dei modelli averaging, permettendo di gestire particolari condizioni multi-attributo negli esperimenti di misurazione funzionale. Il metodo R-Average è stato applicato in un primo studio nel campo del marketing. Nell’acquistare un prodotto, le persone esprimono una preferenza per particolari prodotti: comprendere i processi cognitivi sottostanti la formulazione delle preferenze dei consumatori risulta quindi un punto importante. Lo studio è stato condotto in accordo con un produttore locale di pasta, l’azienda Sgambaro. Gli scopi della ricerca erano tre: comprendere la formulazione dei giudizi dei consumatori su un prodotto di mercato, testare il metodo R-Aveage in condizioni reali e fornire all’azienda Sgambaro utili informazioni per un’ottimale commercializzazione del prodotto. Sono stati manipolati due fattori: la confezione della pasta Sgambaro (scatola con finestra, scatola senza finestra e busta di plastica) e il prezzo (0.89€, 0.99€, 1.09€). Le analisi sono partite considerando le valutazioni del prodotto espresse dai partecipanti: per ogni soggetto sono stati stimati i parametri del modello averaging. Dato che la popolazione dei consumatori presumibilmente non è omogenea in quanto a preferenze, il campione complessivo è stato diviso in tre gruppi (chiamati semplicemente Cluster A, Cluster B e Cluster C) attraverso un algoritmo di cluster analysis. Per entrambi i fattori Prezzo e Confezione, i diversi raggruppamenti mostrano punteggi differenti. Il Cluster A esprime giudizi che si posizionano nel centro scala, indicando come questi partecipanti non fossero particolarmente attratti dai prodotti. All’opposto, il Cluster B esprime giudizi positivi, e il Cluster C esprime giudizi generalmente negativi con l’eccezione della confezione “scatola con finestra”. Per quanto concerne la confezione, si osserva che la scatola con finestra, sebbene non sia quella preferita in tutti e tre i gruppi, ha sempre valutazione positive, mentre i giudizi per le altre confezioni variano tra i gruppi. Inoltre, se il target di potenziali consumatori per il prodotto è la popolazione generale, la scatola con finestra può essere considerata la confezione più apprezzata. Inoltre, nel Cluster C l’ANOVA mostra un’interazione significativa tra Prezzo e Confezione. Difatti, i parametri stimati per il modello averaging mostrano che il Cluster C è generalmente influenzato da un prezzo elevato. In questo gruppo il prezzo più alto ha un peso doppio rispetto agli altri nel punteggio finale, e ciò potrebbe invalidare l’influenza positiva della confezione “scatola con finestra”. È importante notare che il gruppo che è più sensibile a un prezzo alto è anche quello che presenta i punteggi di preferenza più bassi rispetto agli altri gruppi. In un secondo esperimento, il metodo R-Average è stato applicato in uno studio nel campo delle decisioni economiche in condizioni di rischio. L’assunzione che ha mosso lo studio è che, quando una persona deve valutare una scommessa a carattere economico in una situazione rischiosa, la persona integra cognitivamente il valore economico della scommessa con quello della probabilità di vittoria. In passato, Shanteau (1974) ha mostrato che l’integrazione tra valore e probabilità è realizzata attraverso una regola moltiplicativa. Lo studio, come quello di Lynch (1979), ha sottolineato che quando la situazione concerne due scommesse simultanee, ognuna composta da un valore e una probabilità, i giudizi per la scommessa doppia sono diversi dalla somma dei giudizi espressi per le scommesse singole. Questa osservazione, denominata effetto di subadditività, viola le assunzioni della Teoria dell’Utilità Attesa. Lo studio proposto analizza la convenienza/soddisfazione associata alle scommesse singole e doppie. Lo studio ha proposto ai partecipanti due tipologie di scommessa. Un primo gruppo di scommesse riguardava un bene (telefono cellulare) e l’altro un servizio (messaggi SMS gratis per giorno); a ogni bene/servizio era associata la probabilità di ottenerlo. Sono state definite due condizioni sperimentali. Nella prima condizione, i soggetti giudicano le scommesse considerando che i telefoni cellulari sono prodotti da una buona compagnia, e il servizio SMS è fornito da un provider inaffidabile. Nella condizione inversa, i soggetti giudicano le scommesse considerando che i telefoni cellulari sono prodotti con bassa qualità da una compagnia inaffidabile, e il servizio SMS è fornito da un provider robusto e affidabile. Per le scommesse doppie, è stata ipotizzata la presenza di un modello d’integrazione averaging, e i parametri del modello sono stati stimati utilizzando R-Average per ogni soggetto. I risultati mostrano che, in presenza di una scommessa doppia, l’integrazione è pienamente compatibile con un modello averaging: la corretta regola d’integrazione sembra essere quella a media ponderata e non quella additiva. Nell’ultimo esperimento, il modello averaging e la metodologia R-Average sono state applicate a uno studio sulle credenze di fiducia in tre contesti di vita quotidiana: interpersonale, istituzionale e organizzativo. Le credenze di fiducia sono attributi positivi che si ritiene una persona debba possedere affinché ci si possa fidare di lei. Le credenze di fiducia sono fattori rilevanti perché un individuo ne consideri un altro affidabile. Esse definiscono fino a che punto chi ripone fiducia si sente sicuro nel credere che la persona su cui ripone fiducia sia affidabile. Secondo McKnight, Cummings e Chervany (1998), le credenze di fiducia più citate sono: benevolenza, competenza, onestà e prevedibilità. L’idea sottostante lo studio proposto è che le credenze potrebbero essere integrate cognitivamente nel concetto di affidabilità attraverso un processo di ponderazione. Il metodo R-Average è stato utilizzato per identificare i parametri del modello averaging per ogni partecipante. Come principale risultato, l’analisi mostra che, in accordo con McKnight, Cummings e Chervany (1998), le quattro credenze principali giocano un ruolo fondamentale nel giudicare la fiducia. Inoltre, in accordo con la teoria dell’integrazione delle informazioni, un modello averaging sembra spiegare le risposte individuali. La grande maggioranza dei partecipanti potrebbe essere inquadrata come caso a pesi diversi. Mentre i valori di scala mostrano un netto andamento lineare con slopes più elevati per onestà e competenza, i pesi mostrano differenze con valori medi più elevati anche per onestà e competenza. Questi risultati sono coerenti con l’idea che attributi diversi giochino un ruolo diverso nel giudizio finale: infatti, onestà e competenza sembrano rivestire un ruolo preminente, mentre la prevedibilità sembra meno rilevante. Un’altra interessante conclusione riguarda l’elevato peso assunto da un basso livello di onestà; ciò sembra mostrare come una credenza connessa alla bassa onestà giochi il principale ruolo all’interno di un giudizio finale negativo. Infine, la differente inclinazione dell’andamento dei livelli degli attributi nei tre contesti situazionali suggerisce un ruolo preminente dell’onestà nelle situazioni interpersonali e della competenza nelle situazioni istituzionali. In conclusione, la teoria dell’integrazione delle informazioni e la misurazione funzionale sembrano rappresentare un approccio interessante per comprendere la formulazione del giudizio umano. Questo lavoro di ricerca propone un nuovo metodo per stimare i parametri dei modelli averaging. Il metodo mostra una buona capacità di identificare i parametri e apre nuovi scenari nella teoria dell’integrazione delle informazioni, fornendo un buon strumento per comprendere più nel dettaglio l’integrazione averaging degli attributi

Criteri dell'Informazione e Selezione dei Modelli in Misurazione Funzionale

MASSIDDA, DAVIDE
2012

Abstract

I processi di valutazione degli stimoli ambientali e di decisione sono comuni nella vita quotidiana e in tante situazioni di carattere sociale ed economico. Questi processi sono generalmente descritti dalla letteratura scientifica utilizzando modelli di scelta multi-attributo. Tali modelli assumono che la valutazione di uno stimolo descritto da più attributi sia il risultato di un processo a più stadi (Anderson, 1981; Lynch, 1985): valutazione degli attributi, integrazione dei valori e valutazione esplicita dello stimolo. Comunemente, in questo campo, le situazioni sperimentali richiedono la valutazione di un set di stimoli costruiti combinando diversi attributi. Un soggetto valutatore esamina gli attributi di ogni stimolo; usando il solo modello “mentale” di scelta (Oral e Kettani, 1989), assegna un valore agli attributi e formula un giudizio globale. Infine, il soggetto esprime la sua opinione in termini di ordinamento, preferenze a coppie, valori su una scala numerica e così via. Questa cosiddetta valutazione multi-attributo soffre di una fondamentale difficoltà nel misurare i valori di ogni attributo di uno stimolo partendo dalle valutazioni complessive di ogni soggetto. Fondamentalmente, il problema è derivare ogni valore decomponendo il giudizio complessivo (cioè la risposta in output). Questa difficoltà di misurazione è tipica di molte delle spesso complementari tradizioni dei modelli multi-attributo, come la Conjoint Analysis (Luce e Tukey, 1964; Krantz e Tversky, 1971; Green e Rao, 1971) o la Teoria dell’Integrazione delle Informazioni (IIT: Anderson, 1970, 1981, 1982). Secondo la IIT di Anderson, il sistema cognitivo fornisce un valore soggettivo a ogni caratteristica di uno stimolo, e tali valori vengono combinati in un giudizio complessivo utilizzando una specifica funzione d’integrazione. La IIT descrive le modalità d’integrazione utilizzando differenti regole matematiche, e la misurazione funzionale è la metodologia proposta per determinare e misurare la funzione d’integrazione. La misurazione funzionale si serve di esperimenti fattoriali, selezionando alcuni attributi di uno stimolo e combinandoli in piani fattoriali. Solitamente, le valutazioni dei soggetti per ogni cella del disegno sperimentale sono riportate su una category scale, e ogni soggetto ripete la valutazione per più prove. Partendo dalle valutazioni soggettive, la misurazione funzionale mira a quantificare il valore di ogni livello dei fattori e la sua importanza nel giudizio complessivo, per ogni soggetto valutatore o gruppo di soggetti. La teoria di Anderson suggerisce che le regole d’integrazione più ampiamente utilizzate sono di tre fondamentali e semplici tipologie: additiva, moltiplicativa e di media ponderata (averaging). Tecniche statistiche come l’analisi della varianza possono essere utilizzare per individuare la regola d’integrazione sulla base della bontà dell’adattamento. La regola averaging in particolare è in grado di tenere in considerazione gli effetti d’interazione tra i fattori, scindendo la valutazione in due componenti: valore di scala e peso, che possono essere identificati e misurati separatamente (Zalisnki e Anderson, 1989). Se il valore di scala rappresenta il posizionamento del livello del fattore sulla scala di risposta, il peso rappresenta la sua importanza nel giudizio complessivo. Il modello averaging fornisce una via molto utile per gestire gli effetti d’interazione tra i fattori, superando l’assunto d’indipendenza sul quale molte applicazioni dei modelli di scelta multi-attributo sono basate. Tuttavia, il modello presenta alcuni punti critici relativi alla questione della stima, e per questo motivo il suo potenziale non è stato pienamente sfruttano fin’ora. In questo lavoro di ricerca viene proposto un nuovo metodo per la stima dei parametri del modello averaging. Il metodo consente di selezionare il miglior set di parametri per adattare i dati, e mira a superare alcuni problemi che ne hanno limitato l’uso. Secondo questo nuovo metodo, chiamato R-Average (Vidotto e Vicentini, 2007; Vidotto, Massidda e Noventa, 2010), la scelta del miglior modello è fatta in accordo al cosiddetto “principio di parsimonia”: il miglior modello è quello più “semplice”, che trova il miglior compromesso tra spiegazione del fenomeno (varianza spiegata) e complessità strutturale (numero di parametri di peso diversi). Il processo di selezione usa in combinazione due indici di bontà dell’adattamento: l’Akaike Information Criterion (AIC; Akaike, 1974) e il Bayesian Information Criterion (BIC; Schwartz, 1978). Entrambi gli indici sono ricavati partendo dal logaritmo della varianza residua pesata per il numero di osservazioni, e penalizzando i modelli con parametri aggiuntivi. AIC e BIC differiscono nella funzione di penalizzazione – dato che il BIC impone una penalità maggiore ai modelli con più parametri – e sono molto utili per la comparazione fra modelli. In questo lavoro di ricerca vengono presentate due versioni del metodo R-Average. Queste due versioni sono una l’evoluzione dell’altra, ed entrambi i metodi sono strutturati in diverse procedure per eseguire la stima. Fondamentalmente, R-Average consta di tre procedure: procedura EAM, procedura DAM e procedura Information Criteria (IC). EAM, DAM e IC differiscono nei vincoli imposti sui pesi durante il processo di ottimizzazione. La procedura EAM vincola tutti i pesi all’interno di ogni fattore a essere uguali, stimando un modello a pesi uguali. Questo modello è il migliore in termini di parsimonia, perché presenta il minor numero di parametri (uno unico per ogni fattore). Infatti, si definisce come “parsimonioso” un modello semplice, nel quale i pesi sono uguali. Diversamente, la procedura DAM non impone alcun vincolo sui pesi, lasciandoli liberi di variare. Così, questa procedura può potenzialmente convergere verso un modello averaging a pesi completamente diversi (dove cioè tutti i pesi dei livelli di ogni fattore sono diversi). Il cuore del metodo R-Average è la procedura Information Criteria. Questa procedura è basata sull’idea che, da un punto di vista psicologico, un modello semplice è più plausibile di un modello complesso. Per questo motivo, l’algoritmo di stima non è volto alla ricerca dei parametri che spiegano la maggior quota di varianza, ma cerca un compromesso tra varianza spiegata e complessità del modello. Un modello complesso sarà valutato come migliore di uno più semplice solo se permette di ottenere un grado significativamente superiore di spiegazione del fenomeno. La procedura IC cerca il modello provando a tenere (nella versione “forward”) o a rendere (nella versione “backward”) tutti i pesi uguali. Nella versione forward, la procedura parte dal modello EAM e passa in rassegna tutte le possibili combinazioni di pesi, modificandole: inizialmente uno a uno, poi due a due, poi tre a tre e così via. Per ogni combinazione, la procedura prova a diversificare i pesi. Di volta in volta, utilizzando gli indici BIC e AIC, la procedura seleziona il miglior set di parametri e assume il modello selezionato come rifermento per il passo successivo (se un’evidenzia di miglioramento viene trovata). Nella versione backward, la procedura parte dal modello DAM e passa in rassegna tutte le possibili combinazioni di pesi, provando a renderli uguali. Gli indici BIC e AIC sono utilizzati per comparare i nuovi modelli con quelli di riferimento: se un nuovo modello viene individuato come migliore di quello di riferimento, sarà utilizzato come nuovo riferimento per i passi successivi. Infine, tutti i modelli stimati dalle procedure vengono comparati, e il quello migliore sulla base dei criteri dell’informazione viene scelto. La formulazione originale del modello averaging è stata modificata nell’evoluzione del metodo R-Average di base. Questa riformulazione considera il peso non come semplice parametro w ma come w = exp(t). Questa trasformazione esponenziale conduce a una soluzione del classico problema di unicità che affligge la formulazione averaging (Vidotto, 2011). Inoltre, essa giustifica l’applicazione di algoritmi di cluster analysis sui parametri di peso, necessari per le procedure di raggruppamento dei soggetti sperimentali sulla base delle loro similarità. Infatti, la distanza tra due valori t può essere valutata in termini di semplice differenza. Diversamente, la distanza tra due valori w può essere valutata solo in termini di rapporto tra loro. Ciò consente l’uso di algoritmi di raggruppamento dei soggetti basati su matrici di prossimità fra i parametri. La performance di R-Average è stata testata utilizzando studi Monte Carlo e applicazioni pratiche in tre differenti campi di ricerca: nel marketing, nella teoria delle decisioni economiche e nella fiducia interpersonale. I risultati degli studi Monte Carlo mostrano una buona capacità del metodo di identificare i parametri del modello averaging. I parametri di scala sono in generale ben stimati. Diversamente, la stima dei pesi è un po’ più critica. La stima puntuale del valore reale del peso non è precisa come quella dei valori di scala, in particolare all’aumento della deviazione standard della componente d’errore dei dati. Nonostante questo, le stime appaiono attendibili, e le uguaglianze fra i pesi sono identificate. L’aumento del numero di replicazioni sperimentali può aiutare la selezione del modello quando gli errori presentano una grande deviazione standard. In sintesi, R-Average si configura come uno strumento molto utile per selezionare il miglior modello all’interno della famiglia dei modelli averaging, permettendo di gestire particolari condizioni multi-attributo negli esperimenti di misurazione funzionale. Il metodo R-Average è stato applicato in un primo studio nel campo del marketing. Nell’acquistare un prodotto, le persone esprimono una preferenza per particolari prodotti: comprendere i processi cognitivi sottostanti la formulazione delle preferenze dei consumatori risulta quindi un punto importante. Lo studio è stato condotto in accordo con un produttore locale di pasta, l’azienda Sgambaro. Gli scopi della ricerca erano tre: comprendere la formulazione dei giudizi dei consumatori su un prodotto di mercato, testare il metodo R-Aveage in condizioni reali e fornire all’azienda Sgambaro utili informazioni per un’ottimale commercializzazione del prodotto. Sono stati manipolati due fattori: la confezione della pasta Sgambaro (scatola con finestra, scatola senza finestra e busta di plastica) e il prezzo (0.89€, 0.99€, 1.09€). Le analisi sono partite considerando le valutazioni del prodotto espresse dai partecipanti: per ogni soggetto sono stati stimati i parametri del modello averaging. Dato che la popolazione dei consumatori presumibilmente non è omogenea in quanto a preferenze, il campione complessivo è stato diviso in tre gruppi (chiamati semplicemente Cluster A, Cluster B e Cluster C) attraverso un algoritmo di cluster analysis. Per entrambi i fattori Prezzo e Confezione, i diversi raggruppamenti mostrano punteggi differenti. Il Cluster A esprime giudizi che si posizionano nel centro scala, indicando come questi partecipanti non fossero particolarmente attratti dai prodotti. All’opposto, il Cluster B esprime giudizi positivi, e il Cluster C esprime giudizi generalmente negativi con l’eccezione della confezione “scatola con finestra”. Per quanto concerne la confezione, si osserva che la scatola con finestra, sebbene non sia quella preferita in tutti e tre i gruppi, ha sempre valutazione positive, mentre i giudizi per le altre confezioni variano tra i gruppi. Inoltre, se il target di potenziali consumatori per il prodotto è la popolazione generale, la scatola con finestra può essere considerata la confezione più apprezzata. Inoltre, nel Cluster C l’ANOVA mostra un’interazione significativa tra Prezzo e Confezione. Difatti, i parametri stimati per il modello averaging mostrano che il Cluster C è generalmente influenzato da un prezzo elevato. In questo gruppo il prezzo più alto ha un peso doppio rispetto agli altri nel punteggio finale, e ciò potrebbe invalidare l’influenza positiva della confezione “scatola con finestra”. È importante notare che il gruppo che è più sensibile a un prezzo alto è anche quello che presenta i punteggi di preferenza più bassi rispetto agli altri gruppi. In un secondo esperimento, il metodo R-Average è stato applicato in uno studio nel campo delle decisioni economiche in condizioni di rischio. L’assunzione che ha mosso lo studio è che, quando una persona deve valutare una scommessa a carattere economico in una situazione rischiosa, la persona integra cognitivamente il valore economico della scommessa con quello della probabilità di vittoria. In passato, Shanteau (1974) ha mostrato che l’integrazione tra valore e probabilità è realizzata attraverso una regola moltiplicativa. Lo studio, come quello di Lynch (1979), ha sottolineato che quando la situazione concerne due scommesse simultanee, ognuna composta da un valore e una probabilità, i giudizi per la scommessa doppia sono diversi dalla somma dei giudizi espressi per le scommesse singole. Questa osservazione, denominata effetto di subadditività, viola le assunzioni della Teoria dell’Utilità Attesa. Lo studio proposto analizza la convenienza/soddisfazione associata alle scommesse singole e doppie. Lo studio ha proposto ai partecipanti due tipologie di scommessa. Un primo gruppo di scommesse riguardava un bene (telefono cellulare) e l’altro un servizio (messaggi SMS gratis per giorno); a ogni bene/servizio era associata la probabilità di ottenerlo. Sono state definite due condizioni sperimentali. Nella prima condizione, i soggetti giudicano le scommesse considerando che i telefoni cellulari sono prodotti da una buona compagnia, e il servizio SMS è fornito da un provider inaffidabile. Nella condizione inversa, i soggetti giudicano le scommesse considerando che i telefoni cellulari sono prodotti con bassa qualità da una compagnia inaffidabile, e il servizio SMS è fornito da un provider robusto e affidabile. Per le scommesse doppie, è stata ipotizzata la presenza di un modello d’integrazione averaging, e i parametri del modello sono stati stimati utilizzando R-Average per ogni soggetto. I risultati mostrano che, in presenza di una scommessa doppia, l’integrazione è pienamente compatibile con un modello averaging: la corretta regola d’integrazione sembra essere quella a media ponderata e non quella additiva. Nell’ultimo esperimento, il modello averaging e la metodologia R-Average sono state applicate a uno studio sulle credenze di fiducia in tre contesti di vita quotidiana: interpersonale, istituzionale e organizzativo. Le credenze di fiducia sono attributi positivi che si ritiene una persona debba possedere affinché ci si possa fidare di lei. Le credenze di fiducia sono fattori rilevanti perché un individuo ne consideri un altro affidabile. Esse definiscono fino a che punto chi ripone fiducia si sente sicuro nel credere che la persona su cui ripone fiducia sia affidabile. Secondo McKnight, Cummings e Chervany (1998), le credenze di fiducia più citate sono: benevolenza, competenza, onestà e prevedibilità. L’idea sottostante lo studio proposto è che le credenze potrebbero essere integrate cognitivamente nel concetto di affidabilità attraverso un processo di ponderazione. Il metodo R-Average è stato utilizzato per identificare i parametri del modello averaging per ogni partecipante. Come principale risultato, l’analisi mostra che, in accordo con McKnight, Cummings e Chervany (1998), le quattro credenze principali giocano un ruolo fondamentale nel giudicare la fiducia. Inoltre, in accordo con la teoria dell’integrazione delle informazioni, un modello averaging sembra spiegare le risposte individuali. La grande maggioranza dei partecipanti potrebbe essere inquadrata come caso a pesi diversi. Mentre i valori di scala mostrano un netto andamento lineare con slopes più elevati per onestà e competenza, i pesi mostrano differenze con valori medi più elevati anche per onestà e competenza. Questi risultati sono coerenti con l’idea che attributi diversi giochino un ruolo diverso nel giudizio finale: infatti, onestà e competenza sembrano rivestire un ruolo preminente, mentre la prevedibilità sembra meno rilevante. Un’altra interessante conclusione riguarda l’elevato peso assunto da un basso livello di onestà; ciò sembra mostrare come una credenza connessa alla bassa onestà giochi il principale ruolo all’interno di un giudizio finale negativo. Infine, la differente inclinazione dell’andamento dei livelli degli attributi nei tre contesti situazionali suggerisce un ruolo preminente dell’onestà nelle situazioni interpersonali e della competenza nelle situazioni istituzionali. In conclusione, la teoria dell’integrazione delle informazioni e la misurazione funzionale sembrano rappresentare un approccio interessante per comprendere la formulazione del giudizio umano. Questo lavoro di ricerca propone un nuovo metodo per stimare i parametri dei modelli averaging. Il metodo mostra una buona capacità di identificare i parametri e apre nuovi scenari nella teoria dell’integrazione delle informazioni, fornendo un buon strumento per comprendere più nel dettaglio l’integrazione averaging degli attributi
24-gen-2012
Italiano
misurazione funzionale, functional measurement, information integration, integrazione delle informazioni, media ponderata, averaging, modello statistico, statistical model, akaike information criterion, bayesian information criterion, selezione dei modelli, model selection
VIDOTTO, GIULIO
PAZZAGLIA, FRANCESCA
Università degli studi di Padova
134
File in questo prodotto:
File Dimensione Formato  
phd_massidda.pdf

accesso aperto

Dimensione 3.35 MB
Formato Adobe PDF
3.35 MB Adobe PDF Visualizza/Apri

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14242/89453
Il codice NBN di questa tesi è URN:NBN:IT:UNIPD-89453