Ricaviamo da due news provider professionali le news e gli annunci sugli utili dei componenti dell'S&P 100 e dieci indicatori macroeconomici, inoltre raccogliamo i Google Trends associati ai titoli come indice dell'attenzione dei piccoli investitori. Creiamo un database esteso ed innovativo, utile per analizzare il legame tra le news e gli andamenti dei prezzi dei titoli. Rileviamo il sentiment delle news usando un dizionario di parole associate a un sentiment e delle negazioni, e proponiamo un insieme di più di cinquemila variabili che rappresentano l'informazione usata da agenti eterogenei. Facciamo luce sull'impatto delle misure di informazione sulla volatilità realizzata giornaliera e le selezioniamo con la regressione penalizzata; poi le usiamo per prevedere la volatilità, ottenendo risultati superiori rispetto a modelli che le omettono. Dopodiché, rileviamo i salti intragiornalieri nei prezzi dei componenti dell'S&P 100 e costruiamo indicatori di news ad alta frequenza dalle news di due news provider professionali, dagli annunci sugli utili e da ventitré indicatori macroeconomici. Mettiamo in relazione i salti nei prezzi con gli indicatori di news e li selezioniamo con la regressione logistica penalizzata. Confrontiamo l'importanza economica dei salti e troviamo effetti sui rendimenti e sulla volatilità sia a livello di alta frequenza che giornaliero, e che questi effetti variano a seconda del tipo di news a cui i salti sono associati. Troviamo anche che i rendimenti futuri trimestrali e annuali sembrano esposti a misure di rischio basate sui salti associati ad annunci macroeconomici. Un metodo comune per rilevare il sentiment di un testo è il cosiddetto bag-of-words. Estendiamo il metodo in tre direzioni, usando: 1) una lista estesa di negazioni composta da parole singole, sequenze di due parole, e sequenze di tre parole; 2) liste di espressioni associate a un sentiment; 3) liste di combinazioni di parole associate a un sentiment. Lo scopo è creare un metodo generale adatto a rilevare il sentiment di un testo finanziario di qualsiasi tipo.

The Information Content of Financial Textual Data: Creating News Measures for Volatility Modeling and for the Analysis of Price Jumps

POLI, FRANCESCO
2017

Abstract

Ricaviamo da due news provider professionali le news e gli annunci sugli utili dei componenti dell'S&P 100 e dieci indicatori macroeconomici, inoltre raccogliamo i Google Trends associati ai titoli come indice dell'attenzione dei piccoli investitori. Creiamo un database esteso ed innovativo, utile per analizzare il legame tra le news e gli andamenti dei prezzi dei titoli. Rileviamo il sentiment delle news usando un dizionario di parole associate a un sentiment e delle negazioni, e proponiamo un insieme di più di cinquemila variabili che rappresentano l'informazione usata da agenti eterogenei. Facciamo luce sull'impatto delle misure di informazione sulla volatilità realizzata giornaliera e le selezioniamo con la regressione penalizzata; poi le usiamo per prevedere la volatilità, ottenendo risultati superiori rispetto a modelli che le omettono. Dopodiché, rileviamo i salti intragiornalieri nei prezzi dei componenti dell'S&P 100 e costruiamo indicatori di news ad alta frequenza dalle news di due news provider professionali, dagli annunci sugli utili e da ventitré indicatori macroeconomici. Mettiamo in relazione i salti nei prezzi con gli indicatori di news e li selezioniamo con la regressione logistica penalizzata. Confrontiamo l'importanza economica dei salti e troviamo effetti sui rendimenti e sulla volatilità sia a livello di alta frequenza che giornaliero, e che questi effetti variano a seconda del tipo di news a cui i salti sono associati. Troviamo anche che i rendimenti futuri trimestrali e annuali sembrano esposti a misure di rischio basate sui salti associati ad annunci macroeconomici. Un metodo comune per rilevare il sentiment di un testo è il cosiddetto bag-of-words. Estendiamo il metodo in tre direzioni, usando: 1) una lista estesa di negazioni composta da parole singole, sequenze di due parole, e sequenze di tre parole; 2) liste di espressioni associate a un sentiment; 3) liste di combinazioni di parole associate a un sentiment. Lo scopo è creare un metodo generale adatto a rilevare il sentiment di un testo finanziario di qualsiasi tipo.
1-ago-2017
Inglese
news, Google Trends, sentiment, volatility, forecasting, jumps, regularization, big data
CAPORIN, MASSIMILIANO
NICOLO', ANTONIO
Università degli studi di Padova
File in questo prodotto:
File Dimensione Formato  
poli_francesco_tesi.pdf

accesso aperto

Dimensione 3.17 MB
Formato Adobe PDF
3.17 MB Adobe PDF Visualizza/Apri

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14242/88678
Il codice NBN di questa tesi è URN:NBN:IT:UNIPD-88678