La tesi mira ad analizzare la struttura, la composizione e di conseguenza le principali differenze linguistiche che esistono nella componente accademica dei due corpora che vengono comunemente associati alle due variazioni principali della lingua inglese: American English e British English, vale a dire il Corpus of Contemporary American English (COCA) e il British National Corpus (BNC). Lo studio ਠreso possibile grazie alla disponibilità  sempre crescente dei suddetti corpora, collezioni di testi prodotti in modalità  sia scritta che orale, che vengono organizzati al fine di aiutare le indagini in campo linguistico. Si intendono analizzare in particolare i due sottocorpora definiti academic dei due corpora disponibili online, composti da milioni di parole che vengono consultati da migliaia di persone ogni mese. L'analisi parte con un'introduzione generale che prende in considerazione il concetto di corpus linguistics inteso come lo studio del linguaggio basato su raccolte di linguaggi archiviato nei corpora. In relazione al concetto appena citato, vengono analizzati i principali vantaggi e svantaggi nell'utilizzo dei corpora; viene inoltre integrata una spiegazione della sua funzione e di come i corpora vengono selezionati, raccolti e organizzati e di come questa disciplina sia relativamente nuova e innovativa. Si passa poi a una breve classificazione di questi corpus e a una presentazione di quelli esistenti online, tra cui quelli che saranno presi in considerazione: COCA e BNC, con i due relativi sottocorpora su cui ci focalizzeremo nella parte metodologica. Successivamente, le varie componenti dei due corpora vengono spiegate e analizzate, con maggiore attenzione alla componente accademica. Viene anche introdotta la nozione di shell noun o signalling noun, poichà© nella seconda parte verranno analizzate due parole che fanno parte di questa categoria del vocabolario inglese. Per shell noun o signalling noun, si intende un nome astratto che, in un contesto specifico, si riferisce a un'idea complessa. Il termine ਠstato coniato la prima volta da Schmid nel 1997. Nel secondo capitolo, l'attenzione viene spostata sulla metodologia. Due shell nouns o signalling nouns vengono analizzati prima nel Corpus of Contemporary American English e in un secondo momento nel British National Corpus, in particolare nella loro componente accademica, quindi spuntando sempre la casella corrispondente sui siti web dei due corpora. Attraverso l'aiuto di schermate l'analisi dei due termini e l'utilizzo dei due corpora risulteranno molto pi๠trasparenti ed efficaci, poichà© i due corpora non sono complicati da utilizzare ma i risultati a volte sono devianti. Inoltre, grazie all'analisi delle frequenze dei termini ricercati, delle concordanze, del contesto, delle tabelle, del processo di lemmatization e del KWIC, un acronimo che viene usato per key word in context (tutti concetti che vengono studiati nella parte teorica della tesi), le ricerche risulteranno pi๠efficaci e la messa in pratica delle competenze molto vantaggiosa. In conclusione, nel terzo capitolo, verranno messe a confronto le due ricerche condotte nel Corpus of Contemporary American English e nel British National Corpus, riportando i dati che abbiamo esaminato, le tecniche utilizzate e gli obiettivi raggiunti.

Variazione del Linguaggio e Corpora: un'analisi di American e British English basata sui corpora

2019

Abstract

La tesi mira ad analizzare la struttura, la composizione e di conseguenza le principali differenze linguistiche che esistono nella componente accademica dei due corpora che vengono comunemente associati alle due variazioni principali della lingua inglese: American English e British English, vale a dire il Corpus of Contemporary American English (COCA) e il British National Corpus (BNC). Lo studio ਠreso possibile grazie alla disponibilità  sempre crescente dei suddetti corpora, collezioni di testi prodotti in modalità  sia scritta che orale, che vengono organizzati al fine di aiutare le indagini in campo linguistico. Si intendono analizzare in particolare i due sottocorpora definiti academic dei due corpora disponibili online, composti da milioni di parole che vengono consultati da migliaia di persone ogni mese. L'analisi parte con un'introduzione generale che prende in considerazione il concetto di corpus linguistics inteso come lo studio del linguaggio basato su raccolte di linguaggi archiviato nei corpora. In relazione al concetto appena citato, vengono analizzati i principali vantaggi e svantaggi nell'utilizzo dei corpora; viene inoltre integrata una spiegazione della sua funzione e di come i corpora vengono selezionati, raccolti e organizzati e di come questa disciplina sia relativamente nuova e innovativa. Si passa poi a una breve classificazione di questi corpus e a una presentazione di quelli esistenti online, tra cui quelli che saranno presi in considerazione: COCA e BNC, con i due relativi sottocorpora su cui ci focalizzeremo nella parte metodologica. Successivamente, le varie componenti dei due corpora vengono spiegate e analizzate, con maggiore attenzione alla componente accademica. Viene anche introdotta la nozione di shell noun o signalling noun, poichà© nella seconda parte verranno analizzate due parole che fanno parte di questa categoria del vocabolario inglese. Per shell noun o signalling noun, si intende un nome astratto che, in un contesto specifico, si riferisce a un'idea complessa. Il termine ਠstato coniato la prima volta da Schmid nel 1997. Nel secondo capitolo, l'attenzione viene spostata sulla metodologia. Due shell nouns o signalling nouns vengono analizzati prima nel Corpus of Contemporary American English e in un secondo momento nel British National Corpus, in particolare nella loro componente accademica, quindi spuntando sempre la casella corrispondente sui siti web dei due corpora. Attraverso l'aiuto di schermate l'analisi dei due termini e l'utilizzo dei due corpora risulteranno molto pi๠trasparenti ed efficaci, poichà© i due corpora non sono complicati da utilizzare ma i risultati a volte sono devianti. Inoltre, grazie all'analisi delle frequenze dei termini ricercati, delle concordanze, del contesto, delle tabelle, del processo di lemmatization e del KWIC, un acronimo che viene usato per key word in context (tutti concetti che vengono studiati nella parte teorica della tesi), le ricerche risulteranno pi๠efficaci e la messa in pratica delle competenze molto vantaggiosa. In conclusione, nel terzo capitolo, verranno messe a confronto le due ricerche condotte nel Corpus of Contemporary American English e nel British National Corpus, riportando i dati che abbiamo esaminato, le tecniche utilizzate e gli obiettivi raggiunti.
2019
it
Dipartimento di Studi Linguistici e Culturali
Università degli Studi di Modena e Reggio Emilia
File in questo prodotto:
File Dimensione Formato  
TESI_DEF.pdf

accesso solo da BNCF e BNCR

Tipologia: Altro materiale allegato
Licenza: Tutti i diritti riservati
Dimensione 4.42 MB
Formato Adobe PDF
4.42 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14242/297645
Il codice NBN di questa tesi è URN:NBN:IT:UNIMORE-297645