The overall purpose of this research project is to study and explore the potential and limitations of the distributional approach with respect to lexical semantics. Analyzing paradigmatic relations such as synonymy, antonymy, hypernymy, hyponymy and co-hyponymy while using distributional methods could be very interesting and really challenging. For instance, state of the art semantic distributional methods have difficulties in distinguishing these relations. This is because these relations tend to distribute, within the texts, in a very similar way. We first carried out a study about current state of the art distributional measures developed for the recognition of paradigmatic semantic relations, trying to assess the degree of success reported by such measures. We then used the data we gathered to develop new distributional measures apt to classify the hyponymy/hypernymy relation and the antonymy relation. Not only did we prove that distributional methods can indeed be used in order to classify, in a non-supervised way, these relations; we also developed measures, especially conceived for recognizing and classifying hypernymy and antonymy, that performs better than state of the art ones. L'obiettivo generale di questo progetto di ricerca è quello di studiare ed esplorare le potenzialità e i limiti dell'approccio distribuzionale rispetto alla semantica lessicale. Utilizzare metodi basati sull’approccio distribuzionale per l’analisi delle relazioni semantiche paradigmatiche (come sinonimia, antonimia, iperonimia, iponimia e co-iponimia) potrebbe rivelarsi molto complesso e al contempo molto interessante, per varie ragioni. Ad esempio, le attuali misure allo stato dell'arte basate sull’approccio distribuzionale hanno difficoltà nel distinguere queste relazioni. Questo perché queste relazioni tendono a distribuirsi, all'interno dei testi, in un modo molto simile l’una all’altra. In primo luogo abbiamo quindi condotto uno studio sulle misure distribuzionali sviluppate per il riconoscimento delle relazioni semantiche paradigmatiche attualmente allo stato dell’arte, cercando di valutare il grado di successo riportato da tali misure. Abbiamo poi utilizzato i dati raccolti allo scopo di sviluppare nuove misure distribuzionali atte a classificare la relazione di iponimia / iperonimia e la relazione di antonimia. In questo lavoro, non solo si riesce a dimostrare che con metodi distribuzionali è possibile classificare, in modo non supervisionato, relazioni semantiche paradigmatiche; ma sono anche state sviluppate misure distribuzionali studiate appositamente per il riconoscimento e la classificazione di iperonimia e antonimia, che danno risultato migliori di quelle allo stato dell'arte.
Distributional Models for Semantic Relations: A Sudy on Hyponymy and Antonymy
2015
Abstract
The overall purpose of this research project is to study and explore the potential and limitations of the distributional approach with respect to lexical semantics. Analyzing paradigmatic relations such as synonymy, antonymy, hypernymy, hyponymy and co-hyponymy while using distributional methods could be very interesting and really challenging. For instance, state of the art semantic distributional methods have difficulties in distinguishing these relations. This is because these relations tend to distribute, within the texts, in a very similar way. We first carried out a study about current state of the art distributional measures developed for the recognition of paradigmatic semantic relations, trying to assess the degree of success reported by such measures. We then used the data we gathered to develop new distributional measures apt to classify the hyponymy/hypernymy relation and the antonymy relation. Not only did we prove that distributional methods can indeed be used in order to classify, in a non-supervised way, these relations; we also developed measures, especially conceived for recognizing and classifying hypernymy and antonymy, that performs better than state of the art ones. L'obiettivo generale di questo progetto di ricerca è quello di studiare ed esplorare le potenzialità e i limiti dell'approccio distribuzionale rispetto alla semantica lessicale. Utilizzare metodi basati sull’approccio distribuzionale per l’analisi delle relazioni semantiche paradigmatiche (come sinonimia, antonimia, iperonimia, iponimia e co-iponimia) potrebbe rivelarsi molto complesso e al contempo molto interessante, per varie ragioni. Ad esempio, le attuali misure allo stato dell'arte basate sull’approccio distribuzionale hanno difficoltà nel distinguere queste relazioni. Questo perché queste relazioni tendono a distribuirsi, all'interno dei testi, in un modo molto simile l’una all’altra. In primo luogo abbiamo quindi condotto uno studio sulle misure distribuzionali sviluppate per il riconoscimento delle relazioni semantiche paradigmatiche attualmente allo stato dell’arte, cercando di valutare il grado di successo riportato da tali misure. Abbiamo poi utilizzato i dati raccolti allo scopo di sviluppare nuove misure distribuzionali atte a classificare la relazione di iponimia / iperonimia e la relazione di antonimia. In questo lavoro, non solo si riesce a dimostrare che con metodi distribuzionali è possibile classificare, in modo non supervisionato, relazioni semantiche paradigmatiche; ma sono anche state sviluppate misure distribuzionali studiate appositamente per il riconoscimento e la classificazione di iperonimia e antonimia, che danno risultato migliori di quelle allo stato dell'arte.File | Dimensione | Formato | |
---|---|---|---|
SemRel.pdf
accesso aperto
Tipologia:
Altro materiale allegato
Dimensione
2.64 MB
Formato
Adobe PDF
|
2.64 MB | Adobe PDF | Visualizza/Apri |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14242/133598
URN:NBN:IT:UNIPI-133598