Si è affrontato il problema del riconoscimento vocale di parlato continuo mediante Modelli di Markov Nascosti (HMM). Dopo aver svolto una rassegna dello stato dell'arte per le tecnologie coinvolte, la tesi espone i diversi risultati sperimentali ottenuti per gli originali elementi innovativi introdotti. Viene innanzitutto realizzato un modello di sorgente markoviano per l'alfabeto fonetico che descrive le unità elementari di produzione linguistica, stimando le probabilità condizionate non soltanto al fonema precedente, ma anche alla posizione del fonema all'interno della parola e della sillaba, catturando così molti dei vincoli fonotattici della lingua. Quindi, l'algoritmo di stima dei parametri degli HMM che rappresentano le variabilità acustiche degli elementi fonetici è modificato allo scopo di adottare dei modelli di semi-markov, in cui la probabilità di rimanere in uno stesso stato decade esponenzialmente nel tempo, fornendo valori di probabilità di durata più verosimili per ciò che riguarda gli eventi fonatori. Infine, l'algoritmo di Viterbi necessario a svolgere il passo di riconoscimento è anch'esso modificato per tener conto del nuovo modello di durata, dimostrando un teorema che permette di mantenerne la complessità computazionale nello stesso ordine di grandezza degli HMM tradizionali.

Decodifica Acustico-Fonetica del Messaggio Vocale su basi Informativo-Strutturali mediante modelli di Markov nascosti

FALASCHI, Alessandro
1989

Abstract

Si è affrontato il problema del riconoscimento vocale di parlato continuo mediante Modelli di Markov Nascosti (HMM). Dopo aver svolto una rassegna dello stato dell'arte per le tecnologie coinvolte, la tesi espone i diversi risultati sperimentali ottenuti per gli originali elementi innovativi introdotti. Viene innanzitutto realizzato un modello di sorgente markoviano per l'alfabeto fonetico che descrive le unità elementari di produzione linguistica, stimando le probabilità condizionate non soltanto al fonema precedente, ma anche alla posizione del fonema all'interno della parola e della sillaba, catturando così molti dei vincoli fonotattici della lingua. Quindi, l'algoritmo di stima dei parametri degli HMM che rappresentano le variabilità acustiche degli elementi fonetici è modificato allo scopo di adottare dei modelli di semi-markov, in cui la probabilità di rimanere in uno stesso stato decade esponenzialmente nel tempo, fornendo valori di probabilità di durata più verosimili per ciò che riguarda gli eventi fonatori. Infine, l'algoritmo di Viterbi necessario a svolgere il passo di riconoscimento è anch'esso modificato per tener conto del nuovo modello di durata, dimostrando un teorema che permette di mantenerne la complessità computazionale nello stesso ordine di grandezza degli HMM tradizionali.
1989
HMM; riconoscimento vocale; Fonotassi; Probabilità di durata
Università degli Studi di Roma "La Sapienza"
142
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14242/116117
Il codice NBN di questa tesi è URN:NBN:IT:UNIROMA1-116117