Optimal methods and metrics for coevolutionary analysis of eukaryotic genes have not yet been established. In this dissertation, two different applications of a procedure suitable for large-scale analysis are described, together with experimental validations of the new bioinformatics tool. The described method can identify coevolution in profiles with low overall similarities through analysis of state transitions (i.e. 1->0 or 0->1) shared among phylogenetic profiles. We applied the procedure to large collections of orthogroups extracted from the OrthoDB database or we built de novo human-centered orthogroups. To demonstrate the ability of the method to predict hidden gene associations, two eukaryotic gene families have been investigated through in vitro studies of recombinant proteins, leading to assign the ureidoglycolate lyase function to “malate synthase-like” genes in Metazoa and the 2-aminomuconate reductase function to “aspartate dehydrogenase” genes in vertebrates. The identification of “malate synthase” as a candidate for the missing activity in purine catabolism explains the presence of glyoxylate cycle genes in metazoa and suggests an anaplerotic role of purine degradation in early eukaryotes. The repositioning of the ASPDH gene in tryptophan degradation pathways clarifies its maintenance during evolution despite the abolishment of the ancestral function in NAD biosynthesis.
La coevoluzione a livello genico, descritta da eventi correlati di perdita o guadagno di geni, può emergere dall’analisi del profilo filogenetico, ma non è ancora stato universalmente riconosciuto un metodo ottimale. In questa tesi di dottorato sono descritte due diverse applicazioni di una procedura adatta all’analisi su larga scala, insieme a convalide sperimentali del nuovo strumento bioinformatico. Questa metrica è in grado di identificare la coevoluzione in profili con basse somiglianze complessive grazie all’identificazione delle transizioni di stato (cioè 1->0 o 0->1) condivise tra i profili filogenetici. Abbiamo applicato la procedura a ampie raccolte di ortogruppi ottenute dal database OrthoDB o, in alternativa, abbiamo costruito de novo ortogruppi identificati a partire dal gene umano. Per dimostrare la capacità del metodo di prevedere associazioni geniche nascoste, sono state studiate due famiglie di geni eucariotici attraverso studi in vitro di proteine ricombinanti; queste indagini hanno portato ad assegnare la funzione di ureidoglicolato liasi ai geni definiti come "malato sintasi" nei Metazoi e la funzione di 2-aminomuconato reduttasi a geni definiti come "aspartato deidrogenasi" nei vertebrati. L’identificazione della "malato sintasi" come candidato per l’attività mancante nel catabolismo delle purine spiega la presenza di geni del ciclo del gliossilato nei metazoi e suggerisce un ruolo anaplerotico della degradazione delle purine negli eucarioti.l riposizionamento del gene ASPDH nella via di degradazione del triptofano chiarisce la sua conservazione nel corso dell’evoluzione degli eucarioti nonostante l’abolizione della funzione ancestrale nella biosintesi del NAD.
Identificazione di associazioni mancanti nel metabolismo eucariotico mediante analisi coevolutiva
Elena, Dembech
2023
Abstract
Optimal methods and metrics for coevolutionary analysis of eukaryotic genes have not yet been established. In this dissertation, two different applications of a procedure suitable for large-scale analysis are described, together with experimental validations of the new bioinformatics tool. The described method can identify coevolution in profiles with low overall similarities through analysis of state transitions (i.e. 1->0 or 0->1) shared among phylogenetic profiles. We applied the procedure to large collections of orthogroups extracted from the OrthoDB database or we built de novo human-centered orthogroups. To demonstrate the ability of the method to predict hidden gene associations, two eukaryotic gene families have been investigated through in vitro studies of recombinant proteins, leading to assign the ureidoglycolate lyase function to “malate synthase-like” genes in Metazoa and the 2-aminomuconate reductase function to “aspartate dehydrogenase” genes in vertebrates. The identification of “malate synthase” as a candidate for the missing activity in purine catabolism explains the presence of glyoxylate cycle genes in metazoa and suggests an anaplerotic role of purine degradation in early eukaryotes. The repositioning of the ASPDH gene in tryptophan degradation pathways clarifies its maintenance during evolution despite the abolishment of the ancestral function in NAD biosynthesis.File | Dimensione | Formato | |
---|---|---|---|
DembechElena_XXXV_Thesis.pdf
embargo fino al 01/06/2025
Dimensione
10.3 MB
Formato
Adobe PDF
|
10.3 MB | Adobe PDF | |
REPORT_ATTIVITA'.pdf
non disponibili
Dimensione
187.4 kB
Formato
Adobe PDF
|
187.4 kB | Adobe PDF |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14242/193614
URN:NBN:IT:UNIPR-193614