Gli studi in silico aventi per oggetto la struttura di domini proteici e di motif sia strutturali che lineari, sono in grado di fornire un importante apporto in termini di comprensione di funzione e nelle biotecnologie. Lo studio delle caratteristiche a carico della superficie proteica si rivelano essenziali nella comprensione delle Interazioni Proteina-Proteina (PPI); in particolare, la conservazione e variazione della superficie proteica e delle relative cavità in termini di idrofobicità, ingombro sterico e caratteristiche elettrostatiche, possono essere considerate come la forza in grado di guidare l’evoluzione e la specializzazione funzionale delle proteine stesse. Alla luce di quanto sopra esposto, tecniche come la Modellistica Molecolare ed il confronto tra strutture giocano un ruolo importante nel chiarire il modus operandi delle proteine e questo progetto di Dottorato ha proprio sfruttato l’approccio integrato di alcune ben note tecniche di biologia computazionale basate sulla Modellistica Molecolare come, ad esempio, Homology Modeling, Fold Recognition, Ab initio Modeling, PBE (Poisson-Boltzmann Electrostatics), Protein-peptide Docking e Hydropathy Analysis con confronto di sequenze e strutture. Elemento indispensabile e prezioso, ovviamente, il feedback ottenuto dagli esperimenti al banco effettuati dai nostri collaboratori. Questo approccio integrato è stato dunque applicato a differenti sistemi biologici: • Individuazione di determinanti di superficie in virus influenzali di tipo A H5N1: è stata effettuata un’analisi dei determinanti di superficie a carico dell’emoagglutinina proveniente dal virus influenzale H5N1, coinvolta nell’interazione virus-ospite. Questo lavoro ha già condotto ad una pubblicazione. La variazione genomica è elevata nei virus influenzali di tipo A. L’evoluzione e la diffusione dei virus sono molto influenzate dalle caratteristiche immunogeniche e dalla capacità del virus, di interagire con le cellule dell’ospite tramite le due più importanti proteine presenti sul capside virale: l’emoagglutinina e la neuraminidasi. Le analisi oggi a disposizione sono basate sul confronto dell’attività sierologica e di sequenze primarie; alla luce di ciò, l’analisi strutturale di queste proteine capsidiche può essere in grado di svelare delle conoscenze a riguardo di certe regioni presenti sulla superficie proteica che possono essere cruciali per l’antigenicità e per il legame alle cellule dell’ospite. L’emoagglutinina, sezionata nei suoi domini e subdomini, è stata da noi studiata con metodi di Modellistica Molecolare e sottoposta a confronti strutturali fini, per individuare quelle variazioni che potessero risultare tipo/dominio specifiche. Abbiamo evidenziato che la vicinanza strutturale e la similarità di sequenza primaria non sempre sono correlate; in più, caratteristiche tipo-specifiche di sottoregioni dell’emoagglutinina, monomeri e trimeri, possono essere rivelate grazie al confronto delle loro proprietà di superficie, (in termini di elettrostatica ed idrofobicità) appartenenti a sottoregioni dell’emoagglutinina, monomeri e trimeri. In questo lavoro ci siamo focalizzati sul virus H5N1 e abbiamo scoperto che il dominio di legame recettoriale dell’emoagglutinina (RBD) presenta delle variazioni tra clade circolanti e non più circolanti. Le recenti scoperte riguardanti l’associazione tra la disposizione delle cariche al RBD ed il successo in termini evolutivi e di diffusione del virus H5N1 ci hanno spinto ad eseguire analisi integrate di filogenesi e biologia strutturale a carico dei virus H9N2. Infatti, l’influenza A è un agente zoonotico in grado di produrre un grosso impatto sia sulla salute pubblica che sull’industria del pollame, avendo la capacità di effettuare il salto d’ospite, come riportato proprio per H5N1 ed H9N2. Abbiamo effettuato un’analisi evoluzionistica su un grande dataset non ridondante di ceppi virali e questo ci ha consentito di individuare cinque gruppi di virus H9N2. In accordo con le precedenti analisi effettuate per H5N1, abbiamo ottenuto accordo tra i dati filogenetici con quelli ottenuti dalle analisi di confronto strutturale. In particolare, emerge che la variazione della disposizione delle cariche coincide con quella di siti noti dell’emoagglutinina coinvolti nell’evasione al sistema immunitario e nella specificità d’ospite. I risultati ottenuti da questo secondo lavoro pongono l’accento sull’importanza dell’integrazione tra analisi di tipo filogenetiche e di biologia strutturale nella scoperta di nuovi meccanismi evolutivi dei virus dell’influenza. • Variazione dell’architettura di domini in proteine di mammifero coinvolte nel traffico vescicolare: la proteina umana VAMP7b è la più interessante tra quelle prodotte per splicing alternativo del gene SYBL1. La produzione di VAMP7b è causata dal salto dell’esone 6 che si traduce in uno slittamento della sequenza codificante. Abbiamo scoperto che questo evento è conservato in altre specie di mammiferi. VAMP7b condivide con l’isoforma principale il dominio inibitorio longin N-terminale e la prima metà dello SNARE motif. Nei mammiferi, VAMP7b è una proteina tronca in cui al C-terminale metà dello SNARE motif e la regione transmembrana sono sostituite da peptidi corti e variabili. È molto interessante notare come negli uomini e nelle scimmie antropomorfe lo slittamento della regione codificante determinato dal salto dell’esone 6 abbia prodotto un nuovo dominio di funzione sconosciuta: proprio per questo VAMP7b umana non è tronca, ma addirittura 40 residui più lunga rispetto all’isoforma principale. Dal momento che l’esistenza di questa isoforma “lunga” ed il suo nuovo dominio sono stati confermati a livello proteico grazie all’ausilio di specifici anticorpi, abbiamo effettuato una dissezione in silico del nuovo dominio adoperando un’analisi di sequenza di tipo matrice posizione-specifica (PSI-BLAST), seguita da da Modellistica Strutturale di tipo ab initio. In più, dal momento che la regione N-terminale dello SNARE motif è conservata ed è nota nel mediare il legame intramolecolare al dominio Longin, abbiamo appurato la conservazione della conformazione chiusa sia in vivo (saggio del doppio ibrido in lievito) che in vitro (analisi NMR). Inoltre, la localizzazione subcellulare (SCL) di VAMP7b e Ykt6b è stata studiata adoperando chimere contenenti GFP e RFP. Non ultimo, le isoforme b dei geni longin sono stati analizzati tramite qPCR e si è scoperto essere regolate durante lo sviluppo. • Motif di legame con azione regolatoria sulla crescita e l’indirizzamento neuronale: La regolazione fine delle interazioni proteina-proteina che avviene grazie alle variazioni nell’architettura dei domini o dal cambiamento di motif locali indotto dalla modulazione di caratteristiche di superficie, è in grado di regolare i percorsi di segnalazione sia a livello intra- che extracellulare. Le interazioni proteina-proteina extracellulari possono giocare un ruolo fondamentale nel riconoscimento eterologo (es. ospite-patogeno) come nella segnalazione omologa tra cellule appartenenti allo stesso organismo. Le proteine esposte in membrana plasmatica (PM) possono interagire le une con le altre e con la matrice extracellulare (ECM) per consentire informazioni posizionali e segnali di indirizzamento. Le molecole di adesione cellulare (CAMs) sono proteine della membrana plasmatica in grado di mediare segnali sia di natura attrattiva che repulsiva grazie ad interazioni omo- ed eterofiliche a carico dei loro domini extracellulari (EDs). Questi ultimi sono composti per la magior parte da domini ripetuti aventi fold di tipo Ig o Fibronectina di tipo III. Le attuali conoscenze suggeriscono che i 4 domini extracellulari N-terminali di tipo Ig siano importanti nelle interazioni omo- o eterofiliche ed in modo particolare il dominio Ig2 è provvisto di un importante motif di interazione. Nel nostro laboratorio abbiamo sviluppato dei peptidi biomimetici che riproducono i motif di interazione conosciuti o predetti appartenenti al dominio Ig2 di L1CAM umana e al singolo dominio Ig di LINGO1 umana, proteine, queste, che giocano un ruolo fondamentale nella crescita, nell’indirizzamento e nel differenziamento neuronale. Sulla base della conservazione strutturale della regione del motif (anche tra proteine con architetture molto diverse dei loro EDs), abbiamo iniziato a studiarne la variazione di sequenza mediante analisi per omologia e per espressioni regolari, per infine tornare al livello strutturale mediante Modellistica Molecolare. I risultati preliminari indicano una forte conservazione dell’Arginina centrale presente nel motif d’interazione, mentre nelle altre posizioni del motif si osserva la conservazione di proprietà dei residui piuttosto che la presenza di specifici residui. Questa evidenza è in accordo con il dato di fatto che la mutazione dell’Arginina in L1CAM è responsabile di un serio disordine neurologico, mentre mutazioni a carico di altri residui del motif causano un fenotipo meno grave. Questo suggerisce che il motif è un epitopo posizionalmente conservato attorno all’Arginina centrale in grado di consentire una variabilità limitata ma significativa nella sequenza circostante. Per verificare quest’ipotesi è stata effettuata una superimposizione strutturale dei domini Ig contenenti il motif d’interazione: il risultato ha confermato che il peptide contenente il motif è di per sé conservato posizionalmente e che la conservazione maggiore sia a livello posizionale che struturale è a carico del residuo centrale di Arginina. Esperimenti con peptidi mutati nell’Arginina centrale hanno dimostrato un’attività in termini di segnalazione nella neuritogenesi. Questi lavori hanno consentito di sviluppare un protocollo bioinformatico per la caratterizzazione di determinanti d’interazione e della loro modulazione funzionale, facilmente trasportabile su altre proteine.

Towards "Systems Biotechnology": identification, characterization and design/engineering of protein interaction motifs/domains mediating regulatory signals

RIGHETTO, IRENE
2017

Abstract

Gli studi in silico aventi per oggetto la struttura di domini proteici e di motif sia strutturali che lineari, sono in grado di fornire un importante apporto in termini di comprensione di funzione e nelle biotecnologie. Lo studio delle caratteristiche a carico della superficie proteica si rivelano essenziali nella comprensione delle Interazioni Proteina-Proteina (PPI); in particolare, la conservazione e variazione della superficie proteica e delle relative cavità in termini di idrofobicità, ingombro sterico e caratteristiche elettrostatiche, possono essere considerate come la forza in grado di guidare l’evoluzione e la specializzazione funzionale delle proteine stesse. Alla luce di quanto sopra esposto, tecniche come la Modellistica Molecolare ed il confronto tra strutture giocano un ruolo importante nel chiarire il modus operandi delle proteine e questo progetto di Dottorato ha proprio sfruttato l’approccio integrato di alcune ben note tecniche di biologia computazionale basate sulla Modellistica Molecolare come, ad esempio, Homology Modeling, Fold Recognition, Ab initio Modeling, PBE (Poisson-Boltzmann Electrostatics), Protein-peptide Docking e Hydropathy Analysis con confronto di sequenze e strutture. Elemento indispensabile e prezioso, ovviamente, il feedback ottenuto dagli esperimenti al banco effettuati dai nostri collaboratori. Questo approccio integrato è stato dunque applicato a differenti sistemi biologici: • Individuazione di determinanti di superficie in virus influenzali di tipo A H5N1: è stata effettuata un’analisi dei determinanti di superficie a carico dell’emoagglutinina proveniente dal virus influenzale H5N1, coinvolta nell’interazione virus-ospite. Questo lavoro ha già condotto ad una pubblicazione. La variazione genomica è elevata nei virus influenzali di tipo A. L’evoluzione e la diffusione dei virus sono molto influenzate dalle caratteristiche immunogeniche e dalla capacità del virus, di interagire con le cellule dell’ospite tramite le due più importanti proteine presenti sul capside virale: l’emoagglutinina e la neuraminidasi. Le analisi oggi a disposizione sono basate sul confronto dell’attività sierologica e di sequenze primarie; alla luce di ciò, l’analisi strutturale di queste proteine capsidiche può essere in grado di svelare delle conoscenze a riguardo di certe regioni presenti sulla superficie proteica che possono essere cruciali per l’antigenicità e per il legame alle cellule dell’ospite. L’emoagglutinina, sezionata nei suoi domini e subdomini, è stata da noi studiata con metodi di Modellistica Molecolare e sottoposta a confronti strutturali fini, per individuare quelle variazioni che potessero risultare tipo/dominio specifiche. Abbiamo evidenziato che la vicinanza strutturale e la similarità di sequenza primaria non sempre sono correlate; in più, caratteristiche tipo-specifiche di sottoregioni dell’emoagglutinina, monomeri e trimeri, possono essere rivelate grazie al confronto delle loro proprietà di superficie, (in termini di elettrostatica ed idrofobicità) appartenenti a sottoregioni dell’emoagglutinina, monomeri e trimeri. In questo lavoro ci siamo focalizzati sul virus H5N1 e abbiamo scoperto che il dominio di legame recettoriale dell’emoagglutinina (RBD) presenta delle variazioni tra clade circolanti e non più circolanti. Le recenti scoperte riguardanti l’associazione tra la disposizione delle cariche al RBD ed il successo in termini evolutivi e di diffusione del virus H5N1 ci hanno spinto ad eseguire analisi integrate di filogenesi e biologia strutturale a carico dei virus H9N2. Infatti, l’influenza A è un agente zoonotico in grado di produrre un grosso impatto sia sulla salute pubblica che sull’industria del pollame, avendo la capacità di effettuare il salto d’ospite, come riportato proprio per H5N1 ed H9N2. Abbiamo effettuato un’analisi evoluzionistica su un grande dataset non ridondante di ceppi virali e questo ci ha consentito di individuare cinque gruppi di virus H9N2. In accordo con le precedenti analisi effettuate per H5N1, abbiamo ottenuto accordo tra i dati filogenetici con quelli ottenuti dalle analisi di confronto strutturale. In particolare, emerge che la variazione della disposizione delle cariche coincide con quella di siti noti dell’emoagglutinina coinvolti nell’evasione al sistema immunitario e nella specificità d’ospite. I risultati ottenuti da questo secondo lavoro pongono l’accento sull’importanza dell’integrazione tra analisi di tipo filogenetiche e di biologia strutturale nella scoperta di nuovi meccanismi evolutivi dei virus dell’influenza. • Variazione dell’architettura di domini in proteine di mammifero coinvolte nel traffico vescicolare: la proteina umana VAMP7b è la più interessante tra quelle prodotte per splicing alternativo del gene SYBL1. La produzione di VAMP7b è causata dal salto dell’esone 6 che si traduce in uno slittamento della sequenza codificante. Abbiamo scoperto che questo evento è conservato in altre specie di mammiferi. VAMP7b condivide con l’isoforma principale il dominio inibitorio longin N-terminale e la prima metà dello SNARE motif. Nei mammiferi, VAMP7b è una proteina tronca in cui al C-terminale metà dello SNARE motif e la regione transmembrana sono sostituite da peptidi corti e variabili. È molto interessante notare come negli uomini e nelle scimmie antropomorfe lo slittamento della regione codificante determinato dal salto dell’esone 6 abbia prodotto un nuovo dominio di funzione sconosciuta: proprio per questo VAMP7b umana non è tronca, ma addirittura 40 residui più lunga rispetto all’isoforma principale. Dal momento che l’esistenza di questa isoforma “lunga” ed il suo nuovo dominio sono stati confermati a livello proteico grazie all’ausilio di specifici anticorpi, abbiamo effettuato una dissezione in silico del nuovo dominio adoperando un’analisi di sequenza di tipo matrice posizione-specifica (PSI-BLAST), seguita da da Modellistica Strutturale di tipo ab initio. In più, dal momento che la regione N-terminale dello SNARE motif è conservata ed è nota nel mediare il legame intramolecolare al dominio Longin, abbiamo appurato la conservazione della conformazione chiusa sia in vivo (saggio del doppio ibrido in lievito) che in vitro (analisi NMR). Inoltre, la localizzazione subcellulare (SCL) di VAMP7b e Ykt6b è stata studiata adoperando chimere contenenti GFP e RFP. Non ultimo, le isoforme b dei geni longin sono stati analizzati tramite qPCR e si è scoperto essere regolate durante lo sviluppo. • Motif di legame con azione regolatoria sulla crescita e l’indirizzamento neuronale: La regolazione fine delle interazioni proteina-proteina che avviene grazie alle variazioni nell’architettura dei domini o dal cambiamento di motif locali indotto dalla modulazione di caratteristiche di superficie, è in grado di regolare i percorsi di segnalazione sia a livello intra- che extracellulare. Le interazioni proteina-proteina extracellulari possono giocare un ruolo fondamentale nel riconoscimento eterologo (es. ospite-patogeno) come nella segnalazione omologa tra cellule appartenenti allo stesso organismo. Le proteine esposte in membrana plasmatica (PM) possono interagire le une con le altre e con la matrice extracellulare (ECM) per consentire informazioni posizionali e segnali di indirizzamento. Le molecole di adesione cellulare (CAMs) sono proteine della membrana plasmatica in grado di mediare segnali sia di natura attrattiva che repulsiva grazie ad interazioni omo- ed eterofiliche a carico dei loro domini extracellulari (EDs). Questi ultimi sono composti per la magior parte da domini ripetuti aventi fold di tipo Ig o Fibronectina di tipo III. Le attuali conoscenze suggeriscono che i 4 domini extracellulari N-terminali di tipo Ig siano importanti nelle interazioni omo- o eterofiliche ed in modo particolare il dominio Ig2 è provvisto di un importante motif di interazione. Nel nostro laboratorio abbiamo sviluppato dei peptidi biomimetici che riproducono i motif di interazione conosciuti o predetti appartenenti al dominio Ig2 di L1CAM umana e al singolo dominio Ig di LINGO1 umana, proteine, queste, che giocano un ruolo fondamentale nella crescita, nell’indirizzamento e nel differenziamento neuronale. Sulla base della conservazione strutturale della regione del motif (anche tra proteine con architetture molto diverse dei loro EDs), abbiamo iniziato a studiarne la variazione di sequenza mediante analisi per omologia e per espressioni regolari, per infine tornare al livello strutturale mediante Modellistica Molecolare. I risultati preliminari indicano una forte conservazione dell’Arginina centrale presente nel motif d’interazione, mentre nelle altre posizioni del motif si osserva la conservazione di proprietà dei residui piuttosto che la presenza di specifici residui. Questa evidenza è in accordo con il dato di fatto che la mutazione dell’Arginina in L1CAM è responsabile di un serio disordine neurologico, mentre mutazioni a carico di altri residui del motif causano un fenotipo meno grave. Questo suggerisce che il motif è un epitopo posizionalmente conservato attorno all’Arginina centrale in grado di consentire una variabilità limitata ma significativa nella sequenza circostante. Per verificare quest’ipotesi è stata effettuata una superimposizione strutturale dei domini Ig contenenti il motif d’interazione: il risultato ha confermato che il peptide contenente il motif è di per sé conservato posizionalmente e che la conservazione maggiore sia a livello posizionale che struturale è a carico del residuo centrale di Arginina. Esperimenti con peptidi mutati nell’Arginina centrale hanno dimostrato un’attività in termini di segnalazione nella neuritogenesi. Questi lavori hanno consentito di sviluppare un protocollo bioinformatico per la caratterizzazione di determinanti d’interazione e della loro modulazione funzionale, facilmente trasportabile su altre proteine.
28-lug-2017
Inglese
Homology Modeling, Fold Recognition, Ab initio Modeling, PBE (Poisson-Boltzmann Electrostatics), Protein-peptide Docking, Hydropathy Analysis, Protein-protein interactions, H5N1, H9N2, protein surface, CAM, biomimetics, SNARE
FILIPPINI, FRANCESCO
BERNARDI, PAOLO
Università degli studi di Padova
File in questo prodotto:
File Dimensione Formato  
Righetto_Irene_tesi.pdf

accesso aperto

Dimensione 10.19 MB
Formato Adobe PDF
10.19 MB Adobe PDF Visualizza/Apri

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14242/176685
Il codice NBN di questa tesi è URN:NBN:IT:UNIPD-176685