Chemoinformatics approaches for new drugs discovery

Fanton, Marco

Il termine chemoinformatica si riferisce all’uso di metodi informatici per risolvere problemi chimici ed ha come oggetto strutture molecolari e loro rappresentazioni, proprietà e dati collegati; passaggio cruciale è la traduzione di sistemi atomici interconnessi in rappresentazioni e modelli in silico, garantendo il completo e corretto trasferimento dell’ informazione chimica. Negli ultimi 20 anni i database chimici sono evoluti da semplici archivi molecolari a strumenti di ricerca per l’ identificazione di nuovi candidati farmaci, grazie allo sviluppo di tecnologie di high-throughput che permettono una continua e costante espansione delle librerie chimiche come testimoniato da database pubblici quali PubChem[http://pubchem.ncbi.nlm.nih.gov/], ZINC[http://zinc.docking.org/], ChemSpider[http://www.chemspider.com/]. Requisiti fondamentali per qualsiasi libreria chimica sono l’ unicità e disambiguità molecolare, la correttezza chimica (relativa ad atomi, legami, ortografia chimica), la standardizzazione dei formati di archiviazione e registrazione molecolare. Lo scopo di questo lavoro è lo sviluppo di strumenti e masse dati chemoinformatici applicabili al processo di identificazione di nuovi farmaci. La prima fase del progetto si è focalizzata sull’ analisi dello spazio chimico commerciale in termini di ridondanza molecolare e correttezza dei modelli in-silico, allo scopo di identificare un descrittore molecolare univoco e non ambiguo utilizzabile nella indicizzazione di librerie molecolari; questo ha permesso di unicare una libreria di 42 milioni di composti commercialmente disponibili e di implementare MMsDusty, un’ applicativo web per l’ unicazione di librerie chemoinformatiche. Uno dei prodotti principali del progetto è MMsINC, una piattaforma chemoinformatica basata su una libreria iniziale di 4 milioni di modelli molecolari di elevata qualità e priva di ridondanza, espansa poi a circa 460 milioni di strutture. La piattaforma permette di effettuare analisi chemoinformatiche tramite funzioni appositamente sviluppate (ricerca per similarità, sottostruttura, descrittori molecolari) oltre ad essere interfacciata col PDB(Protein Data Bank)[http://www.rcsb.org/pdb/home/home.do] e correlata ai farmaci attualmente in commercio. La seconda piattaforma sviluppata è pepMMsMIMIC, un protocollo di analisi ed identificazione di peptidomimetici basato su screening di librerie chimiche multiconformero tramite FP(fingerprints) farmacoforici, allo scopo di identificare piccole molecole organiche in grado di mimare geometricamente e chimicamente peptidi o proteine endogeni. Infine è stato sviluppato un protocollo di analisi conformazionale esaustiva di librerie chimiche, fondamentale per la predizione di modelli molecolari tridimensionali di alta qualità, richiesti nelle applicazioni chemoinformatiche; ottimizzando l’ esplorazione torsionale all’ interno degli intervalli degli angoli diedri più frequenti rilevati nelle strutture organiche risolte ai raggi X del CSD (Cambridge Structural Database) su 89 milioni di grafi molecolari, sono stati generati 2.6 x 10 exp 7 conformeri di alta qualità. Nel complesso la piattaforma ed i protocolli sviluppati permettono di effettuare analisi chemoinformatiche su librerie molecolari di grosse dimensioni, garantendo elevata qualità, correttezza ed unicità del dato chimico e della sua rappresentazione in silico tramite modelli tridimensionali

Chemoinformatics approaches for new drugs discovery

FANTON, MARCO

2013

Abstract

Il termine chemoinformatica si riferisce all’uso di metodi informatici per risolvere problemi chimici ed ha come oggetto strutture molecolari e loro rappresentazioni, proprietà e dati collegati; passaggio cruciale è la traduzione di sistemi atomici interconnessi in rappresentazioni e modelli in silico, garantendo il completo e corretto trasferimento dell’ informazione chimica. Negli ultimi 20 anni i database chimici sono evoluti da semplici archivi molecolari a strumenti di ricerca per l’ identificazione di nuovi candidati farmaci, grazie allo sviluppo di tecnologie di high-throughput che permettono una continua e costante espansione delle librerie chimiche come testimoniato da database pubblici quali PubChem[http://pubchem.ncbi.nlm.nih.gov/], ZINC[http://zinc.docking.org/], ChemSpider[http://www.chemspider.com/]. Requisiti fondamentali per qualsiasi libreria chimica sono l’ unicità e disambiguità molecolare, la correttezza chimica (relativa ad atomi, legami, ortografia chimica), la standardizzazione dei formati di archiviazione e registrazione molecolare. Lo scopo di questo lavoro è lo sviluppo di strumenti e masse dati chemoinformatici applicabili al processo di identificazione di nuovi farmaci. La prima fase del progetto si è focalizzata sull’ analisi dello spazio chimico commerciale in termini di ridondanza molecolare e correttezza dei modelli in-silico, allo scopo di identificare un descrittore molecolare univoco e non ambiguo utilizzabile nella indicizzazione di librerie molecolari; questo ha permesso di unicare una libreria di 42 milioni di composti commercialmente disponibili e di implementare MMsDusty, un’ applicativo web per l’ unicazione di librerie chemoinformatiche. Uno dei prodotti principali del progetto è MMsINC, una piattaforma chemoinformatica basata su una libreria iniziale di 4 milioni di modelli molecolari di elevata qualità e priva di ridondanza, espansa poi a circa 460 milioni di strutture. La piattaforma permette di effettuare analisi chemoinformatiche tramite funzioni appositamente sviluppate (ricerca per similarità, sottostruttura, descrittori molecolari) oltre ad essere interfacciata col PDB(Protein Data Bank)[http://www.rcsb.org/pdb/home/home.do] e correlata ai farmaci attualmente in commercio. La seconda piattaforma sviluppata è pepMMsMIMIC, un protocollo di analisi ed identificazione di peptidomimetici basato su screening di librerie chimiche multiconformero tramite FP(fingerprints) farmacoforici, allo scopo di identificare piccole molecole organiche in grado di mimare geometricamente e chimicamente peptidi o proteine endogeni. Infine è stato sviluppato un protocollo di analisi conformazionale esaustiva di librerie chimiche, fondamentale per la predizione di modelli molecolari tridimensionali di alta qualità, richiesti nelle applicazioni chemoinformatiche; ottimizzando l’ esplorazione torsionale all’ interno degli intervalli degli angoli diedri più frequenti rilevati nelle strutture organiche risolte ai raggi X del CSD (Cambridge Structural Database) su 89 milioni di grafi molecolari, sono stati generati 2.6 x 10 exp 7 conformeri di alta qualità. Nel complesso la piattaforma ed i protocolli sviluppati permettono di effettuare analisi chemoinformatiche su librerie molecolari di grosse dimensioni, garantendo elevata qualità, correttezza ed unicità del dato chimico e della sua rappresentazione in silico tramite modelli tridimensionali

Scheda breve

Scheda completa

Scheda completa (DC)

	Corso di studio
	
				SCIENZE FARMACEUTICHE
			
	Data di pubblicazione
	
				22-gen-2013
			
	Lingua
	
				Inglese
			
	Parola chiave
	
				chemoinformatics, peptidomimetics, screening, redundancy, library, conformers, conformational analysis, database, similarity, pharmacophoric, pharmacophore, fingerprint, SMILES, InChI, connection tables, substructure, shape similarity
			
	Relatore, Supervisor, Advisor o Tutor
	
				MORO, STEFANO
			
	Correlatore, Controrelatore, Co-Supervisor,  Co-Tutor o Coordinatori
	
				POLIMENO, ANTONINO
			
	Nome Editore
	
				Università degli studi di Padova
			
	Collezione di appartenenza
	
				Università degli Studi di Padova

File in questo prodotto:

File	Dimensione	Formato
Fanton_Marco_Tesi.pdf accesso aperto Licenza: Tutti i diritti riservati Dimensione 56.26 MB Formato Adobe PDF Visualizza/Apri	56.26 MB	Adobe PDF	Visualizza/Apri

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14242/81756

Il codice NBN di questa tesi è URN:NBN:IT:UNIPD-81756