In questi ultimi anni, la produzione e distribuzione di dati scientifici è cresciuta esponenzialmente. PubMed, un servizio della U.S. National Library of Medicine che include ormai oltre 18 milioni di citazioni estratte da Medline, incrementa il proprio contenuto di circa 40.000 estratti da pubblicazioni scientifiche o biomediche ogni mese. L’avvento dell’era dell’informazione ha permesso di accumulare e disseminare enormi quantità di dati, ma la nostra capacità di ricavarne conoscenza è rimasta costante. Le nostre inferenze che nascono dall’osservazione si basano spesso sull’uso del linguaggio verbale che raramente risulta adeguato. Inoltre, la ricerca biomedica è caratterizzata da discipline fortemente specializzate che raramente comunicano o condividono risorse. Tutti questi aspetti aiutano a rivolgere l’attenzione sulla reale necessità di integrare informazioni, un concetto generale con molte definizioni. Nel contesto del mio dottorato, per integrazione si intende il processo attraverso il quale i dati possono essere scambiati, interpretati e manipolati pur rimanendo comprensibili da chi utilizza il sistema. Le ontologie biomediche in generale e la Gene Ontology in particolare sono state una componente fondamentale di un importante sforzo di integrazione di informazioni di tipo biologico iniziato nel 2000 con l’ambizioso obiettivo di sviluppare uno strumento per l’unificazione della biologia e oltre. Il mio progetto di dottorato, accompagnandosi a questa iniziativa, si è focalizzato sullo sviluppo di un particolare tipo di database (knowledgebase) che possa facilitare l’esplorazione di specifici dati sperimentali. Il sistema si sviluppa sulla base di informazioni estratte da numerose fonti di dati per buona parte curate manualmente, usando come struttura portante un’ontologia di malattie umane (Disease Ontology). Lo scopo è quello di fornire supporto alla comunità scientifica biomedica per l’interpretazione dei dati relativi a malattie umane, ai geni a queste ricollegabili e ai farmaci in grado di curarle. Nella seconda parte del dottorato è stata approfondita una specifica tematica di ricerca utile per provare il sistema e valutarne le reali possibilità. L’analisi funzionale di dati complessi prodotti con tecnologie high-throughput come i microarray, risulta fondamentale per comprendere i meccanismi di regolazione dei processi molecolari implicati negli stati patologici. Tuttavia, nonostante la disponibilità di validi strumenti di indagine, nel campo delle malattie psichiatriche non si sono avuti gli stessi rilevanti progressi, utili per comprenderne i meccanismi patologici, ottenuti invece in altre aree di ricerca. Pertanto, una adeguata strategia computazionale, abbinata al recente sviluppo della risorsa oggetto di questo lavoro, è stata disegnata per consentire un’indagini sul coinvolgimento di alcuni specifici geni, meccanismi e farmaci nella causa o la cura della patologia psichiatrica. La plasticità dendritica è una componente importante nel funzionamento del sistema nervoso centrale durante lo sviluppo, ed è stato recentemente postulato che possa essere fortemente coinvolta nella patogenesi delle malattie legate al sistema nervoso centrale. Il concetto di plasticità abbraccia un ampio spettro di caratteristiche cliniche che descrivono aspetti del comportamento, dell’apprendimento e della memoria fino ai meccanismi molecolari con cui i neuroni creano o perdono le loro sinapsi. La strategia scelta ha consentito di identificare in modo semi-automatico un grande numero di geni coinvolti a livello molecolare nel meccanismo della plasticità dendritica e ha permesso allo stesso tempo la verifica, in certa misura e in via preliminare, delle qualità e delle potenzialità del knowledgebase sviluppato.

Development of an integrated disease ontology knowledgebase and its application to study mechanisms of neuropsychiatric disorders

Fabrizio, Caldara
2009

Abstract

In questi ultimi anni, la produzione e distribuzione di dati scientifici è cresciuta esponenzialmente. PubMed, un servizio della U.S. National Library of Medicine che include ormai oltre 18 milioni di citazioni estratte da Medline, incrementa il proprio contenuto di circa 40.000 estratti da pubblicazioni scientifiche o biomediche ogni mese. L’avvento dell’era dell’informazione ha permesso di accumulare e disseminare enormi quantità di dati, ma la nostra capacità di ricavarne conoscenza è rimasta costante. Le nostre inferenze che nascono dall’osservazione si basano spesso sull’uso del linguaggio verbale che raramente risulta adeguato. Inoltre, la ricerca biomedica è caratterizzata da discipline fortemente specializzate che raramente comunicano o condividono risorse. Tutti questi aspetti aiutano a rivolgere l’attenzione sulla reale necessità di integrare informazioni, un concetto generale con molte definizioni. Nel contesto del mio dottorato, per integrazione si intende il processo attraverso il quale i dati possono essere scambiati, interpretati e manipolati pur rimanendo comprensibili da chi utilizza il sistema. Le ontologie biomediche in generale e la Gene Ontology in particolare sono state una componente fondamentale di un importante sforzo di integrazione di informazioni di tipo biologico iniziato nel 2000 con l’ambizioso obiettivo di sviluppare uno strumento per l’unificazione della biologia e oltre. Il mio progetto di dottorato, accompagnandosi a questa iniziativa, si è focalizzato sullo sviluppo di un particolare tipo di database (knowledgebase) che possa facilitare l’esplorazione di specifici dati sperimentali. Il sistema si sviluppa sulla base di informazioni estratte da numerose fonti di dati per buona parte curate manualmente, usando come struttura portante un’ontologia di malattie umane (Disease Ontology). Lo scopo è quello di fornire supporto alla comunità scientifica biomedica per l’interpretazione dei dati relativi a malattie umane, ai geni a queste ricollegabili e ai farmaci in grado di curarle. Nella seconda parte del dottorato è stata approfondita una specifica tematica di ricerca utile per provare il sistema e valutarne le reali possibilità. L’analisi funzionale di dati complessi prodotti con tecnologie high-throughput come i microarray, risulta fondamentale per comprendere i meccanismi di regolazione dei processi molecolari implicati negli stati patologici. Tuttavia, nonostante la disponibilità di validi strumenti di indagine, nel campo delle malattie psichiatriche non si sono avuti gli stessi rilevanti progressi, utili per comprenderne i meccanismi patologici, ottenuti invece in altre aree di ricerca. Pertanto, una adeguata strategia computazionale, abbinata al recente sviluppo della risorsa oggetto di questo lavoro, è stata disegnata per consentire un’indagini sul coinvolgimento di alcuni specifici geni, meccanismi e farmaci nella causa o la cura della patologia psichiatrica. La plasticità dendritica è una componente importante nel funzionamento del sistema nervoso centrale durante lo sviluppo, ed è stato recentemente postulato che possa essere fortemente coinvolta nella patogenesi delle malattie legate al sistema nervoso centrale. Il concetto di plasticità abbraccia un ampio spettro di caratteristiche cliniche che descrivono aspetti del comportamento, dell’apprendimento e della memoria fino ai meccanismi molecolari con cui i neuroni creano o perdono le loro sinapsi. La strategia scelta ha consentito di identificare in modo semi-automatico un grande numero di geni coinvolti a livello molecolare nel meccanismo della plasticità dendritica e ha permesso allo stesso tempo la verifica, in certa misura e in via preliminare, delle qualità e delle potenzialità del knowledgebase sviluppato.
gen-2009
Inglese
ontologia, knowledgebase, neuropsychiatric disorders, molecular mechanisms
Università degli studi di Padova
123
File in questo prodotto:
File Dimensione Formato  
Fabrizio_Caldara_Tesi_Dottorato.pdf

accesso aperto

Dimensione 6.11 MB
Formato Adobe PDF
6.11 MB Adobe PDF Visualizza/Apri

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14242/120621
Il codice NBN di questa tesi è URN:NBN:IT:UNIPD-120621