L informazione al servizio della ricerca



Documenti analoghi
La GRID nella Medicina

Progetto Cluster. Sottoprogetto Bioinformatica

PROJECT MANAGEMENT SERVIZI DI PROJECT MANAGEMENT DI ELEVATA PROFESSIONALITÀ

B.P.S. Business Process Server ALLEGATO C10

Il motore di previsione statistica SAS Forecast Server a

Dispensa di Informatica I.1

Che cos'è il cloud computing? e cosa può fare per la mia azienda

Project Management. Modulo: Introduzione. prof. ing. Guido Guizzi

L integrazione dell Operatore Socio Sanitario nel processo assistenziale Ruolo dell O.S.S nell ambito del piano assistenziale

La platea dopo la lettura del titolo del mio intervento

Scopo della lezione. Informatica. Informatica - def. 1. Informatica

Marketing relazionale

SOLUZIONI INFORMATICHE PER LO STUDIO LEGALE

Esigenze di calcolo avanzato presso ARPA FVG

MAPS. I motori semantici per la valutazione di appropriatezza prescrittiva

Certificazioni Project Management

Analisi dei requisiti e casi d uso

Carpire il segreto della vita con l informatica Giosuè Lo Bosco Dipartimento di Matematica e Informatica, Università di Palermo, ITALY.

Origini e caratteristiche dei calcolatori elettronici

STUDI SU MATERIALE GENETICO

e-dva - eni-depth Velocity Analysis

Project Cycle Management La programmazione della fase di progettazione esecutiva. La condivisione dell idea progettuale.

ATTIVAMENTE INSIEME BIOTECH NEL CUORE DELLE BIOTECNOLOGIE: CELLULE STAMINALI E FARMACI ORFANI

Scheduling della CPU. Sistemi multiprocessori e real time Metodi di valutazione Esempi: Solaris 2 Windows 2000 Linux

SOMMARIO. Sistemi Self-Adaptive Motivazioni Ciclo di vita della cellula Paradigma. Future Work

Comprendere il Cloud Computing. Maggio, 2013

Loredana Fortunato. Forum Risk Management in Sanità Novembre Arezzo. Istituto di Fisiologia Clinica, CNR - Pisa

PROGETTO SCIENZE CLASSI PRIME SECONDARIA I GRADO A.S. 2013/2014

Carlo Bartolomeo Novaro - Studio di Coaching. Executive Team & Business Coaching NPL Training

La gestione di un calcolatore. Sistemi Operativi primo modulo Introduzione. Sistema operativo (2) Sistema operativo (1)

25/11/14 ORGANIZZAZIONE AZIENDALE. Tecnologie dell informazione e controllo

Progetto Atipico. Partners

IDENTITÀ GIOVANE. Nata nel 2006 con l intento di diventare leader nel settore IT, Easytech cresce con una solida competenza in tre divisioni:

Cost_. Quality_. Delivery_. L eccellenza della tua SuppLy chain parte da qui

Big Data e IT Strategy

WorkFLow (Gestione del flusso pratiche)

Knowledge Management. Sistemi Informativi 08/05/12. Introduzione (1/2)

Cercare documenti Web

CAPITOLO CAPIT Tecnologie dell ecnologie dell info inf rmazione e controllo

Corso di Informatica

Nerviano Medical Sciences

REALIZZAZIONE LAN

WNoD: Virtualizzazione, Grid e Cloud nel Calcolo Scientifico per l INFN

Stefania Marrara - Esercitazioni di Tecnologie dei Sistemi Informativi. Integrazione di dati di sorgenti diverse

Corso di PHP. Prerequisiti. 1 - Introduzione

1. Introduzione agli ERP e a SAP

B14 DMS IT Governance Business Competence

La Guida per l Organizzazione degli Studi professionali

Architetture Informatiche. Dal Mainframe al Personal Computer

Attività federale di marketing

Indice generale. OOA Analisi Orientata agli Oggetti. Introduzione. Analisi

Ciclo di vita dimensionale

Tecnologia dei Sistemi Informativi. architettura s.i. 1

Corso di Informatica

Sistema Ambiente 2010": Il Network Nazionale della Biodiversità. Checklist, chiavi di identificazione, archivi di immagini ed altre risorse

Programma 1 WP7: Il portale di Allenza

Analisi e catalogazione automatica dei Curriculum Vitae

TECNICHE DI SIMULAZIONE

Fasi di creazione di un programma

leaders in engineering excellence

Convegno 6 giugno 2013 Federlazio Frosinone

Generazione Automatica di Asserzioni da Modelli di Specifica

Lezione 1. Introduzione e Modellazione Concettuale

La riforma del servizio di distribuzione del

Progetto IDENTITAS: Formazione agli operatori di Bilancio di Competenze

Introduzione alle basi di dati (prima parte)

Scende in campo l esperienza

Innovation Technology

LA DIAGNOSTICA MOLECOLARE E I TUMORI DEL SANGUE

SOFTWARE PER LA RILEVAZIONE DEI TEMPI PER CENTRI DI COSTO

Pianificazione e progettazione

Architetture Informatiche. Dal Mainframe al Personal Computer

Mirco Minoccheri Maurizio Ricciardelli IPIA Alberghetti Classe 4 a/tl

Cloud Service Broker

Cloud Computing: alcuni punti fermi per non smarrirsi fra le nuvole

Parte I. Prima Parte

I Problemi e la loro Soluzione. Il Concetto Intuitivo di Calcolatore. Risoluzione di un Problema. Esempio

IL TALENTO DELLE IDEE, edizione

MANUALE DELLA QUALITÀ Pag. 1 di 6

COME VIENE REALIZZATA UNA RICERCA SPERIMENTALE IN BIOLOGIA MOLECOLARE?

comscore: costruire un grande data warehouse per i Big Data

Progetto LearnIT PL/08/LLP-LdV/TOI/140001

La soluzione per la gestione dei suoi utensili

Ottimizzazione delle interrogazioni (parte I)

Appunti del corso di Informatica 1 (IN110 Fondamenti) 4 Linguaggi di programmazione

I quattro ordini di scuola a confronto Elisabetta Malaguti

Configuration Management

Smart Work La rivoluzione Copernicana nel mondo della consulenza commerciale

COME NASCE E COME OPERA BANCO FARMACEUTICO

Capitolo 13. Interrogare una base di dati

Quotidiano.

Meeting. Gli alimenti cultura del vivere

COMUNE DI RAVENNA GUIDA ALLA VALUTAZIONE DELLE POSIZIONI (FAMIGLIE, FATTORI, LIVELLI)

Legge e apprende nozioni in qualsiasi lingua, le contestualizza ed è in grado di elaborarle e riutilizzarle quando serve

Progettaz. e sviluppo Data Base

Sistema operativo: Gestione della memoria

PROGRAMMA SVOLTO NELLA SESSIONE N.

1. BASI DI DATI: GENERALITÀ

Il sistema C.R.M. / E.R.M.

Transcript:

L informazione al servizio della ricerca Pietro Leo Executive IT Architect IBM Global Business Services IBM Innovation Lab 23 Ottobre 2007 Milano Area Kitchen

Temi Le nuove sfide e i problemi affrontati dalla biologia moderna con l avvento delle informazioni genetiche La bioinformatica, che studia come analizzare e gestire informazioni genetiche per trarre nuova conoscenza sul mondo biologico DNA 1ENH RNA Anatomia di una piattaforma applicativa per supportare il lavoro dei bioinformatici Il progetto LIBI: un esempio di piattaforma bioinformatica complessa Ricercatore Applicazioni Bioinformatiche Servizi di Data analisi e discovery di nuovi dati e informazioni Virtualizzazione (knowledge warehouse) TTACAGACGT GACGTTTACA CAGATTACGT AGATTACCGT TTCGACAGAT Team work TTACAGACGT GACGTTTACA CAGATTACGT AGATTACCGT TTCGACAGAT Servizio Informativo Insights Analisi, scoperta e gestione di dati, informazioni e conoscenza Connect Mito condrio Tools & Applicazioni Processi Insight Utenti Organizzazione e distribuzione mirata della conoscenza Ricerca multi-modale e Indicizzazione Semantica Mining di Informazioni e Conoscenza da dati strutturati e non strutturati del mondo biomedico Accesso, Integrazione e Assimilazione e virtualizzazione di Contenuti Clinici e Biologici Risorse (Dati e Computazionali) Database Fisici & Risorse Computazionali Piattaforma Bioinformatica 2

Io ho un problema da risolvere... Ovviamente non è quello che state immaginando! 3

il mio problema è un altro: utilizzare le informazioni genetiche per analizzare la qualità del bicchiere di vino che sto bevendo! Io vivo qui, a Bari, in Puglia Ma come faccio a distinguere il Vino Primitivo originale.. per dalla far questo copia? potremmo usare il DNA Barcode del PRIMITIVO. Una sorta di codice a barre genetico che individua la specifica varietà d uva usata per produrre il vino! Il DNA Barcode del PRIMITIVO potrà quindi essere incapsulato all interno di dispositivi di analisi a bassissimo costo chiamati DNAchip, che sarano in grado di effettuare analisi anche in tempo reale Questa varietà d uva è chiamata PRIMITIVO ed è coltivata in questa zona di Puglia. Dai tempi dei romani è usata per produrre il vino PRIMITIVO Quest altro grappolo è di una varità chiamata ZINFANDEL e cresce sulle colline californiane. Da questa varietà si produce un vino molto simile al PRIMITIVO tant è che i produttori californiani affermano che anche essi producono il vino PRIMITIVO! Nell IBM Innovation Lab, quando benviamo il PRIMITIVO, saremo finalmente sicuri di bere il nostro PRIMITIVO e non quello fatto con il vitigno Zinfandel! 4

I primi strumenti basati su test genetici cominciano a comparire: è il caso del CYP Test di Roche in grado di determiniare la capacità di metabolismo di farmaci da parte di un individuo in base ad esami genetici condotti sui geni 2D6 e 2C19 del citocromo p450 implicati nel metabolismo di numerosi farmaci di larga prescrizione Profili genetici analizzati CYP2D6: antidepressivi, antiemetici, antipsicotici, antiaritmici, beta-bloccanti e oppiacei CYP2C19: anticoagulanti, anticonvulsivi, anti-malarici, benzodiazepine, inibitori della pompa protonica. Categorie in cui viene classificato il paziente in base alla sua capacità metabolica: 1. Ultra-rapid 2. Extensive 3. Intermediate 4. Poor Metabolizer http://www.roche-diagnostics.it/prodotti/laboratorio/biologia_molecolare/amplic.htm 5

Il progetto Genographic Una partnership di 5 anni per ricostruire i principali flussi migratori dell umanità La ricerca riguarda sia popolazioni indigene che generici individui Kit Raccolta Campioni E la piu ambiziosa iniziativa di antropologia genetica realizzata sino a questo momento Decine di migliaia di Kit raccolta campioni e analisi genetiche effettuate www.genographic.com 6

Evidentemente si pongono nuove frontiere etiche per tutti noi e nuove informazioni e dati su cui riflettere: il caso Deborah Lindner Deborah Lindner è una donna di 33 anni che ha effettuato un test genetico ed ha scoperto di avere il un alta probabilità di ammalarsi di cancro al seno nel corso della sua vita. Ha deciso di effettuare una mastectomia preventiva per ridurre il rischio di contrarre la malattia del 90% 7

Queste ed altre esperienze hanno avuto inizio dal sequenziamento del genoma umano che comincia ad influenzare la pratica medica e sarà sempre più influente nei prossimi anni 1ENH RNA DNA Gene: CYP2D6 TTACAGACGT GACGTTTACA CAGATTACGT AGATTACCGT TTCGACAGAT TTACAGACGT GACGTTTACA CAGATTACGT AGATTACCGT TTCGACAGAT Mito condrio Uno dei più importanti motori dei sistemi biologici, e quindi della vita sulla terra, è l informazione. Questa è contenuta, codificata e trasmessa in svariati modi. L informazione è contenuta in molti database, il più importante è il DNA, replicato in ogni cellula, contiene le istruzioni base (note come Geni) che governano la struttura e il funzionamento di ogni organismo. Ogni specie ha delle peculiarità che si connotano in una diversità molecolare, vale a dire possiede contenuti caratteristici nel proprio database che possono essere usati per caratterizzare e distinguere le specie fra loro. La diversità molecolare è uno dei più potenti strumenti usati dalla bioinformatica per realizzare metodi di analisi 8

Dal punto di vista IT supportare il lavoro dei bioinformatici corrisponde alla realizzazione di complesse piattaforme applicative in grado di trattare e fornire informazioni genetiche a diversi livelli e per differenti scopi di utilizzo Servizio Informativo Insights Tools & Applicazioni Processi Insight Utenti Knowledge management, elaborazione e distribuzione mirata di nuova conscenza Analisi, all interno dell organizzazione a singoli scoperta utenti, e gruppi di lavoro gestione o l intera comunità di dati, Indicizzazione informazioni e ricerca multimodale conoscenza (relazionale, e sintattica, semantica, tassonomica) di informazioni strutturate Connect e non strutturate Scoperta di nuova conoscenza, classificazione automatica di informazioni dispoonibili nelle farie sogenti e in combinazioni di queste 9 Organizzazione e distribuzione mirata della conoscenza Ricerca multi-modale e Indicizzazione Semantica Mining di Informazioni e Conoscenza da dati strutturati e non strutturati del mondo biomedico Accesso, Integrazione e Assimilazione e virtualizzazione di Contenuti Clinici e Biologici Per impiantare la backbone informativa dell organizzazione, integrando, assimilando, federnado dati clinici e biologici interni ed estreni all organizzazione disponibili e risorse computazionali Risorse (Dati e Computazionali)

La realizzazione di piattaforme bioinformatiche è un attività complessa dal punto di vista dell ingegneria informatica. Occorre non solo disporre di innumerevoli middleware e prodotti ma molte componenti occorre svilupparle ad hoc Servizio Informativo Insights Tools & Applicazioni Processi Insight Utenti Analisi, scoperta e gestione di dati, informazioni e conoscenza Connect Lotus NotesOrganizzazione IBM GBS Knowledge e distribuzione Management mirata & e-learning framework Portal Server della conoscenza Bio-Worflow Interface Ricerca multi-modale e Indicizzazione Semantica Data Discovery Query Builder BioExtractor Mining di Informazioni Webclass Classification e Conoscenza Module da dati strutturati Research e non strutturati Analytics -del BIW mondo biomedico Healthcare ESB Accesso, IBM Clinical Integrazione Gemomics e De-identification Assimilazione Patform e virtualizzazione IBM HCN di Contenuti Clinici e Biologici Webs. Federation Server Trasformation TX Enterprise Editrion Omnifind DB2 Datawarehouse Edition = Prodotti Standard = Assets Risorse (Dati e Computazionali) 10

Progetto LIBI: Laboratorio Internazionale di Bioinformatica LIBI è un laboratorio di Bioinformatica e Biologia Computazionale rivolto sia ad aspetti di ricerca di base che applicata. Il LIBI è concepito come Laboratorio, "without walls"; costituisce uno spazio di lavoro virtuale per i partner che forniscono le proprie infrastrutture e utilizzano gli strumenti ed i macchinari del laboratorio, usufruendo delle capacità e competenze messe a disposizione dagli altri partner. Il LIBI si propone come una unità organizzativa in grado di concentrare e potenziare competenze multidisciplinari e piattaforme tecnologiche adeguate e offrire un insieme di servizi specializzati alla comunità bioinformatica nazionale e internzionale LIBI è un progetto FIRB, co-finanziato dal Ministero dell Università e della Ricerca Istituto di Tecnologie Biomediche-Sezione di Bari, (CNR-ITB) Coordinatore IBM Innovation Lab - Bari Istituto di Nazionale di Fisica Nucleare, (INFN) CINECA Università di Lecce, (SPACI) Università di Trieste (CBMTS) Università di Milano Dipartimento di biologia, (UNIMI-BI) www.libi.it Dipartimento di Biologia Molecolare, Università degli Studi di Bologna (UNIBO-BM) 11

Il progetto LIBI si pone l obiettivo di realizzare una piattaforma di lavoro virtuale rivolta alla comunità di ricercatori bioinformatici Un ricercatore perviene ad una nuova intuizione nell ambito dello studio di una malatia, o nell osservare le condizioni di un paziente, o nell osservare una una particolare molecola, etc. Ricercatore Team work Il ricercatore usa varie applicazioni bioinformatiche che complessivamente permettono di analizzare e simulare il fenomeno osservato analizzando i dati biologici grezzi raccolti. Un variegato numero di middleware forniscono un potente e scalabile ambiente di analisi che le applicazioni di analisi bioinformatica usano Applicazioni Bioinformatiche Servizi di Data analisi e discovery di nuovi dati e informazioni Virtualizzazione (knowledge warehouse) 12 Un infrastruttura IT è resa disponibile integrando informazioni e dati e virtualizzando risorse computazionali disponibili Database Fisici & Risorse Computazionali Piattaforma Bioinformatica

WORKFLOW Analisi 1 Analisi 2 Analisi 3 RISULTATI e-workplace Piattaforma LIBI Un biologo avvia un complesso workflow di analisi bioinformatica operando con il Portale LIBI fornendo i dati di input e attendendo per ottenere i risultati. L analisi richiesta consiste di 3 complessi step che verranno realizzati in modo distribuito sulla piattaforma LIBI. Il primo passo è una una query per reperire i dati biologici oggetto dello studio dal nodo LIBI Data Grid, gestito dall IBM Innovation Lab di Bari e che federa innumerevoli banche dati biologiche. 13

WORKFLOW Analisi 1 Analisi 2 Analisi 3 RISULTATI e-workplace Piattaforma LIBI Il primo step di analisi richiede l esecuzione di specifici algoritmi bioinformatici che opererano su un cluster standard consistente di 154 G4 bi- processori, ospitato presso la server farm dell istituto SPACI (Southern Partnership for Advanced Computational Infrastructures) di Lecce. 14

WORKFLOW Analysis 1 Analisi 2 Analisi 3 RISULTATI e-workplace Piattaforma LIBI Parte dei risultati prodotti dal primo step di analisi sono quindi utilizzati per effettuare una nuova query al nodo LIBI Data Grid DB, ospitato presso la server farm dell IBM Innovation Lab di Bari. Ulteriori dati biologici sono estratti dalle banche dati federate e verranno analizzati durante gli step di analisi successivi 15

WORKFLOW Analysis 1 Analysis 2 Analisi 3 RISULTATI e-workplace Piattaforma LIBI Lo step di analisi 2 richiede un infrastruttura di High Performance Computing. Questo task viene eseguito da un cluster HPC (IBM SP Cluster 1600 consisting of 512 CPUs) ospitato presso la server farm del CINECA (Interuniversity Consortium, the largest Italian computing centre) a Bologna 16

WORKFLOW Analysis 1 Analysis 2 Analysis 3 RISULTATI e-workplace Piattaforma LIBI EGEE Grid Il terzo step di analisi prevede l esecuzione di programmi lanciati su un ambiente di grid computing, in questo caso viene usata la griglia EGEE, gestita dall INFN (Italian National Institute for Nuclear Physics). Il riultati del workflow sono a questo punto disponibili e vengono proposti al biologo attraverso il portale web LIBI 17

Conclusioni L IT pervade permette di affrontare adeguatamente le moderne sfide di gestione di informazioni e conoscenza che complessi domini applicativi pongono, come quello della biologia e della medicina moderna La Bioinformatica è un esempio di dominio applicativo complesso in cui sono richieste sofisticate tecnologie per gestire e trattare informazioni genetiche La realizzazione di piattaforme bioinformatiche richiede l uso di prodotti software comuni a tanti domini applicativi combinati con asset e sviluppi ad-hoc Sono stati brevemente richiamati gli obiettivi del progetto LIBI che puntata a realizzare una complessa piattaforma bioinformatica. Progetto FIRB cofinanziato dal MUR e guidato dal CNR che coinvolge i più importanti gruppi di ricerca italiani in bioinformatica 18

19