UNIVERSITA DEGLI STUDI DI NAPOLI FEDERICO II

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "UNIVERSITA DEGLI STUDI DI NAPOLI FEDERICO II"

Transcript

1 UNIVERSITA DEGLI STUDI DI NAPOLI FEDERICO II FACOLTA DI SCIENZE MM.FF.NN. TESI DI LAUREA IN INFORMATICA (MAGISTRALE) Una piattaforma per lo studio e l'analisi di dati sperimentali della cellula e delle sue reti genetiche. Relatori Prof. Adriano Peron Dott. Diego di Bernardo Candidato Gennaro Gambardella matricola 961/103 Correlatore Prof. Salvatore Cuomo ANNO ACCADEMICO

2 Crescere vuol dire avere il coraggio di non strappare le pagine della nostra vita ma semplicemente voltare pagina. Crescere significa riuscire a superare i grandi dolori senza dimenticare. Crescere significa avere il coraggio di guardare il mondo e di sorridere. Crescere significa guardarsi indietro e abbracciare i ricordi senza piangere. Crescere è saper distinguere la realtà dai sogni. Crescere è sapersi rialzare dopo una brutta caduta. Crescere... non tutti hanno voglia di crescere... forse perché sono consapevoli delle difficoltà che incontreranno crescendo... James Douglas Morrison (Jim Morrison)

3 RINGRAZIAMENTI Ed eccomi qui, finalmente!... a scrivere l ultimo capitolo di questa tesi, quello più importante, quello che racconta realmente la tua esperienza, l avventura che hai vissuto. Per mia fortuna sono capitato in un laboratorio pieno di persone che dal primo giorno hanno cercato di mettermi a mio agio facendomi sentire subito parte integrante del gruppo. Da chi partire se non dai capi... il primo ringraziamento va al prof. Peron, che nel momento del bisogno ha saputo comprendere le mie difficoltà e consigliarmi da padre più che da professore. Poi c è l altro boss, il dott. Di Bernardo o più semplicemente Diego, come ha voluto lo chiamassi dal primo giorno... una persona come dico sempre a chi mi chiede, da un dono speciale... quello di riuscire ad essere sempre nei tempi giusti amico dei suoi studenti e capo intransigente e severo che tutti temono. Tolto il pensiero dei boss, posso passare ai ringraziamenti dedicati ai ragazzi (non più tutti oramai, a buon intenditor poche parole ;- ) ). Il primo ringraziamento è dedicato al mio dottorando, che devo dire la verità ha una pazienza infinita visto che mi ha dovuto sopportare e soprattutto spiegare parecchie cose di cui non avevo mai sentito parlare... <<grazie Vinc!>> Un altro ringraziamento speciale, va alla Siciliano, che non smetterò mai di ripetere essere una grande attrice... <<Ve, il web ci ricorderà!>>... detto ciò siccome dici sempre che non ti faccio mai un complimento, oggi ti dico che sei una bellissima persona, allegra e piena di vita... non scordarlo mai... Da Velia non posso far altro che passare a Rossella, spesso dispensatrice di saggi consigli... stacanovista per definizione, alla quale auguro tanta fortuna, per i sacrifici che fa e che presto frutteranno... ha però un grande difetto... è troppo freddolosa! Parlando delle persone del mio cuore (bioinformatico) preferito, non posso non ringraziare Marghe che gli piace uscire dalle torte (o erano porte?)... dolcissima persona (sarà per le torte?), che ringrazio anche perché ha dedicato un intero giorno a calcolare una matrice dei dati normalizzati per me... che poi per mio errore era anche sbagliata e quindi ho dovuto cestinare... ma d altronde se non combino pasticci non sono io (Velia tu ne sai qualcosa vero? Basta solo che ti ricordi le parole chiavi dell auto ).

4 E poi sempre lì, da quelle parti, nel cuore bioinformatico, c è anche Gopu... che pur di scambiare qualche parola con me è stato costretto ad imparare qualche parola in italiano!!... se rassegnato pure lui... ma io non mollo!! Tornando al lab invece, non posso dimenticare i due dell acquario... Francesco e Mario, che poverini quest estate hanno sofferto un bel po li dentro, viste le temperature africane di quella stanza... ricorderò per sempre Francesco come compagno di scarpe a Bologna (o si ricorderanno per sempre di noi quelli che passavano vicino alla finestra dove la sera le poggiavamo?... ai posteri l ardua sentenza...) Un duplice ringraziamento va a Giulia (duplice perché c era anche Iolanda nel pancione), che con la sua allegria è capace di rendere le giornate di lavoro più leggere... <<Giù! Torna presto che Lucia non ce la fa più!!>> Mamma mia quanti ne siamo... ci sono ancora Filippo, Alda e Maria Aurelia... Maria Aurelia, la donna dai dolci squisiti, piccola ma piena di determinazione... Alda alla quale auguro ogni bene... e Filippo l ingegnere oramai californiano. Ora posso passare agli amici quelli storici, Davide e Diego. Amici fin dalle superiori... le strade si sono spesso divise ma poi rincontrate... questa è l ennesima dimostrazione che l amicizia vera non è quella in cui ci si vede o ci si sente tutti giorni... Poi c è Maria, che mi è stata vicina nei momenti difficili... a volte anche con troppa apprensione, ma solo perché si preoccupava per me... grazie. Ringrazio Sara, una persona a cui vorrò sempre un mondo di bene, con la quale sono cresciuto e che mi ha accompagnato per quasi tutto il mio percorso universitario... non dimenticherò mai tutti i bei ricordi che ho... In fine, mi rimane un ultima persona, che giunta a questo punto si starà chiedendo: <<ed io dove so?, quelli del lab già li ha fatti tutti...>>. Eccoti qui... infine ringrazio la montanara Lucia... spirito libero... una persona speciale, che troppo spesso dimentica di esserlo... che mi ha aiutato più di quanto non crede... compagna di forchette bolognesi... <<Sci Sci... grazie Lu!>>. un ringraziamento particolare va alla mia famiglia 4

5 INDICE INTRODUZIONE 7 1. NOZIONI ELEMENTARI DI BIOLOGIA IL DNA L RNA LA TRASCRIZIONE L UTILIZZO DEI MICROARRAYS PER LO STUDIO DEI TRASCRITTOMI LE RETI DI REGOLAZIONE GENETICA ANALISI DEL PROBLEMA INTRODUZIONE INTRODUZIONE ALLE BANCHE DATI BIOLOGICHE DATABASE DI SEQUENZE BASI DI DATI DI ESPRESSIONI GENICHE BASI DI DATI CONTENENTI MUTAZIONI/POLIMORFISMI BASI DI DATI PROTEOMICHE BASI DI DATI DI DOMINI/FAMIGLIE DI PROTEINE BASI DI DATI DI STRUTTURE TRIDIMENSIONALI BASI DI DATI DI PATHWAY BIOLOGICI BASI DI DATI BIBLIOGRAFICHE ALTRO (BASI DI DATI SPECIALIZZATE O BOUTIQUE ) OBIETTIVO DELLA RICERCA I MICROARRAY AFFYMETRIX MINIMUM INFORMATION ABOUT MICROARRAY EXPERIMENT INVESTIGATION DESCRIPTION FORMAT (IDF) FILE SAMPLE AND DATA RELATIONSHIP FORMAT (SDRF) FILE LE INFORMAZIONI MINIME CHE IL SISTEMA DEVE ESSERE IN GRADO DI ESTRARRE REQUISITI FUNZIONALI DEL SISTEMA LA PIATTAFORMA PER LO STUDIO DELLA CELLULA INTRODUZIONE ARCHITETTURA DEL SISTEMA IL PROCESSO DI NORMALIZZAZIONE INTRODUZIONE LA SCELTA DEL FORMATO DEI FILE DA CUI IMPORTARE I DATI I CAMPI D INTERESSE NEI FILE SDRF LA NORMALIZZAZIONE DEI TERMINI LE ONTOLOGIE 59 5

6 4.2 LO STRUMENTO SEMI- AUTOMATICO PER LA COSTRUZIONE DEL VOCABOLARIO DEI TERMINI CONSIDERAZIONI FINALI SULLA FASE DI NORMALIZZAZIONE IL DATABASE DELLE ESPRESSIONI GENICHE INTRODUZIONE L AMBIENTE DI SVILUPPO COSTRUZIONE DEL DATA- SET E STATISTICHE SUI DATI IL CLIENT FTP JAVA STATISTICHE SUL DATASET STRUTTURE DATI PER LA GENERAZIONE DELLE STATISTICHE LO SCHEMA DEL DATABASE TECNICHE PER IL MIGLIORAMENTO DELLE PRESTAZIONI L IMPLEMENTAZIONE DEGLI ALBERI ONTOLOGICI NEL DATABASE LA TECNICA DI PARTIZIONAMENTO DELLE TABELLE IL PARSING DEI FILE PER IL POPOLAMENTO DEL DATABASE IL WAREHOUSE PER L ANALISI DEI DATI INTRODUZIONE LA MISURA DI SIMILARITÀ TRA I GENI LA REGRESSIONE LINEARE L INDICE DI CORRELAZIONE DI PEARSON APPLICAZIONE DEL COEFFICIENTE DI CORRELAZIONE NOZIONI ELEMENTARI SUI DATA WAREHOUSE MODELLIZZAZIONE DEL WAREHOUSE L INSERIMENTO DEI DATI 99 7.RISULTATI E CONCLUSIONI INTRODUZIONE RISULTATI CONCLUSIONI E SVILUPPI FUTURI INDICE DELLE FIGURE BIBLIOGRAFIA 108 6

7 INTRODUZIONE In ambito biologico, una delle più importanti sfide per i ricercatori è rappresentata dal cercare di individuare quale possano essere le funzioni svolte da un gene e come insiemi di geni interagiscono tra loro per assolvere a tali funzioni. Per tali scopi gli strumenti più idonei sono rappresentati oggi giorno dai microarray, un punto di riferimento per ricercatori e professionisti che lavorano nel campo della biomedicina e delle scienze biologiche. A differenza dei classici metodi di ricerca, con i microarray si ha la possibilità di identificare centinaia di geni contemporaneamente, fornendo la possibilità ai ricercatori di tutto il mondo di eseguire un analisi genetica su larga scala. Dalla sua nascita negli anni novanta, la tecnologia dei microarray, ha avuto una rapida crescita sia per quanto riguarda le tecniche di sperimentazione vere e proprie che per l analisi statistica dei dati. Questo anche perché molti dei metodi classici possono non portare a risultati significativi in tale campo in quanto studiare le singole componenti (geni) di un sistema biologico è molto diverso dall analizzarlo nel suo insieme. Il dover studiare il comportamento di migliaia di geni contemporaneamente, ha fornito lo stimolo necessario a coinvolgere ricercatori di altre discipline, quali: l informatica, la matematica, la statistica. La multidisciplinarietà richiesta da questa nuova scienza ha portato alla nascita di nuove figure professionale come il bioinformatico o il biostatistico. Le enormi quantità di dati biologici prodotti dai microarray hanno reso necessario l utilizzo delle scienze informatiche, per l analisi ed il modelling dei dati. Il seguente lavoro di tesi è stato svolto presso il TIGEM (Telethon Institute of Genetics and Medicine) con la supervisione del dott. Diego di Bernardo e del Ph.D. Vincenzo Belcastro. Il progetto ha come principale obiettivo quello di costruire un sistema informativo in grado di ospitare dati di espressione genica ottenuti mediante utilizzo della tecnologia dei microarray. Il sistema che si intende sviluppare, deve permettere l analisi dei dati di espressione genica nei diversi tessuti, fornendo informazioni univoche sulla co- regolazione di un insieme di geni in un determinato tessuto sfruttando in maniera intergrata le informazioni attualmente disponibili sotto forma di risorsa pubblica. Nella prima parte del lavoro di tesi si sono ampiamente analizzati i vari standard utilizzati dai biologi per la memorizzazione (presentati in dettaglio nel Capitolo 2 paragrafo 5) dei dati riguardanti un esperimento di espressione genica. Il passo successivo è stato quello di 7

8 recuperare dal database ArrayExpress gli esperimenti di interesse al fine di costruire un database delle espressioni geniche (Capitolo 5) che permettesse il recupero di ibridazioni effettuate su specifici tessuti o tipi cellulari e di effettuare interrogazioni più specifiche rispetto a quelle attualmente risolvibili dagli attuali sistemi di analisi automatica. Affinché fosse possibile utilizzare i dati prelevati dai database pubblici si è resa necessaria (Capitolo 4) una fase di normalizzazione e ri- annotazione dei termini presenti nei dati recuperati dal database di riferimento (ArrayExpress), seguendo specifiche ontologie (Capitolo 4, paragrafo 4.1). La fase di normalizzazione delle annotazioni ha reso possibile catalogare in modo rigoroso le ibridazioni. Ciò ha reso possibile estrarre ibridazioni con particolari caratteristiche (riguardanti uno specifico tessuto, tipo cellulare, etc.) ed analizzarle ottenendo informazioni specifiche riguardanti un particolare tessuto o altre caratteristiche. A partire dalla matrice dei dati normalizzati, possiamo considerare ciascuna riga (ogni riga è un probe set o gene) come una variabile per la quale sono state effettuate! misure (una per ciascuna delle ibridazioni) e calcolare le correlazioni r rispetto a ciascuna delle altre righe, ottenendo così una nuova matrice, che possiamo chiamare matrice delle correlazioni tra geni riguardante un tessuto o tipo cellulare (Capitolo 6, paragrafi 2.1, 2.2, 2.3). Queste misure di similarità tra i geni sono poi state memorizzate in nuovo sistema costruito utilizzando strutture tipiche del data warehousing (Capitolo 6) in modo da manipolarle ed analizzarle al meglio. Il sistema costruito aveva l obbiettivo di rispondere alla seguente forma di query: Dato il gene A e la misura di similarità Z trovare tutti i geni "simili" ad A nel tessuto X della specie Y. Con l implementazione finale del sistema, a partire da un gene è possibile recuperare tutti quelli maggiormente correlati in un tessuto prefissato ed analizzando i suoi vicini tramite la gene ontology enrichment analysis (GOEA) è possibile provare ad inferire la sua funzione (Capitolo 7). Ad esempio supponiamo di prendere un gene le cui funzioni sono conosciute come IGLC1, responsabile del complesso di produzione di immunoglobuline (anticorpi). Estraendo dal sistema i geni correlati (ad esempio nel tessuto sangue) ed applicando la gene ontology 8

9 enrichement analysis su questi si mostra che le funzioni più probabili di tale gene riguardano effettivamente quelle a cui prende parte (Capitolo 7, paragrafo 2). Il seguente elaborato è articolato in sette capitoli più la bibliografia. Nel Capitolo 1 si danno alcune nozioni elementari legate alla biologia, utili per una maggiore comprensione dell elaborato. Il Capitolo 2 è dedicato all introduzione nel mondo dei database biologici ed in particolare degli standard utilizzati per la pubblicazione degli esperimenti effettuati con microarray nelle banche date internazionali. Nel Capitolo 3 si descrive l architettura del sistema da implementare. Nel Capitolo 4 viene presentato il processo di normalizzazione dei termini e la ri- annotazione degli stessi tramite l ausilio di ontologie. Il Capitolo 5 invece è dedicato alla presentazione del database delle espressioni geniche costruito. Il Capitolo 6 invece descrive l utilizzo delle strutture di warehousing per la memorizzazione delle correlazioni tra geni. Il Capitolo 7 in fine è dedicato alla discussione dei risultati ed alle conclusioni e gli sviluppi futuri. 9

10 1. NOZIONI ELEMENTARI DI BIOLOGIA 1. IL DNA Il DNA (acido desossiribonucleico) [1] è la molecola biologica più importante senza la quale la vita non potrebbe né cominciare né continuare, è depositaria dell informazione genetica e trasmette i caratteri ereditari da una cellula all altra e dai genitori ai figli. Il DNA ha il compito importantissimo di dirigere la formazione delle proteine mediante quella serie d operazioni denominate espressione genica; divenendo dunque l architetto che dirige e regola la formazione di ogni essere vivente. Il DNA è organizzato in unità definite geni, responsabili dunque delle caratteristiche principali della maggior parte degli organismi viventi [2]. I geni sono generalmente stabili, poiché sono tramandati di generazione in generazione, seppur soggetti a piccole variazioni, chiamate mutazioni, anch esse ereditate dalle generazioni future. La maggior parte dei geni viene utilizzata come stampo per la sintesi di proteine, costituenti fondamentali di tutte le cellule, che sono molecole molto complesse costituite dalla successione di 20 tipi diversi di aminoacidi che si combinano in vario modo, conferendo a ciascuna molecola proprietà uniche. Le unità di base che costituiscono il DNA sono i nucleotidi, molecole composte da uno zucchero (desossiribosio), un gruppo fosfato ed una base azotata. Le basi azotate comprendono le purine: adenina (A) e guanina (G) e le pirimidine: timina (T) e citosina (C). La disposizione in sequenza di queste quattro basi costituisce l'informazione genetica. I nucleotidi sono legati fra loro con legami covalenti per formare uno scheletro zucchero- fosfato. Il carbonio 3 di uno zucchero è legato al gruppo fosfato in posizione 5 dello zucchero adiacente, costituendo un legame 3 5 fosfodiesterico. In questo modo è quindi possibile formare polimeri di lunghezza indefinita. Qualunque sia la lunghezza della catena, esisterà sempre un carbonio 5 ad una estremità ed un carbonio 3 all altra estremità che non è legato ad un altro nucleotide. La struttura del DNA è costituita da due catene polinucleotidiche, tenute insieme da legami specifici che si formano tra le basi azotate, avvolte a formare una doppia elica. Tale struttura può essere paragonata ad una sottile scala a chiocciola con una ringhiera su 10

11 ciascun lato, dove le ringhiere sono costituite da uno zucchero e da un acido fosforico che si alternano regolarmente ed i sottili gradini che si estendono a migliaia da una ringhiera all altra invece, sono formati ognuno da due basi affiancate. L accoppiamento tra le due basi che formano uno stesso gradino non è casuale, poiché la base A può accoppiarsi soltanto con la base T e la base C con la base G. In tal modo si possono ottenere soltanto due tipi di gradini che la cui successione risulta in infinite combinazioni, specificità che rappresenta il punto centrale della struttura del DNA. Questo tipo d associazione determina la complementarietà delle due eliche, le quali per poter combaciare devono essere orientate in direzioni opposte (una 3 5 e l altra 5 3 ). FIGURA 1 - LA STRUTTURA A DOPPIA ELICA DEL DNA 11

12 2. L RNA L RNA presenta una struttura polinucleotidica simile a quella del DNA. Tre delle quattro basi azotate (adenina, guanina e citosina) che formano i nucleotidi del RNA sono le stesse che per il DNA, la quarta è l uracile (U) che sostituisce la timina non presente nel RNA. Come nelle molecole di DNA, i polinucleotidi di RNA contengono legami fosfodiesterici 3-5, meno stabili di quelli di un polinucletide di DNA; ragione per cui le funzioni biologiche dell RNA richiedono che il polinucleotide sia lungo, al massimo, poche migliaia di nucleotidi. Ogni cellula può contenere diverse molecole di RNA; per comprenderne meglio le loro funzioni possiamo inizialmente suddividerle in due grandi categorie: RNA codificante ed RNA non codificante. L RNA codificate è composto da una sola classe di molecole: gli RNA messaggeri (mrna), sono trascritti dalle informazioni codificate nei geni e danno vita alle proteine al completamento dell ultimo passaggio dell espressione genica (raramente superano il 4% dell RNA totale nella cellula). L RNA non codificante comprende trascritti che hanno varie funzioni e le due categorie principali presenti sia negli eucarioti che nei procarioti sono: gli RNA ribosomiali (rrna), che sono parte integrante dei ribosomi, ossia le particelle dove ha luogo la sintesi proteica; gli RNA transfer (trna), piccole molecole coinvolte nella sintesi proteica che hanno il compito di trasportare gli aminoacidi ai ribosomi in modo tale da permettere che vengano uniti nell ordine specificato dalla sequenza nucleotidica dell mrna. Altre forme di RNA non codificati possono poi essere specifici all interno di organismi differenti (vedi figura 2). 12

13 RNA totale RNA codificante 4% del totale RNA non codificante 96% del totale Pre- mrna (hnrna) Pre- rrna Pre- trna snrna snorna scrn A tmrna e vari altri tipi LEGENDA Tutti gli organismi Soltanto gli eucarioti mrn A rrna trna Soltanto i batteri FIGURA 2 - LE CATEGORIE DI RNA 13

14 3. LA TRASCRIZIONE Il processo mediante il quale l informazione contenuta nei geni è convertita in una macromolecola funzionale, tipicamente proteine, è detto espressione genica. L espressione genica è il processo più frequente e complesso e richiede l intervento di agglomerati proteici quali ribosoma e polimerasi In maniera semplificata il processo di espressione genica può essere suddiviso in due passaggi: 1. trascrizione (conversione del DNA in RNA); 2. traduzione (conversione di RNA in proteine). Il prodotto della prima fase, chiamato trascrittoma, è l insieme di tutte le molecole di RNA ottenute trascrivendo le informazioni codificate nelle sequenze geniche. Il prodotto della seconda parte è il proteoma, l insieme delle proteine presenti all interno della cellula ottenute traducendo le molecole di RNA prodotto della prima fase dell espressione genica. Come anticipato, questo schema è una semplificazione di quello che è uno dei processi più complessi in natura. Più dettagliatamente, l espressione genica comprende le seguenti fasi: l accesso al genoma, poiché il DNA è impacchettato nei cromosomi in maniera complessa, bisogna assicurarsi che i geni interessati siano fisicamente accessibili; l assemblaggio del complesso di inizio della trascrizione, nel quale sono coinvolte un insieme di proteine che lavorano in modo coordinato per copiare i geni in RNA; la sintesi dell RNA, durante la quale il gene è trascritto in RNA; il processamento dell RNA, durante la quale la struttura chimica delle molecole di RNA può essere modificata prima di essere tradotte in proteine; la degradazione dell RNA; l assemblaggio del complesso di inizio della traduzione; la sintesi proteica, ossia la traduzione di una molecola di RNA in proteina; il ripiegamento e la maturazione delle proteine, che possono avvenire o meno contemporaneamente; la degradazione proteica, anche essa parte integrante dell espressione genica. 14

15 Il processo di trascrizione viene avviato tramite il legame di particolari enzimi (RNA polimerasi) a determinate sequenze regolatrici poste di solito al 5 dei geni, chiamate promotori (che non vengono trascritte), le quali fungono da modulatori dell espressione genica. Tramite la trascrizione viene prodotto un altro acido nucleico, l RNA, utilizzato poi come stampo per la sintesi di proteine mediante il processo di traduzione. Prima di essere tradotto, l RNA subisce una serie di modifiche che portano alla sua maturazione. Questo perché in realtà, specialmente negli eucarioti, sono sintetizzate molecole di RNA precursori come il pre- mrna dal quale si ricava poi mrna utile per lo stampo della proteina (vedi figura precedente). Inoltre la maggior parte dei geni sono discontinui, ossia solo alcuni tratti di sequenza sono utilizzati per sintetizzare proteine dette esoni, mentre quelli non codificanti sono dette introni. Il processo di maturazione del pre- mrna può essere effettuato mediante due operazioni: editing dell RNA: gruppi di nucleotidi sono propriamente immessi nella sequenza di RNA, dando luogo ad una nuova sequenza utilizzata poi per lo stampo proteico; splicing alternativo: gli introni vengono eliminati dall RNA precursore, mentre le sequenze esoniche possono essere combinate in qualsiasi ordine. 15

16 FIGURA 3 - L'EDITING DELL' RNA E LO SPLICING ALTERNATIVO La maturazione dell RNA, dunque, fa si che una sequenza proteica possa non corrispondere esattamente alla sequenza del gene da cui deriva. Inoltre come si può notare anche dalla figura precedente, da un precursore di RNA possono essere ricavati anche due o più mrna codificanti. Sebbene il trascrittoma costituisca meno del 4% dell RNA totale di una cellula, esso è il componente più importante poiché contiene l RNA codificante che specifica la composizione del proteoma e determina, quindi, le proprietà biochimiche della cellula. Anche nei più semplici organismi, possono essere attivi diversi geni contemporaneamente, rendendo così i trascrittomi molto complessi, dal momento che possono contenere centinaia se non migliaia di mrna contemporaneamente. 16

17 4. L UTILIZZO DEI MICROARRAYS PER LO STUDIO DEI TRASCRITTOMI Tradizionalmente, la ricerca in biologia molecolare si è occupata dello studio intensivo di uno, o pochi geni alla volta. Quando i progetti di ricerca cominciarono a identificare un enorme numero di geni, si cominciò a pensare di sviluppare tecnologie che permettessero un analisi di geni su vasta scala. A tale scopo è stata messa a punto una nuova tecnologia basata su un supporto fisico chiamato microarray. I microarray permettono di misurare simultaneamente l espressione di migliaia di geni. I microarrays sono piccoli vetrini che contengono una serie ordinata di campioni. Il tipo di microarray dipende dal materiale posizionato sul vetrino: DNA (si parla di DNA microarray), RNA (RNA microarray), tessuto (tissue microarray). Poiché i campioni sono posizionati in modo ordinato (si dice che i geni sul microarray sono indirizzabili), è sempre possibili risalire al gene mappato su una particolare area del vetrino; il numero di campioni sul microarray come detto possono essere nell ordine delle migliaia. Il più comune microarray utilizzato è il DNA microarray (comunemente conosciuto come gene chip, DNA chip, o biochip) che è costituito da una collezione di microscopiche sonde di DNA attaccate ad una superficie solida come vetro, plastica, o chip siliconici formanti un array. Il supporto di solito è un vetrino da microscopio che ha le dimensioni, più o meno, di un pollice della mano. Ogni sonda è costituita da un segmento di DNA a singola elica (parte della sequenza di un gene) e nel loro insieme, tutte le sonde di un DNA chip rappresentano tutti o la maggior parte dei geni di un organismo. I microarray possono essere fabbricati usando diverse tecnologie, come la stampa di micro solchi, con un particolare microspillo appuntito su una lastrina di vetro dove verrà attaccata covalentemente la sonda (probe) di materiale genetico ottenuta per clonazione sfruttando la tecnica PCR, (fotolitografia); usando maschere preformate da ditte specializzate come ad esempio da Greiner Bio- One. Un tipico esempio delle attività lavorative [3] svolte durante la realizzazione di un esperimento con microarray è mostrato nella figura successiva. Come esempio di applicazione dei microarray consideriamo l identificazione dei geni specificatamente espressi, o non espressi, in un tessuto tumorale rispetto al relativo tessuto normale. Dato un DNA microarray, il passo successivo è quello di ottenere i campioni necessari per l etichettatura e l ibridazione. L etichettatura dell RNA consiste di tre passi: 1. Isolare l RNA da tessuto o cellule. 17

18 2. Etichettare l RNA tramite una procedura inversa di trascrizione inserendo dei marcatori fluorescenti (solitamente Cy3 e Cy5 per i two- color array, e Cy3 per i one- color array) ottenendo così campioni di cdna (DNA complementare). 3. Purificazione dei prodotti ottenuti. I campioni etichettati ottenuti possono poi essere ibridizzati su due microarrays distinti (one- color array) oppure possono essere miscelati e ibridizzati in un singolo microarray (two- color array), ciò dipende dal tipo di microarray utilizzato. FIGURA 4 - ESEMPIO DI UN TIPICO ESPERIMENTO EFFETTUATO UTILIZZANDO MICROARRAY DI DNA 18

19 Le posizione in cui si ha l ibridazione indicano gli oligonucleotidi che rappresentano i geni i cui trascritti sono presenti nel trascrittoma. La fase di analisi dei risultati consiste nella scansione dei vetrini per la lettura del segnale e della sua normalizzazione; solitamente si utilizzano dei tool commerciali. L operazione di scansione produce in output i seguenti dati: (1) le immagine grezze delle ibridazioni (solitamente in formato tiff); (2) Un insieme di dati grezzi ricavati direttamente dalle immagini. Sui dati grezzi si effettuano opereazioni di normalizzazione al fine di rendere i dati confrontabili tra loro, ottenendo in genere una matrice contenente i livelli di espressioni di ogni probeset (memorizzata in un documento spreadsheet). FIGURA 5 - LA FIGURA MOSTRA COME DA OGNI MICROARRAY SI OTTENGA LA MATRICE DELLE ESPRESSIONI GENICHE. Un classico esperimento può essere così riassunto: più microarray vengono ibridati sotto differenti condizioni sperimentali (heat- shock, somministrazione di un farmaco ecc.) delle popolazioni di cellule osservate. Un tale esperimento da come risultato una matrice di dati, in cui le righe rappresentano i geni monitorati e le colonne corrispondono alle diverse condizioni sperimentali. Ogni elemento della matrice rappresenta quindi il livello di espressione di un singolo probe in una delle ibridazioni. Ciascuna colonna è data dunque da uno dei campioni osservati. 19

20 FIGURA 6 - ESEMPIO DI MATRICE DEI DATI NORMALIZZATI. 20

21 5. LE RETI DI REGOLAZIONE GENETICA I microarray di espressioni geniche forniscono dati quantitativi e semi- quantitativi sullo stato di una cellula in specifiche condizioni e nel tempo, misurando simultaneamente l espressione genica di migliaia di geni. La biologia molecolare sta, dunque, rapidamente evolvendo in una scienza quantitativa. L idea è di inferire (reverse- engineer di sistemi biologici) dai dati riguardanti espressioni geniche le interazioni regolative tra geni utilizzando degli algoritmi computazionali [4], rappresentando tali iterazioni attraverso un grafo in cui ciascun nodo rappresenta un gene ed un arco un legame (un interazione) tra due geni. Le strategie per il reverse- engineering di sistemi biologici, possono essere divise in due categorie: 1. strategie fisiche (physical interaction): nelle quali si identificano le proteine (Fattori di trascrizione) che regolano la trascrizione e le sequenze di DNA sulle quali queste legano per attivare la trascrizione del gene target (promotori); 2. strategie d influenza (influence interaction): nelle quali si cerca di identificare l influenza che esiste tra gli mrna (trascritto da un gene), in modo relazionare l espressione di un gene con tutti gli altri geni che esso regola, o da cui e regolato, nella cellula. Consideriamo soltanto il secondo approccio: l interazione tra due geni in una rete di geni, non necessariamente implica un interazione fisica, ma può anche riferirsi solamente ad una regolazione indiretta (tramite proteine, metaboliti o ncrna che non sono stati misurati direttamente). Si noti che l influence interaction include la physical interaction, in alcuni casi infatti i trascritti che influenzano la trascrizione di altri trascritti, possono codificare per fattori di trascrizione che legano proprio sul promotore dei trascritti stessi. L utilità del modello di rete genetica utilizzando l approccio influence interaction sono varie tra cui: 1. identificare il sottoinsieme di geni che regola ogni altro (tramite interazioni dirette o indirette); 2. predire il comportamento del sistema a seguito di perturbazioni dello stesso. Ciò consiste nel costruire dei modelli di reti di geni utili a predire la risposta di una rete ad una perturbazione esterna e ad identificare il gene direttamente colpito 21

DNA - RNA. Nucleotide = Gruppo Fosforico + Zucchero Pentoso + Base Azotata. Le unità fondamentali costituenti il DNA e l RNA sono i Nucleotidi.

DNA - RNA. Nucleotide = Gruppo Fosforico + Zucchero Pentoso + Base Azotata. Le unità fondamentali costituenti il DNA e l RNA sono i Nucleotidi. DNA - RNA Le unità fondamentali costituenti il DNA e l RNA sono i Nucleotidi. Nucleotide = Gruppo Fosforico + Zucchero Pentoso + Base Azotata. Esistono 4 basi azotate per il DNA e 4 per RNA Differenze

Dettagli

Corso di Biologia Molecolare

Corso di Biologia Molecolare Corso di Biologia Molecolare Dott.ssa Renata Tisi Dip. Biotecnologie e Bioscienze Ed. U4 Tel. 02 6448 3522 renata.tisi@unimib.it Acidi nucleici Il ruolo degli acidi nucleici è quello di custodire e trasmettere

Dettagli

METODI DI MARCATURA DEGLI ACIDI NUCLEICI

METODI DI MARCATURA DEGLI ACIDI NUCLEICI METODI DI MARCATURA DEGLI ACIDI NUCLEICI Marcatura di acidi nucleici Una sonda per ibridazione è una molecola di DNA marcata, con una sequenza complementare al DNA bersaglio da individuare. Poiché la sonda

Dettagli

LE MOLECOLE INFORMAZIONALI. Lezioni d'autore Treccani

LE MOLECOLE INFORMAZIONALI. Lezioni d'autore Treccani LE MOLECOLE INFORMAZIONALI Lezioni d'autore Treccani Introduzione (I) I pionieri della biologia molecolare, scoperta la struttura degli acidi nucleici, pensarono di associare al DNA una sequenza di simboli,

Dettagli

Una proteina nella rete: Introduzione alla bioinformatica

Una proteina nella rete: Introduzione alla bioinformatica Una proteina nella rete: Introduzione alla bioinformatica L era genomica ha assistito ad una crescita esponenziale delle informazioni biologiche rese disponibili dai progressi nel campo della biologia

Dettagli

Elementi di Bioinformatica. Genomica. Introduzione

Elementi di Bioinformatica. Genomica. Introduzione Corso di Elementi di Bioinformatica Ingegneria Biomedica AA 2013-14 Elementi di Bioinformatica Genomica Introduzione Genomica Genomica (genomics) Riguarda lo studio del genoma degli organismi viventi e,

Dettagli

NUCLEOTIDI e ACIDI NUCLEICI

NUCLEOTIDI e ACIDI NUCLEICI NUCLEOTIDI e ACIDI NUCLEICI Struttura dei nucleotidi Il gruppo fosfato conferisce carica negativa e proprietà acide FUNZIONI DEI NUCLEOTIDI MOLECOLE DI RISERVA DI ENERGIA L idrolisi dei nucleosidi trifosfato

Dettagli

Determinazione della struttura di una molecola di RNA tramite una sequenza di numeri primi

Determinazione della struttura di una molecola di RNA tramite una sequenza di numeri primi Università degli Studi di Milano Polo Didattico e di Ricerca di Crema Facoltà di Scienze Matematiche, Fisiche e Naturali Corso di Geometria Computazionale Determinazione della struttura di una molecola

Dettagli

V. TRASCRIZIONE E TRADUZIONE DEL DNA

V. TRASCRIZIONE E TRADUZIONE DEL DNA V. TRASCRIZIONE E TRADUZIONE DEL DNA 0) CONCETTI BASE La trasformazione delle informazioni genetiche in proteine richiede due passaggi: la trascrizione del DNA in mrna e la traduzione dell mrna in una

Dettagli

La tecnologia dei microarray

La tecnologia dei microarray La tecnologia dei microarray I microarray I progetti di sequenziamento (progetti permesso di identificare migliaia di geni genoma) ) hanno Migliaia di geni (ed i loro prodotti, le proteine) operano in

Dettagli

SINTESI DELL RNA. Replicazione. Trascrizione. Traduzione

SINTESI DELL RNA. Replicazione. Trascrizione. Traduzione SINTESI DELL RNA Replicazione Trascrizione Traduzione L RNA ha origine da informazioni contenute nel DNA La TRASCRIZIONE permette la conversione di una porzione di DNA in una molecola di RNA con una sequenza

Dettagli

Il DNA: la molecola della vita

Il DNA: la molecola della vita Il DNA: la molecola della vita Gli acidi nucleici comprendono il DNA (acido desossiribonucleico) e l RNA (acido ribonucleico). Sono costituiti da molecole molto grandi, formate da unità dette nucleotidi,

Dettagli

LA GENETICA: DNA e RNA LA GENETICA. DNA e RNA. Prof. Daniele Verri

LA GENETICA: DNA e RNA LA GENETICA. DNA e RNA. Prof. Daniele Verri LA GENETICA DNA e RNA Prof. Daniele Verri L'acido desossiribonucleico o deossiribonucleico (DNA) è un acido nucleico che contiene le informazioni necessarie per la formazione di RNA e proteine. LA GENETICA:

Dettagli

Dott.ssa Renata Tisi. Dip. Biotecnologie e Bioscienze Ed. U4 Tel. 02 6448 3522 renata.tisi@unimib.it

Dott.ssa Renata Tisi. Dip. Biotecnologie e Bioscienze Ed. U4 Tel. 02 6448 3522 renata.tisi@unimib.it Dott.ssa Renata Tisi Dip. Biotecnologie e Bioscienze Ed. U4 Tel. 02 6448 3522 renata.tisi@unimib.it Il ruolo degli acidi nucleici è quello di custodire e trasmettere l informazione genetica nelle cellule,

Dettagli

Microarray. (in parte da Wikipedia)

Microarray. (in parte da Wikipedia) Microarray (in parte da Wikipedia) Un DNA microarray (comunemente conosciuto come gene chip, DNA chip, o biochip) è costituito da una collezione di microscopiche sonde di DNA attaccate ad una superficie

Dettagli

Informatica e biotecnologie I parte

Informatica e biotecnologie I parte Informatica e biotecnologie I parte Banche dati biologiche Bioinformatica La Bioinformatica è una disciplina che affronta con metodiche proprie delle Scienze dell'informazione problemi propri della Biologia.

Dettagli

Biotecnologie ed OGM. Prima parte: DNA ricombinante e microorganismi geneticamente modificati.

Biotecnologie ed OGM. Prima parte: DNA ricombinante e microorganismi geneticamente modificati. Biotecnologie ed OGM Prima parte: DNA ricombinante e microorganismi geneticamente modificati. COSA SONO LE BIOTECNOLOGIE? Si dicono Biotecnologie i metodi tecnici che permettono lo sfruttamento di sistemi

Dettagli

ANALISI POST-GENOMICHE TRASCRITTOMA: CONTENUTO DI RNA DI UNA CELLULA.

ANALISI POST-GENOMICHE TRASCRITTOMA: CONTENUTO DI RNA DI UNA CELLULA. TECNICHE PER L ANALISI DELL ESPRESSIONE GENICA RT-PCR REAL TIME PCR NORTHERN BLOTTING ANALISI POST-GENOMICHE Conoscere la sequenza genomica di un organismo non è che l inizio di una serie di esperimenti

Dettagli

SAPIENZA Università di Roma Laurea magistrale in Ingegneria delle Nanotecnologie A.A. 2014-2015 Corso di Laboratorio di Biofotonica

SAPIENZA Università di Roma Laurea magistrale in Ingegneria delle Nanotecnologie A.A. 2014-2015 Corso di Laboratorio di Biofotonica SAPIENZA Università di Roma Laurea magistrale in Ingegneria delle Nanotecnologie A.A. 2014-2015 Corso di Laboratorio di Biofotonica Prof. Francesco Michelotti SAPIENZA Università di Roma Facoltà di Ingegneria

Dettagli

Fibrillina Sindrome di Marfan sindrome di Marfan sindrome di Marfan Sindrome di Marfan Fibrillina 1

Fibrillina Sindrome di Marfan sindrome di Marfan sindrome di Marfan Sindrome di Marfan Fibrillina 1 Genoma La determinazione e la conoscenza dell intera sequenza genomica è la condizione necessaria per comprendere la biologia di un determinato organismo Il genoma contiene le istruzioni (geni) per la

Dettagli

Bioinformatica Analisi del trascrittoma. Dott. Alessandro Laganà

Bioinformatica Analisi del trascrittoma. Dott. Alessandro Laganà Bioinformatica Analisi del trascrittoma Dott. Alessandro Laganà Analisi del trascrittoma Regolazione dell espressione genica I microarray cdna microarray Oligo microarray Affymetrix Chip Analisi dei dati

Dettagli

RNA polimerasi operone. L operatore è il tratto

RNA polimerasi operone. L operatore è il tratto La regolazione genica nei procarioti Alcune proteine vengono prodotte dalla cellula ad un ritmo relativamente costante e l attività dei geni che codificano queste proteine non è regolata in modo sofisticato.

Dettagli

GENETICA seconda parte

GENETICA seconda parte GENETICA seconda parte I cromosomi sono lunghe molecole di una sostanza l acido desossiribonucleico. DNA Il DNA è una lunga catena fatta da due lunghi fili avvolti su se stessi a doppia elica. Sembra una

Dettagli

Le idee della chimica

Le idee della chimica G. Valitutti A.Tifi A.Gentile Seconda edizione Copyright 2009 Zanichelli editore Capitolo 25 Le basi della biochimica 1. I carboidrati 2. I lipidi 3. Gli amminoacidi, i peptidi e le proteine 4. La struttura

Dettagli

Laboratorio di Metodologie e Tecnologie Genetiche ESERCITAZIONE DI BIOINFORMATICA

Laboratorio di Metodologie e Tecnologie Genetiche ESERCITAZIONE DI BIOINFORMATICA Laboratorio di Metodologie e Tecnologie Genetiche ESERCITAZIONE DI BIOINFORMATICA Bioinformatica - Scienza interdisciplinare coinvolgente la biologia, l informatica, la matematica e la statistica per l

Dettagli

Cenni storici. Tale tecnica trova largo impiego in tutte le aree di ricerca biologica:

Cenni storici. Tale tecnica trova largo impiego in tutte le aree di ricerca biologica: DNA Microarray: griglia di DNA costruita artificialmente, in cui ogni elemento della griglia riconosce una specifica sequenza target di RNA o cdna. Tale tecnica trova largo impiego in tutte le aree di

Dettagli

Struttura e funzione dei geni. Paolo Edomi - Genetica

Struttura e funzione dei geni. Paolo Edomi - Genetica Struttura e funzione dei geni 1 Il DNA è il materiale genetico La molecola di DNA conserva l informazione genetica: topi iniettati con solo DNA di batteri virulenti muoiono 2 Proprietà del DNA Il DNA presenta

Dettagli

Dal DNA alle proteine: La trascrizione e la traduzione

Dal DNA alle proteine: La trascrizione e la traduzione Dal DNA alle proteine: La trascrizione e la traduzione DNA RNA Trascrizione RNA PROTEINE Traduzione Dove avvengono? GLI EUCARIOTI I PROCARIOTI Cambell, Reece Biologia ZANICHELLI Trascrizione Sintesi di

Dettagli

Corso di Biologia Molecolare

Corso di Biologia Molecolare Corso di Biologia Molecolare Dott.ssa Renata Tisi Dip. Biotecnologie e Bioscienze Ed. U4 Tel. 02 6448 3522 renata.tisi@unimib.it Acidi nucleici Il ruolo degli acidi nucleici è quello di custodire e trasmettere

Dettagli

La regolazione genica nei eucarioti

La regolazione genica nei eucarioti La regolazione genica nei eucarioti Lic. Scientifico A. Meucci Aprilia Prof. Rolando Neri Differenziamento negli eucarioti pluricellulari Negli eucarioti le cellule specializzate dei vari tessuti contengono

Dettagli

scaricato da www.sunhope.it LA TECNOLOGIA DEI MICROARRAYS

scaricato da www.sunhope.it LA TECNOLOGIA DEI MICROARRAYS LA TECNOLOGIA DEI MICROARRAYS 1 8 anni dopo: 4162 riferimenti bibliografici sui microarrays I microarrays misurano il livello di espressione degli mrna trascritti dai geni del sistema biologico di interesse

Dettagli

Biosensori 3: Biosensori a DNA e Bio- Gene Chip

Biosensori 3: Biosensori a DNA e Bio- Gene Chip Biosensori 3: Biosensori a DNA e Bio- Gene Chip mazzei@di.unipi.it (materiale parzialmente tratto da: http://nestor.med.unibo.it/shared_files/seminari/sartini_21-10-2004.ppt) Biosensori ad affinità basati

Dettagli

Gerarchia della struttura delle proteine

Gerarchia della struttura delle proteine Si indica con CONFORMAZIONE la disposizione tridimensionale degli atomi di una molecola, cioè la loro organizzazione spaziale. Gerarchia della struttura delle proteine struttura primaria: sequenza degli

Dettagli

Bioinformatica. Marin Vargas, Sergio Paul

Bioinformatica. Marin Vargas, Sergio Paul Bioinformatica Marin Vargas, Sergio Paul 2013 Wikipedia: La bioinformatica è una disciplina scientifica dedicata alla risoluzione di problemi biologici a livello molecolare con metodi informatici. La bioinformatica

Dettagli

Analisi Molecolare di sequenze di acidi nucleici

Analisi Molecolare di sequenze di acidi nucleici Analisi Molecolare di sequenze di acidi nucleici 1. L Analisi di restrizione di frammenti o RFLP (Restriction Fragment Lenght Polymorphism) di DNA comporta lo studio delle dimensioni dei frammenti di DNA

Dettagli

Prof.ssa Gamba Sabrina. Lezione 7: IL DNA. Duplicazione e sintesi delle proteine

Prof.ssa Gamba Sabrina. Lezione 7: IL DNA. Duplicazione e sintesi delle proteine Prof.ssa Gamba Sabrina Lezione 7: IL DNA Duplicazione e sintesi delle proteine concetti chiave della lezione Costituzione fisico-chimica del DNA Basi azotate Duplicazione Concetto di geni Rna Trascrizione

Dettagli

La regolazione genica nei virus

La regolazione genica nei virus La regolazione genica nei virus Lic. Scientifico A. Meucci Aprilia Prof. Rolando Neri I VIRUS INDICE Caratteristiche dei virus: il capside e il genoma virale Classificazione virale Fasi del ciclo riproduttivo

Dettagli

La possibilita di conoscere i geni deriva dalla capacita di manipolarli:

La possibilita di conoscere i geni deriva dalla capacita di manipolarli: La possibilita di conoscere i geni deriva dalla capacita di manipolarli: -isolare un gene (enzimi di restrizione) -clonaggio (amplificazione) vettori -sequenziamento -funzione Il gene o la sequenza

Dettagli

C2. Il rilascio del fattore sigma marca il passaggio alla fase di allungamento della trascrizione.

C2. Il rilascio del fattore sigma marca il passaggio alla fase di allungamento della trascrizione. Soluzioni ai problemi del Capitolo 12 Domande concettuali C1. A. I geni dei trna codificano molecole di trna e i geni degli rrna le molecole di rrna che si trovano nei ribosomi. Esistono anche dei geni

Dettagli

Risposta: 2. Uracile. Risposta: 2. legami idrogeno. Adenina, Citosina e Guanina si trovano sia nell RNA che nel DNA.

Risposta: 2. Uracile. Risposta: 2. legami idrogeno. Adenina, Citosina e Guanina si trovano sia nell RNA che nel DNA. Risposta: 2. Uracile Adenina, Citosina e Guanina si trovano sia nell RNA che nel DNA. La Timina si trova soltanto nel DNA; l Uracile si sostituisce alla Timina nelle molecole dell RNA. Risposta: 2. legami

Dettagli

Replicazione del DNA

Replicazione del DNA Replicazione del DNA la replicazione del DNA viene effettuata da ENZIMI: DNA-polimerasi (catalizza la formazione del legame fosfodiestere) ogni filamento fa da stampo (enzima diretto dallo stampo) le DNA-polimerasi

Dettagli

Bioinformatica (1) Introduzione. Dott. Alessandro Laganà

Bioinformatica (1) Introduzione. Dott. Alessandro Laganà Bioinformatica (1) Introduzione Dott. Alessandro Laganà Dott. Alessandro Laganà Martedi 15.30 16.30 Studio Assegnisti - 1 Piano (Davanti biblioteca) Dipartimento di Matematica e Informatica (Città Universitaria)

Dettagli

SUPERAVVOLGIMENTO DEL DNA (ORGANIZZAZIONE TERZIARIA DEL DNA)

SUPERAVVOLGIMENTO DEL DNA (ORGANIZZAZIONE TERZIARIA DEL DNA) SUPERAVVOLGIMENTO DEL DNA (ORGANIZZAZIONE TERZIARIA DEL DNA) ORGANIZZAZIONE TERZIARIA DEL DNA Il DNA cellulare contiene porzioni geniche e intergeniche, entrambe necessarie per le funzioni vitali della

Dettagli

Dal DNA all RNA. La trascrizione nei procarioti e negli eucarioti

Dal DNA all RNA. La trascrizione nei procarioti e negli eucarioti Dal DNA all RNA La trascrizione nei procarioti e negli eucarioti DOGMA CENTRALE DELLA BIOLOGIA MOLECOLARE Gene Regione di DNA che porta l informazione (= che CODIFICA) per una catena polipeptidica o per

Dettagli

Biologia Cellulare e DNA «Bigino»

Biologia Cellulare e DNA «Bigino» Biologia Cellulare e DNA «Bigino» Giulio Barigelletti www.baveno.net Premesse 2 Sempre più frequentemente si sente parlare di DNA, Proteine, Amminoacidi, etc., relazionati all esistenza dell essere umano.

Dettagli

PRINCIPALI TIPI DI PCR a) PRINCIPALI TIPI DI PCR b)

PRINCIPALI TIPI DI PCR a) PRINCIPALI TIPI DI PCR b) PRINCIPALI TIPI DI PCR a) RT-PCR: serve a valutare l espressione di un gene tramite l amplificazione dell mrna da esso trascritto PCR COMPETITIVA: serve a valutare la concentrazione iniziale di DNA o RNA

Dettagli

Analisi di dati Microarray: Esercitazione Matlab

Analisi di dati Microarray: Esercitazione Matlab Analisi di dati Microarray: Esercitazione Matlab Laboratorio di Bioinformatica II Pietro Lovato Anno Accademico 2010/2011 Contenuti 1 Introduzione DNA Microarray 2 Lavorare con una singola ibridazione

Dettagli

Genoma umano: illusioni, realtà, prospettive

Genoma umano: illusioni, realtà, prospettive Genoma umano: illusioni, realtà, prospettive Giovedì 15 Marzo 2007 - ore 17.30 Istituto Veneto di Scienze, Lettere ed Arti - Venezia Giuseppe Borsani e Gerolamo Lanfranchi, coordina Fabio Pagan Il flusso

Dettagli

Cultura Tecnologica di Progetto

Cultura Tecnologica di Progetto Cultura Tecnologica di Progetto Politecnico di Milano Facoltà di Disegno Industriale - DATABASE - A.A. 2003-2004 2004 DataBase DB e DataBase Management System DBMS - I database sono archivi che costituiscono

Dettagli

Ibridizzazione in situ

Ibridizzazione in situ ANALISI DELL RNA Northen blot E un metodo simile a quello di traferimento e di ibridizzazione del DNA (Southern blot) e si usa per sondare molecole di RNA. Gli mrna sono molecole brevi, in genere meno

Dettagli

http://biocloud.unica.it biocloud@unica.it Emanuele Pascariello emanuele.pascariello@gmail.com

http://biocloud.unica.it biocloud@unica.it Emanuele Pascariello emanuele.pascariello@gmail.com Giornate sugli sbocchi professionali Del corso di Laurea in Biotecnologie Industriali (BIOTIN) Oristano 23/24 Aprile 2013 URL email http://biocloud.unica.it biocloud@unica.it Emanuele Pascariello emanuele.pascariello@gmail.com

Dettagli

Introduzione al Pattern Recognition Statistico

Introduzione al Pattern Recognition Statistico Introduzione al Pattern Recognition Statistico Roberto Tagliaferri Dipartimento di Informatica Università di Salerno ( Sa ) 84084 Fisciano e-mail robtag@unisa.it Statistical Pattern Recognition Introduzione

Dettagli

RNA non codificanti ed RNA regolatori

RNA non codificanti ed RNA regolatori RNA non codificanti ed RNA regolatori RNA non codificanti ed RNA regolatori Piccoli RNA non codificanti RNA regolatore microrna RNAi e sirna Piccoli RNA non codificanti Gli RNA non codificanti (ncrna)

Dettagli

Next-generation sequencing, annotazione, ed espressione genica. Giulio Pavesi Dip. Bioscienze Università di Milano giulio.pavesi@unimi.

Next-generation sequencing, annotazione, ed espressione genica. Giulio Pavesi Dip. Bioscienze Università di Milano giulio.pavesi@unimi. Next-generation sequencing, annotazione, ed espressione genica Giulio Pavesi Dip. Bioscienze Università di Milano giulio.pavesi@unimi.it Il primo passo... Abbiamo la sequenza completa del DNA di un organismo:

Dettagli

Tecniche di DM: Link analysis e Association discovery

Tecniche di DM: Link analysis e Association discovery Tecniche di DM: Link analysis e Association discovery Vincenzo Antonio Manganaro vincenzomang@virgilio.it, www.statistica.too.it Indice 1 Architettura di un generico algoritmo di DM. 2 2 Regole di associazione:

Dettagli

Figura 1. Rappresentazione della doppia elica di DNA e struttura delle differenti basi.

Figura 1. Rappresentazione della doppia elica di DNA e struttura delle differenti basi. Sommario La molecola di DNA è deputata a conservare le informazioni genetiche necessarie per lo sviluppo ed il funzionamento degli organismi viventi. Poiché contiene le istruzioni per la costruzione delle

Dettagli

La trascrizione nei procarioti. Prof. Savino; dispense di Biologia Molecolare, Corso di Laurea in Biotecnologie

La trascrizione nei procarioti. Prof. Savino; dispense di Biologia Molecolare, Corso di Laurea in Biotecnologie La trascrizione nei procarioti Concetti base Nucleoside base purinica o pirimidinica legata alla posizione 1 dell anello pentoso Nucleotide base azotata-pentoso-fosfato Concetti base La trascrizione comporta

Dettagli

MEDICINA E CHIRURGIA ANNO ACCADEMICO OFFERTA

MEDICINA E CHIRURGIA ANNO ACCADEMICO OFFERTA FACOLTÀ MEDICINA E CHIRURGIA ANNO ACCADEMICO OFFERTA 2014/2015 FORMATIVA ANNO ACCADEMICO EROGAZIONE 2014/2015 CORSO DI LAUREA (o LAUREA MAGISTRALE) Medicina e Chirurgia Canale Chirone- Sede Formativa Palermo

Dettagli

Il metabolismo dell RNA. Prof. Savino; dispense di Biologia Molecolare, Corso di Laurea in Biotecnologie

Il metabolismo dell RNA. Prof. Savino; dispense di Biologia Molecolare, Corso di Laurea in Biotecnologie Il metabolismo dell RNA I vari tipi di RNA Il filamento di DNA che dirige la sintesi dello mrna è chiamato filamento stampo o filamento antisenso. L altro filamento che ha sequenza identica a quella dello

Dettagli

www.fisiokinesiterapia.biz TRASCRIZIONE

www.fisiokinesiterapia.biz TRASCRIZIONE www.fisiokinesiterapia.biz TRASCRIZIONE TRASCRIZIONE Processo mediante il quale una sequenza di DNA (un gene) viene copiata in una sequenza di RNA Dalla trascrizione derivano gli mrna, che verranno tradotti

Dettagli

I PROGETTI OMICI. Studiano gli elementi biologici nel loro insieme TRASCRITTOMICA PROTEOMICA

I PROGETTI OMICI. Studiano gli elementi biologici nel loro insieme TRASCRITTOMICA PROTEOMICA 1 I PROGETTI OMICI Studiano gli elementi biologici nel loro insieme TRASCRITTOMICA PROTEOMICA Studia il contenuto in mrna di una cellula (in differenti fasi di sviluppo, in risposta a vari stimoli o a

Dettagli

Il flusso dell informazione genetica. DNA -->RNA-->Proteine

Il flusso dell informazione genetica. DNA -->RNA-->Proteine Il flusso dell informazione genetica DNA -->RNA-->Proteine Abbiamo visto i principali esperimenti che hanno dimostrato che il DNA è la molecola depositaria dell informazione genetica nella maggior parte

Dettagli

Maria Antonietta Lepore. Principali tecniche di biologia molecolare clinica

Maria Antonietta Lepore. Principali tecniche di biologia molecolare clinica Maria Antonietta Lepore Principali tecniche di biologia molecolare clinica Copyright MMIX ARACNE editrice S.r.l. www.aracneeditrice.it info@aracneeditrice.it via Raffaele Garofalo, 133 a/b 00173 Roma (06)

Dettagli

Il flusso dell informazione genetica il ruolo dei polimeri di nucleotidi

Il flusso dell informazione genetica il ruolo dei polimeri di nucleotidi Il flusso dell informazione genetica il ruolo dei polimeri di nucleotidi trascrizione traduzione DNA RNA Proteina replicazione DNA replicazione: sintesi del DNA trascrizione: sintesi del RNA traduzione:

Dettagli

I Modelli della Ricerca Operativa

I Modelli della Ricerca Operativa Capitolo 1 I Modelli della Ricerca Operativa 1.1 L approccio modellistico Il termine modello è di solito usato per indicare una costruzione artificiale realizzata per evidenziare proprietà specifiche di

Dettagli

DNA sequence alignment

DNA sequence alignment DNA sequence alignment - Introduzione: un possibile modello per rappresentare il DNA. Il DNA (Acido desossiribonucleico) è una sostanza presente nei nuclei cellulari, sia vegetali che animali; a questo

Dettagli

Lezioni di biotecnologie

Lezioni di biotecnologie Lezioni di biotecnologie 2 Lezione 2 Analisi del DNA e delle proteine 3 Analizzare DNA e proteine Per le applicazioni delle biotecnologie è di fondamentale importanza: 1. essere in grado di identificare

Dettagli

BIOLOGA e BIOLOGO MOLECOLARE

BIOLOGA e BIOLOGO MOLECOLARE Copyright Università degli Studi di Torino, Progetto Atlante delle Professioni 2009 BIOLOGA e BIOLOGO MOLECOLARE Aggiornato il 6 luglio 2009 1. CARTA D IDENTITÀ... 2 2. CHE COSA FA... 4 3. DOVE LAVORA...

Dettagli

Il DNA e la duplicazione cellulare. Acidi nucleici: DNA, materiale ereditario

Il DNA e la duplicazione cellulare. Acidi nucleici: DNA, materiale ereditario Il DN e la duplicazione cellulare Il DN, materiale ereditario Struttura del DN Replicazione del DN Dal DN alla proteina Il odice genetico iclo cellulare Mitosi Meiosi Da Figura 8-11 ampbell & Reece cidi

Dettagli

Biotecnologie ed OGM : come vengono trasferiti i geni?

Biotecnologie ed OGM : come vengono trasferiti i geni? Biotecnologie ed OGM : come vengono trasferiti i geni? a cura di Leonardo Magneschi Scuola Estiva di Orientamento Volterra 2007 Venerdì 29 giugno 2007 1 Introduzione all Ingegneria Genetica L ingeneria

Dettagli

Carpire il segreto della vita con l informatica Giosuè Lo Bosco Dipartimento di Matematica e Informatica, Università di Palermo, ITALY.

Carpire il segreto della vita con l informatica Giosuè Lo Bosco Dipartimento di Matematica e Informatica, Università di Palermo, ITALY. Carpire il segreto della vita con l informatica Giosuè Lo Bosco Dipartimento di Matematica e Informatica, Università di Palermo, ITALY. Lezioni Lincee Palermo, 26 Febbraio 2015 Alla base della vita degli

Dettagli

Si tratta di corpiccioli di natura ribonucleoproteica che nel citoplasma di tutte le cellule presiedono ai processi di sintesi proteica.

Si tratta di corpiccioli di natura ribonucleoproteica che nel citoplasma di tutte le cellule presiedono ai processi di sintesi proteica. I R I BOSOM I I RIBOSOMI sono organuli citoplasmatici presenti in tutte le cellule, sia procariotiche che eucariotiche. Sono visibili al M.O. solo quando presenti in gran numero, (come capita nelle cellule

Dettagli

Metodiche Molecolari

Metodiche Molecolari Metodiche Molecolari La rivelazione degli acidi nucleici virali è un altro saggio che può essere utilizzato sia per verificare la presenza di un virus in un determinato campione biologico, sia per studiare

Dettagli

DI REGOLAZIONE A DUE COMPONENTI

DI REGOLAZIONE A DUE COMPONENTI LEZIONE 16 Sistemi di regolazione SISTEMI DI REGOLAZIONE A DUE COMPONENTI In che modo un batterio sente e risponde a specifici segnali provenienti dall ambiente? Per esempio, nel caso dell operone lac

Dettagli

2.1 Introduzione ai linguaggi di marcatura

2.1 Introduzione ai linguaggi di marcatura Fondamenti di Informatica Sistemi di Elaborazione delle Informazioni Informatica Applicata 2.1 Introduzione ai linguaggi di marcatura Antonella Poggi Anno Accademico 2012-2013 DIPARTIMENTO DI SCIENZE DOCUMENTARIE

Dettagli

La traduzione: dall mrna alle proteine

La traduzione: dall mrna alle proteine La traduzione: dall mrna alle proteine Le infezioni batteriche sono una grave causa di malattie e morte in Europa e negli USA. Le infezioni batteriche si curano con antibiotici che colpiscono l espressione

Dettagli

Manifesto degli Studi Laurea Magistrale in BIOINFORMATICA a.a. 2012-2013

Manifesto degli Studi Laurea Magistrale in BIOINFORMATICA a.a. 2012-2013 1. Tabella degli insegnamenti Manifesto degli Studi Laurea Magistrale in BIOINFORMATICA a.a. 2012-2013 Insegnamento SSD CFU Risultati di apprendimento previsti Applicazioni Web per la Biomedicina MED/04

Dettagli

La tecnologia dei microarray

La tecnologia dei microarray La tecnologia dei microarray Introduzione per l analisi dell espressione genica: Affymetrix GeneChip spotted arrays L analisi dei dati Campi di applicazione dei microarray Introduzione I progetti di sequenziamento

Dettagli

SOLUZIONI AI PROBLEMI DEL CAPITOLO 21. Domande concettuali

SOLUZIONI AI PROBLEMI DEL CAPITOLO 21. Domande concettuali SOLUZIONI AI PROBLEMI DEL CAPITOLO 21 Domande concettuali C1. La genomica strutturale studia la composizione di un genoma. Lo scopo è di mappare tutti i geni nel genoma e alla fine di determinare la sequenza

Dettagli

Come si traccia un alimento di origine animale? Dalle lasagne con carne di cavallo. alla realtà di ogni giorno

Come si traccia un alimento di origine animale? Dalle lasagne con carne di cavallo. alla realtà di ogni giorno Editoriale n.10 Newsletter aprile 2013 Come si traccia un alimento di origine animale? Dalle lasagne con carne di cavallo alla realtà di ogni giorno Identificare la specie, un obiettivo fondamentale quando

Dettagli

Costituzione dei viventi

Costituzione dei viventi Costituzione dei viventi La materia e costituita da elementi chimici in forma pura o in combinazioni dette composti 25 dei 92 elementi naturali sono costituenti essenziali dei viventi 4 (C, O,, N) costituiscono

Dettagli

LABORATORIO. 2 Lezioni su Basi di Dati Contatti:

LABORATORIO. 2 Lezioni su Basi di Dati Contatti: PRINCIPI DI INFORMATICA CORSO DI LAUREA IN SCIENZE BIOLOGICHE Gennaro Cordasco e Rosario De Chiara {cordasco,dechiara}@dia.unisa.it Dipartimento di Informatica ed Applicazioni R.M. Capocelli Laboratorio

Dettagli

Definizione di genoteca (o library) di DNA

Definizione di genoteca (o library) di DNA Definizione di genoteca (o library) di DNA Collezione completa di frammenti di DNA, inseriti singolarmente in un vettore di clonaggio. Possono essere di DNA genomico o di cdna. Libreria genomica: collezione

Dettagli

CORSO DI AGGIORNAMENTO PER GLI INSEGNANTI DELLE SCUOLE MEDIE SUPERIORI INGEGNERIA GENETICA E SUE APPLICAZIONI

CORSO DI AGGIORNAMENTO PER GLI INSEGNANTI DELLE SCUOLE MEDIE SUPERIORI INGEGNERIA GENETICA E SUE APPLICAZIONI CORSO DI AGGIORNAMENTO PER GLI INSEGNANTI DELLE SCUOLE MEDIE SUPERIORI INGEGNERIA GENETICA E SUE APPLICAZIONI mercoledì 5 maggio 2004 La regolazione dell'espressione genica prof. Giovanna Viale - Università

Dettagli

Il DNA e la cellula. Versione 2.3. Versione italiana. ELLS European Learning Laboratory for the Life Sciences

Il DNA e la cellula. Versione 2.3. Versione italiana. ELLS European Learning Laboratory for the Life Sciences Il DNA e la cellula Anastasios Koutsos Alexandra Manaia Julia Willingale-Theune Versione 2.3 Versione italiana ELLS European Learning Laboratory for the Life Sciences Anastasios Koutsos, Alexandra Manaia

Dettagli

Approfondimento: i sistemi di gestione delle basi di dati (DBMS)

Approfondimento: i sistemi di gestione delle basi di dati (DBMS) Approfondimento: i sistemi di gestione delle basi di dati (DBMS) Prerequisito essenziale della funzionalità delle basi di dati è il controllo e la fruibilità dell informazione in esse contenuta: a tale

Dettagli

Cosa succede in un laboratorio di genetica?

Cosa succede in un laboratorio di genetica? 12 laboratori potrebbero utilizzare campioni anonimi di DNA per lo sviluppo di nuovi test, o condividerli con altri in quanto parte dei programmi di Controllo di Qualità, a meno che si chieda specificatamente

Dettagli

Sequenziamento ed analisi dell esoma intero (All Exon)

Sequenziamento ed analisi dell esoma intero (All Exon) Sequenziamento ed analisi dell esoma intero (All Exon) Obiettivi La procedura ha l obiettivo di sequenziare solo le regioni trascritte e codificanti del genoma che rappresentano, almeno nell uomo, circa

Dettagli

Le Biomolecole I parte. Lezioni d'autore di Giorgio Benedetti

Le Biomolecole I parte. Lezioni d'autore di Giorgio Benedetti Le Biomolecole I parte Lezioni d'autore di Giorgio Benedetti LE BIOMOLECOLE Le biomolecole, presenti in tutti gli esseri viventi, sono molecole composte principalmente da carbonio, idrogeno, azoto e ossigeno.

Dettagli

TECNICHE DI BIOLOGIA MOLECOLARE. LA REAZIONE POLIMERASICA A CATENA Principi teorici e aspetti pratici

TECNICHE DI BIOLOGIA MOLECOLARE. LA REAZIONE POLIMERASICA A CATENA Principi teorici e aspetti pratici TECNICHE DI BIOLOGIA MOLECOLARE LA REAZIONE POLIMERASICA A CATENA Principi teorici e aspetti pratici POLYMERASE CHAIN REACTION (PCR) 1955 A. Kronembreg e coll. (Stanford University) scoprono la DNA-polimerasi

Dettagli

Esistono Open Tools di Microsoft per migliorare le attività di ricerca scientifica

Esistono Open Tools di Microsoft per migliorare le attività di ricerca scientifica CL3 - Biotecnologie Esistono Open Tools di Microsoft per migliorare le attività di ricerca scientifica Le informazioni necessarie al progresso scientifico sono spesso difficili da trovare, sommerse nelle

Dettagli

Qualità del frutto: strategie molecolari per il monitoraggio dei geni coinvolti. Gaetano Perrotta

Qualità del frutto: strategie molecolari per il monitoraggio dei geni coinvolti. Gaetano Perrotta Qualità del frutto: strategie molecolari per il monitoraggio dei geni coinvolti Gaetano Perrotta Principali Caratteristiche del Frutto Elevata variabilità Forma Pigmentazione Consistenza Sapore/Aroma Elementi

Dettagli

LICEO ARTISTICO P. GOBETTI OMEGNA PIANO DI LAVORO ANNUALE. Anno scolastico 2012-2013. CLASSE II A Musicale SCIENZE BIOLOGIA.

LICEO ARTISTICO P. GOBETTI OMEGNA PIANO DI LAVORO ANNUALE. Anno scolastico 2012-2013. CLASSE II A Musicale SCIENZE BIOLOGIA. LICEO ARTISTICO P. GOBETTI OMEGNA PIANO DI LAVORO ANNUALE Anno scolastico 2012-2013 CLASSE II A Musicale SCIENZE BIOLOGIA 2 ore settimanali Docente: Prof.ssa Negri Maria Rosa Testo: Le basi della Biologia

Dettagli

Genetica dei microrganismi

Genetica dei microrganismi Genetica dei microrganismi Dott.ssa Silvia Preziuso Dipartimento di Scienze Veterinarie Università di Camerino Sezione di Patologia Animale, Profilassi e Igiene degli Alimenti Argomenti trattati Gli acidi

Dettagli

ncdna Per ncdna si intende il DNA intronico, intergenico e altre zone non codificanti del genoma.

ncdna Per ncdna si intende il DNA intronico, intergenico e altre zone non codificanti del genoma. ncdna Per ncdna si intende il DNA intronico, intergenico e altre zone non codificanti del genoma. ncdna è caratteristico degli eucarioti: Sequenze codificanti 1.5% del genoma umano Introni in media 95-97%

Dettagli

SAGE: Serial Analysis of Gene Expression

SAGE: Serial Analysis of Gene Expression SAGE: Serial Analysis of Gene Expression L insieme di tutti gli mrna presenti in una cellula si definisce trascrittoma. Ogni trascrittoma ha una composizione complessa, con migliaia di mrna diversi, ciascuno

Dettagli

Perché abbiamo deciso di sequenziare il genoma umano

Perché abbiamo deciso di sequenziare il genoma umano L'immagine sopra rappresenta le tappe fondamentali per la scoperta del genoma umano. Una versione più interattiva della mappa è disponibile nel sito del progetto genoma umano, nella sezione dedicata alla

Dettagli

Riprendiamo ora il cosiddetto dogma centrale della biologia: dal gene alla proteina

Riprendiamo ora il cosiddetto dogma centrale della biologia: dal gene alla proteina Riprendiamo ora il cosiddetto dogma centrale della biologia: dal gene alla proteina trascrizione traduzione L mrna lascia il nucleo e si posiziona sugli organelli chiamati ribosomi, contenenti rrna Trascrizione

Dettagli

I composti organici della vita: carboidrati, lipidi, proteine e acidi nucleici

I composti organici della vita: carboidrati, lipidi, proteine e acidi nucleici I composti organici della vita: carboidrati, lipidi, proteine e acidi nucleici La seta della tela di ragno è un insieme di macromolecole, dette proteine. Sono le caratteristiche fisico-chimiche di queste

Dettagli

La Tecnologia dei Microarray. Tor Vergata Aprile 2011 (Susana.Bueno@caspur.it)

La Tecnologia dei Microarray. Tor Vergata Aprile 2011 (Susana.Bueno@caspur.it) La Tecnologia dei Microarray Tor Vergata Aprile 2011 (Susana.Bueno@caspur.it) SH Friend and RB Stoughton, The Magic of Microarray, Scientific American, February. 2002, pp. 44-49 Vogliamo sapere velocemente

Dettagli