La tecnologia dei microarray Introduzione per l analisi dell espressione genica: Affymetrix GeneChip spotted arrays L analisi dei dati Campi di applicazione dei microarray
Introduzione
I progetti di sequenziamento (progetti genoma) hanno permesso di identificare migliaia di geni Migliaia di geni (ed i loro prodotti, le proteine) operano in maniera simultanea e coordinata Il metodo tradizionale della Biologia Molecolare (un gene, un esperimento) risulta limitato E necessaria una tecnologia per monitorare l intero genoma: Microarrays di DNA (DNA microarray) Introduzione
Introduzione
Nucleus DNA Proteins RNA Cell membrane 400 300 200 100 0 Intensity500 1 3 5 7 9 11 13 15 17 19 21 23 25 Normal Cell Line Genes 27 29 31 33 1 63 65 67 69 71 73 787 89 91 93 95 97 Nucleus Proteins 500 Malignant Cell Line DNA RNA Cell membrane Intensity 400 300 200 100 0 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 Genes 35 37 39 41 43 45 47 49 51 565 67 69 Introduzione
Introduzione
La tecnologia dei microarray Introduzione per l analisi dell espressione genica: Affymetrix GeneChip spotted arrays L analisi bioinformatica Campi di applicazione dei microarray
Supporto solido (wafer di silicio o vetrino da microscopia) Migliaia di catene di DNA o di sequenze oligonucleotidiche immobilizzate sul supporto
C TA A G A G C G AT T C T C G C : G T : A A : T A : T G : C A : T G : C C : G
Probe Array Hybridized Array Detect Tagged RNA Target Fluorescent Stain
Esistono due tipologie di matrici a seconda delle caratteristiche della sequenza di DNA immobilizzata: matrici da sintesi in-situ (Affimetrix GeneChip ) matrici da deposizione (Stanford University)
Quartz wafer, single hyb Glass slide, dual hyb
* * * * * * 5 5µm 5 5µm Millions of identical probes/ feature ~6,500,000 20-mer oligonucleotides 1.28cm 1.28cm
Sintesi in-situ: chimica combinatoriale e fotolitografia
mrna reference sequence 5 3 Reference sequence Perfect match probe cells TGTGATGGTGGGAATGGGTCAGAAGGACTCCTATGTGGGTGACGAGGCC... TGTGATGGTGGGAATGGGTCAGAAGGACTCCTATGTGGGTGACGAGGCC Perfect... match oligo TGTGATGGTGGGAATGGGTCAGAACGACTCCTATGTGGGTGACGAGGCC Mismatch... oligo Mismatch probe cells Fluorescence intensity image
Sonde di cdna (500-5000 bp) o oligonucleotidi (30-70-mer) sono depositate in micro-gocce su di un supporto solido funzionalizzato (vetro) La deposizione avviene per mezzo di un sistema robotizzato Le sonde vengono ancorate covalentemente al supporto solido tramite reazione fotochimica Una volta immobilizzate, le sonde devono essere rese a catena singola per permettere l ibridizzazione dei targets
Il robot raccoglie i campioni dalle piastre a 96 o 384 pozzetti usate per produrre le sonde Il prelievo delle sonde e la loro deposizione sulle matrici viene effettuato attraverso un sistema di pennini La deposizione è seguita dal lavaggio dei pennini matrici pennini piastre
12 pennini 230 matrici 5 piastre 2 stazioni di lavaggio 1 stazione di essiccamento 2 matrici per secondo
Materiale: acciaio inox Diametro: ~ 1.5 mm (100 µm in punta) Ogni pennino raccoglie da 250 a 500 nl di soluzione Ogni pennino deposita 0.25-1 nl di soluzione su ciascuna matrice Le gocce hanno un diametro da 100 a 150 µm I centri delle gocce sono separati da 200-250±10 µm
Le molecole di tracciante vengono incorporate durante la trascrizione inversa da RNA a cdna I due traccianti più utilizzati sono il Cy3 ed il Cy5: Cy3 viene usato per marcare il riferimento (verde) Cy5 viene utilizzato per marcare il campione (rosso) I target marcati vengono ibridizzati sulle sonde immobilizzate sulla matrice
3XSSC HYB CHAMBER ARRAY LIFTERSLIP LABEL SLIDE SLIDE LABEL
La matrice ibridizzata viene pennellata con un fascio di luce laser inducendo la fluorescenza dei traccianti Gli spettri di emissione sono raccolti da uno scanner, filtrati, separati nelle due componenti ed, infine, sommati Cy3 - verde Cy5 - rosso Immagine finale
Il colore di ciascun spot indica la provenienza del cdna ibridizzato: verde: gene espresso nel riferimento, non espresso nel campione (gene represso) rosso: gene espresso nel campione, non espresso nel riferimento (gene indotto) giallo: gene espresso in entrambi i targets L intensità di ciascun spot è proporzionale al numero di molecole di tracciante e quindi al numero di targets ibridizzati Colore/intensità diversi espressione genica diversa
Preparazione delle sonde Numero di sonde Lunghezza delle sonde Densità delle sonde Fluorocromi 1 sonda per gene 25-mers ~54700 11 2=1.2 10 6 1 (misura assoluta) Affymetrix GeneChip Sequenze oligonucleotidiche sintetizzate usando maschere fotolitografiche Sequenze oligonucleotidiche o frammenti di cdna depositati da un robot 11-16 sonde per gene 50-70-mers, frammenti di lunghezza variabile (da 100 a 1K bp) ~4 10 4 2 (misura relativa) Spotted arrays
La tecnologia dei microarray Introduzione per l analisi dell espressione genica: Affymetrix GeneChip spotted arrays L analisi dei dati Campi di applicazione dei microarray
Bioinformatica
Bioinformatica
Bioinformatica
Pre-processamento dei dati controllo di qualità, normalizzazione, filtraggio Selezione di geni differenzialmente espressi quali trascritti caratterizzano un fenotipo Clustering (classificazione non supervisionata) come si raggrupano i campioni sulla base dei livelli di espressione genica Classificazione supervisionata predizione diagnotica o prognostica Reverse Engineering ricostruzione delle reti di regolazione genica Bioinformatica
Bioinformatica
Ribosomal proteins ery bio tpc4 tpc3 tpc2 nrps5 nrps3 Bioinformatica
Bioinformatica
La tecnologia dei microarray Introduzione per l analisi dell espressione genica: Affymetrix GeneChip spotted arrays Analisi dei dati Campi di applicazione dei microarray
Food testing Livestock diagnostics or grading Environmental testing Identity testing Agricultural biotech Individualized medicine Basic Research Human diagnostics Applicazioni
Applicazioni
Microarray Microarray AND Tumor 6000 5000 # di citazioni (PubMed) 4000 3000 2000 1000 0 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 Anno Applicazioni
Diagnosis Classification Prognosis Therapeutic Choice Is it benign? Which class of cancer? What are my chances? Which treatment? Applicazioni
ALL AML Which class of leukemia? MLL Golub, T.R., et al. Science 286: 531-537, 1999; Armstrong, S.A., et al. Nature Genetics 30: 41-47, 2002 Applicazioni
Applicazioni
MammaPrint van 't Veer LJ et al., Nature 2002, 415:530-536 Applicazioni
La tecnologia dei microarray Late Onset Disease Newborn Screening Chip e.g. Alzheimers Treatable Infant Conditions e.g. PKU Consumer Genetics Skills & Traits e.g. preferred smells & tastes e.g. height, perfect pitch Untreatable Infant Disease e.g. Swarey s Syndrome Applicazioni
Letture Nature Genetics The Chipping Forecast I II III January 1999, Volume 21 No 1s December 2002, Volume 32 No 4s June 2005, Volume 37 No 6s