Identificazione di geni e fattori di suscettibilità delle malattie umane Prof. Gabriella De Vita
La variabilità genetica nell uomo
Le varianti del DNA umano possono essere classificate in: Larga scala o piccola scala Comuni o rare Patogeniche o non patogeniche (malattia, suscettibilità)
Si intendono varianti su piccola scala quelle che possono essere evidenziate con la sequenza di un prodotto di PCR di poche centinaia di bp Piccola scala: nessun gene o un solo gene Larga scala: molti geni
Circa 1/300 bp è polimorfico: SNPs La maggior parte degli SNPs ha due varianti alleliche Ogni SNP è identificato da numero, preceduto da rs (reference SNP) Circa 12 milioni di SNP mappati
rs212570 (chr 20) La forma più comune: SNP semplice
Circa 2 milioni di SNPs sono polimorfismi DIPs o indels: delezioni/inserzioni di 1 o 2 nt non ripetuti rs36126541(chr 12)
Alcuni SNPs cadono in sequenze palindromiche target di enzimi di restrizione (circa il 10%) Sono detti RFLPs o RSPs NheI: GCTAGC rs36078338
Perché alcuni nucleotidi sono polimorfici mentre quelli circostanti variano solo raramente? Gli SNPs sono stabili su tempi evoluzionari, al contrario di alcune sequenze ripetute Marcatori di segmenti alternativi di cromosomi ancestrali Pochi sono specifici di gruppi etnici, ma la loro frequenza varia tra i gruppi
Le sequenze ripetute possono essere polimorfiche Le più numerose sono le SINE (1,5 milioni) e le LINE (850 000) Alcune inserzioni di SINE o LINE sono polimorfiche Anche i tandem repeat (DNA satellite) mostrano polimorfismo (di lunghezza)
Microsatelliti A) D6S282 B) D12S391 C) D21S11 La maggior parte dei microsatelliti ha unità di 1, 2 o 4 nucleotidi
La variabilità del DNA satellite è dovuta principalmente a due meccanismi: Ricombinazione meiotica tra ripetizioni male appaiate Slittamento della DNA polimerasi
Principale meccanismo per la variabilità dei minisatelliti
Slittamento della polimerasi Principale meccanismo per la variabilità dei microsatelliti (STRP)
I microsatelliti polimorfici o STRPs sono lo strumento più utillizzato per studi di famiglie o analisi forensi per l ampio numero di alleli presenti nella popolazione
Le CNV su larga scala sono molto frequenti Le CNV individuate citogeneticamente generalmente sono patogeniche Solo 3 tipi di CNV di tandem repeat sono rilevabili con la citogenetica: 1. Variazioni di dimensioni dell eterocromatina centromerica dei chr 1, 9 e 16, e del Yq
2. Variazioni di lunghezza e morfologia del braccio p dei cromosomi acrocentrici (13, 14, 15, 21 e 22) satellite
3. Siti fragili (cromatina non superavvolta) normali o patologici (FRAXA, FRAXE). Nel genoma umano di individui sani sono circa 120. Si possono evidenziare coltivando le cellule in condizioni restrittive per la sintesi di DNA (carenza di timidina, afidicolina, ecc.) Sito fragile FRAXA (patologico)
Le tecniche di CGH array hanno evidenziato molte varianti tra genomi di persone (apparentemente) normali/sane Il campione di 269 individui usato per HapMap ha individuato1447 regioni con CNV di almeno 1kb Gli SNP sono più numerosi, ma CNV sono le principali responsabili delle differenze nucleotidiche tra genomi
Il genoma di Craig Venter confrontato con il RHG: 3.2 milioni di SNPs 290,000 indel in eterozigosi (1-571bp) 559,000 indel in omozigosi (1-82,711bp) 90 grandi inversioni 62 CNV di sequenze ad alto numero di copie Per un totale di 12,290,978 nt differenti da RHG 44% di geni con varianti di seq 17% proteina alterata (317 geni malattia)
Malattie monogeniche o mendeliane: Un certo genotipo a un locus è necessario e sufficiente perché il carattere sia espresso OMIM database: www.nci.nlm.nih.gov/omim Circa 20.000 voci tra geni sequenziati, caratteri associati a geni noti e caratteri ereditati in modo mendeliano per i quali non è noto il gene
.ma la maggior parte delle malattie umane non è mendeliana Più è complesso il pathway tra DNA e fenotipo meno probabile è che mostri un pattern di ereditarietà mendeliano: Polimorfismi del DNA (spesso nessun effetto fenotipico) Varianti di proteine (mobilità, attività, ecc.) Difetti dello sviluppo (palatoschisi, spina bifida ecc.) Tratti comportamentali (IQ, schizofrenia, ecc.)
Caratteri non-mendeliani: più loci, con il contributo più o meno grande dell ambiente (multifattoriali) Oligogenici Poligenici Locus principale + background poligenico
Loci che controllano i caratteri non-mendeliani Caratteri dicotomici Geni di suscettibilità Caratteri quantitativi Loci dei tratti quantitativi (QTLs) Familiarità senza pattern mendeliano
Patologie comuni (es. diabete) hanno un eziologia molto eterogenea: Mendeliana Ambientale Multifattoriale Malattie complesse
Per le malattie mendeliane, dagli anni 90 in poi sono stati identificati numerosi geni associati a malattie mendeliane. Nell era post-genomica la possibilità di identificare genimalattia a eredità mendeliana dipende quasi esclusivamente dalla disponibilità di famiglie informative L identificazione delle basi genetiche della suscettibilità alle malattie complesse comuni è invece tuttora una sfida
Per le malattie mendeliane si possono usare due tipi di approcci: Clonaggio posizionale Clonaggio indipendente dalla posizione
Il clonaggio posizionale Il gene-malattia viene identificato conoscendo esclusivamente la sua posizione cromosomica approssimativa Questo approccio richiede la combinazione di vari tipi di studi, e diversi passaggi per arrivare al risultato
Non più necessario (banche dati)
Esempi di geni-malattia identificati mediante clonaggio posizionale Distrofia muscolare di Duchenne (XR) Fibrosi cistica (AR)
Il gene della Distrofina si estende per oltre 2 Mb, contiene 79 esoni e produce un trascritto di 14 kb, che codifica una proteina di 3685 aa (427 kda). Solo lo 0.3% della sequenza genomica è presente sul trascritto maturo. La sua posizione X-linked ha facilitato il clonaggio nei maschi affetti.
Il clonaggio della Distrofina è un esempio di come l esistenza di rari pazienti con anomalie cromosomiche possa facilitare il clonaggio posizionale. Due gruppi hanno utilizzato due diversi tipi di pazienti: Lou Kunkel al Children s Hospital di Boston studiò un ragazzo (BB), affetto da DMD e altre patologie, e con una delezione Xp21 visibile citogeneticamente.
Sindrome da geni contigui: DMD, malattia granulomatosa cronica, retinite pigmentosa, fenotipo di McLeod e ritardo mentale. Il DNA del paziente fu utilizzato per clonaggio sottrattivo dal DNA di un individuo sano della sequenza corrispondente alla delezione. Vennero identificati 8 cloni che non ibridizzavano col DNA di BB, uno dei quali corrispondeva ad una zona che mostrava microdelezioni nel 7% di pazienti solo DMD e con cariotipo normale.
Ron Worton, a Toronto, utilizzò un altro tipo di pazienti: donne affette da DMD a causa di traslocazioni X;autosoma, rarissime (20-30 in tutto il mondo) L inattivazione dell X può rendere affetta una femmina eterozigote se il gene viene rotto dal breakpoint
In ogni paziente l autosoma coinvolto era diverso, ma il breakpoint sull X era sempre lo stesso (Xp21) Una traslocazione in particolare Xp;21p, grazie alla presenza nel braccio corto del 21 di geni ripetuti per rrna, rese possibile l isolamento: Worton cercò cloni che contenessero sia rrna che sequenze derivate dall X, e identificò cosi la regione X-J, cioè il breakpoint. Da questo partì per fare chromosome walking, e identificò un contig che copriva la regione. Con subcloni del contig analizzò banche di cdna dalle quali isolò un cdna contenente i primi 16 esoni della Distrofina
La sindrome di CHARGE (AD) Coloboma, Heart defects, Atresia of the choanae, Retardation of growth and developmental delay, Genital anomalies and Ear anomalies Prima del clonaggio del gene si conoscevano pazienti con anomalie cromosomiche, ma molto diverse tra loro L array CGH sul DNA di due pazienti rivelò che uno aveva una delezione di 5Mb sul cromosoma 8q12
La regione deleta era anche il breakpoint sul cromosoma 8 in un individuo affetto con traslocazione 8;6, che in reltà aveva anche due microdelezioni, inclusa una regione di 2,3 Mb in comune col primo paziente Tra i 9 geni coperti dalle delezioni, CHD7 (chromo-domain helicase DNA-binding protein 7) risultò avere mutazioni puntiformi in oltre il 60% dei pazienti senza delezioni
I fattori di suscettibilità alle malattie complesse non possono essere identificati con approcci posizionali Per questi geni si usano analisi di associazione tra marcatori (SNP) e malattia Questi studi identificano blocchi aplotipici, cioè regioni di linkage disequilibrium Malattia comune-variante comune