Caratteri quantitativi o metrici Vengono descritti mediante quantità di una unità di misura appropriata. Devono essere misurati Caratteri a variabilità continua In un gruppo di individui, variano tra un valore minimo ed uno massimo assumendo tanti valori intermedi; non sono individuabili gruppi nettamente distinti Caratteri multifattoriali o poligenici Sono sotto il controllo di una pluralità di geni Esempio: Altezza di 20 piante di pomodoro Numero della Varianti variante 1 77 2 73 3 70 4 74 5 84 6 62 7 68 8 80 9 66 10 59 11 57 12 80 13 69 14 66 15 90 16 70 17 57 18 72 19 67 20 59 Somm400 Scarti Scarti quadrati 7 49 3 9 0 0 4 16 14 196-8 64-2 4 10 100-4 16-11 121-13 169 10 100-1 1-4 16 20 400 0 0-13 169 2 4-3 9-11 121 0 1564 N individui 20 n Media 70 x = [( x ) / n] Varianza 82,3 s 2 = (x - x ) 2 /n-1 Deviazione standard 9,07 s = s 2 Errore standard 2,0 ES = s 2 /n = s/ n Coeff. di variabilità 12,96 Intervallo fiduciale della media 10 8 6 4 2 0 Classe Frequenze assolute Frequenze relative <58 2 0,10 59-66 5 0,25 67-74 8 0,40 75-82 3 0,15 >83 2 0,10 <58 59-66 67-74 75-82 >83 CV = s/x 66-74 x ± 2(ES)
Istogrammi di frequenza Distribuzione discontinua Frequenze relative Classi fenotipiche Frequenze relative Distribuzione continua Classi fenotipiche Frequenze relative Classi fenotipiche La curva normale
POPOLAZIONE campionamento CAMPIONE PARAMETRI µ σ inferenza STIME x s σ s µ x Popolazioni con la stessa media e diverse deviazioni standard σ σ µ
Esercitazione 1 Variabilità entro popolazioni e tra popolazioni per un carattere quantitativo Presso la serra sono presenti piantine di peperone di diverse varietà. Le varietà devono essere distinguibili per motivi commerciali, e le caratteristiche morfologiche possono permettere di distinguerle. Vogliamo determinare la variabilità presente per la lunghezza delle foglie nelle singole varietà. 1. A coppie, misurate la lunghezza in mm della prima foglia di 50 piante prese a caso per ciascuna popolazione. 2. Calcolate poi i parametri statistici della popolazione utilizzando Excel, senza utilizzare le funzioni statistiche di excel, ma immettendo manualmente le formule (n, Media, Scarti dalla media, Quadrati degli scarti, Somma delle varianti, Somma degli scarti, Somma dei quadrati degli scarti, Varianza, Deviazione standard, Coefficiente di variazione, Errore standard, Intervallo fiduciale della media. 3. Confrontare la variabilità delle diverse popolazioni. 4. Utilizzando excel, costruite un istogramma di frequenza raggruppando i dati in classi. Definite voi le classi per una rappresentazione efficace della distribuzione della popolazione La natura della variazione quantitativa Il miglioramento genetico ha bisogno di variabilità genetica Le leggi di Mendel spiegano la base della variazione genetica qualitativa fdzf Dobbiamo conoscere la base genetica della variazione quantitativa, quella più interessante sul piano pratico
Autofecondazione e omozigosi F 1 Aa Generazioni segreganti % eterozigoti % omozigoti F 2 ¼ AA ½ Aa ¼ aa 1 1/2 1/2 F 3 F 4 F 5 F 6 1/8 A/4 A/8 aa 1/8 Aa 1/16 Aa 1/32 Aa 2 1/4 3/4 3 1/8 7/8 4 1/16 15/16 5 1/32 31/32 m 1/2 m 1-(1/2) m Autofecondazione e omozigosi 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 1-(1/2 m ) = Per n geni Omozigosi 2 m - 1 2 m 2 m - 1 ( ) n 2 m 1 2 3 4 5 6 7 8 9 10 11 12 n. di generazioni segreganti (m) n. di geni 1 2 5 10 100
Esperimento di Johannsen Fagiolo Varietà Princess 19 19 linee selezione dei più leggeri Autofecondazione selezione dei più pesanti 19 19 semi semi cg 35,1 selezione dei più leggeri selezione dei più pesanti selezione dei più leggeri cg 64,3 selezione dei più pesanti cg 35,8 cg 34,8 cg 63,1 cg 64,9 LINEA PURA Insieme di individui derivati per autofecondazione da un capostipite omozigote
L'esperimento di Johannsen dimostra per la prima volta che la variabilità continua di un carattere quantitativo è dovuta a Cause genetiche e Cause ambientali Rendono la selezione efficace Possono ostacolare la selezione s 2 P = s2 G + s2 E Gli esperimenti di Nilsson-Ehle (1908) Eredità del colore delle cariossidi in frumento P1 P2 F1 F2 1) rosso x bianco rosso 3 rossi : 1 bianco 2) rosso x bianco rosso 3) rosso x bianco rosso 15 63 rossi : 1 bianco rossi : 1 bianco Se 1 coppia allelica controlla il carattere: P AA bianco x AA rosso F1 AA rosso chiaro F2 1/4 AA 1/2 A/4 AA 1/4 bianco 3/4 rosso
Se 2 coppie alleliche controllano il carattere: P AABB bianco x AABB rosso scuro F1 AABB rosso F2 AABB 1/16 AABB AABB ecc. 4/16 AABB AABB AABB AABB ecc. ecc. 6/16 4/16 AABB 1/16 0 1 2 3 4 Gradi del colore 1 bianco : 15 colorati Se 3 coppie alleliche controllano il carattere: P bianco x rosso molto scuro F1 rosso scuro F2 Ecc.. Ecc.. Ecc.. Ecc.. Ecc.. 15 20 15 1 6 6 1 0 1 2 3 4 5 6 Gradi del colore 1 bianco : 63 colorati
1) x 2) x 3) x L'esperimento di Nilsson-Ehle fornisce il primo modello della eredità poligenica di un carattere quantitativo Il fenotipo di un carattere quantitativo è sotto il controllo di Una pluralità di geni Nilsson-Ehle (1908) Ambiente Johannsen (1906) L'esperimento di East (1916) Carattere Lunghezza della corolla in Nicotiana longiflora Specie strettamente autogama P1 P2 n Media mm Coeff. di variabilità F1 P 1 125 43,5 4,3 P 2 88 93,2 2,5 F 1 173 63,5 4,6 F 2 211 67,5 8,8 F2 40 50 60 70 80 90 Lunghezza della corolla, mm
Se la lunghezza della corolla fosse controllata d sola coppia allelica East avrebbe dovuto osservare: P x F 1 40 A = allele plus = 45 mm a = allele minus = 20 mm Differenza tra classi contigue 45 20 = 25 mm 65 90 mm Se la lunghezza della corolla fosse controllata da 2 coppie alleliche East avrebbe dovuto osservare: P x F 1 A = allele plus = 22,5 mm a = allele minus = 10 mm = 90 mm = 40 mm
40,0 52,5 65,0 77,5 90,0 2 coppie alleliche 5 classi fenotipiche Differenza tra classi contigue 22,5 10 = 12,5 mm 3 coppie alleliche 7 classi fenotipiche 4 coppie alleliche 9 classi fenotipiche 5 coppie alleliche 11 classi fenotipiche A = allele plus = 9 mm; a = allele minus = 4 mm Con 5 geni, le differenze tra classi contigue (9-4 = 5 mm) sono troppo piccole per poter assegnare con sicurezza un individuo ad una classe
Risultati attesi nelle generazioni successive 1. Piante F 2 con diversa lunghezza della corolla dovrebbero produrre famiglie F 3 differenti per il carattere, poiché le differenze tra individui in F 2 sono di natura genetica e quindi ereditabili F2 F3 2. In F 3 la variabilità entro famiglia dovrebbe essere compresa tra quella delle popolazioni parentali e F 1 e quella della F 2 3. Poiché l autofecondazione porta all omozigosi, la variabilità nelle generazioni successive alla F 2 dovrebbe essere uguale o inferiore a quella della famiglia da cui è stata estratta la pianta madre. Corolla pianta madre (mm) n Media Deviazione standard Coeff. di variabilità P 1-125 43,5 1,8 4,3 P 2-88 93,2 2,3 2,5 F 1-173 63,5 2,9 4,6 F 2-211 67,5 5,9 8,8 F 3-1 46 143 53,5 3,7 7,0 F 3-2 50 147 50,2 3,2 6,3 F 3-3 82 162 80,2 4,8 5,9 F 4-1-1 44 184 45,7 2,4 5,2 F 4-2-1 43 189 46,3 1,9 4,0 F 4-3-1 85 195 82,3 3,3 4,0 F 5-2-1-1 41 161 42,0 2,3 5,5
IPOTESI MULTIFATTORIALE Modello di Fisher, 1918 I caratteri quantitativi sono sotto il controllo di una pluralità di geni mendeliani che agiscono additivamente (modello additivo) L effetto di ciascun gene è molto piccolo e non può essere seguito individualmente (modello infinitesimale) I geni che controllano un carattere quantitativo godono delle stesse proprietà di quelli che controllano i caratteri qualitativi (additività, dominanza, epistasi) I caratteri quantitativi sono influenzati dalle condizioni ambientali Geneticists have for many years been aware that this model is a simplification that does not accurately reflect the true nature of biological systems. However, because the research and commercial applications that adhered to this theory have remained productive despite this, no major efforts have been made to explore more biologically connected alternatives Nelson et al. 2013 A century after Fisher: time for a new paradigm in quantitative genetics Trends in Genetics-1090
E' possibile studiare e selezionare i caratteri quantitativi come se fossere mendeliani? Sax (1923): il colore del seme in fagiolo come marcatore per il peso Thoday (1961): modello multi-marcatore per la selezione Ad esempio: Il gene G contribuisce al controllo di un carattere quantitativo. L allele G è quello utile. Abbiamo incrociato due individui omozigoti contrastanti per il carattere e abbiamo ottenuto una popolazione segregante G M g m 1 cm Se vogliamo selezionare l allele G nella popolazione segregante, disporre di marcatori molecolari (MM) associati strettamente ad esso ci permetterebbe di selezionare direttamente il genotipo con grande precisione (in questo esempio, gli individui che portano M portano anche G, con un errore dell 1%). Se disponiamo di MM per tutti i geni che controllano il carattere quantitativo, o per la maggior parte di essi, possiamo selezionarlo con facilità, selezionando le combinazioni di alleli utili per tutti i MM. Selezione assistita da marcatori (Marker-Assisted Selection, MAS) Nuovi metodi per lo studio dei caratteri quantitativi I loci che controllano caratteri quantitativi (Quantitaive Trait Loci, QTL*) oggi possono essere individuati mediante l'aiuto di marcatori molecolari che possono permettere di realizzare: 1. Mappaggio di QTL mediante mappe genetiche classiche : 2. Mappaggio per associazione, Association mapping o Linkage disequilibrium (LD) mapping Individuati nel genoma, con esperimenti di mappaggio, i QTL, per lo meno quelli con gli effetti maggiori, diventa possibile la MAS. Questa ha diverse modalità, tra cui la più avanzata è la Selezione genomica (moduli Termolino e altri) Mettiamo ora le basi di questi metodi * Termine QTL introdotto da Geldermann, 1975 (TAG 46:319-330)
1. Mappaggio di QTL (for dummies) Fase 1. In una popolazione segregante rilevo alcuni caratteri quantitativi (Q1, Q2...). Costruisco una mappa di associazione di marcatori molecolari Individui popolazio ne segregante (centinaia) Marcatori (centinaia) Car. quantitativi A B C D... Q1 Q2... 1 0 1 0 1... 121 32 2 1 1 1 0... 123 34 3 1 0 0 1... 138 43 4 1 0 0 1... 111 21 5 0 1 0 0... 99 23 6 0 0 1 0... 123 28 7 1 1 1 1... 141 29 8 0 0 1 0... 130 30............... Marcatore A Allele Media Q1 0 118,25 1 145,00 Se la differenza tra i due valori medi è statisticamente significativa (T-test, o ANOVA, o regressione), il marcatore è associato ad un QTL che contribuisce a Q1 Nota: Questi 20 genotipi sono RIL! Collard et al. 2005
Mappaggio di QTL Fase 2. Tra tutti i marcatori significativi, si selezionano marcatori indipendenti mediante regressione multipla; otteniamo così il numero di regioni cromosomiche indipendenti coinvolte nel controllo del carattere Fase 3. Si rifà l ANOVA con i soli marcatori indipendenti per determinare il loro effetto singolo e cumulativo sulla varianza del carattere quantitativo e le eventuali interazioni Si ottiene così una stima del numero minimo di loci, o regioni cromosomiche, coinvolti e del loro peso nel determinare il carattere Limitazioni - Ci vogliono molti individui e molti marcatori - QTL identificati in una determinata popolazione possono non essere trovati in altre popolazioni - QTL identificati in un determinato ambiente possono non essere trovati in altri ambienti, anche nella stessa popolazione: necessaria replicazione in più ambienti/anni - E' difficile e costoso arrivare tanto vicino al gene da poterlo identificare Mappaggio di QTL Per marcatori singoli o per intervalli (interval mapping) Esempio Produzione di granella in mais, reincrocio tra due linee inbred di mais (B73 x Mo17) x Mo17 Un QTL è stato individuato tra i marcatori C256 e C449, vicino al locus dell isoenzima AMP3 In ordinata c'è Il LOD score In ascissa le distanze di mappa (intervalli) in cm Non definito! Falconer e Mackay, Introduction to quantitative genetics, 1996
Il LOD (Log of Odds) score misura la probabilità della posizione del QTL E' infatti il logaritmo del rapporto tra due probabilità (Odds ratio): L probabiltà dei dati osservati sotto l ipotesi della presenza di un QTL in una certa posizione di mappa L 0 probabilità dei dati osservati sotto l ipotesi di assenza del QTL. La posizione attribuita al QTL sulla mappa genetica è quella che rende massimo il valore del LOD. Il valore soglia di LOD per poter affermare di aver individuato un vero QTL è di solito pari o superiore a 3, corrispondente a L:L 0 > 1000:1 Si utilizzano software di mappaggio appositi (MapMaker-QTL, MapQTL, ecc.) Il contributo di ciascun QTL alla varianza fenotipica della popolazione si calcola sulla base dell'effetto medio della sostituzione allelica (v. modello di Mather) Infine, la varianza totale spiegata dall'insieme dei QTL si ottiene sommando gli effetti di tutti i loci 2. Mappaggio per associazione, Association mapping o Linkage disequilibrium (LD) mapping Nella forma più avanzata si parla di Genome Wide Association Studies (GWAS) e Selezione genomica (Genomic selection, GS) Per capire questi metodi bisogna avere le basi della genetica delle popolazioni
Nota Expression QTL (eqtl) La tecnologia microarray (DNA chip) permette di misurare l'espressione di migliaia di geni in un numero anche elevato di individui. Il livello di espressione (trascrizione) dei geni di individui di una popolazione segregante sono trattati come fenotipi di caratteri quantitativi. Essi possono quindi essere mappati rispetto a marcatori molecolari. In questo modo si individuano loci (eqtl) che influenzano il livello di espressione di ciascun gene, che possono essere in cis e in trans. Si tratta di esperimenti in tutto simili a quelli che individuano QTL, ma i fenotipi sono costituiti dai livelli di trascrizione di molti geni, anche migliaia. Narain P. Mol Breeding (2010) 26:135 143 Sommario I caratteri più importanti economicamente sono quelli quantitativi Per studiarli ci vuole la statistica... I modelli statistici (modello multifattoriale) pur semplificando la realtà sono di utilità pratica nel miglioramento genetico Il mappaggio dei marcatori molecolari ci aiuta a dissezionare il controllo genetico dei caratteri quantitativi e individuare QTL La genetica delle popolazioni ci permetterà di capire l'effetto della selezione e ci aiuta a isolare i geni (lezione seguente)