Paolo Oliveri SPETTROSCOPIA NIR E CHEMIOMETRIA Genova, 15 febbraio 2008
TECNOLOGIA STRUMENTI Wilhelm Herschel 17 marzo 1800 Prime applicazioni 1940-1950 CHEMIOMETRIA FDA lincomicina in soia 1986
SPETTRO IR SPETTRO NIR
CHEMIOMETRIA Oi Original i lspectra INFORMAZIONE UTILE All Spectra 0.8 nce 0.6 Reflecta 0.4 0.2 5000 6000 7000 8000 9000 1/cm Nircal: unname d 04.06.99 15:03:11 Jansen QUALITATIVA QUANTITATIVA SPETTRO NIR
CHIMICA TEORICA CHEMIOMETRIA MODELLI MATEMATICI HARD SOFT FITTING PREDICTION ABILITY ABILITY Validità della teoria Valutazione di quantità fisiche, chimiche, biologiche
Risposta QUALITATIVA CLASSIFICAZIONE MODELLAMENTO Da dove vengo? 1) Italia 2) Francia 3) Spagna 4) Ungheria Io sono un vino ungherese Vero Falso
Risposta QUALITATIVA CLASSIFICAZIONE MODELLAMENTO
Risposta QUALITATIVA CLASSIFICAZIONE MODELLAMENTO Diagnostica medica (sani-malati) Provenienza geografica Natura chimica Controllo di qualità Denominazione di origine Genuinità
Risposta QUANTITATIVA assorbanza MODELLO intercetta α pendenza concentrazione
Risposta QUANTITATIVA REGRESSIONE MULTIVARIATA y = b 0 + b 1 x 1 + b 2 x 2 +. + b (m-1) x (m-1) m n y = X. + b n n f y = Xb + f m
Risposta QUANTITATIVA REGRESSIONE MULTIVARIATA DETERMINAZIONE DI Quantità chimiche Quantità fisiche Valutazioni sensoriali
Risposta QUANTITATIVA REGRESSIONE MULTIVARIATA M.C. Ortiz, L.A. Sarabia, R. García-Rey and M.D. Luque de Castro, Anal. Chim. Acta 558 (2006) 125
Risposta QUANTITATIVA REGRESSIONE MULTIVARIATA Multivariate Linear Regression (MLR) Metodi biased : Principal Components Regression (PCR), Partial Least Squares (PLS),...
Risposta QUANTITATIVA REGRESSIONE MULTIVARIATA PARAMETRI DI VALUTAZIONE DEL MODELLO SDEP ν χ < σ < SDEP ν χ 2 2 97.5 2.5 SDEP è una quantità sperimentale affetta da errore dovuto a: Campionamento Tecnica di validazione
SVILUPPO DEL MODELLO SCELTA CAMPIONI Absorb bance 0.20 0.15 0.10 0.05 0.00-0.05 <50 μm 63 μm 88 μm 113 μm 138 μm 163 μm 188 μm 225 μm 275 μm 350 μm 450 μm 1200 1400 1600 1800 2000 2200 2400 Wavelength (nm) a a a... a a a a... a a a a... a............... a a a... a 11 12 13 1m 21 22 23 2m 31 32 33 3m n1 n2 n3 nm PRETRATTAMENTO SPETTRI NIR MATRICE DATI SELEZIONE VARIABILI - COMPATTAMENTO INTERPRETAZIONE E UTILIZZO MODELLO VALIDAZIONE MODELLO COSTRUZIONE MODELLO
Scelta dei CAMPIONI Supermarket design Scelta di campioni rappresentativi
Scelta di campioni rappresentativi Rappresentatività geografica Densità di produzione
DISEGNO SPERIMENTALE PER LA CALIBRAZIONE SCELTA RANDOM KENNARD-STONE DESIGN
DISEGNO SPERIMENTALE PER LA CALIBRAZIONE
SPETTRO 1 SPETTRO 2 SPETTRO 3... SPETTRO n MATRICE DATI: λ 1 λ 2 λ 3 λ m... a a a... a a a a... a a a a... a............... a a a... a 1 2 3 11 12 13 1m 21 22 23 2m 31 32 33 3m n1 n2 n3 nm
PRETRATTAMENTO PRETRATTAMENTO ADEGUATO
PRETRATTAMENTO PRETRATTAMENTO INADEGUATO
SPETTRI NIR 0.20 bance Absor 0.15 0.10 0.05 <50 μm 63 μm 88 μm 113 μm 138 μm 163 μm 188 μm 225 μm 275 μm 350 μm 450 μm LIGHT SCATTERING 0.00 INFORMAZIONE DOVUTA ALLO STATO FISICO DEI CAMPIONI -0.05 1200 1400 1600 1800 2000 2200 2400 Wavelength (nm)
Pendenza/curvatura linea di base Light Scattering
SNV (Standard d Normal Variate) x x x iv i * iv = si
MSC (Multiplicative l Scatter Correction) xiv = ai + bi xv x x a iv i * iv = bi
EMSC (Extended Multiplicative Scatter Correction) 2 xiv ai ci v di v xiv = ai + bi xv + ci v+ di v x* iv = b i 2
ELMSC (Extended Logaritmic Multiplicative Scatter Correction) x = a + b x + c log( v) iv i i v i x x a c log( v ) b iv i i * iv = i
Derivate
SELEZIONE DELLA INFORMAZIONE UTILE
SCELTA DEI PREDITTORI RILEVANTI SELECT ISE UVE-PLS IVS-PLS IPW-PLSPLS AVS-PLS GOLPE LASSO GA MUT
Il COMPATTAMENTO dell informazione Componenti Principali (PC) Trasformata di Fourier Wavelets
È fondamentale valutare l ABILITÀ PREDITTIVA di un modello TRAINING SET: Campioni utilizzati per sviluppare il modello. EVALUATION SET: Campioni non impiegati nella costruzione del modello, ma utilizzati per valutarne l abilità predittiva. (Dev essere nota la loro classe di appartenenza o il loro valore della variabile risposta).
Strategie t per creare l EVALUATION SET: SINGLE EVALUATION SET CROSS VALIDATION (CV) LEAVE ONE OUT (LOO)
CROSS VALIDATION GRUPPO 1: GRUPPO 2: GRUPPO 3: Evaluation Set Training Set CAMPIONE 1 CAMPIONE 1 CAMPIONE 1 CAMPIONE 2 CAMPIONE 2 CAMPIONE 2 CAMPIONE 3 CAMPIONE 3 CAMPIONE 3 CAMPIONE 4 CAMPIONE 4 CAMPIONE 4 CAMPIONE 5 CAMPIONE 5 CAMPIONE 5 CAMPIONE 6 CAMPIONE 6 CAMPIONE 6 CAMPIONE 7 CAMPIONE 7 CAMPIONE 7 CAMPIONE 8 CAMPIONE 8 CAMPIONE 8 CAMPIONE 9 CAMPIONE 9 CAMPIONE 9 CAMPIONE 10 CAMPIONE 10 CAMPIONE 10 CAMPIONE 11 CAMPIONE 11 CAMPIONE 11 CAMPIONE 12 CAMPIONE 12 CAMPIONE 12 CAMPIONE 13 CAMPIONE 13 CAMPIONE 13 CAMPIONE 14 CAMPIONE 14 CAMPIONE 14 CAMPIONE 15 CAMPIONE 15 CAMPIONE 15
La MANUTENZIONE del modello Derive strumentali Aggiornamento del modello: Introduzione di nuovi campioni
TRASFERIMENTO DELLA CALIBRAZIONE Strumento master Strumenti slaves MODELLO Slope p and bias correction
FUSIONE DI SEGNALI DI NATURA DIVERSA NIR V1 V2 V3 Vn UV-VIS HS-MS Sample 1 Sample 2 Sample 3..... Sample n M samples,variables
HS_ MS UV-VIS NIR 45-250 m/z Profili di riga 400-715 nm Derivata prima 4380-10000 cm 1 1 Derivata prima PC 1 PC 2 PC 3.. PC n PC 1 PC 2 PC 3.. PC n PC 1 PC 2 PC 3.. PC n a a a b c b c b c a b c PC 1 PC 2 PC 1 PC 2 PC 1 PC 2
FUSIONE a b c V 1 V 2 V 3.. V n a b c V 1 V 2 V 3.. V n a b c V 1 V 2 V 3.. V n a b c V 1 V 2 V 3.. V n V 1 V 2 V 3.. V n V 1 V 2 V 3.. V n selezione di variabili a b c V 1 V 2 V 3 V 4 V 5 V 6 V n
GRAZIE PER L ATTENZIONE