Analisi, validazione e rappresentazione dei dati nell analisi descrittiva. e non solo

Documenti analoghi
Metodi Multivariati: Analisi delle Componeti Principali (PCA)

Teoria e tecniche dei test. Concetti di base

Media: è la più comune misura di tendenza centrale. Può essere calcolata per variabili numeriche.

Nozioni di statistica

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di dispersione

STATISTICHE DESCRITTIVE Parte II

Confronto fra gruppi: il metodo ANOVA. Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23

Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii

Statistica descrittiva II

Modelli descrittivi, statistica e simulazione

Statistica di base per l analisi socio-economica

Dispensa di Statistica

Esplorazione dei dati

1/55. Statistica descrittiva

La variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

1/4 Capitolo 4 Statistica - Metodologie per le scienze economiche e sociali 2/ed Copyright 2008 The McGraw-Hill Companies srl

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza

STIME STATISTICHE. Consideriamo il caso della misura di una grandezza fisica che sia affetta da errori casuali. p. 2/2

Esercitazione 1.3. Indici di variabilità ed eterogeneità. Prof.ssa T. Laureti a.a

Sintesi dei dati in una tabella. Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6)

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. Analisi dei dati quantitativi :

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. Analisi dei dati quantitativi :

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25

Indicatori di Posizione e di Variabilità. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica

Università del Piemonte Orientale. Corso di laurea specialistica in biotecnologie mediche. Corso di Statistica Medica. Analisi dei dati quantitativi :

Analisi della varianza

Statistica Descrittiva Soluzioni 6. Indici di variabilità, asimmetria e curtosi

L Analisi della Varianza ANOVA (ANalysis Of VAriance)

La variabilità. Monia Ranalli. Ranalli M. Variabilità Settimana # 2 1 / 14

Indici di. tendenza centrale: posizione: variabilità e dispersione: -quantili -decili -percentili. -Media -Moda -Mediana

p. 1/2 STIME STATISTICHE Consideriamo il caso della misura di una grandezza fisica che sia affetta da errori casuali.

Corso di Laurea: Diritto per le Imprese e le istituzioni a.a Statistica. Statistica Descrittiva 3. Esercizi: 5, 6. Docente: Alessandra Durio

Nota didattica sulla validazione e l interpretazione dei dati raccolti per la definizione del profilo sensoriale dei prodotti alimentari.

La variabilità. Antonello Maruotti

Elementi di Statistica


Inferenza statistica Donata Rodi 04/10/2016

L Analisi delle Componenti Principali applicata a dati sensoriali derivanti dall analisi descrittiva.

Corso di Laurea in Economia Aziendale. Docente: Marta Nai Ruscone. Statistica. a.a. 2015/2016

tabelle grafici misure di

Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica. Analisi dei dati quantitativi : Analisi della varianza

Misure di dispersione (o di variabilità)

Statistica. Lezioni: 7, 8. Statistica Descrittiva Univariata 3

INDICE PARTE METODOLOGICA

Scale di Misurazione Lezione 2

Analisi della varianza a una via

Capitolo 3 Sintesi e descrizione dei dati quantitativi

I 5 principi dell estimo

Statistica descrittiva

Le varianze parziali così trovate vengono confrontate fra di loro per mezzo di un test denominato test F

Quanti soggetti devono essere selezionati?

CORSO DI LAUREA IN INFERMIERISTICA. LEZIONI DI STATISTICA Parte II Elaborazione dei dati Variabilità

Matematica Lezione 22

Sperimentazioni di Fisica I mod. A Statistica - Lezione 2

Statistica descrittiva

Statistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione

Corso di Statistica. Variabilità ed eterogeneità. Prof.ssa T. Laureti a.a

Università di Cassino Corso di Laurea in Scienze Motorie Biostatistica Anno accademico 2011/2012

Metodi statistici per la ricerca sociale Capitolo 11. Regressione Multipla e Correlazione

Nel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0.

ESERCIZI DI STATISTICA SOCIALE

Statistica multivariata Donata Rodi 17/10/2016

numeri 2 6 µ = n x p = 100 x 0,5 = 50 σ = n xp x q = 100*0,5*0,5 = 5 Test 14-GEN-2016

Università del Piemonte Orientale. Corsi di Laurea Triennale di Area Tecnica. Corso di Statistica e Biometria

Campo di Variazione Costituisce la misura di

Soluzioni prova scritta di Complementi di Probabilità e Statistica (29/06)

INDICATORI DI TENDENZA CENTRALE

Analisi della varianza

TRACCIA DI STUDIO. Indici di dispersione assoluta per misure quantitative

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell

Grafici e tabelle permettono di fare valutazioni qualitative, non quantitative. E necessario poter sintetizzare i dati attraverso due importanti

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di tendenza centrale

Università del Piemonte Orientale. Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Statistica Descrittiva Variabili numeriche

TEST 12/17 GEN I seguenti dati sono stati elaborati secondo uno schema sperimentale

Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza.

Corso di Sistemi di Gestione per la Qualità (SGQ) AA

Statistica Applicata Corso di Laurea in Scienze Naturali a. a. 2016/2017

Parte 1 : Inferenza. Varianza nota test Z. Distribuzioni asintotiche dei test. Varianza ignota test t ad un campione

Quanti valori posso trovare (in percentuale) che siano maggiori di 4?

Elementi di Psicometria (con laboratorio software 1)

STATISTICHE DESCRITTIVE

esercitazione1 12/10/2015

INDICATORI DI TENDENZA CENTRALE

Matematica con elementi di Informatica

INDICATORI DI TENDENZA CENTRALE

Premessa: la dipendenza in media

Statistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione

( ) ( ) ( e la probabilità che si verifichi un evento compreso tra c e b a < c < b sarà data da:

Prato stabile e caratteristiche del Parmigiano Reggiano

Corso di Laurea triennale Tecniche della Prevenzione PERCORSO STRAORDINARIO 2007/08. Insegnamento di STATISTICA MEDICA. Modulo II

Introduzione alla statistica

University of Messina, Italy

L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale

3/19/18. Obiettivo: Descrizione di un Istogramma

Transcript:

Analisi, validazione e rappresentazione dei dati nell analisi descrittiva. e non solo

Descrizione sensoriale del profilo aromatico di 11 campioni di vino attraverso la valutazione dell intensità dell odore percepito per via orto nasale di 8 descrittori. Panel composto da 9 giudici; 3 repliche di valutazione: ESEMPIO di DATA SET da ANALISI DESCRITTIVA Judge code sample Judges Repetition mora ciliegia prugna secca legno vaniglia erba piselli asparago 3 A Paolo Be 1 6 4 1 3 6 1 1 1 5 A Alessandro Ca 1 5 3 3 4 1 1 1 1 7 A Alessio Gi 1 3 4 5 2 2 4 2 4 8 A Lorenzo Ma 1 3 2 3 5 2 7 6 1 9 A Andrea Ma 1 5 4 3 7 6 7 5 3 10 A Enrico Ne 1 5 4 4 6 4 8 7 8 11 A Yuri Ro 1 6 5 4 7 6 1 1 1 12 A Alessandra Vi 1 1 1 1 3 3 1 1 1 13 A Francesca Vi 1 7 6 6 5 5 2 2 3 3 A Paolo Be 2 4 3 3 5 8 1 1 1 5 A Alessandro Ca 2 6 4 4 1 3 1 1 1 7 A Alessio Gi 2 3 4 3 3 3 5 5 2 8 A Lorenzo Ma 2 1 3 1 1 1 1 1 1 9 A Andrea Ma 2 3 4 3 7 6 2 2 2 10 A Enrico Ne 2 4 4 5 4 4 2 3 1 11 A Yuri Ro 2 3 5 5 3 5 1 1 1 12 A Alessandra Vi 2 1 4 1 3 2 1 1 1 13 A Francesca Vi 2 5 3 3 4 5 6 2 5 3 A Paolo Be 3 5 4 7 5 6 1 1 1 5 A Alessandro Ca 3 6 1 6 1 4 1 1 1 7 A Alessio Gi 3 3 5 4 3 3 2 2 3 8 A Lorenzo Ma 3 1 1 5 1 5 7 1 1 9 A Andrea Ma 3 3 3 4 7 5 3 2 4 10 A Enrico Ne 3 5 4 4 6 4 7 6 6 11 A Yuri Ro 3 4 6 3 2 4 1 1 1 12 A Alessandra Vi 3 3 3 3 5 2 3 4 5 13 A Francesca Vi 3 4 3 3 5 4 8 4 5 Media X1 X2 X3..Xn Per ogni prodotto ed ogni attributo/descrittore è possibile calcolare la media del panel considerando tutti i giudici e tutte le repliche

Medie di intensità (9 giudici x 3 repliche) per ogni attributo e per ogni campioni Attributi Mora Ciliegia Prugna Legno Vaniglia Erba Piselli Asparago Campioni A 3.81 3.58 3.61 4.03 4.25 3.03 2.36 2.44 B 3.92 3.86 3.86 5.69 5.5 1.72 1.78 1.86 La variabilità tra le medie dei campioni per un dato C 3.25 3.47 3.25 4.00 3.83 3.56 3.92 4.69 D 3.72 3.83 3.94 4.64 4.67 1.56 1.89 1.83 attributo indica che i campioni differiscono tra loro. E 4.53 4.33 3.56 5.89 5.53 1.47 1.58 1.53 I campioni rappresentano quindi una SORGENTE di F 4.00 3.69 3.78 4.19 4.19 2.11 2.14 2.44 G 4.06 3.83 5.00 3.28 3.39 1.97 1.92 2.19 VARIABILITA del dato Intensità media. H 4.00 3.69 4.00 4.33 3.86 1.86 1.78 1.83 Il numero di campioni corrisponde al numero di I 3.47 3.25 3.72 3.92 3.33 2.28 2.36 2.64 L 4.75 4.67 4.47 3.06 3.06 2.06 2.06 2.25 TRATTAMENTI o LIVELLI della sorgente di M 3.14 2.81 2.72 4.25 3.97 3.75 4.64 4.42 variabilità.

Medie di intensità (9 giudici x 3 repliche) per ogni attributo e per ogni campioni Campioni La variabilità traattributi le medie di inetnsità dei campioni per un Mora Ciliegia Prugna Legno Vaniglia Erba Piselli Asparago dato attributo è data da diverse SORGENTI di A 3.81 3.58 3.61 4.03 4.25 3.03 2.36 2.44 VARIABILITA ognuno a diversi livelli: B 3.92 3.86 3.86 5.69 5.5 1.72 1.78 1.86 C 3.25 3.47 3.25 4.00 3.83 3.56 3.92 4.69 D 3.72 3.83 3.94 4.64 4.67 1.56 1.89 1.83 E 4.53 4.33 3.56 5.89 5.53 1.47 1.58 1.53 F 4.00 3.69 3.78 4.19 4.19 2.11 2.14 2.44 G 4.06 3.83 5.00 3.28 3.39 1.97 1.92 2.19 H 4.00 3.69 4.00 4.33 3.86 1.86 1.78 1.83..e relative interazioni Campioni; Giudici; Repliche I 3.47 3.25 3.72 3.92 3.33 2.28 2.36 2.64 Campioni x Giudice; L 4.75 4.67 4.47 3.06 3.06 2.06 2.06 2.25 M 3.14 2.81 2.72 4.25 3.97 3.75 4.64 4.42 Campione x Replica; Replica x Giudice

La validazione dei dati effetto dei campioni effetto dei giudici effetto delle repliche Validazione statistica effetto dell interazione campione x giudice effetto dell interazione replica x giudice effetto dell interazione replica x campione

Stima della dispersione rispetto al valore centrale Stima Computo Caratteristiche Intervallo Interquartile Varianza Differenza tra il massimo ed il minimo valore di una serie di dati. E la distanza tra il primo ed il terzo quartile di una distribuzione ordinata di dati. E l intervallo del 50% della distribuzione. σ 2 ; S 2 E fortemente dipendente dal numero delle osservazioni. Non evidenzia i valori più frequenti della serie. E ovviamente influenzato da valori estremi Non è sensibile ai valori estremi della serie. La rappresentazione della tendenza centrale con l interquartile richiede comunque il computo della media E una delle stime più utilizzate della dispersione dei dati intorno alla media. Deviazione Standard σ; S E la radice quadrata della varianza 1σ Indica l intervallo di una curva normale in cui cade il 68.26% dei casi osservati. 2σ Indica l intervallo di una curva normale in cui cade il 95.44% dei casi osservati. 3σ Indica l intervallo di una curva normale in cui cade il 99.72 % dei casi osservati.

Medie di intensità (9 giudici x 3 repliche) per ogni attributo e per ogni campioni Attributi Mora Ciliegia Prugna Legno Vaniglia Erba Piselli Asparago Campioni A 3.81 3.58 3.61 4.03 4.25 3.03 2.36 2.44 B 3.92 3.86 3.86 5.69 5.5 1.72 1.78 1.86 La variabilità in una serie di dati si stima attraverso il C 3.25 3.47 3.25 4.00 3.83 3.56 3.92 4.69 D 3.72 3.83 3.94 4.64 4.67 1.56 1.89 1.83 calcolo della Varianza: E 4.53 4.33 3.56 5.89 5.53 1.47 1.58 1.53 Somma dei Quadrati degli Scarti dalla Media F 4.00 3.69 3.78 4.19 4.19 2.11 2.14 2.44 G 4.06 3.83 5.00 3.28 3.39 1.97 1.92 2.19 Numero delle Osservazioni meno Uno H 4.00 3.69 4.00 4.33 3.86 1.86 1.78 1.83 I 3.47 3.25 3.72 3.92 3.33 2.28 2.36 2.64 L 4.75 4.67 4.47 3.06 3.06 2.06 2.06 2.25 M 3.14 2.81 2.72 4.25 3.97 3.75 4.64 4.42

Logica dell ANALISI della VARIANZA e dell F di Fisher Campioni/Trattamenti A B C oss 1 5 6 7 oss 2 6 7 8 oss 3 7 8 9 media 6 7 8 range 2 2 2 Se le differenze tra i trattamenti, cioè la variabilità TRA le medie dei trattamenti è maggiore della variabilità NEI trattamenti, cioè della variabilità tra i valori in un trattamento, le medie sono significativamente diverse. Al contrario e cioè se la variabilità TRA le medie dei trattamenti è minore o uguale a quella NEI trattamenti, i trattamenti e dunque la sorgente di variabilità non hanno effetto! Campioni/Trattamenti A B C oss. 1 4 6 9 oss. 2 7 7 9 oss. 3 7 8 6 media 6 7 8 range 3 2 3

Data una serie di dati L effetto della sorgente di Campioni/Trattamenti A B C oss 1 5 6 7 oss 2 6 7 8 oss 3 7 8 9 media 6 7 8 range 2 2 2 variabilità «campioni» si stimerà attraverso il calcolo del rapporto tra la varianza TRA i trattamenti e quella NEI trattamenti detta anche ERRORE. Detto rapporto è noto come F di Fisher F = Varianza TRA i Trattamenti Varianza NEI trattamenti (o Errore)

Campioni/Trattamenti A B C k = numero dei trattamenti = 3 oss 1 5 6 7 n = numero di dati per trattamento = 3 oss 2 6 7 8 N = numero totale di dati = k*n = 9 oss 3 7 8 9 Media 6 7 8 7 m = Gran Media = (XA+XB+XC) / 3 Totale 18 21 24 63 T = Gran Totale = TA+TB+TC Varianza TRA TRATTAMENTI Varianza NEI TRATTAMENTI = SS B / k-1 = 6 / 2 = 3 = 6/6 = 1 = SS E / N-kla variabilità TRA le medie dei trattamenti è maggiore della variabilità NEI trattamenti, quindi le medie sono significativamente diverse.

Campioni/Trattamenti A B C k = numero dei trattamenti = 3 oss 1 5 6 7 n = numero di dati per trattamento = 3 oss 2 6 7 8 N = numero totale di dati = k*n = 9 oss 3 7 8 9 Media 6 7 8 7 m = Gran Media = (XA+XB+XC) / 3 Totale 18 21 24 63 T = Gran Totale = TA+TB+TC Somma dei Quadrati Totale = SS T =Σ X 2 - Σ (X) 2 N = Σ X 2 - T 2 N = Σ X 2 - C Somma dei Quadrati Totale = SS T = 453-632 9 = 453-3969 9 = 453 441 = 12 Somma dei Quadrati TRA TRATTAMENTI Somma dei Quadrati NEI TRATTAMENTI T 2 A+ T 2 B + T 2 C 324+441+576 = SS B = - C = - 441 = 6 n 3 T 2 A+ T 2 B + T 2 C 324+441+576 = SS E = Σ X 2 - = 543 - = 6 n 3

Analisi della Varianza ANOVA Source of Variation SS df MS F P-value F crit. Between Groups 6 2 3 3 0.125 5.14 Within Groups 6 6 1 Total 12 8

TWO WAY ANOVA

Significato dell Interazione nell ANOVA

La validazione dei dati effetto dei campioni effetto dei giudici effetto delle repliche Validazione statistica effetto dell interazione campione x giudice effetto dell interazione replica x giudice effetto dell interazione replica x campione

Rappresentazione grafica dei risultati dell ANOVA

Descrizione sensoriale del profilo aromatico di 11 vini attraverso la valutazione dell intensità dell odore percepito per via orto nasale di 8 descrittori. Panel composto da 9 giudici; 3 repliche di valutazione Judge code sample Judges Repetition mora ciliegia prugna secca legno vaniglia erba piselli asparago 3 A Paolo Be 1 6 4 1 3 6 1 1 1 5 A Alessandro Ca 1 5 3 3 4 1 1 1 1 7 A Alessio Gi 1 3 4 5 2 2 4 2 4 8 A Lorenzo Ma 1 3 2 3 5 2 7 6 1 9 A Andrea Ma 1 5 4 3 7 6 7 5 3 10 A Enrico Ne 1 5 4 4 6 4 8 7 8 11 A Yuri Ro 1 6 5 4 7 6 1 1 1 12 A Alessandra Vi 1 1 1 1 3 3 1 1 1 13 A Francesca Vi 1 7 6 6 5 5 2 2 3 3 A Paolo Be 2 4 3 3 5 8 1 1 1 5 A Alessandro Ca 2 6 4 4 1 3 1 1 1 7 A Alessio Gi 2 3 4 3 3 3 5 5 2 8 A Lorenzo Ma 2 1 3 1 1 1 1 1 1 9 A Andrea Ma 2 3 4 3 7 6 2 2 2 10 A Enrico Ne 2 4 4 5 4 4 2 3 1 11 A Yuri Ro 2 3 5 5 3 5 1 1 1 12 A Alessandra Vi 2 1 4 1 3 2 1 1 1 13 A Francesca Vi 2 5 3 3 4 5 6 2 5 3 A Paolo Be 3 5 4 7 5 6 1 1 1 5 A Alessandro Ca 3 6 1 6 1 4 1 1 1 7 A Alessio Gi 3 3 5 4 3 3 2 2 3 8 A Lorenzo Ma 3 1 1 5 1 5 7 1 1 9 A Andrea Ma 3 3 3 4 7 5 3 2 4 10 A Enrico Ne 3 5 4 4 6 4 7 6 6 11 A Yuri Ro 3 4 6 3 2 4 1 1 1 12 A Alessandra Vi 3 3 3 3 5 2 3 4 5 13 A Francesca Vi 3 4 3 3 5 4 8 4 5

Profilo del panel per attributo

ANOVA a due fattori con interazione: Giudici e Campioni

Validazione della performance individuale dei giudici

Rappresentazione grafiche delle performance individuali

GRAFICO p * MSE: FOCUS SU ATTRIBUTI e GIUDICI III IV I OK II Scarsa ripetibilità III scarsa capacità discriminante I II IV Scarsa capacità discriminante e ripetibilità 14.04.2019 26

p -MSE dall ANOVA ad UNA VIA: x GIUDICE

p -MSE dall ANOVA ad UNA VIA: una visione complessiva

*Brillantezza Adesività 9 Granulosità* Colore 5 Pastosità f-vaniglia 1 Dolce* f-burro Acido f-cacao Amaro* *f-cioccolato f-nocciola*

Artichocke (f) Green Olive (o) 9 Ripe Olive (o) Herbal (f) Almond (f) Citrus (f) Apple (f) Tomato leaf (f) Artichoke (f) Grassy (f) Ripe Olive (f) Green Olive (f) Bitterness Pungency Peppery Astringency Thickness Herbal Almond (o) Citrus (o) Apple (o) Tomato leaf (o) Artichoke (o) Grassy (o) Ripe Olive (o) Green Olive (o) Grassy (f) Ripe Olive (f) Green Olive (f) Bitterness Throat Catching Tomato leaf (f) Grassy (f) Ripe Olive (f) Apple (f) Green Olive (f) 5 1 5 1 Astringency Grassy (o) Artichocke (o) Almond (o) Thickness Hotness Green Olive (o) Herbal (f) 9 Ripe Olive (o) Bitterness Throat Catching Grassy (o) Tomato leaf (o) Apple (o) Herbal (o) Thickness Astringency Hotness 1 2 3 4 5 6 7 8 9