Università di Padova

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Università di Padova"

Transcript

1 Università di Padova Dipartimento di Tecnica e Gestione dei sistemi industriali Corso di Laurea Specialistica in Ingegneria Civile Elaborato di analisi statistica a.a. 5-6 Prof. L. Salmaso Dott. L. Corain

2 INDICE ) STATISTICA A CAMPIONE....)Statistica descrittiva ad un campione: tabella ed istogramma di frequenza, indici di sintesi....)statistica inferenziale ad un campione sulla media: intervallo di confidenza, verifica di ipotesi....3) Statistica inferenziale ad un campione sulla proporzione: intervallo di confidenza, verifica di ipotesi... ) STATISTICA A CAMPIONI....) Statistica descrittiva a due campioni: tabella e poligoni di frequenza, confronto principali indici di sintesi....) Statistica inferenziale a due campioni sulle medie: verifica di ipotesi sulle varianze, verifica di ipotesi sulla differenza delle medie....3) Statistica inferenziale a due campioni sulle proporzioni: test Z, test Chi-quadro... 3) STATISTICA A C CAMPIONI... 3.) Anova via... 3.) Regressione lineare multipla...

3 ) STATISTICA A CAMPIONE.) Statistica descrittiva Il primo passo dell esercitazione consiste nell estrazione dei dati dal dataset. Il campione a cui facciamo riferimento per la nostra analisi è quello dei valori dei provini portati a rottura in prove interne per barre di acciaio di diametro 6mm. Con gli strumenti della statistica descrittiva andiamo a rappresentare il campione: Interne rottura diam Descriptive Statistics: Interne rottura diam 6 Variable N Mean Median TrMean StDev SE Mean Interne 66,5 6,5 67,7 4,58 3,6 Variable Minimum Maximum Q Q3 Interne 573, 63, 59,75 67, Tabella di frequenza Snervamento frequenza Intervallo assoluta % 57,5-575, ,5-58,5 58,5-587,5 587,5-59,5 59,5-597, ,5-6,5 6,5-67,5 67,5-6,5 6,5-67,5 6 3

4 67,5-6, ,5-67,5 5 totale complessivo Descriptive Statistics Variable: C A-Squared: P-Value: C: 6 Anderson-Darling Normality Test,88, % Confidence Interval for Mu % Confidence Interval for Median Mean StDev Variance Skewness Kurtosis N Minimum st Quartile Median 3rd Quartile Maximum 599,47,86 596,88 66,5 4,578,53-8,6E- -3,E- 573, 59,75 6,5 67, 63, 95% Confidence Interval for Mu 63,73 95% Confidence Interval for Sigma,9 95% Confidence Interval for Median 66,765 Dai grafici ottenuti possiamo ricavare numerose informazioni sul campione. Esso presenta asimmetria negativa, cioè abbiamo che la media risulta essere minore della mediana. Ciò si può rilevare dall indice di Skewness e dalla forma della curva. Il test di normalità Anderson-Darling ci dice che, assumendo un indice di significatività pari ad alpha=.5 la distribuzione non può essere assunta normale, grazie al confronto col p-value. Tra i grafici troviamo anche il Boxplot, con cui possiamo avere un idea immediata di quali sono il valore centrale e la varianza del nostro campione. Nella scatola è contenuto il 5% dei nostri dati e la linea all interno indica il valore della mediana; i due valori estremali del contenitore sono detti primo e terzo interquartile..) Statistica inferenziale ad un campione sulla media: intervallo di confidenza, verifica di ipotesi rispetto al valore assegnato (colonna " sample test mean", alternativa a due code) One-Sample T: Interne rottura diam 6 Test of mu = 6 vs mu not = 6 Variable N Mean StDev SE Mean Interne rott 66,5 4,58 3,6

5 Variable 95,% CI T P Interne rott ( 599,43; 63,7) -,5,64 Histogram of C9 (with Ho and 95% t-confidence interval for the mean) 8 6 Frequency 4 X _ Ho [ ] C9 Abbiamo svolto una verifica di ipotesi sulla media del campione. Non è stato possibile rifiutare l ipotesi nulla perché il valore del p-value è,64>,5, quindi si può fare inferenza sul parametro media della popolazione dicendo che esso assume il valore 6 (assumendo la significatività considerata). E stato condotto un test-t perché la varianza della popolazione è incognita. Statistica test T X μ = S n S è la varianza campionaria, quindi una stima di quella reale incognita. Essa sarà tanto migliore quanto più grande è la numerosità campionaria (per n>3 molto buona) e si avvicinerà pertanto al test Z; rispetto alla distribuzione normale la T-student ha le code più importanti. Minitab ha costruito l intervallo di confidenza e mostra graficamente che il valore dell ipotesi nulla cade dentro di esso.

6 .3) Costruire una tabella che calcoli la proporzione di campioni "non di qualità" in base alla soglia assegnata (colonna "no quality threshold") Interne rottura diam 6 Test qualità(>6) 63 conforme 6 conforme 67 conforme 6 conforme 63 conforme 63 conforme 65 conforme 69 conforme 63 conforme 6 conforme 587 non conforme 59 non conforme 67 conforme 64 conforme 573 non conforme 583 non conforme 595 non conforme 69 conforme 66 conforme 59 non conforme TOTALE non conformi 6 In questa tabella sono riassunti i valori del campione messi a confronto con la quantità di soglia, che per la nostra esercitazione è pari a 6; solo i valori di rottura maggiori di questa quantità sono conformi..4) Statistica inferenziale ad un campione sulla proporzione: intervallo di confidenza, verifica di ipotesi rispetto al valore assegnato Test and CI for One Proportion Test of p =,3 vs p >,3 Exact Sample X N Sample p 95,% Lower Bound P-Value 6,3,39554,584 Abbiamo studiato la proporzione di barre non conformi, andando a costruire l intervallo di confidenza, e quindi svolgendo la verifica di ipotesi H : p=.3 e H : p>.3. Usiamo come statistica test Z = X np np p ( )

7 sulla popolazione binomiale conforme/non conforme. Il test è a una coda, infatti l ipotesi alternativa ammette solo un confronto unilaterale (>). Il p-value ci dice che l ipotesi nulla non può essere rifiutata perché esso risulta essere >,5, pertanto la probabilità di trovare barre non conformi si può assumere non maggiore del 3%.

8 ) STATISTICA A CAMPIONI.) La seconda parte dell esperienza consiste nell estrarre dal dataset i dati relativi alla rottura in prove interne per il diametro di barra mm e nel confronto col campione precedente. Interne rottura diam Interne rottura diam Andando ad analizzare con la statistica descrittiva il secondo campione: Descriptive Statistics Variable: Diametro Anderson-Darling Normality Test A-Squared: P-Value:,35, Mean StDev Variance Skewness Kurtosis N 64,5,55 6,68,75886, % Conf idence Interv al f or Mu Minimum st Quartile Median 3rd Quartile Maximum 598,78 589, 595,75 6,5 6,5 63, 95% Conf idence Interv al f or Mu 69, % Conf idence Interv al f or Sigma 8,56 6,439 95% Conf idence Interv al f or Median 95% Conf idence Interv al f or Median 598, 69,765

9 Possiamo fare un confronto col precedente: Per questo campione si può assumere una distribuzione approssimatamente normale, infatti il test di normalità Anderson Darling ci fornisce un p-value di,57 e quindi non è possibile rifiutare l ipotesi nulla; A differenza del primo, questo campione presenta asimmetria positiva, ossia il valore della media è maggiore di quello della mediana; Il secondo campione presenta un range interquartile meno esteso rispetto al precedente, ciò significa che i valori si concentrano più vicini alla mediana; Anche la varianza è molto maggiore (6 contro ) testimoniando ancora la maggior vicinanza dei dati al valor medio; I due indici di Skewness dei campioni differiscono di segno, infatti il primo presenta asimmetria negativa, il secondo positiva..)statistica descrittiva a due campioni: tabella e poligoni di frequenza, confronto principali indici di sintesi Usiamo gli strumenti della statistica descrittiva per confrontare le caratteristiche delle distribuzioni dei due campioni. Possiamo notare come la loro media sia piuttosto simile, ma il valore delle mediane è piuttosto lontano; ciò accade a causa della forte asimmetria del campione avente 6 come diametro. Dai boxplots si può notare come il nuovo campione sia distribuito simmetricamente, a differenza dell altro. Descriptive Statistics: vs 6 Variable C N Mean Median TrMean StDev C 64,5 6,5 63,39,6 6 66,5 6,5 67,7 4,58 Variable C SE Mean Minimum Maximum Q Q3 C,5 589, 63, 595,75 6,5 6 3,6 573, 63, 59,75 67,

10 Boxplots di Rottura per Diametro 63 6 Rottura Diametro 6 Dotplots di rottura per diametro 63 6 Rottura Diametro

11 .3) Statistica inferenziale a due campioni sulle medie: verifica di ipotesi sulle varianze, verifica di ipotesi sulla differenza delle medie Vogliamo confrontare le due popolazioni, e in particolare le medie. Prima di tutto, visto che le varianze delle popolazioni non sono conosciute, andiamo a svolgere un test per verificare l ipotesi di uguaglianza. Questo viene effettuato dal programma con il Levene s test e la statistica test f a una coda. L ipotesi nulla e quella alternativa sono: H : H : σ = σ σ σ Test for Equal Variances for -rottura- 95% Confidence Intervals for Sigmas Factor Levels F-Test Test Statistic:,596 Levene's Test Test Statistic:,8 P-Value :,68 P-Value :,373 Boxplots of Raw Data rottura- Abbiamo quindi verificato l uguaglianza delle varianze, infatti il valore del p-value supera quello della soglia di significatività. Pertanto andiamo ad effettuare un test sulle medie, tenendo conto del risultato appena ottenuto. Ipotesi nulla e alternativa sono rispettivamente: H : μ = μ H : μ μ

12 La statistica test che useremo è : T = X X S ( μ μ ) n p + n Dove S p è lo stimatore pooled della varianza, calcolato proporzionalmente alle varianze e alle numerosità campionarie. Two-Sample T-Test and CI: -rottura-; -diametro- Two-sample T for -rottura- -diametr N Mean StDev SE Mean 64,,3,5 6 66,3 4,6 3,3 Difference = mu () - mu (6) Estimate for difference: -, 95% CI for difference: (-,54; 6,4) T-Test of difference = (vs not =): T-Value = -,53 P-Value =,596 DF = 38 Both use Pooled StDev = 3, Boxplots of -rottura by -diametr (means are indicated by solid circles) diametro- -rottura Il p-value,596>,5 ci dice che bisogna accettare l ipotesi nulla; si può pertanto assumere uguaglianza delle medie per le due popolazioni. μ = μ

13 Anche graficamente si può vedere la vicinanza delle medie (dal grafico dei boxplot)..4) Statistica inferenziale a due campioni sulle proporzioni: test Z, test Chi-quadro μ = media pop. φ6 μ = media pop. φ 3) STATISTICA A CAMPIONI Vogliamo studiare la tensione di rottura avendo a disposizione 5 campioni di provini di barre di acciaio aventi diverso diametro. Abbiamo pertanto un fattore (il diametro) con cinque diversi livelli di trattamento. Costruire una tabella di riepilogo con media e dev. std. della variabile di interesse, rispetto a tutti i gruppi Diam Diam Diam 4 Diam 6 Diam Media 64,5 598,5 64,45 66,5 6,5 Deviazione standard,559 7,5969 5, , ,68643

14 Dotplots of Rottura by Diametro Rottura Diametro Boxplots of Rottura by Diametro Rottura Diametro Dai grafici riportati si possono valutare a colpo d occhio la tendenza centrale, la dispersione e l allontanamento dalla simmetria dei valori dei nostri cinque campioni. 3.) ANOVA UNA VIA L analisi della varianza (anova) si utilizza per confrontare le medie quando vi sono più livelli di un singolo fattore.

15 Nel nostro caso abbiamo valori di tensioni di rottura ottenute per cinque diversi diametri delle barre di acciaio; il nostro fattore di interesse è pertanto il diametro e siamo in presenza di cinque trattamenti. Se vi fossero solo due metodi di trattamento, l esperimento potrebbe essere analizzato usando il test t a due campioni, come abbiamo fatto in precedenza. I risultati ottenuti nella tabella precedente possono essere descritti per mezzo del seguente modello statistico lineare µ= media generale della variabile risposta yij = μ + τ + ε τ i = effetto sulla media dell i-esimo livello del fattore (i=,,3,4,5) i ij ε ij = errore casuale Gli effetti dei trattamenti sono definiti come scarti dalla media generale µ, pertanto vale la seguente uguaglianza: a i= τ = i Lo scopo di questo test è di verificare l uguaglianza tra le medie verifica di ipotesi per l ipotesi nulla: Ho τ τ =... = τ : = a = μ i e questo equivale ad una L ipotesi alternativa viceversa risulta essere che almeno uno dei τ i sia non nullo e quindi la variazione dei livelli del fattore non influenza la risposta media. L analisi della varianza suddivide la variabilità dei dati in due parti: una considera la distanza della media per un trattamento dalla media generale, e l altra invece la differenza dei dati dalla media del proprio specifico trattamento, e quindi dovuta all errore casuale. SS = SS + SS T Trattamenti E Dividendo per i gradi di libertà definiamo le seguenti quantità: MSTrattament i = SSTrattamenti /( a ) media quadratica MS E = SS E /[ a( n )] errore quadratico medio Che ci servono per la verifica di ipotesi per cui useremo la statistica test F:

16 MS F o = MS Trattamenti e potremo rifiutare l ipotesi nulla se essa cade nell intervallo fo > fα, a, a( n ) ossia i livelli dei fattori influenzano la variabile risposta. Col software Minitab abbiamo ottenuto questi risultati: E One-way ANOVA: Rottura versus Diametro Analysis of Variance for Rottura Source DF SS MS F P Diametro ,4, Error Total Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ,5,6 (-----*-----) 598,5 7,59 (-----*-----) 4 64,45 5,47 (-----*------) 6 66,5 4,58 (-----*-----) 8 6,5 9,68 (-----*-----) Pooled StDev = 4, Fisher's pairwise comparisons Family error rate =,8 Individual error rate =,5 Critical value =,985 Intervals for (column level mean) - (row level mean) -,9 4, , -5, 8,4,5 6 -, -6,9 -,6 6,6,7 7, 8-5,8-3,7-5,4-3,6-8, -4, -7,8-6, Dalla nostra analisi risulta pertanto che i diversi trattamenti influenzano la media; il p-value viene infatti segnato come. Uno strumento che ci da Minitab per la comparazione diretta tra due campioni è la Fisher pairwise comparisons: nella matrice che si crea se l intervallo derivante dal confronto tra un campione e l altro comprende lo, allora non posso rifiutare l ipotesi nulla e pertanto le medie sono uguali.

17 Nel nostro caso si può vedere come il campione avente diametro 8 si discosti da tutti gli altri. Ora andiamo a verificare l adeguatezza del modello con i grafici: Histogram of the Residuals (response is Rottura) Frequency Residual 3 4 Residuals Versus the Fitted Values (response is Rottura) 4 3 Residual Fitted Value Residuals Versus the Order of the Data (response is Rottura) 4 3 Residual Observation Order

18 Normal Probability Plot of the Residuals (response is Rottura) 3 Normal Score Residual ) REGRESSIONE LINEARE MULTIPLA SiO CaO TiO AlO3 KO 57,86 4,44,,, 53,98 3,4,89 4,67 3,9 6,83,99,88 7,94,38 5,6,3,95 6,4 3,44 55,35,89,93 5,53 4,3 57,87,5,95 3,4 3,9 5,85,4 6,53 3,58 54,9,9,96 6,6 4,6 53,98,5,97 6,8 4, 5,9,39,99 7,54 4, 55,56,,94 5,77 4,6 5,59,,6 9,3 3,39 53,55,6,96 6,88 4,9 5,58 3,7,84 3,44 3,88 57,9 6,75,96 8,4,3 55,99,99,97 5,7 4,6 6,48,9,94,38 3,3 59,68,6,87 3,36 56,78,4, 4,97 3,56 57,5,98,9 3,88 3,9 53,6,86,94 5,53 4,9 54,53,67,89 5,3 4,6 56,83,3,95 3,63 3,68 56,94,3,98 5,5 3,9 47,84 6,54,7,44 3,6 6,6,6,93,7 3,9 59,3 4,88,97 8,5,99 6,7 4,38,9 8,33,7 6,39,57,9,84 3,5 57,79 4,85,79,94 6,49,5,84 7,7,7 6,8,7,8,9 3,74 57,3 5,44,4,97,

19 5,7,94,97 6,94 3,9 La regressione lineare multipla consiste nel trovare una relazione lineare tra una variabile risposta dipendente e delle variabili indipendenti, dette regressori; formalizzando: Y = β + β x β n x n +ε i Y variabile risposta β valore dell intercetta β coefficiente di regressione, i k ε termine di errore casuale La nostra esercitazione consiste nello svolgere una regressione lineare multipla sui componenti di un tipo di ceramica. Bisogna selezionare le variabili significative e costruire il modello. Regression Analysis: SiO versus CaO; TiO; AlO3; KO The regression equation is SiO = 7,5 -,4 CaO +,9 TiO -,58 AlO3 +,7 KO Predictor Coef SE Coef T P Constant 7,475 4,3 6,86, CaO -,4,556-9,, TiO,89 5,44 4,3, AlO3 -,5753,856-8,49, KO,7,7953,88,385 S =, R-Sq = 9,3% R-Sq(adj) = 9,% Analysis of Variance Source DF SS MS F P Regression 4 367,39 9,87 75,66, Residual Error 9 35,98,4 Total 33 4,58 Il primo modello costruito presenta tutte quattro le variabili; dal test-t risulta che una di queste non è significativa, e pertanto la scartiamo e costruiamo un nuovo modello con tre variabili. Regression Analysis: SiO versus CaO; TiO; AlO3 The regression equation is SiO = 75, -,46 CaO + 9, TiO -,43 AlO3 Predictor Coef SE Coef T P Constant 75,46,93 5,74, CaO -,465,373 -,67, TiO 8,95 3,4 6,3, AlO3 -,486,893-7,44,

20 S =,98 R-Sq = 9,% R-Sq(adj) = 9,% Analysis of Variance Source DF SS MS F P Regression 3 366,37,,37, Residual Error 3 36,4, Total 33 4,5 La verifica mi dice che tutte le tre variabili sono significative, quindi posso fermare la procedura ed ho ottenuto il modello lineare che volevo. Minitab da la possibilità di selezionare automaticamente le variabili significative; basta impostare il programma sul metodo stepwise e lui produce un risultato uguale a quello da noi ottenuto. Stepwise Regression: SiO versus CaO; TiO; AlO3; KO Backward elimination. Alpha-to-Remove:,5 Response is SiO on 4 predictors, with N = 34 Step Constant 7,48 75,5 CaO -,4 -,46 T-Value -9, -,67 P-Value,, TiO,9 9, T-Value 4,3 6,3 P-Value,, AlO3 -,575 -,49 T-Value -8,49-7,44 P-Value,, KO,7 T-Value,88 P-Value,385 S,, R-Sq 9,6 9, R-Sq(adj) 9,5 9, C-p 5, 3,8 Ora per verificare il modello andiamo ad osservare i grafici dei residui:

21 Histogram of the Residuals (response is SiO) Frequency ,5 -, -,5 -, -,5 -,,5,,5, Residual I residui si distribuiscono approssimativamente in maniera normale. Nel grafico dei quantili per i residui possiamo notare un andamento lineare. Normal Probability Plot of the Residuals (response is SiO) Normal Score Residual Gli altri grafici ci mostrano che sono verificate l omoschedasticità e l indipendenza dei valori dei residui. Residuals Versus the Fitted Values (response is SiO) Residual Fitted Value

22 Residuals Versus the Order of the Data (response is SiO) Residual Observation Order

APPLICAZIONI. Analisi della varianza ad un fattore

APPLICAZIONI. Analisi della varianza ad un fattore Douglas C. Montgomery Controllo statistico della qualità /ed 6 McGraw-Hill APPLICAZIONI Analisi della varianza ad un fattore Insegnamento: Metodi ed Applicazioni Statistiche Corso di Laurea Specialistica

Dettagli

Capitolo 12 La regressione lineare semplice

Capitolo 12 La regressione lineare semplice Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università

Dettagli

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza XIII Presentazione del volume XV L Editore ringrazia 3 1. Introduzione alla Statistica 5 1.1 Definizione di Statistica 6 1.2 I Rami della Statistica Statistica Descrittiva, 6 Statistica Inferenziale, 6

Dettagli

Metodi statistici e probabilistici per l ingegneria. Corso di Laurea in Ingegneria Civile A.A. 2009-10. Facoltà di Ingegneria. Università di Padova

Metodi statistici e probabilistici per l ingegneria. Corso di Laurea in Ingegneria Civile A.A. 2009-10. Facoltà di Ingegneria. Università di Padova Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria Civile A.A. 29- Facoltà di Ingegneria Università di Padova Docente: Dott. L. Corain ESERCIZIO (TEST AD UN CAMPIONE) Un

Dettagli

Esercizi di statistica

Esercizi di statistica Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..

Dettagli

ESERCIZI. Test basati su due campioni e ANOVA a una via CAPITOLO 10 Levine, Krehbiel, Berenson, Statistica II ed., 2006 Apogeo

ESERCIZI. Test basati su due campioni e ANOVA a una via CAPITOLO 10 Levine, Krehbiel, Berenson, Statistica II ed., 2006 Apogeo Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università di Padova Docenti: Prof. L. Salmaso, Dott. L. Corain ESERCIZI Test basati su due campioni e

Dettagli

Statistica di base per l analisi socio-economica

Statistica di base per l analisi socio-economica Laurea Magistrale in Management e comunicazione d impresa Statistica di base per l analisi socio-economica Giovanni Di Bartolomeo [email protected] Definizioni di base Una popolazione è l insieme

Dettagli

Corso di STATISTICA EGA - Classe 1 aa Docenti: Luca Frigau, Claudio Conversano

Corso di STATISTICA EGA - Classe 1 aa Docenti: Luca Frigau, Claudio Conversano Corso di STATISTICA EGA - Classe 1 aa 2017-2018 Docenti: Luca Frigau, Claudio Conversano Il corso è organizzato in 36 incontri, per un totale di 72 ore di lezione. Sono previste 18 ore di esercitazione

Dettagli

Confronto fra gruppi: il metodo ANOVA. Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23

Confronto fra gruppi: il metodo ANOVA. Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23 Confronto fra gruppi: il metodo ANOVA Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23 1 Nella popolazione, per ciascun gruppo la distribuzione della variabile risposta

Dettagli

STATISTICA AZIENDALE Modulo Controllo di Qualità

STATISTICA AZIENDALE Modulo Controllo di Qualità STATISTICA AZIENDALE Modulo Controllo di Qualità A.A. 009/10 - Sottoperiodo PROA DEL 14 MAGGIO 010 Cognome:.. Nome: Matricola:.. AERTENZE: Negli esercizi in cui sono richiesti calcoli riportare tutte la

Dettagli

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli. Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:

Dettagli

CAPITOLO 4 Blocchi casualizzati, quadrati latini e piani collegati

CAPITOLO 4 Blocchi casualizzati, quadrati latini e piani collegati Douglas C. Montgomery Progettazione e analisi degli esperimenti 2006 McGraw-Hill CAPITOLO 4 Blocchi casualizzati, quadrati latini e piani collegati Metodi statistici e probabilistici per l ingegneria Corso

Dettagli

Statistica Inferenziale

Statistica Inferenziale Statistica Inferenziale a) L Intervallo di Confidenza b) La distribuzione t di Student c) La differenza delle medie d) L intervallo di confidenza della differenza Prof Paolo Chiodini Dalla Popolazione

Dettagli

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università

Dettagli

Confronto tra due popolazioni Lezione 6

Confronto tra due popolazioni Lezione 6 Last updated May 9, 06 Confronto tra due popolazioni Lezione 6 G. Bacaro Statistica CdL in Scienze e Tecnologie per l'ambiente e la Natura I anno, II semestre Concetti visti nell ultima lezione Le media

Dettagli

Teoria e tecniche dei test. Concetti di base

Teoria e tecniche dei test. Concetti di base Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi

Dettagli

STATISTICA DESCRITTIVA (variabili quantitative)

STATISTICA DESCRITTIVA (variabili quantitative) STATISTICA DESCRITTIVA (variabili quantitative) PRIMO ESEMPIO: Concentrazione di un elemento chimico in una roccia. File di lavoro di STATVIEW Cliccando sul tasto del pane control si ottiene il cosiddetto

Dettagli

1.1 Obiettivi della statistica Struttura del testo 2

1.1 Obiettivi della statistica Struttura del testo 2 Prefazione XV 1 Introduzione 1.1 Obiettivi della statistica 1 1.2 Struttura del testo 2 2 Distribuzioni di frequenza 2.1 Informazione statistica e rilevazione dei dati 5 2.2 Distribuzioni di frequenza

Dettagli

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Strumenti statistici in Excell Pacchetto Analisi di dati Strumenti di analisi: Analisi varianza: ad un fattore Analisi

Dettagli

Contenuti: Capitolo 14 del libro di testo

Contenuti: Capitolo 14 del libro di testo Test d Ipotesi / TIPICI PROBLEMI DI VERIFICA DI IPOTESI SONO Test per la media Test per una proporzione Test per la varianza Test per due campioni indipendenti Test di indipendenza Contenuti Capitolo 4

Dettagli

ESERCIZI. Regressione lineare semplice CAPITOLO 12 Levine, Krehbiel, Berenson, Statistica II ed., 2006 Apogeo

ESERCIZI. Regressione lineare semplice CAPITOLO 12 Levine, Krehbiel, Berenson, Statistica II ed., 2006 Apogeo Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università di Padova Docenti: Prof. L. Salmaso, Dott. L. Corain ESERCIZI Regressione lineare semplice

Dettagli

Dispensa di Statistica

Dispensa di Statistica Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza

Dettagli

Indice. Prefazione. 4 Sintesi della distribuzione di un carattere La variabilità Introduzione La variabilità di una distribuzione 75

Indice. Prefazione. 4 Sintesi della distribuzione di un carattere La variabilità Introduzione La variabilità di una distribuzione 75 00PrPag:I-XIV_prefazione_IAS 8-05-2008 17:56 Pagina V Prefazione XI 1 La rilevazione dei fenomeni statistici 1 1.1 Introduzione 1 1.2 Caratteri, unità statistiche e collettivo 1 1.3 Classificazione dei

Dettagli

LA RAPPRESENTAZIONE E LA SINTESI DEI DATI

LA RAPPRESENTAZIONE E LA SINTESI DEI DATI Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria Civile A.A. 2009-10 Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain 1 LA RAPPRESENTAZIONE E LA SINTESI

Dettagli

Test F per la significatività del modello

Test F per la significatività del modello Test F per la significatività del modello Per verificare la significatività dell intero modello si utilizza il test F Si vuole verificare l ipotesi H 0 : β 1 = 0,, β k = 0 contro l alternativa che almeno

Dettagli

ANALISI DELLA VARIANZA

ANALISI DELLA VARIANZA ANALISI DELLA VARIANZA Il data set coagulation contenuto nella libreria faraway contiene i tempi di coagulazione del sangue (misurato in secondi) di 24 animali sottoposti casualmente a quattro tipi di

Dettagli

Capitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson Apogeo

Capitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson Apogeo Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 10 Test basati su due campioni e ANOVA a una via Insegnamento: Statistica Applicata Corsi di Laurea in "Scienze e tecnologie Alimentari"

Dettagli

CAPITOLO 5 Introduzione ai piani fattoriali

CAPITOLO 5 Introduzione ai piani fattoriali Douglas C. Montgomery Progettazione e analisi degli esperimenti 2006 McGraw-Hill CAPITOLO 5 Introduzione ai piani fattoriali Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria

Dettagli

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25 Sommario Presentazione dell edizione italiana Prefazione xv xiii Capitolo 1 I dati e la statistica 1 Statistica in pratica: BusinessWeek 1 1.1 Le applicazioni in ambito aziendale ed economico 3 Contabilità

Dettagli

Analisi della regressione multipla

Analisi della regressione multipla Analisi della regressione multipla y = β 0 + β 1 x 1 + β 2 x 2 +... β k x k + u 2. Inferenza Assunzione del Modello Classico di Regressione Lineare (CLM) Sappiamo che, date le assunzioni Gauss- Markov,

Dettagli

COGNOME.NOME...MATR..

COGNOME.NOME...MATR.. STATISTICA 29.01.15 - PROVA GENERALE (CHALLENGE) Modalità A (A) ai fini della valutazione verranno considerate solo le risposte riportate dallo studente negli appositi riquadri bianchi: in caso di necessità

Dettagli

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria Civile A.A. 2009-10 Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain 1 STATISTICHE, DISTRIBUZIONI CAMPIONARIE

Dettagli

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura INDICE GENERALE Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura XI XIV XV XVII XVIII 1 LA RILEVAZIONE DEI FENOMENI

Dettagli

Scheda Corso di STATISTICA (D.M. 270 per 9 CFU) Anno Accademico 2014/2015 (versione in Italiano)

Scheda Corso di STATISTICA (D.M. 270 per 9 CFU) Anno Accademico 2014/2015 (versione in Italiano) Scheda Corso di STATISTICA (D.M. 270 per 9 CFU) Anno Accademico 2014/2015 (versione in Italiano) FACOLTA :ECONOMIA CORSI DI LAUREA: Economia e Commercio, Psicoeconomia e Scienze Bancarie ed Assicurative

Dettagli

Test di ipotesi su due campioni

Test di ipotesi su due campioni 2/0/20 Test di ipotesi su due campioni Confronto tra due popolazioni Popolazioni effettive: unità statistiche realmente esistenti. Esempio: Confronto tra forze lavoro di due regioni. Popolazioni ipotetiche:

Dettagli

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1 Statistica Capitolo 1 Regressione Lineare Semplice Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Spiegare il significato del coefficiente di correlazione lineare

Dettagli

Capitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson. Casa editrice: Pearson

Capitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson. Casa editrice: Pearson Levine, Krehbiel, Berenson Statistica II ed. Casa editrice: Pearson Capitolo 10 Test basati su due campioni e ANOVA a una via Insegnamento: Statistica Corsi di Laurea Triennale in Economia Dipartimento

Dettagli

STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7:

STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7: esercitazione 7 p. 1/13 STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7: 20-05-2004 Luca Monno Università degli studi di Pavia [email protected] http://www.lucamonno.it

Dettagli

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Quesito: Posso stimare il numero di ore passate a studiare statistica sul voto conseguito all esame? Potrei calcolare il coefficiente di correlazione.

Dettagli

STATISTICA A K (60 ore)

STATISTICA A K (60 ore) STATISTICA A K (60 ore) Marco Riani [email protected] http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta

Dettagli

LABORATORIO DI PROBABILITA E STATISTICA

LABORATORIO DI PROBABILITA E STATISTICA UNIVERSITA DEGLI STUDI DI VERONA LABORATORIO DI PROBABILITA E STATISTICA Docente: Bruno Gobbi Corso di laurea in Informatica e Bioinformatica 8 VERIFICA DI IPOTESI LA VERIFICA DI IPOTESI Una delle applicazioni

Dettagli

L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale

L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile Corso di Metodologia della ricerca sociale L analisi della varianza (ANOVA) La tecnica con cui si esplorano le relazioni

Dettagli

L Analisi della Varianza ANOVA (ANalysis Of VAriance)

L Analisi della Varianza ANOVA (ANalysis Of VAriance) L Analisi della Varianza ANOVA (ANalysis Of VAriance) 1 Concetti generali: Confronto simultaneo tra più di due popolazioni, esempi... La analisi della varianza estende il confronto a p gruppi con p>2.

Dettagli

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre R - Esercitazione 6 Andrea Fasulo [email protected] Università Roma Tre Venerdì 22 Dicembre 2017 Il modello di regressione lineare semplice (I) Esempi tratti da: Stock, Watson Introduzione all econometria

Dettagli

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17 C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica

Dettagli

Strumenti informatici Realizzare un test z, un test t e un test F per campioni indipendenti con Excel e SPSS

Strumenti informatici Realizzare un test z, un test t e un test F per campioni indipendenti con Excel e SPSS Strumenti informatici 5.2 - Realizzare un test z, un test t e un test F per campioni indipendenti con Excel e SPSS Sia Excel che SPSS consentono di realizzare in modo abbastanza rapido il test sulle medie

Dettagli

Z-test, T-test, χ 2 -test

Z-test, T-test, χ 2 -test Z-test, T-test, χ 2 -test Francesco Corrias Chiara Todaro DIMA 13 febbraio 2012 Francesco Corrias Chiara Todaro (DIMA) Z-test, T-test, χ 2 -test 13 febbraio 2012 1 / 19 Verifica d ipotesi Definizione (Test

Dettagli

Sintesi dei dati in una tabella. Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6)

Sintesi dei dati in una tabella. Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6) Sintesi dei dati in una tabella Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6) Sintesi dei dati Spesso si vuole effettuare una sintesi dei dati per ottenere indici

Dettagli

La variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

La variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali Dip. di Scienze Umane e Sociali [email protected] Introduzione [1/2] Gli indici di variabilità consentono di riassumere le principali caratteristiche di una distribuzione (assieme alle medie) Le

Dettagli

05. Errore campionario e numerosità campionaria

05. Errore campionario e numerosità campionaria Statistica per le ricerche di mercato A.A. 01/13 05. Errore campionario e numerosità campionaria Gli schemi di campionamento condividono lo stesso principio di fondo: rappresentare il più fedelmente possibile,

Dettagli

Il test di Student. F. Scotti. 25 febbraio Introduzione ai test statistici di significatività: ipotesi nulla e livello di significatività

Il test di Student. F. Scotti. 25 febbraio Introduzione ai test statistici di significatività: ipotesi nulla e livello di significatività Il test di Student F. Scotti 25 febbraio 2006 Indice 1 Introduzione ai test statistici di significatività: ipotesi nulla e livello di significatività deltest 2 2 IltestdidiStudent 2 2.1 Introduzione al

Dettagli

Variabili aleatorie. continue. Discreto continuo

Variabili aleatorie. continue. Discreto continuo Variabili aleatorie continue Discreto continuo.18 Uniforme discreta, n=11 n=21 n=11 n=6 n=51 n=51 Uniforme.16.14.12.1.8.6?.4.2 1 1 2 2 3 3 4 4 5 5 6 6 7 7 Per passare dal modello discreto al modello continuo

Dettagli

IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI

IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI Perchè confrontare le varianze stimate in due campioni? Torniamo all'esempio dei frinosomi Per poter applicare il test t avevamo detto che le varianze, e

Dettagli