LABORATORIO 5. ANALISI DELLA VARIANZA AD UN CRITERIO DI CLASSIFICAZIONE

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "LABORATORIO 5. ANALISI DELLA VARIANZA AD UN CRITERIO DI CLASSIFICAZIONE"

Transcript

1 LABORATORIO 5. ANALISI DELLA VARIANZA AD UN CRITERIO DI CLASSIFICAZIONE 5.1 ESEMPIO DI ANOVA AD UNA VIA In un esperimento un gruppo di bambini è stato assegnato a caso a 3 trattamenti, allo scopo di determinare se certi esercizi accelerano il tempo in cui i bambini imparano a camminare da soli. I risultati indicano l età in mesi in cui i bambini hanno cominciato a camminare: Età in cui i bambini hanno iniziato a camminare per tipo_esercizi Gruppo Esercizi Attivi (1) Gruppo Esercizi Passivi (2) Gruppo senza Esercizi (3) 9,00 11,00 11,50 9,50 10,50 12,00 9,75 10,00 10,00 10,00 11,75 13,50 12,00 10,25 13,75 9,65 11,00 14,00 Verifica se esiste differenza nell età in cui questi gruppi di bambini hanno cominciato a camminare. Aprire il dataset bambini.txt ricordandosi che le colonne sono delimitate da spazio. Descriviamo i dati (media e sd e quartili) per ogni gruppo di tipo_esercizi: > by(bambini$età, bambini$tipo_esercizi, mean, na.rm=true) [1] [1] [1] > by(bambini$età, bambini$tipo_esercizi, sd, na.rm=true) [1] [1] [1] > by(bambini$età, bambini$tipo_esercizi, quantile, na.rm=true, probs=c( 0,.25,.5,.75,1 ))

2 Descriviamo graficamente i dati per ogni gruppo tramite il box_plot: Dal grafico si nota che i tre campioni indipendenti hanno mediane e variabilità presumibilmente diverse tra di loro. Si nota un punto anomalo. Verifichiamo l omogeneità delle varianze tramite il test di Bartlett: Statistiche -> varianze -> test di Bartlett > bartlett.test(età ~ tipo_esercizi, data=bambini) Bartlett test of homogeneity of variances data: età by tipo_esercizi Bartlett's K-squared = , df = 2, p-value = Le varianze tra i campioni sono omogenee. Descriviamo graficamente la distribuzione dei dati tramite il qq_plot: I campioni presumibilmente sono normali. 2

3 Verifichiamo la normalità dei dati tramite il test di Shapiro-Wilk (è possibile che in aula il comando non funzioni perchè non è stata caricata la libreria stats ): shapiro.test(bambini$età) Shapiro-Wilk normality test data: bambini$età W = , p-value = I campioni sono normali. Tutte le assunzioni dell ANOVA sono rispettate. Si può procedere con l analisi della varianza ad una via: Statistiche -> medie -> Anova ad una via > anova(lm(età ~ tipo_esercizi, data=bambini)) Analysis of Variance Table Response: età Df Sum Sq Mean Sq F value Pr(>F) tipo_esercizi ** Residuals > tapply(bambini$età, bambini$tipo_esercizi, mean, na.rm=true) # means > tapply(bambini$età, bambini$tipo_esercizi, sd, na.rm=true) # std. deviations > tapply(bambini$età, bambini$tipo_esercizi, function(x) sum(!is.na(x))) # counts la riga tipo_esercizi rappresenta la varianza tra gruppi. Residuals è la varianza residua. Il rapporto tra queste due varianze mi fornisce il test F. Da tale test posso concludere che esiste una differenza statisticamente significativa tra i tre gruppi. I soggetti che fanno esercizi attivi incominciano a camminare prima degli altri individui. 5.2 ANALISI DELLA VARIANZA MEDIANTE MODELLO DI REGRESSIONE Statistiche -> Fitta i modelli -> modelli lineari -> età ~ tipo_esercizi > LinearModel.1 <- lm(età ~ tipo_esercizi, data=bambini) > summary(linearmodel.1) Call: lm(formula = età ~ tipo_esercizi, data = bambini) Residuals: 3

4 Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e-12 *** tipo_esercizi[t.2] tipo_esercizi[t.3] ** Residual standard error: on 15 degrees of freedom Multiple R-Squared: 0.494, Adjusted R-squared: F-statistic: on 2 and 15 DF, p-value: L intercetta rappresenta la media del gruppo di riferimento (1) che è significativamente diversa da 0. tipo_esercizi[t.2] rappresenta la differenza tra la media stimata del gruppo 2 e quella del gruppo 1 che non differisce significativamente da 0. tipo_esercizi[t.3] rappresenta la differenza tra la media stimata del gruppo 3 e quella del gruppo 1 che differisce significativamente da 0. Da notare dalla tabella dell anova della regressione che la varianza dovuta alla regressione corrisponde alla varianza tra gruppi sopra riportata, infatti: > Anova(LinearModel.1) Anova Table (Type II tests) Response: età Sum Sq Df F value Pr(>F) tipo_esercizi ** Residuals Non essendoci differenze tra i soggetti che fanno esercizi allora possiamo provare ad accorpare il gruppo 1 con il 2 e rifare l ANOVA: > LinearModel.2 <- lm(età ~ esercizi, data=bambini) > summary(linearmodel.2) Call: lm(formula = età ~ esercizi, data = bambini) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e-14 *** esercizi[t.1] ** Residual standard error: on 16 degrees of freedom Multiple R-Squared: , Adjusted R-squared: F-statistic: on 1 and 16 DF, p-value:

5 L intercetta rappresenta la media del gruppo (0) di riferimento che non fa esercizi. Tale media è significativamente diversa da 0. esercizi[t.1] rappresenta la differenza tra la media stimata del gruppo che fa esercizi e quella del gruppo 0. Tali medie sono significativamente diverse e quindi significa che i bambini che fanno esercizi incominciano a camminare mediamente circa 2 mesi prima. 5

0.1 Percorrenza e Cilindrata

0.1 Percorrenza e Cilindrata 0.1 Percorrenza e Cilindrata Iniziamo ora un analisi leggermente più complessa basata sempre sui concetti appena introdotti. Innanzi tutto possiamo osservare, dal grafico ottenuto con il comando pairs,

Dettagli

ANALISI DELLA VARIANZA

ANALISI DELLA VARIANZA ANALISI DELLA VARIANZA Il data set coagulation contenuto nella libreria faraway contiene i tempi di coagulazione del sangue (misurato in secondi) di 24 animali sottoposti casualmente a quattro tipi di

Dettagli

LABORATORIO DI PROBABILITA E STATISTICA

LABORATORIO DI PROBABILITA E STATISTICA UNIVERSITA DEGLI STUDI DI VERONA LABORATORIO DI PROBABILITA E STATISTICA Docente: Bruno Gobbi 6 ESERCIZI RIEPILOGATIVI PRIME 3 LEZIONI REGRESSIONE LINEARE: SPORT - COLESTEROLO ESERCIZIO 8: La tabella seguente

Dettagli

Esercitazione Statistica Computazionale B Modelli di regressione lineare semplice Verifica di ipotesi - Analisi della varianza

Esercitazione Statistica Computazionale B Modelli di regressione lineare semplice Verifica di ipotesi - Analisi della varianza Esercitazione Statistica Computazionale B Modelli di regressione lineare semplice Verifica di ipotesi - Analisi della varianza 3 maggio 2005 Esercizio 1 Consideriamo l esempio del libro di testo Annette

Dettagli

Analisi grafica residui in R. Da output grafico analisi regressionelm1.csv Vedi dispensa. peso-statura

Analisi grafica residui in R. Da output grafico analisi regressionelm1.csv Vedi dispensa. peso-statura Analisi grafica residui in R Da output grafico analisi regressionelm1.csv Vedi dispensa peso-statura 1) Il plot in alto a sinistra mostra gli errori residui contro i loro valori stimati. I residui devono

Dettagli

VARIETÀ. zona geografica A B C D

VARIETÀ. zona geografica A B C D Anova a 2 vie con repliche (( chiarire che non devono essere esattamente nello stesso numero per ogni cella ovvero per le ripetizioni dei de fattori ma che excel li legge così) Esercizio-esempio 1 Il valore

Dettagli

> d = alimentazione == "benz" > mean(percorr.urbana[!d]) - mean(percorr.urbana[d]) [1] 2.385627. > sd(percorr.urbana[d]) [1] 2.

> d = alimentazione == benz > mean(percorr.urbana[!d]) - mean(percorr.urbana[d]) [1] 2.385627. > sd(percorr.urbana[d]) [1] 2. A questo punto vale la pena di soffermarci di più sull alimentazione. Intanto cerchiamo di indagare se l alimentazione è davvero un fattore significativo per la percorrenza come è luogo comune pensare.

Dettagli

ANOVA 2. Monica Marabelli. 15 Gennaio 2016

ANOVA 2. Monica Marabelli. 15 Gennaio 2016 ANOVA 2 Monica Marabelli 15 Gennaio 2016 ANOVA a una via Nella scorsa esercitazione abbiamo visto che nell Analisi della Varianza (ANOVA) si considerano le medie di una variabile dipendente (quantitativa)

Dettagli

Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico 2011-12)

Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico 2011-12) Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico 011-1) REGRESSIONE LINEARE SEMPLICE OPEN STATISTICA 8.44 Per 8 settimanali, appartenenti alla medesima fascia di prezzo e presenti in edicola

Dettagli

Prova scritta di Affidabilità dei sistemi e controllo statistico di qualità

Prova scritta di Affidabilità dei sistemi e controllo statistico di qualità Prova scritta di Affidabilità dei sistemi e controllo statistico di qualità 1. a) La funzione di affidabilità è: Soluzioni 28 Gennaio 2016 = = 4. b) La probabilità che il sistema si guasti tra 0.4 e 1.4

Dettagli

Esercizio 1 GRAFICO 1. X e Y sono indipendenti. X e Y non sono correlate. La correlazione tra X e Y è <1. X e Y sono perfettamente correlate

Esercizio 1 GRAFICO 1. X e Y sono indipendenti. X e Y non sono correlate. La correlazione tra X e Y è <1. X e Y sono perfettamente correlate Esercizio 1 Osservare il grafico 1 riportato in figura che mette in relazione una variabile dipendente Y ed una variabile indipendente X e rispondere alle seguenti domande. 400 300 200 GRAFICO 1 100 0

Dettagli

REGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori

REGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori REGRESSIONE lineare e CORRELAZIONE Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori Y X La NATURA e la FORZA della relazione tra variabili si studiano con la REGRESSIONE

Dettagli

Stima dei parametri di modelli lineari

Stima dei parametri di modelli lineari Stima dei parametri di modelli lineari Indice Introduzione................................ 1 Il caso studio................................ 2 Stima dei parametri............................ 3 Bontà delle

Dettagli

Validazione dei modelli Strumenti quantitativi per la gestione

Validazione dei modelli Strumenti quantitativi per la gestione Validazione dei modelli Strumenti quantitativi per la gestione Emanuele Taufer Validazione dei modelli Il data set Auto I dati Il problema analizzato Validation set approach Diagramma a dispersione Test

Dettagli

Regressione lineare multipla Strumenti quantitativi per la gestione

Regressione lineare multipla Strumenti quantitativi per la gestione Regressione lineare multipla Strumenti quantitativi per la gestione Emanuele Taufer Regressione lineare multipla (RLM) Esempio: RLM con due predittori Stima dei coefficienti e previsione Advertising data

Dettagli

Prova scritta di Affidabilità dei sistemi e controllo statistico di qualità

Prova scritta di Affidabilità dei sistemi e controllo statistico di qualità Prova scritta di Affidabilità dei sistemi e controllo statistico di qualità 18 Febbraio 2016 1. La probabilità di errore nella trasmissione di una cifra binaria attraverso un certo canale di comunicazione

Dettagli

Confronto fra gruppi: il metodo ANOVA. Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23

Confronto fra gruppi: il metodo ANOVA. Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23 Confronto fra gruppi: il metodo ANOVA Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23 1 Nella popolazione, per ciascun gruppo la distribuzione della variabile risposta

Dettagli

ESERCITAZIONE C. Analisi di dati sperimentali PARTE 3: REGRESIONE

ESERCITAZIONE C. Analisi di dati sperimentali PARTE 3: REGRESIONE Università degli Studi di Padova Facoltà di Scienze MM.FF.NN. Corso di Laurea Magistrale: Biologia Sanitaria/Biologia Molecolare Insegnamento: Statistica Applicata Docente: Prof.ssa Alessandra R. Brazzale

Dettagli

Esercizi di ripasso. Monica Marabelli. 22 Gennaio 2016

Esercizi di ripasso. Monica Marabelli. 22 Gennaio 2016 Esercizi di ripasso Monica Marabelli 22 Gennaio 2016 Esercizio 1 Tre diverse diete sono state testate per valutare la loro efficacia nel determinare una diminuzione di peso. Verifica se almeno una delle

Dettagli

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli. Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:

Dettagli

Università di Padova

Università di Padova Università di Padova Dipartimento di Tecnica e Gestione dei sistemi industriali Corso di Laurea Specialistica in Ingegneria Civile Elaborato di analisi statistica a.a. 5-6 Prof. L. Salmaso Dott. L. Corain

Dettagli

Inferenza statistica Donata Rodi 04/10/2016

Inferenza statistica Donata Rodi 04/10/2016 Inferenza statistica Donata Rodi 04/10/2016 Popolazione Campionamento Campione Parametri Inferenza Statistiche µ, ϭ 2 descrittive Stima X, s 2 Quale test? Parametrico o no Scala di misura 1 gruppo 2 gruppi

Dettagli

ANOVA a un fattore between in R

ANOVA a un fattore between in R ANOVA a un fattore between in R Il file Excel Il file sinburn.xlsx contiene i dati dello studio sulla sindrome da burnout in quindici infermieri ospedalieri di tre diversi reparti. Importare dati in R

Dettagli

Modelli con predittori qualitativi e modelli con interazioni

Modelli con predittori qualitativi e modelli con interazioni Modelli con predittori qualitativi e modelli con interazioni Strumenti quantitativi per la gestione Emanuele Taufer Utilizzare variabili indipendenti qualitative (VIQ) Codifica binaria 0,1 Esempio: salari

Dettagli

Test F per la significatività del modello

Test F per la significatività del modello Test F per la significatività del modello Per verificare la significatività dell intero modello si utilizza il test F Si vuole verificare l ipotesi H 0 : β 1 = 0,, β k = 0 contro l alternativa che almeno

Dettagli

Introduzione alla Regressione Logistica

Introduzione alla Regressione Logistica Introduzione alla Regressione Logistica Contenuto regressione lineare semplice e multipla regressione logistica lineare semplice La funzione logistica Stima dei parametri Interpretazione dei coefficienti

Dettagli

Modelli non lineari Strumenti quantitativi per la gestione

Modelli non lineari Strumenti quantitativi per la gestione Modelli non lineari Strumenti quantitativi per la gestione Emanuele Taufer Metodi per affrontare problemi non lineari Regressione polinomiale Esempio: modellare i picchi di domanda di energia Fattori che

Dettagli

Modelli non lineari. Strumenti quantitativi per la gestione

Modelli non lineari. Strumenti quantitativi per la gestione Modelli non lineari Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/7_gam.html#(5) 1/54 Metodi per affrontare problemi nonlineari Regressione

Dettagli

LABORATORIO DI PROBABILITA E STATISTICA

LABORATORIO DI PROBABILITA E STATISTICA LABORATORIO DI PROBABILITA E STATISTICA Docente: Bruno Gobbi 3 LA REGRESSIONE LINEARE ES. STUDIO RELAZIONE ALTEZZA - PESO Soggetto Altezza Peso A 174 75 B 166 63 C 173 70 D 171 71 E 168 68 F 167 68 G 165

Dettagli

DAL CAMPIONE ALLA POPOLAZIONE: LA STIMA DEI PARAMETRI

DAL CAMPIONE ALLA POPOLAZIONE: LA STIMA DEI PARAMETRI DAL CAMPIONE ALLA POPOLAZIONE: LA STIMA DEI PARAMETRI Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Università degli Studi di Perugia Versione on-line: http://www.unipg.it/ onofri/rtutorial/index.html

Dettagli

> cement <- read.table("i:/modelli/cement.dat", col.names=c("tempo", "resist")) > attach(cement)

> cement <- read.table(i:/modelli/cement.dat, col.names=c(tempo, resist)) > attach(cement) Laboratorio 6 Analisi dei residui 6.1 Analisi dei dati CEMENT.DAT I dati riportati nel file cement.dat si riferiscono ad uno studio sulla resistenza del cemento alla tensione. La resistenza dipende, tra

Dettagli

CAPITOLO 4 Blocchi casualizzati, quadrati latini e piani collegati

CAPITOLO 4 Blocchi casualizzati, quadrati latini e piani collegati Douglas C. Montgomery Progettazione e analisi degli esperimenti 2006 McGraw-Hill CAPITOLO 4 Blocchi casualizzati, quadrati latini e piani collegati Metodi statistici e probabilistici per l ingegneria Corso

Dettagli

Esercizio 8. Ne segue, ovviamente che le aree geografiche di riferimento sono Africa e America del Sud.

Esercizio 8. Ne segue, ovviamente che le aree geografiche di riferimento sono Africa e America del Sud. Esercizio 8 La Swiss Economic Research della Union Bank of Switzerland conduce un controllo periodico dei livelli dei prezzi e dei salari nella principali città del mondo. Una delle variabili rilevate

Dettagli

Contrasti e confronti multipli

Contrasti e confronti multipli Contrasti e confronti multipli Andrea Onofri 25 gennaio 2012 Indice 1 Introduzione 1 2 I contrasti pianificati 2 Test di confronto multiplo 4 4 Limitazione delle MCP 5 5 Scegliere la MCP 7 Sommario Scopo

Dettagli

Regressione lineare semplice

Regressione lineare semplice Regressione lineare semplice Strumenti quantitativi per la gestione Emanuele Taufer Regressione lineare (RL) La regressione lineare per i dati Advertising Analisi d interesse Regressione lineare semplice

Dettagli

Analisi della varianza

Analisi della varianza Capitolo 4 Analisi della varianza 4.1 ANOVA La procedura per eseguire una ANOVA passa attraverso il fit del modello lineare corrispondente. 4.2 ANOVA a una via In questo caso, che è il più semplice, si

Dettagli

Strumenti informatici Realizzare l analisi della varianza con Excel e SPSS

Strumenti informatici Realizzare l analisi della varianza con Excel e SPSS Strumenti informatici 6.4 - Realizzare l analisi della varianza con Excel e SPSS Excel non dispone di una funzione che realizzi l analisi della varianza, a meno di aver installato uno dei moduli aggiunti

Dettagli

ESERCIZIO 1. Di seguito vengono riportati i risultati di un modello fattoriale di analisi della varianza con 3 fattori tra i soggetti.

ESERCIZIO 1. Di seguito vengono riportati i risultati di un modello fattoriale di analisi della varianza con 3 fattori tra i soggetti. ESERCIZIO. Di seguito vengono riportati i risultati di un modello fattoriale di analisi della varianza con fattori tra i soggetti. Variabile dipendente: PERF Sorgente Modello corretto Intercept SEX_96

Dettagli

Statistica multivariata Donata Rodi 08/11/2016

Statistica multivariata Donata Rodi 08/11/2016 Statistica multivariata Donata Rodi 08/11/2016 MANOVA: Multivariate Analysis of Variance Due o più variabili dipendenti quantitative Una o più variabili indipendenti categoriali (con più livelli) Residui

Dettagli

Indice. 1 Introduzione ai modelli lineari 2. 2 Dataset 3. 3 Il Modello 8. 4 In pratica 12 4.1 Peso e percorrenza... 12

Indice. 1 Introduzione ai modelli lineari 2. 2 Dataset 3. 3 Il Modello 8. 4 In pratica 12 4.1 Peso e percorrenza... 12 Indice 1 Introduzione ai modelli lineari 2 2 Dataset 3 3 Il Modello 8 4 In pratica 12 41 Peso e percorrenza 12 1 Capitolo 1 Introduzione ai modelli lineari Quando si analizzano dei dati, spesso si vuole

Dettagli

Verifica di ipotesi sui coefficienti di regressione. Verifica di ipotesi sul coefficiente angolare

Verifica di ipotesi sui coefficienti di regressione. Verifica di ipotesi sul coefficiente angolare Verifica di ipotesi sui coefficienti di regressione Per il momento supponiamo di muoverci nel contesto del modello gaussiano. Vogliamo capire se alcune nostre congetture sui coefficienti di regressione

Dettagli

Analisi della Varianza Fattoriale

Analisi della Varianza Fattoriale Analisi della Varianza Fattoriale AMD Marcello Gallucci marcello.gallucci@unimib.it Ripasso dell ANOVA Lo studio degli effetti di una serie di variabili indipendenti nominale (gruppi) su un variabile dipendente

Dettagli

Analisi della varianza (anova) a due vie: parcelle di diverse dimensioni

Analisi della varianza (anova) a due vie: parcelle di diverse dimensioni Analisi della varianza (anova) a due vie: parcelle di diverse dimensioni Andrea Onofri 31 gennaio 2012 Indice 1 Motivazioni dei disegni a split-plot 1 2 Calcolo dell ANOVA a split-plot 4 2.1 SED, confronti

Dettagli

Misure Ripetute. Partizione della Varianza. Marcello Gallucci

Misure Ripetute. Partizione della Varianza. Marcello Gallucci Misure Ripetute Partizione della Varianza Marcello Gallucci GLM l ANOVA a misure ripetute rappresenta un caso del modello lineare generale in cui la variabilità non è valutata tra gruppi ma tra misure

Dettagli

LABORATORIO DI PROBABILITA E STATISTICA

LABORATORIO DI PROBABILITA E STATISTICA LABORATORIO DI PROBABILITA E STATISTICA Docente: Bruno Gobbi Bonus ESERCIZI DI RIPASSO FINALE 1 - STATISTICA DESCRITTIVA TABLET ESERCIZIO 1: La seguente tabella riporta i volumi di vendita (in migliaia

Dettagli

LABORATORIO DI PROBABILITA E STATISTICA

LABORATORIO DI PROBABILITA E STATISTICA UNIVERSITA DEGLI STUDI DI VERONA LABORATORIO DI PROBABILITA E STATISTICA Docente: Bruno Gobbi Corso di laurea in Informatica e Bioinformatica 9 ESERCIZI DI RIPASSO FINALE (1 di 2) 1 - STATISTICA DESCRITTIVA

Dettagli

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi) CHEMIOMETRIA Applicazione di metodi matematici e statistici per estrarre (massima) informazione chimica (affidabile) da dati chimici INCERTEZZA DI MISURA (intervallo di confidenza/fiducia) CONFRONTO CON

Dettagli

Prova scritta di Complementi di Probabilità e Statistica. 7 Dicembre 2012

Prova scritta di Complementi di Probabilità e Statistica. 7 Dicembre 2012 Prova scritta di Complementi di Probabilità e Statistica 7 Dicembre. Un ingegnere vuole investigare se le caratteristiche di una superficie metallica sono influenzate dal tipo di pittura usata e dal tempo

Dettagli

Laboratorio di R - 3 a lezione Prof. Mauro Gasparini

Laboratorio di R - 3 a lezione Prof. Mauro Gasparini Laboratorio di R - 3 a lezione Prof. Mauro Gasparini 1. Verifica di ipotesi: il test t di Student In R è disponibile la funzione t.test che effettua il test t di Student ad un campione, a due campioni

Dettagli

Analisi della varianza

Analisi della varianza 1. 2. univariata ad un solo fattore tra i soggetti (between subjects) 3. univariata: disegni fattoriali 4. univariata entro i soggetti (within subjects) 5. : disegni fattoriali «misti» L analisi della

Dettagli

RAPPORTO CER Aggiornamenti

RAPPORTO CER Aggiornamenti RAPPORTO CER Aggiornamenti 12 Ottobre 2012 LO SPREAD PROSSIMO VENTURO Quanto potrà scendere lo spread Btp-Bund dopo le misure di austerità fiscale? Per rispondere, forniamo una semplice stima derivata

Dettagli

Regressione multipla

Regressione multipla Regressione multipla L obiettivo è costruire un modello probabilistico per spiegare la variabile y tramite più di una variabile indipendente x 1, x 2,..., x k. Esempio: Per un efficiente progettazione

Dettagli

Il BOOM degli ascolti dei programmi culinari. ha inciso sulle iscrizioni all istituto alberghiero???

Il BOOM degli ascolti dei programmi culinari. ha inciso sulle iscrizioni all istituto alberghiero??? Il BOOM degli ascolti dei programmi culinari ha inciso sulle iscrizioni all istituto alberghiero??? 60000 50000 40000 30000 20000 10000 0 2007 2008 2009 2010 2011 2012 2013 2014 gli ingredienti sono: Anno

Dettagli

Analisi Univariata e Multivariata degli indici ricavati dai dati rilevati tramite Multiplex

Analisi Univariata e Multivariata degli indici ricavati dai dati rilevati tramite Multiplex Sviluppo di reti probabilistiche di supporto alle decisioni in viticoltura ed enologia Analisi Univariata e Multivariata degli indici ricavati dai dati rilevati tramite Multiplex Federico M. Stefanini

Dettagli

Analisi della varianza

Analisi della varianza Analisi della varianza Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona ANALISI DELLA VARIANZA - 1 Abbiamo k gruppi, con un numero variabile di unità statistiche.

Dettagli

STATISTICA BIVARIATA: ALCUNI STIMOLI DI APPROFONDIMENTO (Tecn. Lab. Biomedico e Tecn. Fisiop. e Perfus. Cardiovascolare 3 Anno)

STATISTICA BIVARIATA: ALCUNI STIMOLI DI APPROFONDIMENTO (Tecn. Lab. Biomedico e Tecn. Fisiop. e Perfus. Cardiovascolare 3 Anno) STATISTICA BIVARIATA: ALCUNI STIMOLI DI APPROFONDIMENTO (Tecn. Lab. Biomedico e Tecn. Fisiop. e Perfus. Cardiovascolare 3 Anno) 1) ASSOCIAZIONE TRA DUE CARATTERI RISCHIO RELATIVO E ODDS RATIO In uno studio

Dettagli

LABORATORIO DI PROBABILITA E STATISTICA

LABORATORIO DI PROBABILITA E STATISTICA UNIVERSITA DEGLI STUDI DI VERONA LABORATORIO DI PROBABILITA E STATISTICA Docente: Bruno Gobbi 8 ESERCIZI DI RIPASSO FINALE 1 - STATISTICA DESCRITTIVA LAUREATI ESERCIZIO 1: La seguente tabella riporta il

Dettagli

Esercizio 4 (Regressione multipla)

Esercizio 4 (Regressione multipla) Esercizio (Regressione multipla) DATI Il data set employee.sav (o employee.xls; fonte SPSS) contiene 7 dati relativi agli impiegati di un azienda. Le variabili sono ID Employee Code BDATE Date of Birth

Dettagli

Confronto tra più di due campioni

Confronto tra più di due campioni Confronto tra più di due campioni La matrice dei dati Quando si esaminano più di due popolazioni, le informazioni sono u- sualmente organizzate sotto forma di matrice.,,, n ( ω ω ω ) 1 2 Pino, Maria,,Giacomo

Dettagli

Statistica descrittiva con R

Statistica descrittiva con R Statistica descrittiva con R Silvia Parolo 21 Novembre 2014 Sintesi dei dati Le votazioni in matematica di 20 studenti della Yale University sono state le seguenti: 68 84 75 82 68 90 62 88 76 93 73 79

Dettagli

Statistica multivariata Donata Rodi 17/10/2016

Statistica multivariata Donata Rodi 17/10/2016 Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare

Dettagli

LABORATORIO DI PROBABILITA E STATISTICA

LABORATORIO DI PROBABILITA E STATISTICA UNIVERSITA DEGLI STUDI DI VERONA LABORATORIO DI PROBABILITA E STATISTICA Docente: Bruno Gobbi 4 ESERCIZI RIEPILOGATIVI PRIME 3 LEZIONI 1 - STATISTICA DESCRITTIVA VENDITE PC ESERCIZIO 1: La seguente tabella

Dettagli

Introduzione all Analisi della Varianza (ANOVA)

Introduzione all Analisi della Varianza (ANOVA) Introduzione all Analisi della Varianza (ANOVA) AMD Marcello Gallucci marcello.gallucci@unimib.it Variabili nella Regressione Nella regressione, la viariabile dipendente è sempre quantitativa e, per quello

Dettagli

La previsione delle vendite dei lm

La previsione delle vendite dei lm La previsione delle vendite dei lm L'industria cinematograca è un business con un alto prolo e un'elevata variabilità nei ricavi. Nel 2005, gli americani hanno speso 8.8 miliardi di dollari di biglietti

Dettagli

1/4 Capitolo 4 Statistica - Metodologie per le scienze economiche e sociali 2/ed Copyright 2008 The McGraw-Hill Companies srl

1/4 Capitolo 4 Statistica - Metodologie per le scienze economiche e sociali 2/ed Copyright 2008 The McGraw-Hill Companies srl 1/4 Capitolo 4 La variabilità di una distribuzione Intervalli di variabilità Box-plot Indici basati sullo scostamento dalla media Confronti di variabilità Standardizzazione Statistica - Metodologie per

Dettagli

Politecnico di Milano - Scuola di Ingegneria Industriale. II Prova in Itinere di Statistica per Ingegneria Energetica 25 luglio 2011

Politecnico di Milano - Scuola di Ingegneria Industriale. II Prova in Itinere di Statistica per Ingegneria Energetica 25 luglio 2011 Politecnico di Milano - Scuola di Ingegneria Industriale II Prova in Itinere di Statistica per Ingegneria Energetica 25 luglio 2011 c I diritti d autore sono riservati. Ogni sfruttamento commerciale non

Dettagli

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura INDICE GENERALE Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura XI XIV XV XVII XVIII 1 LA RILEVAZIONE DEI FENOMENI

Dettagli

Statistica descrittiva con R

Statistica descrittiva con R Statistica descrittiva con R Monica Marabelli 6 Novembre 2015 Sintesi dei dati Le votazioni in matematica di 20 studenti della Yale University sono state le seguenti: 68 84 75 82 68 90 62 88 76 93 73 79

Dettagli

obbligatorio - n. iscrizione sulla lista

obbligatorio - n. iscrizione sulla lista 02.09.2015 - appello di STATISTICA per studenti ENE - docente: E. Piazza obbligatorio - n. iscrizione sulla lista il presente elaborato si compone di 5 (cinque) pagine se non ve lo ricordate siete fritti;

Dettagli

R Commander: Quattro domande di statistica (e quattro risposte)

R Commander: Quattro domande di statistica (e quattro risposte) R Commander: Quattro domande di statistica (e quattro risposte) Massimo Borelli Dipartimento di Matematica e Geoscienze Dipartimento di Scienze della Vita Università degli Studi di Trieste Via A. Valerio

Dettagli

Analisi della varianza

Analisi della varianza Università degli Studi di Padova Facoltà di Medicina e Chirurgia Facoltà di Medicina e Chirurgia - A.A. 2009-10 Scuole di specializzazione Lezioni comuni Disciplina: Statistica Docente: dott.ssa Egle PERISSINOTTO

Dettagli

ANOVA 1 Via Esercizio esempio 1

ANOVA 1 Via Esercizio esempio 1 ANOVA 1 Via Esercizio esempio 1 Miller e Vanhoutte hanno condotto una ricerca sperimentale in cui cani femmine adulte, a cui erano state precedentemente asportate le ovaie (ovariectomizzate), sono stati

Dettagli

In via preliminare, confrontiamo la distribuzione del peso del cuore nei due sessi.

In via preliminare, confrontiamo la distribuzione del peso del cuore nei due sessi. Laboratorio 12 Analisi della covarianza 12.1 Analisi del dataset CATS.DAT I dati contenuti nel file cats.dat presentano il peso del corpo ed il peso del cuore di alcuni gatti di sesso femminile (1) e maschile

Dettagli

Strumenti informatici Realizzare un test z, un test t e un test F per campioni indipendenti con Excel e SPSS

Strumenti informatici Realizzare un test z, un test t e un test F per campioni indipendenti con Excel e SPSS Strumenti informatici 5.2 - Realizzare un test z, un test t e un test F per campioni indipendenti con Excel e SPSS Sia Excel che SPSS consentono di realizzare in modo abbastanza rapido il test sulle medie

Dettagli

Analisi delle caratteristiche socio-demografiche dei clienti

Analisi delle caratteristiche socio-demografiche dei clienti Analisi delle caratteristiche socio-demografiche dei clienti In questo documento vengono analizzate le caratteristiche socio-demografiche dei clienti e le eventuali relazioni esistenti tra queste e le

Dettagli

Analisi descrittiva: calcolando medie campionarie, varianze campionarie e deviazioni standard campionarie otteniamo i dati:

Analisi descrittiva: calcolando medie campionarie, varianze campionarie e deviazioni standard campionarie otteniamo i dati: Obiettivi: Esplicitare la correlazione esistente tra l altezza di un individuo adulto e la lunghezza del suo piede e del suo avambraccio. Idea del progetto: Il progetto nasce dall idea di acquistare scarpe

Dettagli

Misure Ripetute. Analisi dei dati in disegni di ricerca con misure ripetute. Marcello Gallucci

Misure Ripetute. Analisi dei dati in disegni di ricerca con misure ripetute. Marcello Gallucci Misure Ripetute Analisi dei dati in disegni di ricerca con misure ripetute Marcello Gallucci Introduzione Consideriamo una ricerca in cui un gruppo di pazienti è sottoposto ad un trattamento terapeutico

Dettagli

Metodi statistici e probabilistici per l ingegneria. Corso di Laurea in Ingegneria Civile A.A. 2009-10. Facoltà di Ingegneria. Università di Padova

Metodi statistici e probabilistici per l ingegneria. Corso di Laurea in Ingegneria Civile A.A. 2009-10. Facoltà di Ingegneria. Università di Padova Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria Civile A.A. 29- Facoltà di Ingegneria Università di Padova Docente: Dott. L. Corain ESERCIZIO (TEST AD UN CAMPIONE) Un

Dettagli

8. ANALISI DELLA COVARIANZA (ANCOVA)

8. ANALISI DELLA COVARIANZA (ANCOVA) 8. ANALISI DELLA COVARIANZA (ANCOVA) L analisi della covarianza è un metodo statistico che risulta dalla combinazione dell analisi di regressione con l analisi della varianza. È utile quando all analisi

Dettagli

Es. la performance all esame in relazione alle ore di studio a casa e alle abilità cognitive

Es. la performance all esame in relazione alle ore di studio a casa e alle abilità cognitive Regressione Tale tecnica esamina e studia la relazione tra una o più variabili indipendenti e una variabile dipendente. L insieme dei parametri riassumono la relazione tra VD e VI, sotto le ipotesi che

Dettagli

Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill

Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill Es. Soluzione degli esercizi del capitolo 8 home - indice In base agli arrotondamenti effettuati nei calcoli, si

Dettagli

Regressione Semplice. Correlazioni. sconto leverage. sconto Correlazione di Pearson 1,275. Sign. (a due code),141

Regressione Semplice. Correlazioni. sconto leverage. sconto Correlazione di Pearson 1,275. Sign. (a due code),141 Regressione Semplice Analisi Per avere una prima idea della struttura di dipendenza fra le variabili in esame, possiamo cominciare col costruire la matrice di correlazione delle variabili presenti nel

Dettagli

Nozioni di statistica

Nozioni di statistica Nozioni di statistica Distribuzione di Frequenza Una distribuzione di frequenza è un insieme di dati raccolti in un campione (Es. occorrenze di errori in seconda elementare). Una distribuzione può essere

Dettagli

MODELLI STATISTICI PER LE SPERIMENTAZIONI CLINICHE

MODELLI STATISTICI PER LE SPERIMENTAZIONI CLINICHE Università degli Studi di Milano-Bicocca Facoltà di Scienze Statistiche - Specialistica in Biostatistica Anno accademico 006-007 Corso di: MODELLI STATISTICI PER LE SPERIMENTAZIONI CLINICHE Prof.ssa A.

Dettagli

i dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente

i dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente TEST DI AUTOVALUTAZIONE - SETTIMANA 6 I diritti d autore sono riservati. Ogni sfruttamento commerciale non autorizzato sarà perseguito. Metodi statistici per la biologia Parte A. La retta di regressione.2

Dettagli

MODELLI LINEARI E NON LINEARI IN R

MODELLI LINEARI E NON LINEARI IN R MODELLI LINEARI E NON LINEARI IN R Angelo M. Mineo Dipartimento di Scienze Statistiche e Matematiche S. Vianelli Università degli Studi di Palermo Copyright 2008 Angelo M. Mineo. All rights reserved. i

Dettagli

docente: J. Mortera/P. Vicard Nome

docente: J. Mortera/P. Vicard Nome A opportuni passaggi). Verrà accettato in consegna solo il presente plico. 2. [9] Una certa zona è servita da 4 compagnie telefoniche. Per ciascuna compagnia è stato rilevato il costo al minuto (in centesimi

Dettagli

UNIVERSITÀ DEGLI STUDI DI PADOVA FACOLTÀ DI SCIENZE STATISTICHE

UNIVERSITÀ DEGLI STUDI DI PADOVA FACOLTÀ DI SCIENZE STATISTICHE UNIVERSITÀ DEGLI STUDI DI PADOVA FACOLTÀ DI SCIENZE STATISTICHE Corso di laurea triennale in Statistica e Gestione delle Imprese Tesi di laurea INFLAZIONE SALARIALE E DISOCCUPAZIONE: UNA VERIFICA EMPIRICA

Dettagli

ESERCIZIO 1. Biondi Castani Rossi Neri TOTALE

ESERCIZIO 1. Biondi Castani Rossi Neri TOTALE ESERCIZIO 1 La seguente tabella riporta la ripartizione di un campione di 374 abitanti della nazione RAINBOW in base al colore dei capelli e al genere: GENERE Femminile Maschile TOTALE COLORE DEI CAPELLI

Dettagli

Metodi di regressione multivariata

Metodi di regressione multivariata Metodi di regressione multivariata Modellamento dei dati per risposte quantitative I metodi di regressione multivariata sono strumenti utilizzati per ricercare relazioni funzionali quantitative tra un

Dettagli

DESCRITTIVE, TEST T PER IL CONFRONTO DELLE MEDIE DI CAMPIONI INDIPENDENTI.

DESCRITTIVE, TEST T PER IL CONFRONTO DELLE MEDIE DI CAMPIONI INDIPENDENTI. Corso di Laurea Specialistica in Biologia Sanitaria, Universita' di Padova C.I. di Metodi statistici per la Biologia, Informatica e Laboratorio di Informatica (Mod. B) Docente: Dr. Stefania Bortoluzzi

Dettagli

Analisi della varianza a una via

Analisi della varianza a una via Analisi della varianza a una via Statistica descrittiva e Analisi multivariata Prof. Giulio Vidotto PSY-NET: Corso di laurea online in Discipline della ricerca psicologico-sociale SOMMARIO Modelli statistici

Dettagli

stima per intervallo

stima per intervallo stima per intervallo intervalli di fiducia confidence interval una affermazione come questa: CI(95%): lim inf < µ < lim sup p = 0.95 che la media della popolazione sia compresa nell intervallo fra lim

Dettagli

Intervallo di fiducia del coefficiente angolare e dell intercetta L intervallo di fiducia del coefficiente angolare (b 1 ) è dato da:

Intervallo di fiducia del coefficiente angolare e dell intercetta L intervallo di fiducia del coefficiente angolare (b 1 ) è dato da: Analisi chimica strumentale Intervallo di fiducia del coefficiente angolare e dell intercetta L intervallo di fiducia del coefficiente angolare (b 1 ) è dato da: (31.4) dove s y è la varianza dei valori

Dettagli

Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii

Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii Sommario Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii xv Parte I Statistica descrittiva 1 Capitolo 1 Introduzione 3 Perché studiare statistica? 4

Dettagli

Esercitazioni. Es 1. Dato il seguente dataset

Esercitazioni. Es 1. Dato il seguente dataset Esercitazioni Es 1 Dato il seguente dataset N SESSO ETA' PESO ALTEZZA DIPLOMA COMPONENTI OCCHIALI FUMO 1 0 20,6 65 180 Ist.Tecnico 6 0 1 2 0 20,2 75 180 Liceo 4 0 0 3 0 20,3 60 173 Ist.Tecnico 4 1 0 4

Dettagli

Multicollinearità. Strumenti quantitativi per la gestione

Multicollinearità. Strumenti quantitativi per la gestione Multicollinearità Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/3c_mc.html#(1) 1/13 Quando non tutto va come dovrebbe Si parla di multi-collinearità

Dettagli

Esercizio 1 Questa tabella esprime i tempi di durata di 200 apparecchiature elettriche:

Esercizio 1 Questa tabella esprime i tempi di durata di 200 apparecchiature elettriche: Istituzioni di Statistica 1 Esercizi su indici di posizione e di variabilità Esercizio 1 Questa tabella esprime i tempi di durata di 200 apparecchiature elettriche: Durata (ore) Frequenza 0 100? 100 200

Dettagli

Analisi Univariata & Esercizi

Analisi Univariata & Esercizi Analisi Univariata & Esercizi Metodi Quantitativi per Economia, Finanza e Management Esercitazione n 3 Lavoro di Gruppo Inviare entro oggi 16/10/2015, a gmagistrelli@liuc.it e gdeppieri@liuc.it: nome,

Dettagli

APPLICAZIONE DI FERTIRRIGAZIONE SU POMODORO DA INDUSTRIA

APPLICAZIONE DI FERTIRRIGAZIONE SU POMODORO DA INDUSTRIA NUTRIZIONE APPLICAZIONE DI IGAZIONE SU POMODORO DA INDUSTRIA 2005 sponsor Ravenna, 24 ottobre 2005 INTRODUZIONE E SCOPO DELLA VERIFICA Si è valutata l efficacia di fertirrigazione idonea anche per il biologico

Dettagli