INTRODUZIONE AI MODELLI LINEARI

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "INTRODUZIONE AI MODELLI LINEARI"

Transcript

1 INTRODUZIONE AI MODELLI LINEARI Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Universitá degli Studi di Perugia Versione on-line: onofri/rtutorial/index.html Indice 1 Lo schema di lavoro 1 2 Il caso della media 2 3 Il caso della regressione lineare semplice 4 4 L analisi della varianza ANOVA 9 1 Lo schema di lavoro Adattare un modello matematico statistico ai dati sperimentali significa identificare una relazione matematica del tipo: Y = fx, θ + ɛ con la quale si vogliono descrivere le osservazioni Y, tramite una funzione f, una o più variabili esplicative X, uno o più parametri θ. La descrizione delle osservazioni non sarà perfetta, ma rimarrà una certa quota di variabilità non spiegata ɛ. Il lavoro procede in quattro fasi fondamentali: 1. Definizione del/dei modello/i e delle variabili esplicative 2. Parametrizzazione del/dei modello/i stima dei parametri 3. Stima delle devianze modello e residuo 4. Test d ipotesi Illustriamo il metodo attraverso alcuni esempi pratici. 1

2 2 IL CASO DELLA MEDIA 2 2 Il caso della media Definizione del modello Poniamo di avere due osservazioni sperimentali 3, 1 e immaginiamo che il modello lineare sia della forma: Y = µ + ɛ con il quale si intende che le due osservazioni possono essere considerate una funzione della media, più o meno un certo errore sperimentale. Si tratta in realtà di un sistema a due equazioni, del tipo: { 3 = µ + ε1 1 = µ + ε 2 In notazione matriciale, questo sistema può essere scritto: Y = Zθ + ɛ con: Y = 3 1 ; Z = 1 1 ; θ = µ Z prende il nome di matrice del disegno. La risposta attesa è: Stima dei parametri EY = Zθ La nostra incognita è θ. La si può determinare considerando che, da un punto di vista geometrico, le osservazioni in nostro possesso Y sono un vettore giacente nello spazio R n n è pari al numero dei dati; in questo caso, nel piano euclideo, il vettore Y è rappresentato dal punto di coordinate 3,1, mentre la risposta attesa EY deve giacere sul luogo dei punti con coordinate uguali per definizione di media e quindi sulla retta r bisettrice del primo e terzo quadrante. Questa retta è un sottospazio di R 2 ad una dimensione la media ha quindi un grado di libertà generato dal vettore Z e dal versore µ. Di conseguenza EY può essere individuato come il punto della retta r più vicino al punto Y, cioè il piede della perpendicolare ad r passante per Y 1. Insomma, il vettore ɛ deve essere perpendicolare al vettore Z; ossia: Di conseguenza: Z T ɛ = 0

3 2 IL CASO DELLA MEDIA 3 Figura 1: Significato geometrico del metodo dei minimi quadrati, per il calcolo della media di due osservazioni. Da cui: Z T ɛ = Z T Y Zθ = Z T Y Z T Zθ θ = Z T Z 1 Z T Y L equazione risolutiva anzidetta equivale perfettamente alla formula usuale per il calcolo della media; infatti si può facilmente osservare che: Z Z T 1 = 1 n Z T Y = n X i i=1 dove n rappresenta il numero dei dati. Stima delle devianze Dopo aver eseguito la stima dei parametri del modello un modo elegante per dire: dopo aver calcolato la media possiamo procedere al calcolo del vettore ɛ; il quadrato del modulo di questo vettore, coincide con la devianza somma dei quadrati degli scarti ed è pari a: ε T ε = Questa devianza ha un solo grado di libertà, in quanto il vettore ɛ deve per forza giacere su un segmento perpendicolare alla retta r e può quindi muoversi solo in uno spazio unidimensionale ben definito. = 2

4 3 IL CASO DELLA REGRESSIONE LINEARE SEMPLICE 4 Ovviamente, nel semplice caso della media non vi sono esempi di test d ipotesi di interesse pratico. 3 Il caso della regressione lineare semplice Definizione del modello L estensione al caso della regressione lineare è estremamente semplice: si assume che la variabile dipendente è funzione di quella indipendente secondo la retta di equazione generale y = a + bx. Il modello lineare è analogo a quello precedentemente indicato, ma la matrice Z, stavolta, ha due colonne, la prima come nel caso della media è rappresentata da una colonna di 1, mentre la seconda è rappresentata dalla variabile indipendente. Consideriamo, come semplice esempio, tre osservazioni sperimentali, sulle quali siano state rilevate due caratteristiche X ed Y: Num. x y Le matrici Y e Z sono: Y = Stima dei parametri Z = Anche in questo caso possiamo vedere il nostro vettore Y variabile dipendente osservata come un punto nello spazio a tre dimensioni. Ci possiamo ora chiedere, nello stesso spazio, dove giace la risposta attesa EY = Zθ. Si può osservare che, se si indicano con b 0 e b 1 rispettivamente l intercetta e la pendenza della retta, la risposta attesa è pari a: Zθ = b0 b 1 = b 0 + 5b 1 b b 1 b b 1 Cambiando i valori di b 0 e b 1 cambia la posizione del punto che rappresenta la risposta attesa nello spazio a tre dimensioni. Si può notare che se b 0 e b 1 fossero entrambi uguali a zero, la risposta attesa sarebbe Y 0, 0, 0 cioè coinciderebbe con l origine degli assi. Se invece b 0 fosse pari a 0 e b 1 ad 1, otterremmo il punto Y 5, 10, 15, mentre se b 0 fosse pari a 1 e b 1 a 0, otterremmo il punto Y 1, 1, 1. Si può quindi dimostrare che la risposta attesa

5 3 IL CASO DELLA REGRESSIONE LINEARE SEMPLICE 5 giace su un piano definito dall origine degli assi e dai punti 1,1,1 e 5,10,15 corrispondenti ad ognuna delle colonne della matrice del disegnoz. Di conseguenza, la stima di b 0 e b 1 e b 0 e b 1 è data dai valori che consentono di minimizzare la distanza tra il punto Y di coordinate 91, 61, 54 e il punto Y, che giace sul piano della risposta attesa. Anche in questo caso il punto di un piano più vicino ad un punto dato ed esterno al piano è rappresentato dal piede delle perpendicolare al piano passante per il punto dato. La linea che congiunge Y ed Y è rappresentata dal vettore ɛ. Bisogna quindi imporre che il vettore degli scarti sia perpendicolare ortogonale a Z e, di conseguenza, vale ancora la relazione scritta più sopra per il caso della media: θ = Z T Z 1 Z T Y Si può dimostrare che l anzidetta relazione matriciale porta a risultati assolutamente analoghi a quelli raggiungibili per via algebrica si veda ad esempio onofri/rtutorial/tutorial/regressione.htm Nel nostro caso otteniamo: Z T Y = θ = = 1 Z Z T Z T Y = = la risposta attesa sarà: Zθ = = mentre il vettore degli scarti sarà Stima delle devianze ε = Y Zθ = La norma al quadrato di ɛ è pari a 88.17, che corrisponde alla devianza residuale del modello, cioà la devianza non spiegata dalla regressione della Y sulla X. Da questa possiamo calcolare la varianza, considerando che il numero di gradi di libertà è dato dalla differenza tra n numero dei dati, nel nostro caso 3 e p numero dei parametri stimati nel nostro caso 2. La varianza sarà quindi 88.17/1= 88.17, mentre la deviazione standard del residuo sarà pari alla radice quadrata della varianza, cioè

6 3 IL CASO DELLA REGRESSIONE LINEARE SEMPLICE 6 Per stabilire la quota di devianza spiegata dal modello dobbiamo procedere in modo sequenziale. Possiamo infatti considerare che aggiungendo alla matrice del disegno Zla seconda colonna che è apunto quella che differenzia il caso della regressione rispetto al caso della media esposto in precedenza otteniamo un decremento della devianza del residuo pari a cioè = , che costituisce appunto la quota di devianza spiegata dalla regressione. In altre parole, la devianza spiegata dalla regressione è pari alla differenza tra la devianza totale delle osservazioni e la devianza del residuo della regressione, con un numero di gradi di libertà pari al numero dei parametri stimati meno 1 nel nostro caso 1. Test d ipotesi Dopo la stima dei parametri, prima di procedere con qualunque altra analisi, è necessario verificare la correttezza del modello e la sua adeguatezza a descrivere i dati sperimentali. Gli aspetti legato alla diagnostica di un modello sono trattati in una lezione a parte, ma si anticipa che si tratta di una fase fondamentale di ogni analisi statistica corretta. Una volta che si sia sicuri della bontá del modello si puó procedere con una serie di test d ipotesi di interesse biologico o con il calcolo di alcune statistiche di interesse pratico. Test F per la bontà del modello Un modello è buono il suo effetto cioè la quota di varianza che riesce a spiegare è superiore alla varianza dell errore. Queste due varianze possono essere confrontate mediante un test di F: F p,n p = MS reg MS residuo che in questo caso è uguale a 684.5/88.17 = 7.76, con una probabilità pari a Di conseguenza, la varianza spiegata dalla regressione non è tanto più alta di quella dell errore da consentirci di rifiutare l ipotesi nulla di non significatività del modello. Ovviamente questo risultato è legato prevalentemente al basso numero di gradi di libertà in gioco. Bontà della stima dei parametri L errore standard del p-esimo parametro si ottiene con la seguente formula: [ ES θ p = s Z T Z 1] pp dove s è la deviazione standard del residuo e il termine sotto radice è dato dal p-esimo termine diagonale della matrice quadrata ottenuta dall inversa del prodotto Z T Z 1 già menzionata in precedenza.

7 3 IL CASO DELLA REGRESSIONE LINEARE SEMPLICE 7 Nel caso dell esempio esposto in precedenza gli errori standard dei parametri sarebbero: ESb 0 = = ESb 1 = = 1.33 I limiti di confidenza della stima possono essere costruiti moltiplicando l errore standard per l integrale di probabilitã della distribuzione t di Student, per un numero di gradi di libertã pari alla devianza del residuo n - p e il livello α prefissato. Il rapporto tra la stima di un parametro e il suo errore standard segue la distribuzione t di Student, per un numero di gradi di libertà pari ad 1 e permette di testare l ipotesi che il valore stimato differisce da 0. Gli intervalli di confidenza del valore y stimato per un dato x0 si possono calcolare tramite la formula: f x 0 ; θ ± s y0 T ZT Z y 0 t N P ;α/2 Il coefficiente di determinazione Una quantitã frequentemente utilzzata per valutare la bontã d adattamento di un modello di regressione à il coefficiente di determinazione R2, dato dal rapporto tra la devianza della regressione e la devianza totale. R 2 = SS reg SS tot Essendo un rapporto, ci da solo una indicazione abbastanza grezza sulla bontà della regressione, in quanto valori bassi possono essere ottenuti sia perchè la devianza dell errore è grande, sia perchè la devianza dell errore è piccola, ma lo è anche la devianza della regressione. Inoltre, R 2 dipende dall intervallo di variazione della variabile indipendente; di conseguenza, se nella regressione aggiungiamo uno o più livelli della X otteniamo un innalzamento del valore di R 2, che tuttavia non necessariamente produce una miglior stima della funzione. Un esempio tipico è l aggiunta del livello di fertilizzazione zero in una prova di concimazione: ciò aiuta ad alzare il valore di R 2, ma non necessariamente implica una miglior stima del modello di regressione, soprattutto in vicinanza dei livelli ottimali. Ciò è particolarmente importante con le regressioni non-lineari, laddove vi sono molti parametri di forma della curva. Ad esempio, se il valore di N ottimale è tra 5 e 40 kg/ha, un esperimento con 0, 20, 40 e 80 kg/ha di N darà sicuramente valori di R 2 più alti che non un esperimento con 5,10, 20 e 40 kg/ha anche se quest ultimo fornirà più probabilmente una miglior stima dei livelli di N ottimale.

8 3 IL CASO DELLA REGRESSIONE LINEARE SEMPLICE 8 Se dovessimo confrontare i due modelli, sarebbe preferibile farlo attraverso la devianza del residuo, magari espressa come coefficiente di variabilità, piuttosto che attraverso il valore del coefficiente di determinazione. Un altra considerazione generale che può essere fatta è che il coefficiente di determinazione è sensibile al numero di regressori presenti nel modello, quindi in caso di regressione multipla, all aumentare del numero di variabili X incluse nel modello aumenta il valore di R 2, anche se l aggiunta non determina un miglioramento della capacità descrittiva del modello stesso. Il coefficiente di determinazione corretto Il vaore di R 2 corretto è costituito dalla proporzione di varianza MS spiegata dalla regressione ed è pari a: R 2 a = 1 MS residuo MS tot Per questo motivo il valore di R 2 corretto è detto anche R 2 corretto per i gradi di libertà. Il suo rapporto con il coefficiente di determinazione tradizionale è: 1 R Ra 2 2 n 1 = 1 n k 1 dove n è il numero di osservazioni e k il numero dei regressori. L R 2 corretto è sempre più basso dell R 2 e diminuisce con l aggiunta al modello di un nuovo regressore se l incremento di devianza totale è meno che quello della devianza residua. Può assumere valori negativi se la varianza del residuo è maggiore della varianza della variabile dipendente. La regressione con R L analidi di regressione in R si effettua ricorrendo alla funzione lmy ~ x. L oggetto risultanto può essere interrogato con l uso della funzione summary, che fornisce i parametri stimati ed altre statistiche descrittive, e con la funzione anova, che invece fornisce l analisi della varianza della regressione. x <- c5, 10, 15 y <- c91,61,54 model summarymodel Call: lmformula = y ~ x Residuals:

9 4 L ANALISI DELLA VARIANZA ANOVA Coefficients: Estimate Std. Error t value Pr>t Intercept x Signif. codes: 0 *** ** 0.01 * Residual standard error: 9.39 on 1 degrees of freedom Multiple R-Squared: , Adjusted R-squared: F-statistic: on 1 and 1 DF, p-value: > anovamodel Analysis of Variance Table Response: y Df Sum Sq Mean Sq F value Pr>F x Residuals > 4 L analisi della varianza ANOVA Definizione del modello Immaginiamo di aver posto a confronto tre trattamenti sperimentali qualitativi tre tipi di concime, tre varietà di frumento... e di aver registrato il loro effetto su una variabile quantitativa ad esempio la produzione Supponiamo di aver distribuito su due parcelle di frumento solo acqua e di aver registrato una produzione pari a A54, 49. Altre due parcelle sono state trattate con acqua ed una sostanza concimante, registrando una produzione pari a B57, 54. Altre due parcelle sono state trattate con acqua ed una seconda sostanza concimante, registrando una produzione C59,61. Ovviamente, le sei parcelle sono inserite in un disegno a randomizzazione completa, nel quale esse differiscono solo per il trattamento oggetto di studio ed ognuna di esse è assegnata casualmente ad uno dei trattamenti. Il modello lineare potrebbe essere posto nel modo usuale: con: y = Zθ + ɛ

10 4 L ANALISI DELLA VARIANZA ANOVA 10 Y = Z = ϑ = In sostanza, ogni osservazione è funzione della media generale, più l effetto del trattamento α, più l errore sperimentale. La differenza con l analisi della regressione è che gli effetti non sono quantitativi bensì qualitativi: una tesi differisce dall altra per la qualità del trattamento, non per la quantità. Stima dei parametri La stima dei parametri può essere effettuata con la formula risolutiva usuale, che nel caso degli effetti qualitativi, soprattutto per i disegni più complessi, pone problemi legati al fatto che la matrice Z T Z non è sempre di rango pieno e quindi è necessario ricorrere al calcolo della pseudoinversa di Moore- Penrose, o ricorrere a procedure numeriche come l eliminazione di Gauss- Jordan o l algoritmo Sweep. Più semplicemente, notiamo che: Z T Z = Questa matrice non è di rango pieno in quanto la prima colonna e la prima riga possono essere ottenute per combinazione lineare delle altre tre colonne o righe rispettivamente. Non possiamo quindi calcolare l inversa, ma possiamo calcolare in modo semplice un inversa generalizzata, escludendo la prima colonna e la prima riga della matrice quindi prendendo solo la parte di rango pieno, facendo l inversa della matrice 3 x 3 che resta e aggiungendo poi una prima colonna ed una prima riga di zeri. Così facendo otteniamo: 1 = e quindi: Z T Z Z T Z 1 Z T Y = µ α 1 α 2 α 3

11 4 L ANALISI DELLA VARIANZA ANOVA 11 Stima delle devianze Dopo essere giunti alla stima dei parametri, possiamo notare che il residuo errore è rappresentato dal vettore ɛ2.5,-2.5, 1.5, -1.5, -1, 1, il cui modulo al quadrato del modulo è pari a 19. La devianza del modello, anche in questo caso, è uguale al calo della devianza residua che otteniamo dopo aver inserito nel modello l effetto del trattamento le ultime tre colonne della matrice Z, cioè alla differenza tra la devianza totale delle sei osservazioni pari a e la devianza residua del modello, quindi = 72.33: Nel caso di disegni bilanciati, è possibile raggiungere gli stessi risultati con un approccio algebrico semplificato. Infatti, l effetto del trattamento è dato dalla differenza tra la media del trattamento e la media generale. Le tre medie sono pari a 51.5, 55.5 e 60, rispettivamente, mentre la media generale è pari a Di conseguenza il modello lineare può essere scritto: = I due vettori a destra rappresentano rispettivamente l effetto del trattamento e il residuo. Il quadrato dei loro moduli à pari a rispettivamente alla devianza del trattamento e del residuo, che coincidono con le quantitã riportate in precedenza. Per rispondere alla domanda: il trattamento ha avuto effetto? è sufficiente confrontare l effetto del trattamento con il residuo. Non dobbiamo però dimenticare che in generale i due effetti espressi come devianze possono avere un diverso numero di gradi di libertà e quindi non essere confrontabili. Di conseguenza, andremo a confrontare le varianze come nella tabella seguente: Factor Df Sum Sq Mean Sq F value Prob. X Residuals Test d ipotesi Poniamo l ipotesi nulla che il trattamento non ha avuto effetto; in questo caso, la probabilità di trovare un valore di F pari a 5.71 è del 9.4% circa. Non abbiamo quindi elementi per rifiutare l ipotesi nulla e dobbiamo accettarla. Di conseguenza, possiamo affermare che non ci sono elementi sufficienti per ritenere che il trattamento concimante ha avuto effetto.

12 4 L ANALISI DELLA VARIANZA ANOVA 12 Grazie all ANOVA possiamo calcolare alcune importanti quantità, come ad esempio il coefficiente di variabilità della prova: MSresiduo 6.33 CV = 100 = 100 = 4.52 µ che è una buona misura della precisione dell esperimento, nonchè l errore standard di una media s.e.m.: MS errore s.e.m. = n r dove n è il numero delle repliche, oppure l errore standard della differenza di due medie s.e.d. 2 MS errore s.e.d. = n r S.e.m. e s.e.d. sono in genere accettate dalle riviste scientifiche come indicatori di variabilità delle prove da riportare su grafici e tabelle; il s.e.m. è preferito per serie di dati quantitativi come nel caso della regressione mentre il s.e.d. è preferito per variabili esplicative qualitative come in questo caso. L ANOVA con R In R l esecuzione dell ANOVA è banale ed avviene attraverso la funzione giè presentata nel capitolo precedente. Nel caso in cui la variabile esplicativa à di tipo quantitativo bisogna ricordarsi di specificare che la variabile esplicativa à di tipo factor, altrimenti R esegue un analisi di regressione lineare. > Y<-c54,49,57,54,59,61 > X<-c1,1,2,2,3,3 > X1<-factorX > analisi.varianza<-lmy~x1 > anovaanalisi.varianza Analysis of Variance Table Response: Y Df Sum Sq Mean Sq F value Pr>F X Residuals

13 4 L ANALISI DELLA VARIANZA ANOVA 13 Signif. codes: 0 *** ** 0.01 * > regressione<-lmy~x > anovaregressione Analysis of Variance Table Response: Y Df Sum Sq Mean Sq F value Pr>F X * Residuals Signif. codes: 0 *** ** 0.01 * Per approfondimenti CAMUSSI Alessandro, MOELLER Frank, OTTAVIANO Ercole, SARI GORLA Mirella Metodi Statistici per la sperimentazione biologica. Zanichelli Editore, 496 pp.

Anova e regressione. Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Universitá degli Studi di Perugia 22 marzo 2011

Anova e regressione. Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Universitá degli Studi di Perugia 22 marzo 2011 Anova e regressione Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Universitá degli Studi di Perugia 22 marzo 2011 Nella sperimentazione agronomica e biologica in genere è normale organizzare

Dettagli

Stima dei parametri di modelli lineari

Stima dei parametri di modelli lineari Stima dei parametri di modelli lineari Indice Introduzione................................ 1 Il caso studio................................ 2 Stima dei parametri............................ 3 Bontà delle

Dettagli

Valutazione dei modelli matematici

Valutazione dei modelli matematici Valutazione dei modelli matematici Andrea Onofri 30 aprile 2013 Indice 1 Introduzione 2 2 Metodi grafici di valutazione 2 3 Metodi numerici 3 3.1 Il coefficiente di determinazione................... 5

Dettagli

Laboratorio di Statistica Aziendale Modello di regressione lineare multipla

Laboratorio di Statistica Aziendale Modello di regressione lineare multipla Laboratorio di Statistica Aziendale Modello di regressione lineare multipla Michela Pasetto michela.pasetto2@unibo.it Definizione del modello OLS (semplice) L obiettivo della regressione lineare è di valutare

Dettagli

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Quesito: Posso stimare il numero di ore passate a studiare statistica sul voto conseguito all esame? Potrei calcolare il coefficiente di correlazione.

Dettagli

0.1 Percorrenza e Cilindrata

0.1 Percorrenza e Cilindrata 0.1 Percorrenza e Cilindrata Iniziamo ora un analisi leggermente più complessa basata sempre sui concetti appena introdotti. Innanzi tutto possiamo osservare, dal grafico ottenuto con il comando pairs,

Dettagli

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli. Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:

Dettagli

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla Introduzione E la generalizzazione del modello di regressione lineare semplice: per spiegare il fenomeno d interesse Y vengono introdotte p, con p > 1, variabili esplicative. Tale generalizzazione diventa

Dettagli

Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico )

Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico ) Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico 05-6) REGRESSIONE LINEARE SEMPLICE OPEN STATISTICA 8.44 Per 8 settimanali, appartenenti alla medesima fascia di prezzo e presenti in edicola

Dettagli

Contrasti e confronti multipli

Contrasti e confronti multipli Contrasti e confronti multipli Andrea Onofri 25 gennaio 2012 Indice 1 Introduzione 1 2 I contrasti pianificati 2 Test di confronto multiplo 4 4 Limitazione delle MCP 5 5 Scegliere la MCP 7 Sommario Scopo

Dettagli

L Analisi della Varianza ANOVA (ANalysis Of VAriance)

L Analisi della Varianza ANOVA (ANalysis Of VAriance) L Analisi della Varianza ANOVA (ANalysis Of VAriance) 1 Concetti generali: Confronto simultaneo tra più di due popolazioni, esempi... La analisi della varianza estende il confronto a p gruppi con p>2.

Dettagli

Nel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0.

Nel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0. Regressione [] el modello di regressione lineare si assume una relazione di tipo lineare tra il valore medio della variabile dipendente Y e quello della variabile indipendente X per cui Il modello si scrive

Dettagli

STATISTICA A K (60 ore)

STATISTICA A K (60 ore) STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta

Dettagli

LABORATORIO 5. ANALISI DELLA VARIANZA AD UN CRITERIO DI CLASSIFICAZIONE

LABORATORIO 5. ANALISI DELLA VARIANZA AD UN CRITERIO DI CLASSIFICAZIONE LABORATORIO 5. ANALISI DELLA VARIANZA AD UN CRITERIO DI CLASSIFICAZIONE 5.1 ESEMPIO DI ANOVA AD UNA VIA In un esperimento un gruppo di bambini è stato assegnato a caso a 3 trattamenti, allo scopo di determinare

Dettagli

Test F per la significatività del modello

Test F per la significatività del modello Test F per la significatività del modello Per verificare la significatività dell intero modello si utilizza il test F Si vuole verificare l ipotesi H 0 : β 1 = 0,, β k = 0 contro l alternativa che almeno

Dettagli

s a Inferenza: singolo parametro Sistema di ipotesi: : β j = β j0 H 1 β j0 statistica test t confronto con valore t o p-value

s a Inferenza: singolo parametro Sistema di ipotesi: : β j = β j0 H 1 β j0 statistica test t confronto con valore t o p-value Inferenza: singolo parametro Sistema di ipotesi: H 0 : β j = β j0 H 1 : β j β j0 statistica test t b j - b s a jj j0 > t a, 2 ( n-k) confronto con valore t o p-value Se β j0 = 0 X j non ha nessuna influenza

Dettagli

Analisi della varianza

Analisi della varianza Analisi della varianza Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona ANALISI DELLA VARIANZA - 1 Abbiamo k gruppi, con un numero variabile di unità statistiche.

Dettagli

DAL CAMPIONE ALLA POPOLAZIONE: LA STIMA DEI PARAMETRI

DAL CAMPIONE ALLA POPOLAZIONE: LA STIMA DEI PARAMETRI DAL CAMPIONE ALLA POPOLAZIONE: LA STIMA DEI PARAMETRI Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Università degli Studi di Perugia Versione on-line: http://www.unipg.it/ onofri/rtutorial/index.html

Dettagli

Esercitazione 5 - Statistica (parte II) Davide Passaretti 9/3/2017

Esercitazione 5 - Statistica (parte II) Davide Passaretti 9/3/2017 Esercitazione 5 - Statistica (parte II) Davide Passaretti 9/3/2017 Contents 1 Inferenza sulla regressione semplice 1 1.1 Test sulla pendenza della retta................................... 1 1.2 Test sull

Dettagli

Il metodo di Gauss-Newton per le regressioni non-lineari

Il metodo di Gauss-Newton per le regressioni non-lineari Il metodo di Gauss-Newton per le regressioni non-lineari Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Università degli Studi di Perugia Versione on-line: http://www.unipg.it/ onofri/rtutorial/index.html

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Associazione, correlazione e dipendenza tra caratteri In un collettivo di 11 famiglie è stata

Dettagli

Esercizi di statistica

Esercizi di statistica Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..

Dettagli

L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale

L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile Corso di Metodologia della ricerca sociale L analisi della varianza (ANOVA) La tecnica con cui si esplorano le relazioni

Dettagli

STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7:

STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7: esercitazione 7 p. 1/13 STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7: 20-05-2004 Luca Monno Università degli studi di Pavia luca.monno@unipv.it http://www.lucamonno.it

Dettagli

Matematica Lezione 22

Matematica Lezione 22 Università di Cagliari Corso di Laurea in Farmacia Matematica Lezione 22 Sonia Cannas 14/12/2018 Indici di posizione Indici di posizione Gli indici di posizione, detti anche misure di tendenza centrale,

Dettagli

Analisi della varianza a due fattori

Analisi della varianza a due fattori Laboratorio 11 Analisi della varianza a due fattori 11.1 Analisi del dataset PENICILLIN.DAT I dati contenuti nel file penicillin.dat, si riferiscono ad un esperimento di produzione di penicillina tendente

Dettagli

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1 lezione n. 6 (a cura di Gaia Montanucci) METODO MASSIMA VEROSIMIGLIANZA PER STIMARE β 0 E β 1 Distribuzione sui termini di errore ε i ε i ~ N (0, σ 2 ) ne consegue : ogni y i ha ancora distribuzione normale,

Dettagli

Corso in Statistica Medica

Corso in Statistica Medica Corso in Statistica Medica Introduzione alle tecniche statistiche di elaborazione dati Regressione e correlazione Dott. Angelo Menna Università degli Studi di Chieti G. d Annunziod Annunzio Anno Accademico

Dettagli

Minimi quadrati ordinari Interpretazione geometrica. Eduardo Rossi

Minimi quadrati ordinari Interpretazione geometrica. Eduardo Rossi Minimi quadrati ordinari Interpretazione geometrica Eduardo Rossi Il MRLM Il modello di regressione lineare multipla è usato per studiare le relazioni tra la variabile dipendente e diverse variabili indipendenti

Dettagli

La regressione lineare. Rappresentazione analitica delle distribuzioni

La regressione lineare. Rappresentazione analitica delle distribuzioni La regressione lineare Rappresentazione analitica delle distribuzioni Richiamiamo il concetto di dipendenza tra le distribuzioni di due caratteri X e Y. Ricordiamo che abbiamo definito dipendenza perfetta

Dettagli

Analisi della varianza (anova) a due vie: parcelle di diverse dimensioni

Analisi della varianza (anova) a due vie: parcelle di diverse dimensioni Analisi della varianza (anova) a due vie: parcelle di diverse dimensioni Andrea Onofri 31 gennaio 2012 Indice 1 Motivazioni dei disegni a split-plot 1 2 Calcolo dell ANOVA a split-plot 4 2.1 SED, confronti

Dettagli

Old Faithful, Yellowstone Park. Statistica e biometria. D. Bertacchi. Dati congiunti. Tabella. Scatterplot. Covarianza. Correlazione.

Old Faithful, Yellowstone Park. Statistica e biometria. D. Bertacchi. Dati congiunti. Tabella. Scatterplot. Covarianza. Correlazione. Coppie o vettori di dati Spesso i dati osservati sono di tipo vettoriale. Ad esempio studiamo 222 osservazioni relative alle eruzioni del geyser Old Faithful. Old Faithful, Yellowstone Park. Old Faithful

Dettagli

Statistica Applicata all edilizia: il modello di regressione

Statistica Applicata all edilizia: il modello di regressione Statistica Applicata all edilizia: il modello di regressione E-mail: orietta.nicolis@unibg.it 27 aprile 2009 Indice Il modello di Regressione Lineare 1 Il modello di Regressione Lineare Analisi di regressione

Dettagli

CAPITOLO 3 Esperimenti con un singolo fattore: l Analisi della Varianza

CAPITOLO 3 Esperimenti con un singolo fattore: l Analisi della Varianza Douglas C. Montgomery Progettazione e analisi degli esperimenti 006 McGraw-Hill CAPITOLO 3 Esperimenti con un singolo fattore: l Analisi della Varianza Metodi statistici e probabilistici per l ingegneria

Dettagli

Analisi della varianza a una via

Analisi della varianza a una via Analisi della varianza a una via Statistica descrittiva e Analisi multivariata Prof. Giulio Vidotto PSY-NET: Corso di laurea online in Discipline della ricerca psicologico-sociale SOMMARIO Modelli statistici

Dettagli

Capitolo 12 La regressione lineare semplice

Capitolo 12 La regressione lineare semplice Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università

Dettagli

Regressione. Monica Marabelli. 15 Gennaio 2016

Regressione. Monica Marabelli. 15 Gennaio 2016 Regressione Monica Marabelli 15 Gennaio 2016 La regressione L analisi di regressione é una tecnica statistica che serve a studiare la relazione tra variabili. In particolare, nel modello di regressione

Dettagli

ESERCITAZIONE REGRESSIONE MULTIPLA

ESERCITAZIONE REGRESSIONE MULTIPLA ESERCITAZIONE REGRESSIONE MULTIPLA Dati delle Nazioni Unite del 2005 riferiti, per diverse nazioni, al tasso di feconditá (bambini per donna) (variabile Fert), alla percentuale di donne che usa contraccettivi

Dettagli

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre R - Esercitazione 6 Andrea Fasulo fasulo.andrea@yahoo.it Università Roma Tre Venerdì 22 Dicembre 2017 Il modello di regressione lineare semplice (I) Esempi tratti da: Stock, Watson Introduzione all econometria

Dettagli

Test delle Ipotesi Parte I

Test delle Ipotesi Parte I Test delle Ipotesi Parte I Test delle Ipotesi sulla media Introduzione Definizioni basilari Teoria per il caso di varianza nota Rischi nel test delle ipotesi Teoria per il caso di varianza non nota Test

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative

Dettagli

Metodi Statistici per il Management

Metodi Statistici per il Management Metodi Statistici per il Management Statistica Multivariata I Simone Borra - Roberto Rocci Introduzione e obiettivi La statistica multivariata si occupa di analizzare e studiare in modo simultaneo un set

Dettagli

Confronto fra gruppi: il metodo ANOVA. Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23

Confronto fra gruppi: il metodo ANOVA. Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23 Confronto fra gruppi: il metodo ANOVA Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23 1 Nella popolazione, per ciascun gruppo la distribuzione della variabile risposta

Dettagli

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1 Statistica Capitolo 1 Regressione Lineare Semplice Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Spiegare il significato del coefficiente di correlazione lineare

Dettagli

Regressione & Correlazione

Regressione & Correlazione Regressione & Correlazione Monia Ranalli Ranalli M. Dipendenza Settimana # 4 1 / 20 Sommario Regressione Modello di regressione lineare senplice Stima dei parametri Adattamento del modello ai dati Correlazione

Dettagli

STATISTICA. Esercitazione 5

STATISTICA. Esercitazione 5 STATISTICA Esercitazione 5 Esercizio 1 Ad un esame universitario sono stati assegnati in modo casuale due compiti diversi con i seguenti risultati: Compito A Compito B Numero studenti 102 105 Media dei

Dettagli

Regressione Lineare Semplice e Correlazione

Regressione Lineare Semplice e Correlazione Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)

Dettagli

Dispensa di Statistica

Dispensa di Statistica Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza

Dettagli

Sistemi lineari. Lorenzo Pareschi. Dipartimento di Matematica & Facoltá di Architettura Universitá di Ferrara

Sistemi lineari. Lorenzo Pareschi. Dipartimento di Matematica & Facoltá di Architettura Universitá di Ferrara Sistemi lineari Lorenzo Pareschi Dipartimento di Matematica & Facoltá di Architettura Universitá di Ferrara http://utenti.unife.it/lorenzo.pareschi/ lorenzo.pareschi@unife.it Lorenzo Pareschi (Univ. Ferrara)

Dettagli

Rango di una matrice e teorema di Rouché-Capelli

Rango di una matrice e teorema di Rouché-Capelli Rango di una matrice e teorema di Rouché-Capelli Sappiamo che a una matrice m n, A, è associata l applicazione lineare L A : R n R m, L A (X) = AX, X R n. Definizione 1. Lo spazio nullo di A, N (A), è

Dettagli

Appunti su Indipendenza Lineare di Vettori

Appunti su Indipendenza Lineare di Vettori Appunti su Indipendenza Lineare di Vettori Claudia Fassino a.a. Queste dispense, relative a una parte del corso di Matematica Computazionale (Laurea in Informatica), rappresentano solo un aiuto per lo

Dettagli

Statistica economica

Statistica economica Statistica economica a.a. 013/14 Dr. Luca Secondi 10.a. Output tipico di un modello di regressione lineare multipla 1 Le analisi basate sul modello di regressione prevedono la stima dei coefficienti associati

Dettagli

Laboratorio di Probabilità e Statistica

Laboratorio di Probabilità e Statistica Laboratorio di Probabilità e Statistica lezione 8 Massimo Guerriero Ettore Benedetti Consegna 1. Implementare delle funzioni che, accettando opportuni parametri in ingresso, risolvano le formule viste

Dettagli

1. variabili dicotomiche: 2 sole categorie A e B

1. variabili dicotomiche: 2 sole categorie A e B Variabile X su scala qualitativa (due categorie) modello di regressione: variabili quantitative misurate almeno su scala intervallo (meglio se Y è di questo tipo e preferibilmente anche le X i ) variabili

Dettagli

Antonella Bodini Istituto di Matematica Applicata e Tecnologie Informatiche E. Magenes del CNR

Antonella Bodini Istituto di Matematica Applicata e Tecnologie Informatiche E. Magenes del CNR Antonella Bodini Istituto di Matematica Applicata e Tecnologie Informatiche E. Magenes del CNR Materiale ad uso dei ricercatori che hanno seguito il corso di formazione interna in Statistica, edizione

Dettagli

LABORATORIO DI PROBABILITA E STATISTICA

LABORATORIO DI PROBABILITA E STATISTICA UNIVERSITA DEGLI STUDI DI VERONA LABORATORIO DI PROBABILITA E STATISTICA Docente: Bruno Gobbi 6 ESERCIZI RIEPILOGATIVI PRIME 3 LEZIONI REGRESSIONE LINEARE: SPORT - COLESTEROLO ESERCIZIO 8: La tabella seguente

Dettagli

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi) CHEMIOMETRIA Applicazione di metodi matematici e statistici per estrarre (massima) informazione chimica (affidabile) da dati chimici INCERTEZZA DI MISURA (intervallo di confidenza/fiducia) CONFRONTO CON

Dettagli

Regressione multipla

Regressione multipla Regressione multipla L obiettivo è costruire un modello probabilistico per spiegare la variabile y tramite più di una variabile indipendente x 1, x 2,..., x k. Esempio: Per un efficiente progettazione

Dettagli

Esercitazione del

Esercitazione del Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri

Dettagli

Statistica13-23/11/2015

Statistica13-23/11/2015 Statistica13-23/11/2015 Voglio studiare due fattori dipendenti uno dall altro L esempio classico sono le rese di macellazione: il peso di un organo aumenta infatti all aumentare del peso dell animale (quale

Dettagli

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli Dipartimento di Sociologia e Ricerca Sociale Corso di Laurea in Sociologia Insegnamento di Statistica (a.a. 2018-2019) dott.ssa Gaia Bertarelli Esercitazione n. 6 1. Si consideri un campione di 69 persone

Dettagli

VARIETÀ. zona geografica A B C D

VARIETÀ. zona geografica A B C D Anova a 2 vie con repliche (( chiarire che non devono essere esattamente nello stesso numero per ogni cella ovvero per le ripetizioni dei de fattori ma che excel li legge così) Esercizio-esempio 1 Il valore

Dettagli

Analisi grafica residui in R. Da output grafico analisi regressionelm1.csv Vedi dispensa. peso-statura

Analisi grafica residui in R. Da output grafico analisi regressionelm1.csv Vedi dispensa. peso-statura Analisi grafica residui in R Da output grafico analisi regressionelm1.csv Vedi dispensa peso-statura 1) Il plot in alto a sinistra mostra gli errori residui contro i loro valori stimati. I residui devono

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 19-Rapporto fra varianze e 20-Introduzione all Anova vers. 1.0 (5 dicembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia,

Dettagli

CAPITOLO 5 Introduzione ai piani fattoriali

CAPITOLO 5 Introduzione ai piani fattoriali Douglas C. Montgomery Progettazione e analisi degli esperimenti 2006 McGraw-Hill CAPITOLO 5 Introduzione ai piani fattoriali Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria

Dettagli

STATISTICA MULTIVARIATA SSD MAT/06

STATISTICA MULTIVARIATA SSD MAT/06 Università degli studi di Ferrara Dipartimento di Matematica A.A. 2018/2019 I semestre STATISTICA MULTIVARIATA SSD MAT/06 LEZIONE 4 - Questioni di analisi e applicazione della regressione lineare Pratica

Dettagli

LEZIONE N. 11 ( a cura di MADDALENA BEI)

LEZIONE N. 11 ( a cura di MADDALENA BEI) LEZIONE N. 11 ( a cura di MADDALENA BEI) F- test Assumiamo l ipotesi nulla H 0 :β 1,...,Β k =0 E diverso dal verificare che H 0 :B J =0 In realtà F - test è più generale H 0 :Aβ=0 H 1 :Aβ 0 A è una matrice

Dettagli

Facoltà di Psicologia Università di Padova Anno Accademico Corso di Psicometria - Modulo B

Facoltà di Psicologia Università di Padova Anno Accademico Corso di Psicometria - Modulo B Facoltà di Psicologia Università di Padova Anno Accademico 2010-2011 Corso di Psicometria - Modulo B Dott. Marco Vicentini marco.vicentini@unipd.it Rev. 27/12/2010 Regressione lineare Modello geometrico

Dettagli

COGNOME.NOME...MATR..

COGNOME.NOME...MATR.. STATISTICA 29.01.15 - PROVA GENERALE (CHALLENGE) Modalità A (A) ai fini della valutazione verranno considerate solo le risposte riportate dallo studente negli appositi riquadri bianchi: in caso di necessità

Dettagli

Argomenti della lezione:

Argomenti della lezione: Lezione 13 L analisi della Varianza (ANOVA): il modello lineare Argomenti della lezione: Modello lineare Disegni a una via L Analisi della Varianza (ANOVA): Esamina differenze tra le medie di due o più

Dettagli

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è

Dettagli

Data Mining. Prova parziale del 20 aprile 2017: SOLUZIONE

Data Mining. Prova parziale del 20 aprile 2017: SOLUZIONE Università degli Studi di Padova Corso di Laurea Magistrale in Informatica a.a. 2016/2017 Data Mining Docente: Annamaria Guolo Prova parziale del 20 aprile 2017: SOLUZIONE ISTRUZIONI: La durata della prova

Dettagli

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Strumenti statistici in Excell Pacchetto Analisi di dati Strumenti di analisi: Analisi varianza: ad un fattore Analisi

Dettagli

Istituzioni di Statistica e Statistica Economica

Istituzioni di Statistica e Statistica Economica Istituzioni di Statistica e Statistica Economica Università degli Studi di Perugia Facoltà di Economia, Assisi, a.a. 2013/14 Esercitazione n. 1 A. I dati riportati nella seguente tabella si riferiscono

Dettagli

ANALISI DELLA VARIANZA

ANALISI DELLA VARIANZA ANALISI DELLA VARIANZA Il data set coagulation contenuto nella libreria faraway contiene i tempi di coagulazione del sangue (misurato in secondi) di 24 animali sottoposti casualmente a quattro tipi di

Dettagli

Si assuma di avere portato a termine le seguenti rilevazioni di produzione e di alimento somministrato

Si assuma di avere portato a termine le seguenti rilevazioni di produzione e di alimento somministrato Regressione Lineare Semplice Si assuma di avere portato a termine le seguenti rilevazioni di produzione e di alimento somministrato QUANTITA' DI ALIMENTO PRODUZIONE 2 10 2 9 1.5 5 1 2 1 3 1.5 4 2 7 2 9

Dettagli

Argomenti della lezione:

Argomenti della lezione: Lezione 7 Argomenti della lezione: La regressione semplice Il modello teorico Il calcolo dei parametri Regressione lineare Esamina la relazione lineare tra una o più variabili esplicative (o indipendenti,

Dettagli

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 4 Analisi Bivariata I Parte

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 4 Analisi Bivariata I Parte Metodi Quantitativi per Economia, Finanza e Management Lezione n 4 Analisi Bivariata I Parte Statistica descrittiva bivariata Indaga la relazione tra due variabili misurate. Si distingue rispetto alla

Dettagli

Statistica descrittiva in due variabili

Statistica descrittiva in due variabili Statistica descrittiva in due variabili Dott Nicola Pintus AA 2018-2019 Indichiamo con U la popolazione statistica e con u i le unità statistiche Ad ogni unità statistica associamo i caratteri osservati

Dettagli

Metodi statistici per la ricerca sociale Capitolo 12. Confronto fra gruppi: L analisi della varianza. Esercitazione

Metodi statistici per la ricerca sociale Capitolo 12. Confronto fra gruppi: L analisi della varianza. Esercitazione Metodi statistici per la ricerca sociale Capitolo 12. Confronto fra gruppi: L analisi della varianza Esercitazione Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università

Dettagli

Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii

Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii Sommario Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii xv Parte I Statistica descrittiva 1 Capitolo 1 Introduzione 3 Perché studiare statistica? 4

Dettagli

TRACCIA DI STUDIO. Test di confronto per misure qualitative. Verifica di ipotesi

TRACCIA DI STUDIO. Test di confronto per misure qualitative. Verifica di ipotesi TRACCIA DI STUDIO Verifica di ipotesi Nelle analisi statistiche di dati sperimentali riguardanti più gruppi di studio (talvolta più variabili) si pone come ipotesi da verificare la cosiddetta ipotesi zero:

Dettagli

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)

Dettagli

x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y )

x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y ) Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 0/03 lezioni di statistica del 5 e 8 aprile 03 - di Massimo Cristallo - A. Le relazioni tra i fenomeni

Dettagli

Ulteriori applicazioni del test del Chi-quadrato (χ 2 )

Ulteriori applicazioni del test del Chi-quadrato (χ 2 ) Ulteriori applicazioni del test del Chi-quadrato (χ 2 ) Finora abbiamo confrontato con il χ 2 le numerosità osservate in diverse categorie in un campione con le numerosità previste da un certo modello

Dettagli

Regressione lineare semplice

Regressione lineare semplice Regressione lineare semplice Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Statistica con due variabili var. nominale, var. nominale: gruppo sanguigno - cancro

Dettagli

lezione 4 AA Paolo Brunori

lezione 4 AA Paolo Brunori AA 2016-2017 Paolo Brunori dove eravamo arrivati - abbiamo individuato la regressione lineare semplice (OLS) come modo immediato per sintetizzare una relazione fra una variabile dipendente (Y) e una indipendente

Dettagli

STATISTICA INDUTTIVA: STIMA DI PARAMETRI STIMA PUNTUALE

STATISTICA INDUTTIVA: STIMA DI PARAMETRI STIMA PUNTUALE S.S.I.S TOSCANA F.I.M. -II anno STATISTICA INDUTTIVA: STIMA DI PARAMETRI STIMA PUNTUALE PROBLEMA 1 Vogliamo valutare la percentuale p di donne fumatrici tra le donne in età fertile. Procediamo all estrazione

Dettagli

1. ISTOGRAMMI E GRAFICI DI ALCUNE DENSITA (COMPLEMENTO ALLA LEZIONE PRECEDENTE)

1. ISTOGRAMMI E GRAFICI DI ALCUNE DENSITA (COMPLEMENTO ALLA LEZIONE PRECEDENTE) 1. ISTOGRAMMI E GRAFICI DI ALCUNE DENSITA (COMPLEMENTO ALLA LEZIONE PRECEDENTE) Riprendiamo l esempio X = seq(-5,5,0.01) Y= dnorm(x) plot(x,y) Si poteva automatizzare la scelta delle X ponendo: X=rnorm(1000)

Dettagli

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni La statistica inferenziale Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni E necessario però anche aggiungere con

Dettagli

EQUAZIONE DELLA RETTA

EQUAZIONE DELLA RETTA EQUAZIONE DELLA RETTA EQUAZIONE DEGLI ASSI L equazione dell asse x è 0. L equazione dell asse y è 0. EQUAZIONE DELLE RETTE PARALLELE AGLI ASSI L equazione di una retta r parallela all asse x è cioè è uguale

Dettagli

Esercitazione 8 maggio 2014

Esercitazione 8 maggio 2014 Esercitazione 8 maggio 2014 Esercizio 2 dal tema d esame del 13.01.2014 (parte II). L età media di n gruppo di 10 studenti che hanno appena conseguito la laurea triennale è di 22 anni. a) Costruire un

Dettagli

LeLing12: Ancora sui determinanti.

LeLing12: Ancora sui determinanti. LeLing2: Ancora sui determinanti. Ārgomenti svolti: Sviluppi di Laplace. Prodotto vettoriale e generalizzazioni. Rango e determinante: i minori. Il polinomio caratteristico. Ēsercizi consigliati: Geoling

Dettagli

Metodi statistici per la ricerca sociale Capitolo 13. Combinare regressione e ANOVA: predittori categoriali e quantitativi

Metodi statistici per la ricerca sociale Capitolo 13. Combinare regressione e ANOVA: predittori categoriali e quantitativi Metodi statistici per la ricerca sociale Capitolo 13. Combinare regressione e ANOVA: predittori categoriali e quantitativi Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA)

Dettagli

Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza.

Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza. Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza. Misure ripetute forniscono dati numerici distribuiti attorno ad un valore centrale indicabile con un indice (indice

Dettagli

Correlazione e regressione

Correlazione e regressione Correlazione e regressione Correlazione 1 Come posso determinare il legame tra due o più variabili? Correlazione COEFFICIENTE DI CORRELAZIONE (r di Pearson) massimo consumo di ossigeno e prestazione nelle

Dettagli