La verifica delle ipotesi statistiche

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "La verifica delle ipotesi statistiche"

Transcript

1 La verifica delle ipotesi statistiche Problema pratico: Quale, tra diverse situazioni possibili, riferite alla popolazione, è quella meglio sostenuta dalle evidenze empiriche? Coerenza del risultato campionario con un ipotesi specificata per la popolazione: se il risultato campionario si verrà a trovare talmente lontano dal valore teorizzato per da cadere in un insieme di valori ritenuti non coerenti (in quanto troppo poco probabili) con l ipotesi su, tale risultato avvalorerà la possibilità di ipotesi alternative a quella specificata. Test statistico = regola di decisione che ad ogni valore campionario associa una decisione sul parametro.

2 La logica della verifica delle ipotesi Punto di partenza: Informazione su un parametro Ipotesi sul parametro: = 0 Punto di arrivo: Campione Conferma l ipotesi Non conferma l ipotesi TEST Decisione sul valore del parametro ipotizzato H 0 : l ipotesi sul parametro è vera La vera distribuzione è centrata su 0 0 H 1 : l ipotesi sul parametro è falsa La vera distribuzione non è centrata su 0 1

3 Richiamando gli intervalli di confidenza: Dati: un campione X 1,, X n, un parametro ed una statistica T n, il cui valore calcolato sul campione è t n La probabilità: P t 1 n ha un senso solo se il valore di è noto (nel qual caso non ha utilità) A meno che

4 Se è noto: Prima di estrarre il campione t n non è fisso bensì una v.c. campionaria (T n ), quindi si può ragionare sulla probabilità che T n assuma valore compreso (ossia che t n cada) in un certo intervallo intorno a. A che scopo? Per stabilire se la nostra conoscenza su è avvalorata dall evidenza empirica (cioè dal campione) Esempio: t n = media campionaria N, n P z Xn z 1 n n z n z n X L intervallo è fisso, perché è centrato su varia al variare del campione tra tutti i possibili campioni, è fisso

5 Le ipotesi statistiche Ipotesi statistica: affermazione che specifica completamente o parzialmente la distribuzione di probabilità di una v.c. X. Ipotesi nulla H 0 : Informazione sulla popolazione riconosciuta come valida fino a prima all esperimento campionario (valida fino a prova contraria): Ipotesi alternativa H 1 : H 0 : = 0 Complemento all ipotesi nulla. È costituita da un singolo valore o da un insieme di valori possibili per e considerati alternativi a 0 : H 1 : = 1 H 1 : < 0 H 1 : > 0 H 1 : 0 Ipotesi semplice Ipotesi unidirezionale Ipotesi bidirezionale Le ipotesi H 0 e H 1 sono esaustive e disgiunte: o vale l una o vale l altra. In ogni caso la decisione è presa rispetto ad H 0

6 Test e regole di decisione Il test permette di stabilire se le osservazioni campionarie debbano ritenersi coerenti con l ipotesi nulla oppure no Da un punto di vista operativo, effettuare il test significa definire una statistica, detta statistica-test T n, la cui distribuzione campionaria sia nota, così che: campione casuale (X 1,, X n ) un valore numerico coerente con H 0 non coerente con H 0 Spazio campionario: insieme dei valori che la statistica-test può assumere Distribuzione campionaria: Distribuzione di probabilità della statistica-test

7 Errori di I e II specie Indipendentemente dalla regola adottata, il test porta sempre a dover scegliere tra due possibili decisioni, H 0 e H 1 e a poter commettere due possibili errori: rifiutare un ipotesi vera H 0 Vera Falsa accettare un ipotesi falsa Accetto Ok Errore di II specie Rifiuto Errore di I specie Ok Esempio: H 0 : piove Piove Non piove Ombrello SI Ombrello NO Ok Danno più grave Danno meno grave Ok N.B.: non esiste la decisione giusta!!! c è sempre il rischio di sbagliare, ma è possibile gestirlo e controllarlo QUANTIFICANDOLO

8 Rischio di errori di I e II specie H 0 Vera Falsa H 0 : = 0 H 1 : = 1 Accetto Rifiuto Ok Errore di I specie Errore di II specie Ok H 0 vera H 0 Vera Falsa Accetto 1 - Rifiuto 1-0 H 0 falsa 1 Definizioni: = probabilità di errore di I specie = livello di significatività del test 1 - = probabilità di accettare correttamente (affidabilità del test) = probabilità di errore di II specie 1 - = potenza del test = probabilità di rifiutare correttamente (varia al variare di 1, quindi può essere determinato solo se H 1 è un ipotesi semplice )

9 Approccio conservativo del test L ipotesi nulla è quella che, se vera, lascia invariate le cose L errore di I specie è considerato più grave di quello di II specie Mai lasciare la via vecchia (H 0 ) per la nuova (H 1 ) Esempi: fino ad EVIDENTE prova contraria H 0 : vecchio farmaco migliore del nuovo H 1 : nuovo farmaco migliore del vecchio H 0 : Tizio è innocente H 1 : Tizio è colpevole H 0 Il vecchio è migliore Il nuovo è migliore H 0 Innocente Colpevole Vecchio Ok Danno meno grave Assolvo Ok Danno meno grave Nuovo Danno più grave ok Condanno Danno più grave ok È per questo che: L ipotesi nulla e l ipotesi alternativa non sono equivalenti ai fini della decisione, nel senso che il test non è mai conclusivo circa H 1, ma concerne solo la possibilità che dal campione si possa pervenire al rifiuto o al non rifiuto di H 0.

10 Come prendere la decisione Una volta calcolato il valore campionario t n della statistica-test, detto valoretest, si può seguire una delle due seguenti procedure alternative: Livello di significatività osservato (approccio di Fisher): si cerca (sulle tavole) il p-value, ossia la probabilità di ottenere un valore di T n maggiore del valore osservato t n (P[T n > t n ]) p-value = grado di coerenza di H 0 p-value t n T n Regione critica (approccio di Neymann- Pearson): si fissa a priori il livello di significatività del test 1 -, che identifica sulla distribuzione della statistica-test due regioni: Regione di accettazione: insieme dei valori di T n coerenti con H 0 Regione di rifiuto (o regione critica): insieme di valori di T n non coerenti con H 0? t n 1 - t T n Accettazione Rifiuto

11 Regione critica per un test statistico con ipotesi alternativa unidirezionale:? t n H 0 : = 0 H 1 : > t T n Accettazione Rifiuto Regione critica per un test statistico con ipotesi alternativa bidirezionale: t n H 0 : = 0 H 1 : 0 / 1 - / -t / 0 t / T n Rifiuto Accettazione Rifiuto

12 Verifica di ipotesi sulla media X ~ N(, ) nota La decisione si basa sui valori critici Con essi va confrontato il valore-test (valore della statistica-test calcolata sul campione) I valori critici sono ottenuti dalla distribuzione della statistica-test, fissato il livello di significatività desiderato per il test Per la media: Xn P z z 1 n Valori critici Statistica-test

13 Esempio La frequenza cardiaca dei maschi giovani sani segue una distribuzione Normale con media = 7 battiti al minuto (bpm) e varianza = 64. Si misura la frequenza cardiaca su un campione di 5 atleti maschi e si ottiene una media pari a 68,7 bpm. Si verifichi, ad un livello di significatività del 5%, che la frequenza cardiaca degli atleti non sia diversa da quella della popolazione di tutti i maschi sani. Soluzione test sulla media, bilaterale distribuzione normale, varianza nota = 64 = 8 68,7 = 0,05 / = 0,05 n = 5 Ipotesi H 0 : = 7 H 1 : 7 Statistica test Valori critici X test z 1,96 n Regola di decisione - 1,96 v test 1,96 si accetta H 0 v test < -1,96 oppure v test > 1,96 si rifiuta H 0 Valore test (v test ) 68,7 7 vtest, Decisione -,06 < -1,96 si rifiuta H 0

14 Esempio La quantità di merci in transito negli aeroporti italiani si distribuisce normalmente con una media pari a 18,7 (migliaia di tonnellate) e uno scarto quadratico medio pari a 8. In un campione di 0 aeroporti viene registrato un valore medio pari a 15. Utilizzando un livello di significatività dell 1%: a) Verificare l ipotesi che il transito medio di merci sia rimasto invariato; b) Verificare l ipotesi che il transito medio di merci non sia diminuito Soluzione a) test sulla media, bidirezionale distribuzione normale, varianza nota Ipotesi H 0 : = 18,7 H 1 : 18,7 = 8 15 = 0,01 / = 0,005 n = 0 Statistica test Valori critici X test n z z,58 0,005 Regola di decisione -,58 v test,58 si accetta H0 v test < -,58 oppure v test >,58 si rifiuta H0 Valore test (v test ) 15 18,7 vtest, Decisione -,58 -,07,58 si accetta H0

15 b) test sulla media, unidirezionale distribuzione normale, varianza nota Ipotesi H 0 : = 18,7 H 1 : < 18,7 Statistica test Valore critico X test n z z,33 0,01 Regola di decisione v test -,33 si accetta H0 v test < -,33 si rifiuta H0 Valore test (v test ) 15 18,7 vtest, Decisione -,07 -,33 si accetta H0

16 Verifica di ipotesi sulla media X ~ N(, ) non nota Xn P t t 1 n1 n 1 s n Valori critici Statistica-test Come scegliere la statistica-test per la media? X ~ N no n > 30 no??? si si noto no X s n ~ t n 1 si X n ~ N 0,1

17 Esempio La frequenza cardiaca dei maschi giovani sani segue una distribuzione Normale con media = 7 battiti al minuto (bpm). Si misura la frequenza cardiaca su un campione di 1 atleti maschi e si ottiene una media pari a 68,7 bpm ed una varianza corretta pari a 75,1. Si verifichi, ad un livello di significatività del 5%, che la frequenza cardiaca degli atleti non sia diversa da quella della popolazione di tutti i maschi sani. Soluzione test sulla media, bidirezionale distribuzione normale, varianza non nota s 75,1 s = 8,67 68,7 = 0,05 / = 0,05 n = 1 Ipotesi H 0 : = 7 H 1 : 7 Statistica test test s n 0 Valori critici t,01 0,05;11 Regola di decisione -,01 v test,01 si accetta H 0 v test -,01 oppure v test,01 si rifiuta H 0 Valore test (v test ) 68,7 7 3,3 vtest 1,3 8,67 1,5 Decisione -,01-1,3,01 si accetta H 0

18 Verifica di ipotesi sulla proporzione p P z z 1 1 n Valori critici Statistica-test

19 Esempio In una scommessa con un amico, lanciando 100 volte una moneta si sono ottenute 54 teste. Abbiamo il sospetto che l amico ci abbia ingannati utilizzando una moneta truccata. Si verifichi questa ipotesi ad un livello di significatività del 10%. Soluzione test sulla proporzione, bidirezionale (unidirezionale) = 0,10 p =0,54 n=100 Ipotesi H 0 : = 0,5 H 1 : 0,5 (H 1 : > 0,5) p 0 Statistica test test 1 Valori critici 0 0 n z 1,645 0,05 z 1,8 0,1 Regola di decisione - 1,645 v test 1,645 si accetta H 0 v test -1,645 oppure v test 1,645 si rifiuta H 0 ( ) v test 1,8 si accetta H 0 v test > 1,8 si rifiuta H 0 Valore test (v test ) 0,54 0,50 0,50 1 0, ,80 Decisione -1,645-0,8 1,645 si accetta H 0 (0,80 < 1,8 si accetta H0)

20 Verifica di ipotesi sulla differenza tra medie X e Y ~ N no n e n y > 30 no??? si X si e Y note no X = Y si no X Y y s n s n y y ~ t n n y si X Y y s 1 1 n n y ~ t n n y X Y y no X = Y si 1 1 n n y ~ N 0,1 X Y y y n n y ~ N 0,1 s s n 1 s n 1 X X Y Y n n Stimatore corretto dello sqm comune y

21 A cosa serve il test sulla differenza tra medie? Se su due campioni X ed Y su cui si osserva lo stesso fenomeno si calcolano le rispettive medie (campionarie) esse presenteranno quasi certamente due valori numericamente diversi. Il problema è: tale differenza è significativa, cioè dovuta ad una differenza strutturale tra i due campioni, oppure è dovuta ad una naturale oscillazione della media, data la variabilità del fenomeno?

22 Esempio Gli pneumatici di due diverse marche, X e Y, di uguale prezzo, sono garantiti dalle case costruttrici per la stessa durata media di km e una deviazione standard di.000 km, uguale per le due marche. Da un campione di 14 utilizzatori della marca X risulta una durata media di Km, mentre da uno di 9 utilizzatori della marca Y risulta una durata media di Km. Supponendo che la durata degli pneumatici si distribuisca secondo una legge Normale, si verifichi se esiste tra le due marche una differenza significativa al 5%. Soluzione Ipotesi Statistica test test sulla differenza tra medie, bidirezionale distribuzione Normale, varianze note uguali H 0 : = Y H 1 : X Y test X Y y 1 1 n n y = 0,05 n X =14 n Y =9 X, Y ~ N y X = Y =.000 Valori critici z 1,96 0,05 Regola di decisione - 1,96 v test 1,96 si accetta H 0 v test -1,96 oppure v test 1,96 si rifiuta H 0 Valore test (v test ) vtest, Decisione -,93 < -1,96 si rifiuta H 0

23 Esempio Gli pneumatici di due diverse marche, X e Y, di uguale prezzo, sono garantiti dalle case costruttrici per la stessa durata media di km e la stessa varianza incognita. Da un campione di 14 utilizzatori della marca X risulta una durata media di Km ed una varianza pari a , mentre da uno di 9 utilizzatori della marca Y risulta una durata media di Km ed una varianza pari a Supponendo che la durata degli pneumatici si distribuisca secondo una legge Normale, si verifichi se esiste tra le due marche una differenza significativa al 5%. Soluzione test sulla differenza tra medie, bidirezionale distribuzione Normale, varianze non note uguali = 0, y n Y =9 n X =14 X ~ N sx sy

24 Ipotesi H 0 : = Y H 1 : X Y Statistica test test X Y y 1 1 s n n y con: s s n 1 s n 1 X X Y Y n n y Valori critici t,08 0,05;1 Regola di decisione -,08 v test,08 si accetta H 0 v test -,08 oppure v test,08 si rifiuta H s 038, Valore test (v test ) vtest, , 8 038, Decisione -,87 < -,08 si rifiuta H 0

25 Esempio Gli pneumatici di due diverse marche, X e Y, di uguale prezzo, sono garantiti dalle case costruttrici per la stessa durata media di km ma con varianze diverse e incognite. Da un campione di 14 utilizzatori della marca X risulta una durata media di Km ed una varianza pari a , mentre da uno di 9 utilizzatori della marca Y risulta una durata media di Km ed una varianza pari a Supponendo che la durata degli pneumatici si distribuisca secondo una legge Normale, si verifichi se esiste tra le due marche una differenza significativa al 5%. Soluzione test sulla differenza tra medie, bidirezionale distribuzione Normale, varianze non note diverse = 0, y n Y =9 n X =14 X ~ N sx sy

26 Ipotesi H 0 : = Y H 1 : X Y Statistica test test X Y y s n s n y y Valori critici t,08 0,05;1 Regola di decisione -,08 v test,08 si accetta H 0 v test -,08 oppure v test,08 si rifiuta H 0 Valore test (v test ) vtest, Decisione -,91 < -,08 si rifiuta H 0

27 Esempio Nelle regioni italiane si misura il livello di inquinamento ambientale con il numero di denunce emesse dalla popolazione residente. Nelle 10 regioni del Nord risultano in media 9.1 denunce con s.q.m. 6, mentre nelle 1 del Centro-Sud la media è con s.q.m. 6. Ipotizzando che il numero di denunce segua una distribuzione Normale, verificare l ipotesi che le due aree geografiche siano caratterizzate dallo stesso livello di inquinamento al livello di significatività del 5% y 3.85 Valore test Valore critico 1.75 g.d.l. 0 a 0.05 Decisione: Si accetta H 0 H 0 : - Y = 0 H 1 : X - Y > 0 IC 95% ( m -m y ) = [ -1.4 ; 9.1 ] Contiene lo 0

28 La spezzata delle medie X AREA Geografica Y Classi di REDDITO Totale Medie NORD CENTRO SUD Totale

29 Decomposizione della varianza La varianza di X è data dalla somma di due componenti: varianza esterna = varianza delle medie di gruppo varianza interna = media delle varianze di gruppo Se: G = numero di gruppi; j = media dell j-esimo gruppo; n j = numerosità dell j-esimo gruppo (j = 1,.,G); Quanto differiscono le medie tra loro e rispetto alla media generale? allora: 1 1 G G jnj j nj n j1 n j1 VARIANZA INTERNA VARIANZA ESTERNA ossia: TOT INT EX T

30 A cosa serve scomporre la varianza? n. bot Media e varianza costanti Varianza delle medie et = 0 Media delle varianze int = Stesso comportamento tra le due distribuzioni: CH MM scelta il numero di bottiglie acquistate è lo stesso per chi sceglie le due marche n. bot Medie diverse, varianza costante Varianza delle medie et 0 Media delle varianze int < Diverso comportamento tra le due distribuzioni: CH MM scelta il numero di bottiglie acquistate è diverso a seconda della marca scelta

31 Rapporto di correlazione di Pearson Y X Classe j ma h-1 - h tot y 1 n 11 n 1 n 1h n1. y n 1 n n h n.... y. i n.... ij.. ni.... y k n k1 n k n kh nk. tot n.1 n. n.j n.h n Quando X è quantitativo: i i EXTX i1 X Y c X ˆj X n j j1 r n Quando Y è quantitativo: j Y j EXTY j1 Y X r Y yi Y ni i1 c n N.B.: Su una tabella mista è possibile misurare anche l indipendenza assoluta con l indice del

32 Proprietà e interpretazione 0 1 X Y X Y 0 Perfetta indipendenza in media: le medie delle distribuzioni condizionate di X sono tutte uguali tra loro ed uguali alla media generale (μ X ) X Y 1 Perfetta dipendenza in media: le varianze delle distribuzioni condizionate di X sono nulle. Ad ogni modalità di Y corrisponde una sola intensità di X che presenta frequenza non nulla Y X X Y L indice non è simmetrico (salvo eccezioni)

33 Esempio Fatturato (Y) Settore Merceologico (X) >500 Totale Alimentari Bevande Healt Care Ice Packaging Totale X 4 modalità Y 5 classi ( aperte) i Y i EXTY i1 Y X c Y ŷj Y n j j1 r n 1. Media generale di Y: h Y ŷn j j j n ,96 Nota: Il valore centrale della prima classe (aperta) è stato ottenuto considerando che, nella successione di valori del carattere fatturato, i valori più bassi sono di poco superiori a 100 (che si assume, quindi, come estremo inferiore della classe); quello dell ultima classe è ottenuto considerando come estremo superiore della classe il valore massimo effettivamente osservato: ( )/ = 156

34 . Medie di Y condizionate alle modalità di X n 1 c 1 ŷn j 1j 1 j1 348, 48 c yn j j j ˆ 66,67 n 3 c 3 ŷn j 3j 3 j n 1 384,33 c 4 ŷn j 4j 4 j n 14 41

35 3. Confronto tra le medie condizionate 1 348, 48 66, , Commento: si può vedere che le medie delle distribuzioni condizionate differiscono dalla media generale di Y, quindi i due caratteri non sono indipendenti in media. Ma quanto è forte il legame di dipendenza in media?

36 r i Y i i1 c j1 4. Calcolo del numeratore dell indice n 348, , ,67 394, ,33 394, , ,14 5. Calcolo del denominatore dell indice j Y j ŷ n , , , , , Calcolo dell indice r i Y ni EXTY i , Y X c Y ŷj Y n j j1 0,013 La dipendenza in media del carattere FATTURATO dal carattere SETTORE MERCEOLOGICO è praticamente nulla ossia: il fatturato in media non dipende dal settore merceologico

37 Il test F Ipotesi: H 0 : m i = m j i,j = 1,, G le medie sono uguali in tutti i gruppi H 1 : m i m j almeno una media differisce dalle altre H 0 H 1 Se le medie sono uguali, la varianza tra i gruppi è nulla: Più le medie differiscono, più: Statistica test: Dev EXT Dev 0 INT Dev TOT Dev 0 Dev Dev EXT / G 1 P F G1;n G; 1 Dev INT / n G EXT INT Dev TOT Statistica-test Valore critico Più basso è il rapporto, più realistica è l'ipotesi nulla Più elevato è il rapporto, meno realistica è l'ipotesi nulla

38 Il test F Ipotesi: H 0 : m i = m j i,j = 1,, G le medie sono uguali in tutti i gruppi H 1 : m i m j almeno una media differisce dalle altre H 0 : H 1 : EXT INT Dev / G 1 Dev / n G Dev / G 1 EXT Dev / n G INT 0 0 H 0 : = 0 H 1 : > 0

39 Fatturato e settore merceologico H 0 : m i = m j i,j = 1,, G le vendite medie sono uguali in tutti i settori H 1 : m i m j almeno una media differisce dalle altre ANOVA Source DF Sum of squares Mean squares F Pr > F Fra gruppi Entro gruppi Totale F Decisione: 0,89 0,04 EXT INT Basso valore di F = bassa EXT = medie vicine Il p-value è molto alto: Si accetta l ipotesi di vendite medie uguali tra i settori, confermata dal campione osservato.

40

41 X AREA Geografica Y Classi di REDDITO Totale Medie NORD CENTRO SUD Totale ANOVA Source DF Sum of squares Mean squares F Pr > F Fra gruppi Entro gruppi Totale Il p-value è basso: Si rifiuta l ipotesi reddito medio uguale nelle tre le aree geografiche.

42 Verifica dell ipotesi di indipendenza H 0 : X ed Y sono indipendenti H 1 : X ed Y non sono indipendenti Ipotesi di indipendenza in media ANOVA: test F H 0 : = 0 H 1 : > 0 Ipotesi di indipendenza assoluta Test del H 0 : = 0 H 1 : > 0 Ipotesi di indipendenza lineare Test su H 0 : = 0 H 1 : > 0 Test su R H 0 : R = 0 H 1 : R > 0

43 Verifica di ipotesi sull indipendenza assoluta tra due caratteri n n i j ij ij ij n r 1c 1 nij n ij P ; r 1 c 1 1 i j n ij Statistica-test Valore critico La variabile è continua, non può essere negativa e varia tra zero e infinito. La sua forma e il suo centro dipendono dal numero di gradi di libertà. La sua forma funzionale è: 1 f(;g) ep g g g g= g=4 g=

44 Verifica di ipotesi sull indipendenza tra due caratteri Conteggio OCCUPAZIONE ATTUALE ATTUALE Non occupato Precario Occ. stabile Totale VOTO VOTO Meno di e lode Totale n ij nij n i j ij 3,84 H 0 : X ed Y indipendenti H 1 : X ed Y non indipendenti = 0,05 Distribuzione del chi-quadro 1-0,05;6 1,59 Ipotesi H 0 : = 0 H 1 : > 0 Statistica test Valore critico Regola di decisione test n ij n n i j ij 0,05; 6 1,59 v test 1,59 si accetta H 0 v test > 1,59 si rifiuta H 0 ij 3,84 Zona di accettazione 1,59 Zona di rifiuto n ij nij n i j ij Valore test (v test ) nij nij vtest 3,84 n i j ij Decisione 3,84 < 1,59 si accetta H 0

45 Verifica dell ipotesi di indipendenza lineare Modello di regressione lineare semplice Fasi del modello: Specificazione del modello: scelta del tipo di funzione da utilizzare per descrivere un fenomeno; definizione delle ipotesi di base Stima dei parametri: uso di stimatori dei parametri caratteristici della funzione scelta Verifica: della significatività delle stime del rispetto delle ipotesi di base (rimozione delle ipotesi, analisi dei residui) Uso del modello: ai fini per i quali è stato specificato (descrittivi, previsivi, ecc.) 45

46 IPOTESI DI BASE DEL MODELLO DI REGRESSIONE Ipotesi deboli: Necessarie perché le stime godano di proprietà ottimali, ossia siano non distorte e a varianza minima (BLUE, Teorema di Gauss-Markow) 1. y i = + i + i. E( i ) = 0 3. var( i ) = var(y i ) = 4. cov( i, j ) = 0 (i j) 5. X nota e senza errore Varianza costante, omoschedasticità Assenza di autocorrelazione X non stocastica Ipotesi forte: Necessaria per verificare la significatività delle stime 6. N(0, ) La varianza di (o di y) rientra tra i parametri da stimare Se ci fosse correlazione tra gli errori significherebbe che esistono altri fattori oltre a X ad influenzare Y, esclusi dal modello. Inoltre implicherebbe un legame anche tra le y i L ipotesi distribuzionale (6) è fondamentale nella fase inferenziale 46

47 RAPPRESENTAZIONE GRAFICA DEL MODELLO Y f() E(Y X) = a + b X Distribuzioni degli errori (intorno alla stima di Y): media 0, varianza costante, indipendenti, distribuiti Normalmente y i i.i.d. con media e varianza costanti 47

48 VERIFICA DEL MODELLO Significatività dell R H 0 : R 0 H 1 : R > 0 Significatività di a e di b H 0 : 0 H 1 : b 0 dev reg R n dev e n 1 R test 1;n b t test n sb F F a,1,n- a H 0 : 0 H 1 : a 0 a t test n sa a/ a/ -t a/,n- t a/,n- 48

49 Varianze della regressione Varianza dei residui: ev Y Devianza dei residui: cod X, Y dev e R 1 dev X d dev y s 1 n s n e i i1 cod X, Y dev e 1 dev X errore standard della regressione Varianza di a: s s a 1 n n i1 i s a errore standard della stima di Varianza di b: s s b n i1 1 i s b errore standard della stima di 49

50 Da un campione di 7 aziende risultano i seguenti valori del numero totale di dipendenti (X) e del numero di dipendenti laureati (Y): Dip. totali (X) Dip. Laureati (Y) a)disegnare la retta di regressione di Y su X; b)misurare la bontà dell adattamento; c)sapendo che 1 s e 3,89 n i n i1 verificare la significatività del modello al livello dell 1% i yi y i y i y i yi y y i i ,9 9 1,65 3, ,71 0 0, ,71 4 7,37 5, ,71 9,94 5, ,9 1 0,08 0, ,9 1 1,65-1, ,9 4 5, 4, ,43 18

51 cov, y cod, y 18 b 0,64 dev 8 a y b 4,9 0,64 8-0,86 Equazione della retta: y y 0,86 0,64 0-0,86 8 4,9 cov, y cod, y devreg devres R 1 dev y dev y dev dev y 18 R 8 19, 43 0,6 y

52 Test su R, unilaterale Ipotesi H 0 : R = 0 H 1 : R > 0 Statistica test Valore critico F 0,01;1;5 = 16,58 Regola di decisione v test 16,58 si accetta H 0 v test 16,58 si rifiuta H 0 Valore test X devreg test F 1;n devres n 1 R 0,6 5 vtest 7,36 1 0,6 R n Decisione 7,36 16,58 si accetta H 0 La relazione lineare tra y ed non è significativa Si rifiuta il modello lineare

53 F 0,05;1;5 = 6,608 ANOVA Source DF Sum of squares Mean squares F Pr > F Model Error Corrected Total Significatività dei coefficienti Source Value Standar d error t Pr > t Lower bound (95%) Upper bound (95%) Intercept

54

55 Test su b, bilaterale Ipotesi H 0 : b = 0 H 1 : b 0 Statistica test Valori critici t 0,005;5 = 4,03 Regola di decisione Valore test X b s t test n in cui: - 4,03 v test 4,03 si accetta H 0 v test - 4,03 oppure v test 4,03 si rifiuta H 0 0,64 vtest 1,7 0,37 s s n i1 1 1 s 1,57 0,37 8 i Decisione - 4,03 1,7 4,03 si accetta H 0 La relazione lineare tra y ed non è significativa Si rifiuta il modello lineare

56 Test su a, bilaterale Ipotesi H 0 : a = 0 H 1 : a 0 Statistica test test n Valori critici t 0,005;5 = 4,03 X a s t s s 1 n n i1 i Regola di decisione - 4,03 v test 4,03 si accetta H 0 v test - 4,03 oppure v test 4,03 si rifiuta H 0 Valore test 3,89 8 s 1 1, ,86 vtest 0,63 1,35 Decisione - 4,03-0,63 4,03 si accetta H 0

57 Verifica di ipotesi sul confronto tra due varianze

Problema pratico: Test statistico = regola di decisione

Problema pratico: Test statistico = regola di decisione La verifica delle ipotesi statistiche Problema pratico: Quale, tra diverse situazioni possibili, riferite alla popolazione, è quella meglio sostenuta dalle evidenze empiriche? Coerenza del risultato campionario

Dettagli

L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale

L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile Corso di Metodologia della ricerca sociale L analisi della varianza (ANOVA) La tecnica con cui si esplorano le relazioni

Dettagli

Contenuti: Capitolo 14 del libro di testo

Contenuti: Capitolo 14 del libro di testo Test d Ipotesi / TIPICI PROBLEMI DI VERIFICA DI IPOTESI SONO Test per la media Test per una proporzione Test per la varianza Test per due campioni indipendenti Test di indipendenza Contenuti Capitolo 4

Dettagli

Un esempio. Ipotesi statistica: supposizione riguardante: un parametro della popolazione. la forma della distribuzione della popolazione

Un esempio. Ipotesi statistica: supposizione riguardante: un parametro della popolazione. la forma della distribuzione della popolazione La verifica delle ipotesi In molte circostanze il ricercatore si trova a dover decidere quale, tra le diverse situazioni possibili riferibili alla popolazione, è quella meglio sostenuta dalle evidenze

Dettagli

Regressione Lineare Semplice e Correlazione

Regressione Lineare Semplice e Correlazione Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)

Dettagli

Fasi del modello di regressione

Fasi del modello di regressione Fasi del modello di regressione Specificazione del modello: scelta del tipo di funzione da utilizzare per descrivere un fenomeno; definizione delle ipotesi di base Stima dei parametri: uso di stimatori

Dettagli

STATISTICA A K (60 ore)

STATISTICA A K (60 ore) STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta

Dettagli

Verifica delle ipotesi

Verifica delle ipotesi Statistica inferenziale Stima dei parametri Verifica delle ipotesi Concetti fondamentali POPOLAZIONE o UNIVERSO Insieme degli elementi cui si rivolge il ricercatore per la sua indagine CAMPIONE Un sottoinsieme

Dettagli

Esercizi di statistica

Esercizi di statistica Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..

Dettagli

SOLUZIONI PROVA SCRITTA DI STATISTICA (cod. 4038, 5047, 371, 377) 8 settembre 2005

SOLUZIONI PROVA SCRITTA DI STATISTICA (cod. 4038, 5047, 371, 377) 8 settembre 2005 SOLUZIONI PROVA SCRITTA DI STATISTICA cod. 4038, 5047, 371, 377) 8 settembre 2005 MODALITÀ B APPROSSIMARE TUTTI I CALCOLI ALLA QUARTA CIFRA DECIMALE Esercizio 1. 7 punti) Su un collettivo di 13 nuclei

Dettagli

Corso di STATISTICA EGA - Classe 1 aa Docenti: Luca Frigau, Claudio Conversano

Corso di STATISTICA EGA - Classe 1 aa Docenti: Luca Frigau, Claudio Conversano Corso di STATISTICA EGA - Classe 1 aa 2017-2018 Docenti: Luca Frigau, Claudio Conversano Il corso è organizzato in 36 incontri, per un totale di 72 ore di lezione. Sono previste 18 ore di esercitazione

Dettagli

Università di Pavia Econometria. Richiami di Statistica. Eduardo Rossi

Università di Pavia Econometria. Richiami di Statistica. Eduardo Rossi Università di Pavia Econometria Richiami di Statistica Eduardo Rossi Università di Pavia Campione casuale Siano (Y 1, Y 2,..., Y N ) variabili casuali tali che le y i siano realizzazioni mutuamente indipendenti

Dettagli

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1 Statistica Capitolo 1 Regressione Lineare Semplice Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Spiegare il significato del coefficiente di correlazione lineare

Dettagli

Lezione 16. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 16. A. Iodice. Ipotesi statistiche

Lezione 16. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 16. A. Iodice. Ipotesi statistiche Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 23 Outline 1 2 3 4 5 6 () Statistica 2 / 23 La verifica delle ipotesi Definizione Un ipotesi statistica

Dettagli

STATISTICA MULTIVARIATA SSD MAT/06

STATISTICA MULTIVARIATA SSD MAT/06 Università degli studi di Ferrara Dipartimento di Matematica A.A. 2018/2019 I semestre STATISTICA MULTIVARIATA SSD MAT/06 LEZIONE 4 - Questioni di analisi e applicazione della regressione lineare Pratica

Dettagli

STATISTICA ESERCITAZIONE 13

STATISTICA ESERCITAZIONE 13 STATISTICA ESERCITAZIONE 13 Dott. Giuseppe Pandolfo 9 Marzo 2015 Errore di I tipo: si commette se l'ipotesi nulla H 0 viene rifiutata quando essa è vera Errore di II tipo: si commette se l'ipotesi nulla

Dettagli

x ;x Soluzione Gli intervalli di confidenza possono essere ottenuti a partire dalla seguente identità: da cui si ricava: IC x ;x = +

x ;x Soluzione Gli intervalli di confidenza possono essere ottenuti a partire dalla seguente identità: da cui si ricava: IC x ;x = + ESERCIZIO 6.1 Si considerino i 0 campioni di ampiezza n = estratti da una popolazione X di N = 5 elementi distribuiti normalmente, con media µ = 13,6 e σ = 8,33. A partire dalle 0 determinazioni della

Dettagli

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURA/TECNICA DI ANALISI DEI DATI SPECIFICAMENTE DESTINATA A STUDIARE LA RELAZIONE TRA UNA VARIABILE NOMINALE (ASSUNTA

Dettagli

Università degli Studi Roma Tre Anno Accademico 2014/2015 ST410 Statistica 1

Università degli Studi Roma Tre Anno Accademico 2014/2015 ST410 Statistica 1 Università degli Studi Roma Tre Anno Accademico 2014/2015 ST410 Statistica 1 Lezione 1 - Martedì 23 Settembre 2014 Introduzione al corso. Richiami di probabilità: spazi di probabilità, variabili aleatorie,

Dettagli

VERIFICA DELLE IPOTESI

VERIFICA DELLE IPOTESI VERIFICA DELLE IPOTESI Ipotesi statistica parametrica non parametrica una qualunque affermazione che specifica completamente o parzialmente la distribuzione di probabilità di una v.c. X. semplice: se la

Dettagli

per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione

per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione Rapporti statistici di composizione la parte rispetto al tutto percentuali di derivazione per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione di frequenza (tassi) rapporti

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Associazione, correlazione e dipendenza tra caratteri In un collettivo di 11 famiglie è stata

Dettagli

Statistica (parte II) Esercitazione 4

Statistica (parte II) Esercitazione 4 Statistica (parte II) Esercitazione 4 Davide Passaretti 03/03/016 Test sulla differenza tra medie (varianze note) Un negozio di scarpe è interessato a capire se le misure delle scarpe acquistate da adulti

Dettagli

La statistica è la scienza che permette di conoscere il mondo intorno a noi attraverso i dati.

La statistica è la scienza che permette di conoscere il mondo intorno a noi attraverso i dati. RICHIAMI DI STATISTICA La statistica è la scienza che permette di conoscere il mondo intorno a noi attraverso i dati. Quale è la media della distribuzione del reddito dei neolaureati? Per rispondere dovremmo

Dettagli

PROVA SCRITTA DI STATISTICA (COD COD ) 7 luglio 2005 APPROSSIMARE TUTTI I CALCOLI ALLA QUARTA CIFRA DECIMALE SOLUZIONI MODALITÀ A

PROVA SCRITTA DI STATISTICA (COD COD ) 7 luglio 2005 APPROSSIMARE TUTTI I CALCOLI ALLA QUARTA CIFRA DECIMALE SOLUZIONI MODALITÀ A PROVA SCRITTA DI STATISTICA (COD. 047 - COD. 403-37-377) 7 luglio 200 APPROSSIMARE TUTTI I CALCOLI ALLA QUARTA CIFRA DECIMALE SOLUZIONI MODALITÀ A Esercizio (9 punti) Supponiamo di aver osservato la seguente

Dettagli

1.1 Obiettivi della statistica Struttura del testo 2

1.1 Obiettivi della statistica Struttura del testo 2 Prefazione XV 1 Introduzione 1.1 Obiettivi della statistica 1 1.2 Struttura del testo 2 2 Distribuzioni di frequenza 2.1 Informazione statistica e rilevazione dei dati 5 2.2 Distribuzioni di frequenza

Dettagli

Dispensa di Statistica

Dispensa di Statistica Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza

Dettagli

Premessa: la dipendenza in media

Premessa: la dipendenza in media Premessa: la dipendenza in media Supponiamo di avere K diversi livelli di un fattore che potrebbero influire su una determinata variabile. Per esempio supponiamo di domandarci se la diversificazione (intesa

Dettagli

Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1

Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1 Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1 Lezione 1 - Mercoledì 28 Settembre 2016 Introduzione al corso. Richiami di probabilità: spazi di probabilità, variabili aleatorie,

Dettagli

ESAME. 9 Gennaio 2017 COMPITO A

ESAME. 9 Gennaio 2017 COMPITO A ESAME 9 Gennaio 2017 COMPITO A Cognome Nome Numero di matricola 1) Approssimare tutti i calcoli alla quarta cifra decimale. 2) Ai fini della valutazione si terrà conto solo ed esclusivamente di quanto

Dettagli

Analisi della varianza a una via

Analisi della varianza a una via Analisi della varianza a una via Statistica descrittiva e Analisi multivariata Prof. Giulio Vidotto PSY-NET: Corso di laurea online in Discipline della ricerca psicologico-sociale SOMMARIO Modelli statistici

Dettagli

lezione 4 AA Paolo Brunori

lezione 4 AA Paolo Brunori AA 2016-2017 Paolo Brunori dove eravamo arrivati - abbiamo individuato la regressione lineare semplice (OLS) come modo immediato per sintetizzare una relazione fra una variabile dipendente (Y) e una indipendente

Dettagli

Analisi di Regressione Multipla

Analisi di Regressione Multipla Analisi di Regressione Multipla Stima OLS della relazione Test Score/STR : TestScore! = 698.9.8 STR, R =.05, SER = 18.6 (10.4) (0.5) E una stima credibile dell effetto causale sul rendimento nei test di

Dettagli

Calcolo delle Probabilità e Statistica Matematica: definizioni prima parte. Cap.1: Probabilità

Calcolo delle Probabilità e Statistica Matematica: definizioni prima parte. Cap.1: Probabilità Calcolo delle Probabilità e Statistica Matematica: definizioni prima parte Cap.1: Probabilità 1. Esperimento aleatorio (definizione informale): è un esperimento che a priori può avere diversi esiti possibili

Dettagli

COGNOME.NOME...MATR..

COGNOME.NOME...MATR.. STATISTICA 29.01.15 - PROVA GENERALE (CHALLENGE) Modalità A (A) ai fini della valutazione verranno considerate solo le risposte riportate dallo studente negli appositi riquadri bianchi: in caso di necessità

Dettagli

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza XIII Presentazione del volume XV L Editore ringrazia 3 1. Introduzione alla Statistica 5 1.1 Definizione di Statistica 6 1.2 I Rami della Statistica Statistica Descrittiva, 6 Statistica Inferenziale, 6

Dettagli

STATISTICA. Esercitazione 5

STATISTICA. Esercitazione 5 STATISTICA Esercitazione 5 Esercizio 1 Ad un esame universitario sono stati assegnati in modo casuale due compiti diversi con i seguenti risultati: Compito A Compito B Numero studenti 102 105 Media dei

Dettagli

STATISTICA A K (60 ore)

STATISTICA A K (60 ore) STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Esercizio Il contenuto di nicotina di una certa marca di sigarette è 0,25 milligrammi con una deviazione standard di 0,015. Un associazione

Dettagli

Elementi di Psicometria (con laboratorio software 1)

Elementi di Psicometria (con laboratorio software 1) Elementi di Psicometria (con laboratorio software 1) 05-La verifica delle ipotesi con le medie dei campioni (v. 1.0, 15 aprile 2019) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia,

Dettagli

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità D

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità D Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità D Cognome Nome: Part time: Numero di matricola: Diurno: ISTRUZIONI: Il punteggio relativo alla prima parte dell esame viene calcolato

Dettagli

Richiami di inferenza statistica Strumenti quantitativi per la gestione

Richiami di inferenza statistica Strumenti quantitativi per la gestione Richiami di inferenza statistica Strumenti quantitativi per la gestione Emanuele Taufer Inferenza statistica Parametri e statistiche Esempi Tecniche di inferenza Stima Precisione delle stime Intervalli

Dettagli

Argomenti della lezione:

Argomenti della lezione: Lezione 13 L analisi della Varianza (ANOVA): il modello lineare Argomenti della lezione: Modello lineare Disegni a una via L Analisi della Varianza (ANOVA): Esamina differenze tra le medie di due o più

Dettagli

STATISTICA. Federico M. Stefanini. e.mail: a.a (3 CFU)

STATISTICA. Federico M. Stefanini. e.mail: a.a (3 CFU) STATISTICA a.a. 2001-2002 (3 CFU) Federico M. Stefanini Dipartimento di Statistica G.Parenti viale Morgagni 59, 50134 Firenze, tel. 055-4237211 PARTE 5-3.12.2001 e.mail: stefanin@ds.unifi.it http://www.ds.unifi.it/ricerca/pagperson/docenti/stefanini.htm

Dettagli

Richiami di inferenza statistica. Strumenti quantitativi per la gestione. Emanuele Taufer

Richiami di inferenza statistica. Strumenti quantitativi per la gestione. Emanuele Taufer Richiami di inferenza statistica Strumenti quantitativi per la gestione Emanuele Taufer Inferenza statistica Inferenza statistica: insieme di tecniche che si utilizzano per ottenere informazioni su una

Dettagli

Università degli Studi Roma Tre Anno Accademico 2017/2018 ST410 Statistica 1

Università degli Studi Roma Tre Anno Accademico 2017/2018 ST410 Statistica 1 Università degli Studi Roma Tre Anno Accademico 2017/2018 ST410 Statistica 1 Lezione 1 - Mercoledì 27 Settembre 2017 Introduzione al corso. Richiami di probabilità: spazi di probabilità, variabili aleatorie,

Dettagli

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità B

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità B Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità B Cognome Nome: Part time: Numero di matricola: Diurno: ISTRUZIONI: Il punteggio relativo alla prima parte dell esame viene calcolato

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2016-2017 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

Lezione 17. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 17. A. Iodice

Lezione 17. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 17. A. Iodice con Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 29 Outline con 1 2 3 con 4 5 campioni appaiati 6 Indipendenza tra variabili () Statistica 2 /

Dettagli

Tecniche di sondaggio

Tecniche di sondaggio SMID a.a. 2005/2006 Corso di Statistica per la Ricerca Sperimentale Tecniche di sondaggio 24/1/2006 Nomenclatura Indicheremo con P una popolazione, con N la sua numerosità, con k la sua etichetta e con

Dettagli

Corso di Statistica Esercitazione 1.8

Corso di Statistica Esercitazione 1.8 Corso di Statistica Esercitazione.8 Test su medie e proporzioni Prof.ssa T. Laureti a.a. 202-203 Esercizio Un produttore vuole monitorare i valori dei livelli di impurità contenute nella merce che gli

Dettagli

ECONOMETRIA: Laboratorio I

ECONOMETRIA: Laboratorio I ECONOMETRIA: Laboratorio I Luca De Angelis CLASS - Università di Bologna Programma Laboratorio I Valori attesi e varianze Test di ipotesi Stima di un modello lineare attraverso OLS Valore atteso Data una

Dettagli

Nel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0.

Nel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0. Regressione [] el modello di regressione lineare si assume una relazione di tipo lineare tra il valore medio della variabile dipendente Y e quello della variabile indipendente X per cui Il modello si scrive

Dettagli

ESAME. 9 Gennaio 2017 COMPITO B

ESAME. 9 Gennaio 2017 COMPITO B ESAME 9 Gennaio 2017 COMPITO B Cognome Nome Numero di matricola 1) Approssimare tutti i calcoli alla quarta cifra decimale. 2) Ai fini della valutazione si terrà conto solo ed esclusivamente di quanto

Dettagli

STATISTICA A K (60 ore)

STATISTICA A K (60 ore) STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Esercizio In una prova sul carico di rottura di due tipi di corda si dispone di 2 campioni di ampiezza 26 e 35 rispettivamente. Nel

Dettagli

Capitolo 12 La regressione lineare semplice

Capitolo 12 La regressione lineare semplice Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università

Dettagli

Ulteriori Conoscenze di Informatica e Statistica

Ulteriori Conoscenze di Informatica e Statistica Ulteriori Conoscenze di Informatica e Statistica Carlo Meneghini Dip. di fisica via della Vasca Navale 84, st. 83 (I piano) tel.: 06 55 17 72 17 meneghini@fis.uniroma3.it Indici di forma Descrivono le

Dettagli

LEZIONI DI STATISTICA MEDICA

LEZIONI DI STATISTICA MEDICA LEZIONI DI STATISTICA MEDICA Lezione n.11 - Principi dell inferenza statistica - Campionamento - Distribuzione campionaria di una media e di una proporzione - Intervallo di confidenza di una media e di

Dettagli

LEZIONI DI STATISTICA MEDICA

LEZIONI DI STATISTICA MEDICA LEZIONI DI STATISTICA MEDICA Lezione n.12 - Test statistico Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona IPOTESI SCIENTIFICA Affermazione che si può sottoporre a verifica

Dettagli

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)

Dettagli

Parametri e statistiche. Parametri e statistiche. Distribuzioni campionarie. Popolazione Parametri Valori fissi, Statistiche o Stimatori.

Parametri e statistiche. Parametri e statistiche. Distribuzioni campionarie. Popolazione Parametri Valori fissi, Statistiche o Stimatori. Parametri e statistiche Popolazione Parametri Valori fissi, spesso non noti Campione Statistiche o Stimatori Variabili casuali, le cui determinazioni dipendono dalle particolari osservazioni scelte Parametri

Dettagli

CONFRONTO TRA LA MEDIE DI DUE CAMPIONI INDIPENDENTI

CONFRONTO TRA LA MEDIE DI DUE CAMPIONI INDIPENDENTI CONFRONTO TRA LA MEDIE DI DUE CAMPIONI INDIPENDENTI ipotesi sul confronto tra le medie di due campioni indipendenti Obiettivo: decidere, attraverso il confronto tra le medie dei due campioni indipendenti,

Dettagli

Esercitazione 8 del corso di Statistica 2

Esercitazione 8 del corso di Statistica 2 Esercitazione 8 del corso di Statistica Prof. Domenico Vistocco Dott.ssa Paola Costantini 6 Giugno 8 Decisione vera falsa è respinta Errore di I tipo Decisione corretta non è respinta Probabilità α Decisione

Dettagli

Esercizio 1. La variabile casuale G, somma di due V.C. normali, si distribuisce anch essa come una normale.

Esercizio 1. La variabile casuale G, somma di due V.C. normali, si distribuisce anch essa come una normale. Esercizio 1. La V.C. Y segue una distribuzione normale con media 45 e varianza 9. La V.C. X segue una legge normale con media 12 e varianza 4. Calcolare come si distribuisce e quali sono i parametri della

Dettagli

Regressione lineare semplice

Regressione lineare semplice Regressione lineare semplice Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Statistica con due variabili var. nominale, var. nominale: gruppo sanguigno - cancro

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unina.it Università degli studi di Cassino () Statistica 1 / 24 Outline 1 () Statistica 2 / 24 Outline 1 2 () Statistica 2 / 24 Outline 1 2 3 () Statistica 2 /

Dettagli

Esercitazione 5 - Statistica (parte II) Davide Passaretti 9/3/2017

Esercitazione 5 - Statistica (parte II) Davide Passaretti 9/3/2017 Esercitazione 5 - Statistica (parte II) Davide Passaretti 9/3/2017 Contents 1 Inferenza sulla regressione semplice 1 1.1 Test sulla pendenza della retta................................... 1 1.2 Test sull

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2018-2019 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

Metodi statistici per la ricerca sociale Capitolo 12. Confronto fra gruppi: L analisi della varianza. Esercitazione

Metodi statistici per la ricerca sociale Capitolo 12. Confronto fra gruppi: L analisi della varianza. Esercitazione Metodi statistici per la ricerca sociale Capitolo 12. Confronto fra gruppi: L analisi della varianza Esercitazione Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università

Dettagli

Verifica delle ipotesi. Verifica delle ipotesi

Verifica delle ipotesi. Verifica delle ipotesi Con la procedura di stima intervallare si cerca definire in modo verosimile il valore di un parametro incognito a partire dalle osservazioni campionarie Valore campionario Procedura di stima intervallare

Dettagli

Indice. Prefazione. 4 Sintesi della distribuzione di un carattere La variabilità Introduzione La variabilità di una distribuzione 75

Indice. Prefazione. 4 Sintesi della distribuzione di un carattere La variabilità Introduzione La variabilità di una distribuzione 75 00PrPag:I-XIV_prefazione_IAS 8-05-2008 17:56 Pagina V Prefazione XI 1 La rilevazione dei fenomeni statistici 1 1.1 Introduzione 1 1.2 Caratteri, unità statistiche e collettivo 1 1.3 Classificazione dei

Dettagli

STATISTICA. Esercitazione 6

STATISTICA. Esercitazione 6 STATISTICA Esercitazione 6 Esercizio 1 Ad un esame universitario sono stati assegnati in modo casuale tre compiti diversi con i seguenti risultati: Compito A Compito B Compito C Numero studenti 41 39 43

Dettagli

Statistica multivariata Donata Rodi 17/10/2016

Statistica multivariata Donata Rodi 17/10/2016 Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2015-2016 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI

IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI Perchè confrontare le varianze stimate in due campioni? Torniamo all'esempio dei frinosomi Per poter applicare il test t avevamo detto che le varianze, e

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative

Dettagli

COGNOME.NOME...MATR..

COGNOME.NOME...MATR.. STATISTICA 29.01.15 - PROVA GENERALE (STANDARD) Modalità B (A) ai fini della valutazione verranno considerate solo le risposte riportate dallo studente negli appositi riquadri bianchi: in caso di necessità

Dettagli

Esercitazione del

Esercitazione del Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36

Dettagli

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE La presentazione dei dati per molte ricerche mediche fa comunemente riferimento a frequenze, assolute o percentuali. Osservazioni cliniche conducono sovente

Dettagli

Corso introduttivo di Epidemiologia e Biostatistica

Corso introduttivo di Epidemiologia e Biostatistica Corso introduttivo di Epidemiologia e Biostatistica massimo guerriero carlo pomari e con il contributo di: Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health ELEMENTI

Dettagli

STATISTICA. Regressione-4 ovvero Macron!

STATISTICA. Regressione-4 ovvero Macron! STATISTICA Regressione-4 ovvero Macron! Eravamo partiti da qui Stipendio medio orario 2013 Voto per Le Pen Stipendio medio orario (2013) [11,12) [12,13) [13,14) [14,15) [15,23] Eravamo partiti da qui Stipendio

Dettagli

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello Metodi Quantitativi per Economia, Finanza e Management Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello 1. Introduzione ai modelli di regressione 2. Obiettivi 3. Le

Dettagli

Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii

Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii Sommario Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii xv Parte I Statistica descrittiva 1 Capitolo 1 Introduzione 3 Perché studiare statistica? 4

Dettagli

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria Civile A.A. 2009-10 Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain 1 STATISTICHE, DISTRIBUZIONI CAMPIONARIE

Dettagli

Statistica Inferenziale Soluzioni 3. Verifica di ipotesi

Statistica Inferenziale Soluzioni 3. Verifica di ipotesi ISTITUZIONI DI STATISTICA A. A. 007/008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona

Dettagli

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università

Dettagli

Contenuto del capitolo

Contenuto del capitolo Capitolo 8 Stima 1 Contenuto del capitolo Proprietà degli stimatori Correttezza: E(Stimatore) = parametro da stimare Efficienza Consistenza Intervalli di confidenza Per la media - per una proporzione Come

Dettagli

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento. N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle abelle riportate alla fine del documento. Esercizio 1 La concentrazione media di sostanze inquinanti osservata nelle acque di un fiume

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2017-2018 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

STATISTICA A K (60 ore)

STATISTICA A K (60 ore) STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it In una prova sul carico di rottura di due tipi di corda si dispone di 2 campioni di ampiezza 26 e 35 rispettivamente. Nel primo campione

Dettagli

x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y )

x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y ) Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 0/03 lezioni di statistica del 5 e 8 aprile 03 - di Massimo Cristallo - A. Le relazioni tra i fenomeni

Dettagli

Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale

Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale DIPARTIMENTO DI SCIENZE AGRARIE E AMBIENTALI PRODUZIONE, TERRITORIO, AGROENERGIA Marco Acutis marco.acutis@unimi.it www.acutis.it CdS Scienze della Produzione e Protezione delle Piante (g59) CdS Biotecnologie

Dettagli

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 5 Test d Ipotesi

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 5 Test d Ipotesi Metodi Quantitativi per Economia, Finanza e Management Lezione n 5 Test d Ipotesi Test per lo studio dell associazione tra variabili Nella teoria dei test, il ricercatore fornisce ipotesi riguardo la distribuzione

Dettagli

Ulteriori Conoscenze di Informatica e Statistica

Ulteriori Conoscenze di Informatica e Statistica ndici di forma Ulteriori Conoscenze di nformatica e Statistica Descrivono le asimmetrie della distribuzione Carlo Meneghini Dip. di fisica via della Vasca Navale 84, st. 83 ( piano) tel.: 06 55 17 72 17

Dettagli

05. Errore campionario e numerosità campionaria

05. Errore campionario e numerosità campionaria Statistica per le ricerche di mercato A.A. 01/13 05. Errore campionario e numerosità campionaria Gli schemi di campionamento condividono lo stesso principio di fondo: rappresentare il più fedelmente possibile,

Dettagli

Distribuzioni campionarie

Distribuzioni campionarie 1 Inferenza Statistica Descrittiva Distribuzioni campionarie Statistica Inferenziale: affronta problemi di decisione in condizioni di incertezza basandosi sia su informazioni a priori sia sui dati campionari

Dettagli

Occorre trovare la distribuzione di DM

Occorre trovare la distribuzione di DM Esercizio In una prova sul carico di rottura di due tipi di corda si dispone di 2 campioni di ampiezza 26 e 35 rispettivamente. Nel primo campione la media è 185,3Kg, nel secondo campione la media è 175,2Kg.

Dettagli

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura INDICE GENERALE Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura XI XIV XV XVII XVIII 1 LA RILEVAZIONE DEI FENOMENI

Dettagli

Dispense Associazione PRELIMINARY DRAFT

Dispense Associazione PRELIMINARY DRAFT Dispense Associazione PRELIMINARY DRAFT Cristina Mollica & Jan Martin Rossi January 3, 2019 1 Esercizio 3 - Prova scritta 12-01-2018 Esercizio 3. Si consideri la distribuzione doppia di un campione di

Dettagli