La verifica delle ipotesi statistiche
|
|
- Aureliano Morandi
- 5 anni fa
- Visualizzazioni
Transcript
1 La verifica delle ipotesi statistiche Problema pratico: Quale, tra diverse situazioni possibili, riferite alla popolazione, è quella meglio sostenuta dalle evidenze empiriche? Coerenza del risultato campionario con un ipotesi specificata per la popolazione: se il risultato campionario si verrà a trovare talmente lontano dal valore teorizzato per da cadere in un insieme di valori ritenuti non coerenti (in quanto troppo poco probabili) con l ipotesi su, tale risultato avvalorerà la possibilità di ipotesi alternative a quella specificata. Test statistico = regola di decisione che ad ogni valore campionario associa una decisione sul parametro.
2 La logica della verifica delle ipotesi Punto di partenza: Informazione su un parametro Ipotesi sul parametro: = 0 Punto di arrivo: Campione Conferma l ipotesi Non conferma l ipotesi TEST Decisione sul valore del parametro ipotizzato H 0 : l ipotesi sul parametro è vera La vera distribuzione è centrata su 0 0 H 1 : l ipotesi sul parametro è falsa La vera distribuzione non è centrata su 0 1
3 Richiamando gli intervalli di confidenza: Dati: un campione X 1,, X n, un parametro ed una statistica T n, il cui valore calcolato sul campione è t n La probabilità: P t 1 n ha un senso solo se il valore di è noto (nel qual caso non ha utilità) A meno che
4 Se è noto: Prima di estrarre il campione t n non è fisso bensì una v.c. campionaria (T n ), quindi si può ragionare sulla probabilità che T n assuma valore compreso (ossia che t n cada) in un certo intervallo intorno a. A che scopo? Per stabilire se la nostra conoscenza su è avvalorata dall evidenza empirica (cioè dal campione) Esempio: t n = media campionaria N, n P z Xn z 1 n n z n z n X L intervallo è fisso, perché è centrato su varia al variare del campione tra tutti i possibili campioni, è fisso
5 Le ipotesi statistiche Ipotesi statistica: affermazione che specifica completamente o parzialmente la distribuzione di probabilità di una v.c. X. Ipotesi nulla H 0 : Informazione sulla popolazione riconosciuta come valida fino a prima all esperimento campionario (valida fino a prova contraria): Ipotesi alternativa H 1 : H 0 : = 0 Complemento all ipotesi nulla. È costituita da un singolo valore o da un insieme di valori possibili per e considerati alternativi a 0 : H 1 : = 1 H 1 : < 0 H 1 : > 0 H 1 : 0 Ipotesi semplice Ipotesi unidirezionale Ipotesi bidirezionale Le ipotesi H 0 e H 1 sono esaustive e disgiunte: o vale l una o vale l altra. In ogni caso la decisione è presa rispetto ad H 0
6 Test e regole di decisione Il test permette di stabilire se le osservazioni campionarie debbano ritenersi coerenti con l ipotesi nulla oppure no Da un punto di vista operativo, effettuare il test significa definire una statistica, detta statistica-test T n, la cui distribuzione campionaria sia nota, così che: campione casuale (X 1,, X n ) un valore numerico coerente con H 0 non coerente con H 0 Spazio campionario: insieme dei valori che la statistica-test può assumere Distribuzione campionaria: Distribuzione di probabilità della statistica-test
7 Errori di I e II specie Indipendentemente dalla regola adottata, il test porta sempre a dover scegliere tra due possibili decisioni, H 0 e H 1 e a poter commettere due possibili errori: rifiutare un ipotesi vera H 0 Vera Falsa accettare un ipotesi falsa Accetto Ok Errore di II specie Rifiuto Errore di I specie Ok Esempio: H 0 : piove Piove Non piove Ombrello SI Ombrello NO Ok Danno più grave Danno meno grave Ok N.B.: non esiste la decisione giusta!!! c è sempre il rischio di sbagliare, ma è possibile gestirlo e controllarlo QUANTIFICANDOLO
8 Rischio di errori di I e II specie H 0 Vera Falsa H 0 : = 0 H 1 : = 1 Accetto Rifiuto Ok Errore di I specie Errore di II specie Ok H 0 vera H 0 Vera Falsa Accetto 1 - Rifiuto 1-0 H 0 falsa 1 Definizioni: = probabilità di errore di I specie = livello di significatività del test 1 - = probabilità di accettare correttamente (affidabilità del test) = probabilità di errore di II specie 1 - = potenza del test = probabilità di rifiutare correttamente (varia al variare di 1, quindi può essere determinato solo se H 1 è un ipotesi semplice )
9 Approccio conservativo del test L ipotesi nulla è quella che, se vera, lascia invariate le cose L errore di I specie è considerato più grave di quello di II specie Mai lasciare la via vecchia (H 0 ) per la nuova (H 1 ) Esempi: fino ad EVIDENTE prova contraria H 0 : vecchio farmaco migliore del nuovo H 1 : nuovo farmaco migliore del vecchio H 0 : Tizio è innocente H 1 : Tizio è colpevole H 0 Il vecchio è migliore Il nuovo è migliore H 0 Innocente Colpevole Vecchio Ok Danno meno grave Assolvo Ok Danno meno grave Nuovo Danno più grave ok Condanno Danno più grave ok È per questo che: L ipotesi nulla e l ipotesi alternativa non sono equivalenti ai fini della decisione, nel senso che il test non è mai conclusivo circa H 1, ma concerne solo la possibilità che dal campione si possa pervenire al rifiuto o al non rifiuto di H 0.
10 Come prendere la decisione Una volta calcolato il valore campionario t n della statistica-test, detto valoretest, si può seguire una delle due seguenti procedure alternative: Livello di significatività osservato (approccio di Fisher): si cerca (sulle tavole) il p-value, ossia la probabilità di ottenere un valore di T n maggiore del valore osservato t n (P[T n > t n ]) p-value = grado di coerenza di H 0 p-value t n T n Regione critica (approccio di Neymann- Pearson): si fissa a priori il livello di significatività del test 1 -, che identifica sulla distribuzione della statistica-test due regioni: Regione di accettazione: insieme dei valori di T n coerenti con H 0 Regione di rifiuto (o regione critica): insieme di valori di T n non coerenti con H 0? t n 1 - t T n Accettazione Rifiuto
11 Regione critica per un test statistico con ipotesi alternativa unidirezionale:? t n H 0 : = 0 H 1 : > t T n Accettazione Rifiuto Regione critica per un test statistico con ipotesi alternativa bidirezionale: t n H 0 : = 0 H 1 : 0 / 1 - / -t / 0 t / T n Rifiuto Accettazione Rifiuto
12 Verifica di ipotesi sulla media X ~ N(, ) nota La decisione si basa sui valori critici Con essi va confrontato il valore-test (valore della statistica-test calcolata sul campione) I valori critici sono ottenuti dalla distribuzione della statistica-test, fissato il livello di significatività desiderato per il test Per la media: Xn P z z 1 n Valori critici Statistica-test
13 Esempio La frequenza cardiaca dei maschi giovani sani segue una distribuzione Normale con media = 7 battiti al minuto (bpm) e varianza = 64. Si misura la frequenza cardiaca su un campione di 5 atleti maschi e si ottiene una media pari a 68,7 bpm. Si verifichi, ad un livello di significatività del 5%, che la frequenza cardiaca degli atleti non sia diversa da quella della popolazione di tutti i maschi sani. Soluzione test sulla media, bilaterale distribuzione normale, varianza nota = 64 = 8 68,7 = 0,05 / = 0,05 n = 5 Ipotesi H 0 : = 7 H 1 : 7 Statistica test Valori critici X test z 1,96 n Regola di decisione - 1,96 v test 1,96 si accetta H 0 v test < -1,96 oppure v test > 1,96 si rifiuta H 0 Valore test (v test ) 68,7 7 vtest, Decisione -,06 < -1,96 si rifiuta H 0
14 Esempio La quantità di merci in transito negli aeroporti italiani si distribuisce normalmente con una media pari a 18,7 (migliaia di tonnellate) e uno scarto quadratico medio pari a 8. In un campione di 0 aeroporti viene registrato un valore medio pari a 15. Utilizzando un livello di significatività dell 1%: a) Verificare l ipotesi che il transito medio di merci sia rimasto invariato; b) Verificare l ipotesi che il transito medio di merci non sia diminuito Soluzione a) test sulla media, bidirezionale distribuzione normale, varianza nota Ipotesi H 0 : = 18,7 H 1 : 18,7 = 8 15 = 0,01 / = 0,005 n = 0 Statistica test Valori critici X test n z z,58 0,005 Regola di decisione -,58 v test,58 si accetta H0 v test < -,58 oppure v test >,58 si rifiuta H0 Valore test (v test ) 15 18,7 vtest, Decisione -,58 -,07,58 si accetta H0
15 b) test sulla media, unidirezionale distribuzione normale, varianza nota Ipotesi H 0 : = 18,7 H 1 : < 18,7 Statistica test Valore critico X test n z z,33 0,01 Regola di decisione v test -,33 si accetta H0 v test < -,33 si rifiuta H0 Valore test (v test ) 15 18,7 vtest, Decisione -,07 -,33 si accetta H0
16 Verifica di ipotesi sulla media X ~ N(, ) non nota Xn P t t 1 n1 n 1 s n Valori critici Statistica-test Come scegliere la statistica-test per la media? X ~ N no n > 30 no??? si si noto no X s n ~ t n 1 si X n ~ N 0,1
17 Esempio La frequenza cardiaca dei maschi giovani sani segue una distribuzione Normale con media = 7 battiti al minuto (bpm). Si misura la frequenza cardiaca su un campione di 1 atleti maschi e si ottiene una media pari a 68,7 bpm ed una varianza corretta pari a 75,1. Si verifichi, ad un livello di significatività del 5%, che la frequenza cardiaca degli atleti non sia diversa da quella della popolazione di tutti i maschi sani. Soluzione test sulla media, bidirezionale distribuzione normale, varianza non nota s 75,1 s = 8,67 68,7 = 0,05 / = 0,05 n = 1 Ipotesi H 0 : = 7 H 1 : 7 Statistica test test s n 0 Valori critici t,01 0,05;11 Regola di decisione -,01 v test,01 si accetta H 0 v test -,01 oppure v test,01 si rifiuta H 0 Valore test (v test ) 68,7 7 3,3 vtest 1,3 8,67 1,5 Decisione -,01-1,3,01 si accetta H 0
18 Verifica di ipotesi sulla proporzione p P z z 1 1 n Valori critici Statistica-test
19 Esempio In una scommessa con un amico, lanciando 100 volte una moneta si sono ottenute 54 teste. Abbiamo il sospetto che l amico ci abbia ingannati utilizzando una moneta truccata. Si verifichi questa ipotesi ad un livello di significatività del 10%. Soluzione test sulla proporzione, bidirezionale (unidirezionale) = 0,10 p =0,54 n=100 Ipotesi H 0 : = 0,5 H 1 : 0,5 (H 1 : > 0,5) p 0 Statistica test test 1 Valori critici 0 0 n z 1,645 0,05 z 1,8 0,1 Regola di decisione - 1,645 v test 1,645 si accetta H 0 v test -1,645 oppure v test 1,645 si rifiuta H 0 ( ) v test 1,8 si accetta H 0 v test > 1,8 si rifiuta H 0 Valore test (v test ) 0,54 0,50 0,50 1 0, ,80 Decisione -1,645-0,8 1,645 si accetta H 0 (0,80 < 1,8 si accetta H0)
20 Verifica di ipotesi sulla differenza tra medie X e Y ~ N no n e n y > 30 no??? si X si e Y note no X = Y si no X Y y s n s n y y ~ t n n y si X Y y s 1 1 n n y ~ t n n y X Y y no X = Y si 1 1 n n y ~ N 0,1 X Y y y n n y ~ N 0,1 s s n 1 s n 1 X X Y Y n n Stimatore corretto dello sqm comune y
21 A cosa serve il test sulla differenza tra medie? Se su due campioni X ed Y su cui si osserva lo stesso fenomeno si calcolano le rispettive medie (campionarie) esse presenteranno quasi certamente due valori numericamente diversi. Il problema è: tale differenza è significativa, cioè dovuta ad una differenza strutturale tra i due campioni, oppure è dovuta ad una naturale oscillazione della media, data la variabilità del fenomeno?
22 Esempio Gli pneumatici di due diverse marche, X e Y, di uguale prezzo, sono garantiti dalle case costruttrici per la stessa durata media di km e una deviazione standard di.000 km, uguale per le due marche. Da un campione di 14 utilizzatori della marca X risulta una durata media di Km, mentre da uno di 9 utilizzatori della marca Y risulta una durata media di Km. Supponendo che la durata degli pneumatici si distribuisca secondo una legge Normale, si verifichi se esiste tra le due marche una differenza significativa al 5%. Soluzione Ipotesi Statistica test test sulla differenza tra medie, bidirezionale distribuzione Normale, varianze note uguali H 0 : = Y H 1 : X Y test X Y y 1 1 n n y = 0,05 n X =14 n Y =9 X, Y ~ N y X = Y =.000 Valori critici z 1,96 0,05 Regola di decisione - 1,96 v test 1,96 si accetta H 0 v test -1,96 oppure v test 1,96 si rifiuta H 0 Valore test (v test ) vtest, Decisione -,93 < -1,96 si rifiuta H 0
23 Esempio Gli pneumatici di due diverse marche, X e Y, di uguale prezzo, sono garantiti dalle case costruttrici per la stessa durata media di km e la stessa varianza incognita. Da un campione di 14 utilizzatori della marca X risulta una durata media di Km ed una varianza pari a , mentre da uno di 9 utilizzatori della marca Y risulta una durata media di Km ed una varianza pari a Supponendo che la durata degli pneumatici si distribuisca secondo una legge Normale, si verifichi se esiste tra le due marche una differenza significativa al 5%. Soluzione test sulla differenza tra medie, bidirezionale distribuzione Normale, varianze non note uguali = 0, y n Y =9 n X =14 X ~ N sx sy
24 Ipotesi H 0 : = Y H 1 : X Y Statistica test test X Y y 1 1 s n n y con: s s n 1 s n 1 X X Y Y n n y Valori critici t,08 0,05;1 Regola di decisione -,08 v test,08 si accetta H 0 v test -,08 oppure v test,08 si rifiuta H s 038, Valore test (v test ) vtest, , 8 038, Decisione -,87 < -,08 si rifiuta H 0
25 Esempio Gli pneumatici di due diverse marche, X e Y, di uguale prezzo, sono garantiti dalle case costruttrici per la stessa durata media di km ma con varianze diverse e incognite. Da un campione di 14 utilizzatori della marca X risulta una durata media di Km ed una varianza pari a , mentre da uno di 9 utilizzatori della marca Y risulta una durata media di Km ed una varianza pari a Supponendo che la durata degli pneumatici si distribuisca secondo una legge Normale, si verifichi se esiste tra le due marche una differenza significativa al 5%. Soluzione test sulla differenza tra medie, bidirezionale distribuzione Normale, varianze non note diverse = 0, y n Y =9 n X =14 X ~ N sx sy
26 Ipotesi H 0 : = Y H 1 : X Y Statistica test test X Y y s n s n y y Valori critici t,08 0,05;1 Regola di decisione -,08 v test,08 si accetta H 0 v test -,08 oppure v test,08 si rifiuta H 0 Valore test (v test ) vtest, Decisione -,91 < -,08 si rifiuta H 0
27 Esempio Nelle regioni italiane si misura il livello di inquinamento ambientale con il numero di denunce emesse dalla popolazione residente. Nelle 10 regioni del Nord risultano in media 9.1 denunce con s.q.m. 6, mentre nelle 1 del Centro-Sud la media è con s.q.m. 6. Ipotizzando che il numero di denunce segua una distribuzione Normale, verificare l ipotesi che le due aree geografiche siano caratterizzate dallo stesso livello di inquinamento al livello di significatività del 5% y 3.85 Valore test Valore critico 1.75 g.d.l. 0 a 0.05 Decisione: Si accetta H 0 H 0 : - Y = 0 H 1 : X - Y > 0 IC 95% ( m -m y ) = [ -1.4 ; 9.1 ] Contiene lo 0
28 La spezzata delle medie X AREA Geografica Y Classi di REDDITO Totale Medie NORD CENTRO SUD Totale
29 Decomposizione della varianza La varianza di X è data dalla somma di due componenti: varianza esterna = varianza delle medie di gruppo varianza interna = media delle varianze di gruppo Se: G = numero di gruppi; j = media dell j-esimo gruppo; n j = numerosità dell j-esimo gruppo (j = 1,.,G); Quanto differiscono le medie tra loro e rispetto alla media generale? allora: 1 1 G G jnj j nj n j1 n j1 VARIANZA INTERNA VARIANZA ESTERNA ossia: TOT INT EX T
30 A cosa serve scomporre la varianza? n. bot Media e varianza costanti Varianza delle medie et = 0 Media delle varianze int = Stesso comportamento tra le due distribuzioni: CH MM scelta il numero di bottiglie acquistate è lo stesso per chi sceglie le due marche n. bot Medie diverse, varianza costante Varianza delle medie et 0 Media delle varianze int < Diverso comportamento tra le due distribuzioni: CH MM scelta il numero di bottiglie acquistate è diverso a seconda della marca scelta
31 Rapporto di correlazione di Pearson Y X Classe j ma h-1 - h tot y 1 n 11 n 1 n 1h n1. y n 1 n n h n.... y. i n.... ij.. ni.... y k n k1 n k n kh nk. tot n.1 n. n.j n.h n Quando X è quantitativo: i i EXTX i1 X Y c X ˆj X n j j1 r n Quando Y è quantitativo: j Y j EXTY j1 Y X r Y yi Y ni i1 c n N.B.: Su una tabella mista è possibile misurare anche l indipendenza assoluta con l indice del
32 Proprietà e interpretazione 0 1 X Y X Y 0 Perfetta indipendenza in media: le medie delle distribuzioni condizionate di X sono tutte uguali tra loro ed uguali alla media generale (μ X ) X Y 1 Perfetta dipendenza in media: le varianze delle distribuzioni condizionate di X sono nulle. Ad ogni modalità di Y corrisponde una sola intensità di X che presenta frequenza non nulla Y X X Y L indice non è simmetrico (salvo eccezioni)
33 Esempio Fatturato (Y) Settore Merceologico (X) >500 Totale Alimentari Bevande Healt Care Ice Packaging Totale X 4 modalità Y 5 classi ( aperte) i Y i EXTY i1 Y X c Y ŷj Y n j j1 r n 1. Media generale di Y: h Y ŷn j j j n ,96 Nota: Il valore centrale della prima classe (aperta) è stato ottenuto considerando che, nella successione di valori del carattere fatturato, i valori più bassi sono di poco superiori a 100 (che si assume, quindi, come estremo inferiore della classe); quello dell ultima classe è ottenuto considerando come estremo superiore della classe il valore massimo effettivamente osservato: ( )/ = 156
34 . Medie di Y condizionate alle modalità di X n 1 c 1 ŷn j 1j 1 j1 348, 48 c yn j j j ˆ 66,67 n 3 c 3 ŷn j 3j 3 j n 1 384,33 c 4 ŷn j 4j 4 j n 14 41
35 3. Confronto tra le medie condizionate 1 348, 48 66, , Commento: si può vedere che le medie delle distribuzioni condizionate differiscono dalla media generale di Y, quindi i due caratteri non sono indipendenti in media. Ma quanto è forte il legame di dipendenza in media?
36 r i Y i i1 c j1 4. Calcolo del numeratore dell indice n 348, , ,67 394, ,33 394, , ,14 5. Calcolo del denominatore dell indice j Y j ŷ n , , , , , Calcolo dell indice r i Y ni EXTY i , Y X c Y ŷj Y n j j1 0,013 La dipendenza in media del carattere FATTURATO dal carattere SETTORE MERCEOLOGICO è praticamente nulla ossia: il fatturato in media non dipende dal settore merceologico
37 Il test F Ipotesi: H 0 : m i = m j i,j = 1,, G le medie sono uguali in tutti i gruppi H 1 : m i m j almeno una media differisce dalle altre H 0 H 1 Se le medie sono uguali, la varianza tra i gruppi è nulla: Più le medie differiscono, più: Statistica test: Dev EXT Dev 0 INT Dev TOT Dev 0 Dev Dev EXT / G 1 P F G1;n G; 1 Dev INT / n G EXT INT Dev TOT Statistica-test Valore critico Più basso è il rapporto, più realistica è l'ipotesi nulla Più elevato è il rapporto, meno realistica è l'ipotesi nulla
38 Il test F Ipotesi: H 0 : m i = m j i,j = 1,, G le medie sono uguali in tutti i gruppi H 1 : m i m j almeno una media differisce dalle altre H 0 : H 1 : EXT INT Dev / G 1 Dev / n G Dev / G 1 EXT Dev / n G INT 0 0 H 0 : = 0 H 1 : > 0
39 Fatturato e settore merceologico H 0 : m i = m j i,j = 1,, G le vendite medie sono uguali in tutti i settori H 1 : m i m j almeno una media differisce dalle altre ANOVA Source DF Sum of squares Mean squares F Pr > F Fra gruppi Entro gruppi Totale F Decisione: 0,89 0,04 EXT INT Basso valore di F = bassa EXT = medie vicine Il p-value è molto alto: Si accetta l ipotesi di vendite medie uguali tra i settori, confermata dal campione osservato.
40
41 X AREA Geografica Y Classi di REDDITO Totale Medie NORD CENTRO SUD Totale ANOVA Source DF Sum of squares Mean squares F Pr > F Fra gruppi Entro gruppi Totale Il p-value è basso: Si rifiuta l ipotesi reddito medio uguale nelle tre le aree geografiche.
42 Verifica dell ipotesi di indipendenza H 0 : X ed Y sono indipendenti H 1 : X ed Y non sono indipendenti Ipotesi di indipendenza in media ANOVA: test F H 0 : = 0 H 1 : > 0 Ipotesi di indipendenza assoluta Test del H 0 : = 0 H 1 : > 0 Ipotesi di indipendenza lineare Test su H 0 : = 0 H 1 : > 0 Test su R H 0 : R = 0 H 1 : R > 0
43 Verifica di ipotesi sull indipendenza assoluta tra due caratteri n n i j ij ij ij n r 1c 1 nij n ij P ; r 1 c 1 1 i j n ij Statistica-test Valore critico La variabile è continua, non può essere negativa e varia tra zero e infinito. La sua forma e il suo centro dipendono dal numero di gradi di libertà. La sua forma funzionale è: 1 f(;g) ep g g g g= g=4 g=
44 Verifica di ipotesi sull indipendenza tra due caratteri Conteggio OCCUPAZIONE ATTUALE ATTUALE Non occupato Precario Occ. stabile Totale VOTO VOTO Meno di e lode Totale n ij nij n i j ij 3,84 H 0 : X ed Y indipendenti H 1 : X ed Y non indipendenti = 0,05 Distribuzione del chi-quadro 1-0,05;6 1,59 Ipotesi H 0 : = 0 H 1 : > 0 Statistica test Valore critico Regola di decisione test n ij n n i j ij 0,05; 6 1,59 v test 1,59 si accetta H 0 v test > 1,59 si rifiuta H 0 ij 3,84 Zona di accettazione 1,59 Zona di rifiuto n ij nij n i j ij Valore test (v test ) nij nij vtest 3,84 n i j ij Decisione 3,84 < 1,59 si accetta H 0
45 Verifica dell ipotesi di indipendenza lineare Modello di regressione lineare semplice Fasi del modello: Specificazione del modello: scelta del tipo di funzione da utilizzare per descrivere un fenomeno; definizione delle ipotesi di base Stima dei parametri: uso di stimatori dei parametri caratteristici della funzione scelta Verifica: della significatività delle stime del rispetto delle ipotesi di base (rimozione delle ipotesi, analisi dei residui) Uso del modello: ai fini per i quali è stato specificato (descrittivi, previsivi, ecc.) 45
46 IPOTESI DI BASE DEL MODELLO DI REGRESSIONE Ipotesi deboli: Necessarie perché le stime godano di proprietà ottimali, ossia siano non distorte e a varianza minima (BLUE, Teorema di Gauss-Markow) 1. y i = + i + i. E( i ) = 0 3. var( i ) = var(y i ) = 4. cov( i, j ) = 0 (i j) 5. X nota e senza errore Varianza costante, omoschedasticità Assenza di autocorrelazione X non stocastica Ipotesi forte: Necessaria per verificare la significatività delle stime 6. N(0, ) La varianza di (o di y) rientra tra i parametri da stimare Se ci fosse correlazione tra gli errori significherebbe che esistono altri fattori oltre a X ad influenzare Y, esclusi dal modello. Inoltre implicherebbe un legame anche tra le y i L ipotesi distribuzionale (6) è fondamentale nella fase inferenziale 46
47 RAPPRESENTAZIONE GRAFICA DEL MODELLO Y f() E(Y X) = a + b X Distribuzioni degli errori (intorno alla stima di Y): media 0, varianza costante, indipendenti, distribuiti Normalmente y i i.i.d. con media e varianza costanti 47
48 VERIFICA DEL MODELLO Significatività dell R H 0 : R 0 H 1 : R > 0 Significatività di a e di b H 0 : 0 H 1 : b 0 dev reg R n dev e n 1 R test 1;n b t test n sb F F a,1,n- a H 0 : 0 H 1 : a 0 a t test n sa a/ a/ -t a/,n- t a/,n- 48
49 Varianze della regressione Varianza dei residui: ev Y Devianza dei residui: cod X, Y dev e R 1 dev X d dev y s 1 n s n e i i1 cod X, Y dev e 1 dev X errore standard della regressione Varianza di a: s s a 1 n n i1 i s a errore standard della stima di Varianza di b: s s b n i1 1 i s b errore standard della stima di 49
50 Da un campione di 7 aziende risultano i seguenti valori del numero totale di dipendenti (X) e del numero di dipendenti laureati (Y): Dip. totali (X) Dip. Laureati (Y) a)disegnare la retta di regressione di Y su X; b)misurare la bontà dell adattamento; c)sapendo che 1 s e 3,89 n i n i1 verificare la significatività del modello al livello dell 1% i yi y i y i y i yi y y i i ,9 9 1,65 3, ,71 0 0, ,71 4 7,37 5, ,71 9,94 5, ,9 1 0,08 0, ,9 1 1,65-1, ,9 4 5, 4, ,43 18
51 cov, y cod, y 18 b 0,64 dev 8 a y b 4,9 0,64 8-0,86 Equazione della retta: y y 0,86 0,64 0-0,86 8 4,9 cov, y cod, y devreg devres R 1 dev y dev y dev dev y 18 R 8 19, 43 0,6 y
52 Test su R, unilaterale Ipotesi H 0 : R = 0 H 1 : R > 0 Statistica test Valore critico F 0,01;1;5 = 16,58 Regola di decisione v test 16,58 si accetta H 0 v test 16,58 si rifiuta H 0 Valore test X devreg test F 1;n devres n 1 R 0,6 5 vtest 7,36 1 0,6 R n Decisione 7,36 16,58 si accetta H 0 La relazione lineare tra y ed non è significativa Si rifiuta il modello lineare
53 F 0,05;1;5 = 6,608 ANOVA Source DF Sum of squares Mean squares F Pr > F Model Error Corrected Total Significatività dei coefficienti Source Value Standar d error t Pr > t Lower bound (95%) Upper bound (95%) Intercept
54
55 Test su b, bilaterale Ipotesi H 0 : b = 0 H 1 : b 0 Statistica test Valori critici t 0,005;5 = 4,03 Regola di decisione Valore test X b s t test n in cui: - 4,03 v test 4,03 si accetta H 0 v test - 4,03 oppure v test 4,03 si rifiuta H 0 0,64 vtest 1,7 0,37 s s n i1 1 1 s 1,57 0,37 8 i Decisione - 4,03 1,7 4,03 si accetta H 0 La relazione lineare tra y ed non è significativa Si rifiuta il modello lineare
56 Test su a, bilaterale Ipotesi H 0 : a = 0 H 1 : a 0 Statistica test test n Valori critici t 0,005;5 = 4,03 X a s t s s 1 n n i1 i Regola di decisione - 4,03 v test 4,03 si accetta H 0 v test - 4,03 oppure v test 4,03 si rifiuta H 0 Valore test 3,89 8 s 1 1, ,86 vtest 0,63 1,35 Decisione - 4,03-0,63 4,03 si accetta H 0
57 Verifica di ipotesi sul confronto tra due varianze
Problema pratico: Test statistico = regola di decisione
La verifica delle ipotesi statistiche Problema pratico: Quale, tra diverse situazioni possibili, riferite alla popolazione, è quella meglio sostenuta dalle evidenze empiriche? Coerenza del risultato campionario
DettagliL'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale
L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile Corso di Metodologia della ricerca sociale L analisi della varianza (ANOVA) La tecnica con cui si esplorano le relazioni
DettagliContenuti: Capitolo 14 del libro di testo
Test d Ipotesi / TIPICI PROBLEMI DI VERIFICA DI IPOTESI SONO Test per la media Test per una proporzione Test per la varianza Test per due campioni indipendenti Test di indipendenza Contenuti Capitolo 4
DettagliUn esempio. Ipotesi statistica: supposizione riguardante: un parametro della popolazione. la forma della distribuzione della popolazione
La verifica delle ipotesi In molte circostanze il ricercatore si trova a dover decidere quale, tra le diverse situazioni possibili riferibili alla popolazione, è quella meglio sostenuta dalle evidenze
DettagliRegressione Lineare Semplice e Correlazione
Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)
DettagliFasi del modello di regressione
Fasi del modello di regressione Specificazione del modello: scelta del tipo di funzione da utilizzare per descrivere un fenomeno; definizione delle ipotesi di base Stima dei parametri: uso di stimatori
DettagliSTATISTICA A K (60 ore)
STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta
DettagliVerifica delle ipotesi
Statistica inferenziale Stima dei parametri Verifica delle ipotesi Concetti fondamentali POPOLAZIONE o UNIVERSO Insieme degli elementi cui si rivolge il ricercatore per la sua indagine CAMPIONE Un sottoinsieme
DettagliEsercizi di statistica
Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..
DettagliSOLUZIONI PROVA SCRITTA DI STATISTICA (cod. 4038, 5047, 371, 377) 8 settembre 2005
SOLUZIONI PROVA SCRITTA DI STATISTICA cod. 4038, 5047, 371, 377) 8 settembre 2005 MODALITÀ B APPROSSIMARE TUTTI I CALCOLI ALLA QUARTA CIFRA DECIMALE Esercizio 1. 7 punti) Su un collettivo di 13 nuclei
DettagliCorso di STATISTICA EGA - Classe 1 aa Docenti: Luca Frigau, Claudio Conversano
Corso di STATISTICA EGA - Classe 1 aa 2017-2018 Docenti: Luca Frigau, Claudio Conversano Il corso è organizzato in 36 incontri, per un totale di 72 ore di lezione. Sono previste 18 ore di esercitazione
DettagliUniversità di Pavia Econometria. Richiami di Statistica. Eduardo Rossi
Università di Pavia Econometria Richiami di Statistica Eduardo Rossi Università di Pavia Campione casuale Siano (Y 1, Y 2,..., Y N ) variabili casuali tali che le y i siano realizzazioni mutuamente indipendenti
DettagliStatistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1
Statistica Capitolo 1 Regressione Lineare Semplice Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Spiegare il significato del coefficiente di correlazione lineare
DettagliLezione 16. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 16. A. Iodice. Ipotesi statistiche
Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 23 Outline 1 2 3 4 5 6 () Statistica 2 / 23 La verifica delle ipotesi Definizione Un ipotesi statistica
DettagliSTATISTICA MULTIVARIATA SSD MAT/06
Università degli studi di Ferrara Dipartimento di Matematica A.A. 2018/2019 I semestre STATISTICA MULTIVARIATA SSD MAT/06 LEZIONE 4 - Questioni di analisi e applicazione della regressione lineare Pratica
DettagliSTATISTICA ESERCITAZIONE 13
STATISTICA ESERCITAZIONE 13 Dott. Giuseppe Pandolfo 9 Marzo 2015 Errore di I tipo: si commette se l'ipotesi nulla H 0 viene rifiutata quando essa è vera Errore di II tipo: si commette se l'ipotesi nulla
Dettaglix ;x Soluzione Gli intervalli di confidenza possono essere ottenuti a partire dalla seguente identità: da cui si ricava: IC x ;x = +
ESERCIZIO 6.1 Si considerino i 0 campioni di ampiezza n = estratti da una popolazione X di N = 5 elementi distribuiti normalmente, con media µ = 13,6 e σ = 8,33. A partire dalle 0 determinazioni della
DettagliPROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA
PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURA/TECNICA DI ANALISI DEI DATI SPECIFICAMENTE DESTINATA A STUDIARE LA RELAZIONE TRA UNA VARIABILE NOMINALE (ASSUNTA
DettagliUniversità degli Studi Roma Tre Anno Accademico 2014/2015 ST410 Statistica 1
Università degli Studi Roma Tre Anno Accademico 2014/2015 ST410 Statistica 1 Lezione 1 - Martedì 23 Settembre 2014 Introduzione al corso. Richiami di probabilità: spazi di probabilità, variabili aleatorie,
DettagliVERIFICA DELLE IPOTESI
VERIFICA DELLE IPOTESI Ipotesi statistica parametrica non parametrica una qualunque affermazione che specifica completamente o parzialmente la distribuzione di probabilità di una v.c. X. semplice: se la
Dettagliper togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione
Rapporti statistici di composizione la parte rispetto al tutto percentuali di derivazione per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione di frequenza (tassi) rapporti
DettagliCORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Associazione, correlazione e dipendenza tra caratteri In un collettivo di 11 famiglie è stata
DettagliStatistica (parte II) Esercitazione 4
Statistica (parte II) Esercitazione 4 Davide Passaretti 03/03/016 Test sulla differenza tra medie (varianze note) Un negozio di scarpe è interessato a capire se le misure delle scarpe acquistate da adulti
DettagliLa statistica è la scienza che permette di conoscere il mondo intorno a noi attraverso i dati.
RICHIAMI DI STATISTICA La statistica è la scienza che permette di conoscere il mondo intorno a noi attraverso i dati. Quale è la media della distribuzione del reddito dei neolaureati? Per rispondere dovremmo
DettagliPROVA SCRITTA DI STATISTICA (COD COD ) 7 luglio 2005 APPROSSIMARE TUTTI I CALCOLI ALLA QUARTA CIFRA DECIMALE SOLUZIONI MODALITÀ A
PROVA SCRITTA DI STATISTICA (COD. 047 - COD. 403-37-377) 7 luglio 200 APPROSSIMARE TUTTI I CALCOLI ALLA QUARTA CIFRA DECIMALE SOLUZIONI MODALITÀ A Esercizio (9 punti) Supponiamo di aver osservato la seguente
Dettagli1.1 Obiettivi della statistica Struttura del testo 2
Prefazione XV 1 Introduzione 1.1 Obiettivi della statistica 1 1.2 Struttura del testo 2 2 Distribuzioni di frequenza 2.1 Informazione statistica e rilevazione dei dati 5 2.2 Distribuzioni di frequenza
DettagliDispensa di Statistica
Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza
DettagliPremessa: la dipendenza in media
Premessa: la dipendenza in media Supponiamo di avere K diversi livelli di un fattore che potrebbero influire su una determinata variabile. Per esempio supponiamo di domandarci se la diversificazione (intesa
DettagliUniversità degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1
Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1 Lezione 1 - Mercoledì 28 Settembre 2016 Introduzione al corso. Richiami di probabilità: spazi di probabilità, variabili aleatorie,
DettagliESAME. 9 Gennaio 2017 COMPITO A
ESAME 9 Gennaio 2017 COMPITO A Cognome Nome Numero di matricola 1) Approssimare tutti i calcoli alla quarta cifra decimale. 2) Ai fini della valutazione si terrà conto solo ed esclusivamente di quanto
DettagliAnalisi della varianza a una via
Analisi della varianza a una via Statistica descrittiva e Analisi multivariata Prof. Giulio Vidotto PSY-NET: Corso di laurea online in Discipline della ricerca psicologico-sociale SOMMARIO Modelli statistici
Dettaglilezione 4 AA Paolo Brunori
AA 2016-2017 Paolo Brunori dove eravamo arrivati - abbiamo individuato la regressione lineare semplice (OLS) come modo immediato per sintetizzare una relazione fra una variabile dipendente (Y) e una indipendente
DettagliAnalisi di Regressione Multipla
Analisi di Regressione Multipla Stima OLS della relazione Test Score/STR : TestScore! = 698.9.8 STR, R =.05, SER = 18.6 (10.4) (0.5) E una stima credibile dell effetto causale sul rendimento nei test di
DettagliCalcolo delle Probabilità e Statistica Matematica: definizioni prima parte. Cap.1: Probabilità
Calcolo delle Probabilità e Statistica Matematica: definizioni prima parte Cap.1: Probabilità 1. Esperimento aleatorio (definizione informale): è un esperimento che a priori può avere diversi esiti possibili
DettagliCOGNOME.NOME...MATR..
STATISTICA 29.01.15 - PROVA GENERALE (CHALLENGE) Modalità A (A) ai fini della valutazione verranno considerate solo le risposte riportate dallo studente negli appositi riquadri bianchi: in caso di necessità
DettagliIndice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza
XIII Presentazione del volume XV L Editore ringrazia 3 1. Introduzione alla Statistica 5 1.1 Definizione di Statistica 6 1.2 I Rami della Statistica Statistica Descrittiva, 6 Statistica Inferenziale, 6
DettagliSTATISTICA. Esercitazione 5
STATISTICA Esercitazione 5 Esercizio 1 Ad un esame universitario sono stati assegnati in modo casuale due compiti diversi con i seguenti risultati: Compito A Compito B Numero studenti 102 105 Media dei
DettagliSTATISTICA A K (60 ore)
STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Esercizio Il contenuto di nicotina di una certa marca di sigarette è 0,25 milligrammi con una deviazione standard di 0,015. Un associazione
DettagliElementi di Psicometria (con laboratorio software 1)
Elementi di Psicometria (con laboratorio software 1) 05-La verifica delle ipotesi con le medie dei campioni (v. 1.0, 15 aprile 2019) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia,
DettagliStatistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità D
Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità D Cognome Nome: Part time: Numero di matricola: Diurno: ISTRUZIONI: Il punteggio relativo alla prima parte dell esame viene calcolato
DettagliRichiami di inferenza statistica Strumenti quantitativi per la gestione
Richiami di inferenza statistica Strumenti quantitativi per la gestione Emanuele Taufer Inferenza statistica Parametri e statistiche Esempi Tecniche di inferenza Stima Precisione delle stime Intervalli
DettagliArgomenti della lezione:
Lezione 13 L analisi della Varianza (ANOVA): il modello lineare Argomenti della lezione: Modello lineare Disegni a una via L Analisi della Varianza (ANOVA): Esamina differenze tra le medie di due o più
DettagliSTATISTICA. Federico M. Stefanini. e.mail: a.a (3 CFU)
STATISTICA a.a. 2001-2002 (3 CFU) Federico M. Stefanini Dipartimento di Statistica G.Parenti viale Morgagni 59, 50134 Firenze, tel. 055-4237211 PARTE 5-3.12.2001 e.mail: stefanin@ds.unifi.it http://www.ds.unifi.it/ricerca/pagperson/docenti/stefanini.htm
DettagliRichiami di inferenza statistica. Strumenti quantitativi per la gestione. Emanuele Taufer
Richiami di inferenza statistica Strumenti quantitativi per la gestione Emanuele Taufer Inferenza statistica Inferenza statistica: insieme di tecniche che si utilizzano per ottenere informazioni su una
DettagliUniversità degli Studi Roma Tre Anno Accademico 2017/2018 ST410 Statistica 1
Università degli Studi Roma Tre Anno Accademico 2017/2018 ST410 Statistica 1 Lezione 1 - Mercoledì 27 Settembre 2017 Introduzione al corso. Richiami di probabilità: spazi di probabilità, variabili aleatorie,
DettagliStatistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità B
Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità B Cognome Nome: Part time: Numero di matricola: Diurno: ISTRUZIONI: Il punteggio relativo alla prima parte dell esame viene calcolato
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2016-2017 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliLezione 17. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 17. A. Iodice
con Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 29 Outline con 1 2 3 con 4 5 campioni appaiati 6 Indipendenza tra variabili () Statistica 2 /
DettagliTecniche di sondaggio
SMID a.a. 2005/2006 Corso di Statistica per la Ricerca Sperimentale Tecniche di sondaggio 24/1/2006 Nomenclatura Indicheremo con P una popolazione, con N la sua numerosità, con k la sua etichetta e con
DettagliCorso di Statistica Esercitazione 1.8
Corso di Statistica Esercitazione.8 Test su medie e proporzioni Prof.ssa T. Laureti a.a. 202-203 Esercizio Un produttore vuole monitorare i valori dei livelli di impurità contenute nella merce che gli
DettagliECONOMETRIA: Laboratorio I
ECONOMETRIA: Laboratorio I Luca De Angelis CLASS - Università di Bologna Programma Laboratorio I Valori attesi e varianze Test di ipotesi Stima di un modello lineare attraverso OLS Valore atteso Data una
DettagliNel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0.
Regressione [] el modello di regressione lineare si assume una relazione di tipo lineare tra il valore medio della variabile dipendente Y e quello della variabile indipendente X per cui Il modello si scrive
DettagliESAME. 9 Gennaio 2017 COMPITO B
ESAME 9 Gennaio 2017 COMPITO B Cognome Nome Numero di matricola 1) Approssimare tutti i calcoli alla quarta cifra decimale. 2) Ai fini della valutazione si terrà conto solo ed esclusivamente di quanto
DettagliSTATISTICA A K (60 ore)
STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Esercizio In una prova sul carico di rottura di due tipi di corda si dispone di 2 campioni di ampiezza 26 e 35 rispettivamente. Nel
DettagliCapitolo 12 La regressione lineare semplice
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università
DettagliUlteriori Conoscenze di Informatica e Statistica
Ulteriori Conoscenze di Informatica e Statistica Carlo Meneghini Dip. di fisica via della Vasca Navale 84, st. 83 (I piano) tel.: 06 55 17 72 17 meneghini@fis.uniroma3.it Indici di forma Descrivono le
DettagliLEZIONI DI STATISTICA MEDICA
LEZIONI DI STATISTICA MEDICA Lezione n.11 - Principi dell inferenza statistica - Campionamento - Distribuzione campionaria di una media e di una proporzione - Intervallo di confidenza di una media e di
DettagliLEZIONI DI STATISTICA MEDICA
LEZIONI DI STATISTICA MEDICA Lezione n.12 - Test statistico Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona IPOTESI SCIENTIFICA Affermazione che si può sottoporre a verifica
DettagliSTATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo
STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)
DettagliParametri e statistiche. Parametri e statistiche. Distribuzioni campionarie. Popolazione Parametri Valori fissi, Statistiche o Stimatori.
Parametri e statistiche Popolazione Parametri Valori fissi, spesso non noti Campione Statistiche o Stimatori Variabili casuali, le cui determinazioni dipendono dalle particolari osservazioni scelte Parametri
DettagliCONFRONTO TRA LA MEDIE DI DUE CAMPIONI INDIPENDENTI
CONFRONTO TRA LA MEDIE DI DUE CAMPIONI INDIPENDENTI ipotesi sul confronto tra le medie di due campioni indipendenti Obiettivo: decidere, attraverso il confronto tra le medie dei due campioni indipendenti,
DettagliEsercitazione 8 del corso di Statistica 2
Esercitazione 8 del corso di Statistica Prof. Domenico Vistocco Dott.ssa Paola Costantini 6 Giugno 8 Decisione vera falsa è respinta Errore di I tipo Decisione corretta non è respinta Probabilità α Decisione
DettagliEsercizio 1. La variabile casuale G, somma di due V.C. normali, si distribuisce anch essa come una normale.
Esercizio 1. La V.C. Y segue una distribuzione normale con media 45 e varianza 9. La V.C. X segue una legge normale con media 12 e varianza 4. Calcolare come si distribuisce e quali sono i parametri della
DettagliRegressione lineare semplice
Regressione lineare semplice Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Statistica con due variabili var. nominale, var. nominale: gruppo sanguigno - cancro
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@unina.it Università degli studi di Cassino () Statistica 1 / 24 Outline 1 () Statistica 2 / 24 Outline 1 2 () Statistica 2 / 24 Outline 1 2 3 () Statistica 2 /
DettagliEsercitazione 5 - Statistica (parte II) Davide Passaretti 9/3/2017
Esercitazione 5 - Statistica (parte II) Davide Passaretti 9/3/2017 Contents 1 Inferenza sulla regressione semplice 1 1.1 Test sulla pendenza della retta................................... 1 1.2 Test sull
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2018-2019 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliMetodi statistici per la ricerca sociale Capitolo 12. Confronto fra gruppi: L analisi della varianza. Esercitazione
Metodi statistici per la ricerca sociale Capitolo 12. Confronto fra gruppi: L analisi della varianza Esercitazione Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università
DettagliVerifica delle ipotesi. Verifica delle ipotesi
Con la procedura di stima intervallare si cerca definire in modo verosimile il valore di un parametro incognito a partire dalle osservazioni campionarie Valore campionario Procedura di stima intervallare
DettagliIndice. Prefazione. 4 Sintesi della distribuzione di un carattere La variabilità Introduzione La variabilità di una distribuzione 75
00PrPag:I-XIV_prefazione_IAS 8-05-2008 17:56 Pagina V Prefazione XI 1 La rilevazione dei fenomeni statistici 1 1.1 Introduzione 1 1.2 Caratteri, unità statistiche e collettivo 1 1.3 Classificazione dei
DettagliSTATISTICA. Esercitazione 6
STATISTICA Esercitazione 6 Esercizio 1 Ad un esame universitario sono stati assegnati in modo casuale tre compiti diversi con i seguenti risultati: Compito A Compito B Compito C Numero studenti 41 39 43
DettagliStatistica multivariata Donata Rodi 17/10/2016
Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2015-2016 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliIL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI
IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI Perchè confrontare le varianze stimate in due campioni? Torniamo all'esempio dei frinosomi Per poter applicare il test t avevamo detto che le varianze, e
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative
DettagliCOGNOME.NOME...MATR..
STATISTICA 29.01.15 - PROVA GENERALE (STANDARD) Modalità B (A) ai fini della valutazione verranno considerate solo le risposte riportate dallo studente negli appositi riquadri bianchi: in caso di necessità
DettagliEsercitazione del
Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36
DettagliSTATISTICA INFERENZIALE PER VARIABILI QUALITATIVE
STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE La presentazione dei dati per molte ricerche mediche fa comunemente riferimento a frequenze, assolute o percentuali. Osservazioni cliniche conducono sovente
DettagliCorso introduttivo di Epidemiologia e Biostatistica
Corso introduttivo di Epidemiologia e Biostatistica massimo guerriero carlo pomari e con il contributo di: Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health ELEMENTI
DettagliSTATISTICA. Regressione-4 ovvero Macron!
STATISTICA Regressione-4 ovvero Macron! Eravamo partiti da qui Stipendio medio orario 2013 Voto per Le Pen Stipendio medio orario (2013) [11,12) [12,13) [13,14) [14,15) [15,23] Eravamo partiti da qui Stipendio
DettagliMetodi Quantitativi per Economia, Finanza e Management. Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello
Metodi Quantitativi per Economia, Finanza e Management Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello 1. Introduzione ai modelli di regressione 2. Obiettivi 3. Le
DettagliPresentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii
Sommario Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii xv Parte I Statistica descrittiva 1 Capitolo 1 Introduzione 3 Perché studiare statistica? 4
DettagliSTATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA
Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria Civile A.A. 2009-10 Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain 1 STATISTICHE, DISTRIBUZIONI CAMPIONARIE
DettagliStatistica Inferenziale Soluzioni 3. Verifica di ipotesi
ISTITUZIONI DI STATISTICA A. A. 007/008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona
DettagliCapitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica
Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università
DettagliContenuto del capitolo
Capitolo 8 Stima 1 Contenuto del capitolo Proprietà degli stimatori Correttezza: E(Stimatore) = parametro da stimare Efficienza Consistenza Intervalli di confidenza Per la media - per una proporzione Come
DettagliN.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.
N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle abelle riportate alla fine del documento. Esercizio 1 La concentrazione media di sostanze inquinanti osservata nelle acque di un fiume
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2017-2018 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliSTATISTICA A K (60 ore)
STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it In una prova sul carico di rottura di due tipi di corda si dispone di 2 campioni di ampiezza 26 e 35 rispettivamente. Nel primo campione
Dettaglix, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y )
Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 0/03 lezioni di statistica del 5 e 8 aprile 03 - di Massimo Cristallo - A. Le relazioni tra i fenomeni
DettagliMetodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale
DIPARTIMENTO DI SCIENZE AGRARIE E AMBIENTALI PRODUZIONE, TERRITORIO, AGROENERGIA Marco Acutis marco.acutis@unimi.it www.acutis.it CdS Scienze della Produzione e Protezione delle Piante (g59) CdS Biotecnologie
DettagliMetodi Quantitativi per Economia, Finanza e Management. Lezione n 5 Test d Ipotesi
Metodi Quantitativi per Economia, Finanza e Management Lezione n 5 Test d Ipotesi Test per lo studio dell associazione tra variabili Nella teoria dei test, il ricercatore fornisce ipotesi riguardo la distribuzione
DettagliUlteriori Conoscenze di Informatica e Statistica
ndici di forma Ulteriori Conoscenze di nformatica e Statistica Descrivono le asimmetrie della distribuzione Carlo Meneghini Dip. di fisica via della Vasca Navale 84, st. 83 ( piano) tel.: 06 55 17 72 17
Dettagli05. Errore campionario e numerosità campionaria
Statistica per le ricerche di mercato A.A. 01/13 05. Errore campionario e numerosità campionaria Gli schemi di campionamento condividono lo stesso principio di fondo: rappresentare il più fedelmente possibile,
DettagliDistribuzioni campionarie
1 Inferenza Statistica Descrittiva Distribuzioni campionarie Statistica Inferenziale: affronta problemi di decisione in condizioni di incertezza basandosi sia su informazioni a priori sia sui dati campionari
DettagliOccorre trovare la distribuzione di DM
Esercizio In una prova sul carico di rottura di due tipi di corda si dispone di 2 campioni di ampiezza 26 e 35 rispettivamente. Nel primo campione la media è 185,3Kg, nel secondo campione la media è 175,2Kg.
DettagliPrefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura
INDICE GENERALE Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura XI XIV XV XVII XVIII 1 LA RILEVAZIONE DEI FENOMENI
DettagliDispense Associazione PRELIMINARY DRAFT
Dispense Associazione PRELIMINARY DRAFT Cristina Mollica & Jan Martin Rossi January 3, 2019 1 Esercizio 3 - Prova scritta 12-01-2018 Esercizio 3. Si consideri la distribuzione doppia di un campione di
Dettagli