I MODELLI LINEARI GENERALIZZATI GLM

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "I MODELLI LINEARI GENERALIZZATI GLM"

Transcript

1 METODI E TECNICHE DELLA RICERCA IN PSICOLOGIA CLINICA E LABORATORIO AA 018/019 PROF. V.P. SENESE Unverstà della Campana «Lug Vanvtell» (UCLV) Dpartmento d Pscologa METODI E TECNICHE DELLA RICERCA IN PSICOLOGIA CLINICA Prof. V.P. Senese I MODELLI LINEARI GENERALIZZATI GLM 1

2 Secondo la teora de Modell Lnear Generalzzat (GLM), la regressone lneare, l anals della varanza (ANOVA), la regressone logstca e modell log-lnear possono essere vst come cas specal d una classe pù generale d modell che condvdono: (a) alcune propretà d base; (b) metod d stma de parametr, e (c) le statstche d ft (Mcel, 001). y 0 GLM K k 1 β x k k n. scalare y X n. vettorale strutturale K y 0 k 1 ~ y k x k Dove g() ndca una generca funzone che vene detta legame funzonale (lnk functon). Il modello lneare classco (dstrbuzone gaussana) dventa così un caso partcolare de GLM dove l legame funzonale è quello dell denttà. 0 g ~ y K k 1 x k k y~ y ~ y stocastca ~ y y La componente d errore può essere vsta come la rsultante delle varabl esplcatve omesse (numerose), dell errore casuale e dell errore d msura casuale (Mcel, 001).

3 GLM Legame canonco Legame funzonale Dstrbuzone y~ Identtà Normale (Gaussana) ~ y log Logartmo log y~ Logt 1 Posson; Multnomale; Prodotto multnomale Bnomale; Multnomale..ASSUNZIONI LE ASSUNZIONI NEI GLM 3

4 ASSUNZIONI DEI GLM msure: tutte le varabl ndpendent sono msurate su scala ad ntervall, a rapport o dcotomca; modello: la relazone tra varabl ndpendent e dpendente è lneare, proporzonale (nvarante) e addtva; specfcazon: tutt predttor rlevant per la varable dpendente sono stat nsert nell anals, nessun predttore rrlevante è stato nserto (parsmona); valore atteso dell errore: gl error sono esclusvamente d tpo casuale, relatv alla sola varable dpendente e l valore atteso dell errore (epslon) è 0; omoschedastctà: la varanza del termne d errore è la stessa (o è costante) per tutt valor delle varabl ndpendent; ASSUNZIONI DEI GLM no autocorrelazon: non c devono essere correlazon tra termn dell errore prodott da cascun predttore (matematcamente E(, ) = 0; oppure COV(, ) = 0) (osservazon ndpendent); no correlazon tra error e predttor: termn d errore devono essere non correlat con le varabl ndpendent (matematcamente E(, X ) = 0); assenza d perfetta multcollneartà: nessuna delle varabl ndpendent deve essere una combnazone lneare perfetta delle altre varabl ndpendent (matematcamente, per ogn varable R < 1, dove R è la varanza della varable ndpendente X spegata da tutt gl altr predttor (X 1, X,, X k ). 4

5 LA REGRESSIONE LA REGRESSIONE Quando n una rcerca è possble dstnguere (n base alla teora) tra varabl ndpendent e varabl dpendent l rcercatore può essere nteressato a verfcare la presenza della relazone causale supposta (tra le varabl) ne dat raccolt (osservazon camponare). Prma d nzare un qualsas dscorso sulle relazon d causaltà tra varabl dobbamo rbadre la dstnzone tra covarazone e causazone. 5

6 LA REGRESSIONE COVARIAZIONE (Covaranza, Correlazone o Assocazone): quando semplcemente osservamo che due varabl presentano varazon concomtant. CAUSAZIONE: quando pensamo che sano propro le varazon della varable X a determnare le varazon della varable Y. Identfchamo la DIREZIONALITÀ e l esstenza del LEGAME DIRETTO tra le due varabl. Mentre la covarazone è osservable la causazone appartene domno della teora!!! al LA REGRESSIONE I cnque fondamental tp d relazone causale fra due varabl: 1) dretta ) recproca X Y 4) ndretta X Y Z 3) spura X Y 5) condzonata Z Z X Y X Y 6

7 LA REGRESSIONE LINEARE SEMPLICE LA REGRESSIONE LINEARE Quando la relazone s rfersce a due varabl d tpo cardnale (I o R) l anals che può essere mpegata è l anals della regressone lneare. In questo caso l obettvo è quello d voler verfcare se la capactà d prevedere valor d una data varable Y aumenta conoscendo valor assunt da una data varable X. 7

8 Se supponamo che l punteggo Y dpende dal punteggo X del soggetto, possamo prevedere l valore n base alla seguente formula: Y X In pratca potzzamo che (mantenendo la componente stocastca) se la teora è vera, allora la meda d Y è funzone d X. LA REGRESSIONE La regressone lneare s dce semplce quando abbamo una sola VD (o crtero) e una sola VI (o predttore). L potes che vene formulata rguarda l nfluenza della VI sulla VD. frustrazone predttore aggressvtà crtero crtero coeffcente Yˆ x costante predttore errore 8

9 VotoM LA REGRESSIONE Da un punto d vsta grafco vene ndvduata quella retta che, data la relazone tra le varabl, consente d prevedere al meglo puntegg nella varable dpendente a partre da quell nella varable ndpendente. Dagramma d dspersone TestA LA REGRESSIONE Dato un dagramma d dspersone tra due varabl, la retta d regressone è la mglore delle rette nel senso che è quella retta che passa pù vcna a tutt punt (mnmzza tutte le dstanze tra punt e la retta). Assecondando questo prncpo, secondo la teora classca, la retta d regressone s scegle n base al metodo de mnm quadrat. S defnsce mglore la retta che rende mnma la somma de quadrat degl error, coè: ( Y Yˆ) pù pccolo possble 9

10 VotoM VotoM Dagramma d dspersone testa Dagramma d dspersone testa ( Y Yˆ) 10

11 VotoM VotoM Dagramma d dspersone testa ( Y Yˆ) Dagramma d dspersone (ntercetta) valore d y predetto quanto x è zero 0 Dx Dy Dy' Dx testa (coeffcente d regressone ) ncremento d y quando aumenta x ndca l angolo che la retta forma con l asse delle ascsse, coè l nclnazone 11

12 COEFFICIENTE DI REGRESSIONE Esprme la relazone tra X e Y ne termn delle untà d msura delle due varabl. se = 1 per ogn ncremento untaro d X c è un ncremento untaro d Y (45 ) ; Dy' Dx se = per ogn ncremento untaro d X c è un ncremento doppo d Y ( untà) ; se = 0.5 per ogn ncremento untaro d X c è un ncremento d mezza untà d Y. COEFFICIENTE DI REGRESSIONE STANDARDIZZATO Il coeffcente d regressone standardzzato () esprme la relazone tra la varable dpendente (Y) e la varable ndpendente (X) n untà d msura standard (punt z). COEFFICIENTE DI DETERMINAZIONE Il coeffcente d determnazone (r ) ndca la percentuale d varanza (%) della varable crtero (Y) spegata da quella predttore (X). predttore crtero 1

13 I coeffcent d regressone e della popolazone vengono stmat a partre da coeffcent d regressone camponar a e b: POPOLAZIONE Y 0 1x1 CAMPIONE Y a0 b1 x1 e Il coeffcente d regressone è smboleggato come: (beta) quando c s rfersce al coeffcente della popolazone; b quando c s rfersce al coeffcente calcolato nel campone; (beta) quando c s rfersce al coeffcente standardzzato (punt z) calcolato nel campone. 13

14 ..PRIMA DI ENTRARE NEL VIVO LA REGRESSIONE BIVARIATA DA UN PUNTO DI VISTA CONCETTUALE Y depressone 61; ds 13 DEPRESSIONE Y o E ANSIA ( Y )

15 Y depressone 61; ds DEPRESSIONE Y ANSIA Y ' Y depressone 61; ds 13 DEPRESSIONE ANSIA Yˆ

16 ..ENTRIAMO NEL VIVO ESERCITAZIONE REGRESSIONE SEMPLICE Uno pscologo è nteressato a verfcare se la qualtà della vta dpende dall età. A tal scopo sommnstra ad un campone d 8 soggett una msura d qualtà della vta (QDV) e rleva per cascun soggetto l età. MODELLO TEORICO ETÀ QDV Età de soggett espressa n ann (VI, R). Qualtà della vta (QDV) (VD, I). 16

17 r errore standard della stma F b a standardzzato correlazone Notazone scentfca: e x e x y e y 17

18 ..ENTRIAMO NEL VIVO INTRODUZIONE ALLA REGRESSIONE MULTIPLA 18

19 NELLA FORMA GENERALE DEL MODELLO DI REGRESSIONE LA VARIABILE DIPENDENTE Y VIENE CONSIDERATA COME FUNZIONE DI k VARIABILI INDIPENDENTI (X 1 ; X ; X 3 ; ; X k ). IL MODELLO DELLA REGRESSIONE LINEARE ASSUME CHE DATO UN SET DI VARIABILI INDIPENDENTI IL VALORE MEDIO (VALORE ATTESO) DELLA VARIABILE DIPENDENTE SI MODIFICA SECONDO LA SEGUENTE FORMULA: E ( Y ) 1X1 X 3X 3... X k k E ( Y ) 1X1 X 3X 3... X k k,,,,, 1 3 k LE LETTERE GRECHE RAPPRESENTANO I PARAMETRI CHE ESPRIMONO LA RELAZIONE TRA LE k VI E LA VD NELLA POPOLAZIONE,, 1, 3 k RAPPRESENTANO IL COEFFICIENTE DI REGRESSIONE PARZIALE TRA CIASCUNA DELLE k VI E LA VD Y MANTENENDO COSTANTI (CONTROLLANDO) TUTTE LE ALTRE VARIABILI. 19

20 E ( Y ) 1X1 X 3X 3... X k k È L INTERCETTA E RAPPRESENTA IL VALORE ATTESO DI Y QUANDO TUTTE LE VI SONO UGUALI A ZERO. PER OGNI VALORE Y PREDETTO (MANTENENDO COSTANTI I VALORI NELLE VI) IL MODELLO PREVEDE UNA COMPONENTE D ERRORE (COMPONENTE STOCASTICA) QUESTO TERMINE D ERRORE RAPPRESENTA: 1) L EFFETTO SULLA VD Y NON ESPLICITAMENTE INCLUSO NEL MODELLO; ) UN RESIDUO CASUALE NELLA VARIABILE DIPENDENTE. E ( Y ) 1X1 X 3X 3... X k k SEBBENE SIA IMPLICITO NELLA FORMULAZIONE DEL MODELLO È IMPORTANTE SOTTOLINEARE CHE LA RELAZIONE TRA E(Y ) E CIASCUN X k È CONCEPITA COME LINEARE E CHE GLI EFFETTI DELLE k VI SONO ADDITIVI. PER UNA CORRETTA APPLICAZIONE DEL MODELLO DELLA REGRESSIONE, QUINDI, PER UNA CORRETTA STIMA DEI PARAMETRI DELLA POPOLAZIONE E PER LA VERIFICA DELLE IPOTESI È NECESSARIO CHE ALCUNE ASSUNZIONI SIANO VERIFICATE. 0

21 NELL APPLICAZIONE DELLA REGRESSIONE MULTIPLA NON CI TROVIAMO NELLA CONDIZIONE DI CONOSCERE I PARAMETRI DELLA POPOLAZIONE DIRETTAMENTE, MA SI STIMANO A PARTIRE DA UN NUMERO FINITO DI OSSERVAZIONI: LE OSSERVAZIONI CAMPIONARIE PER DISTINGUERE LA REGRESSIONE CAMPIONARIA DA QUELLA DELLA POPOLAZIONE IL MODELLO DI REGRESSIONE VIENE SCRITTO IN QUESTO MODO: E ( Y ) a b1 X1 b X b3 X 3... b k X k e DOVE LE LETTERE LATINE INDICANO I PARAMETRI DEL MODELLO STIMATI A PARTIRE DAL CAMPIONE (n) PER LA STIMA DEI PARAMETRI a E b ( = 1,,, k) IL METODO PIÙ FREQUENTEMENTE IMPIEGATO È IL CRITERIO DEI MINIMI QUADRATI (ORDINARY LEAST SQUARE OLS). LO SCOPO È QUELLO DI STIMARE I PARAMETRI a E b IN MODO TALE CHE SI RIDUCA AL MINIMO LA DISTANZA AL QUADRATO TRA VALORE PREDETTO (Y ) E VALORE OSSERVATO (Y ) n 1 ( Y Yˆ ) 1

22 NELLA REGRESSIONE BIVARIATA LE FORMULE SONO LE SEGUENTI: b n 1 ( X n 1 ( X X )( Y X ) Y ) a Y b X NELLA REGRESSIONE MULTIPLA LE FORMULE PER IL CALCOLO DEI PARAMETRI RICHIEDONO L ALGEBRA MATRICIALE. DAL MOMENTO CHE SI TRATTA DI STIME CAMPIONARE DEI PARAMETRI È NECESSARIO CONOSCERE L EFFETTO DELL ERRORE SULLA STIMA. PER FARE CIÒ È NECESSARIO CALCOLARE L ERRORE STANDARD (s ) DEL COEFFICIENTE STIMATO: s b n 1 ( X n 1 ( Y Yˆ X ) (1 R ) )( n k 1) DOVE: n È L AMPIEZZA CAMPIONARIA; k È IL NUMERO DI VI DEL MODELLO; R È LA CORRELAZIONE MULTIPLA AL QUADRATO DELLA VI SU TUTTE LE ALTRE VI.

23 s b n 1 ( X n 1 ( Y Yˆ X ) (1 R ) )( n k 1) DELLA FORMULA È UTILE NOTARE CHE L ERRORE DI STIMA DI b (s b ) SI RIDUCE SE: AL NUMERATORE: È MINORE L ERRORE DI STIMA DI Y AL DENOMINATORE: È MAGGIORE LA VARIANZA DI X È MINORE LA CORRELAZIONE DI X CON LE ALTRE VI È MAGGIORE IL NUMERO DELLE OSSERVAZIONI n (SE IL NUMERO DI PREDITTORI AUMENTA E SI APPROSSIMA ALL AMPIEZZA CAMPIONARIA, s AUMENTA NOTEVOLMENTE) UN ALTRO ASPETTO UTILE ALLA VALUTAZIONE DEL MODELLO DI REGRESSIONE È LA VALUTAZIONE DELLA BONTÀ DI ADATTAMENTO DEL MODELLO (goodness-of-ft). LA STATISTICA MAGGIORMENTE IMPIEGATA È L R, CHE VIENE STIMATA CON LE SEGUENTI FORMULE: R n 1 n 1 ( Yˆ ( Y Y Y ) ) o R 1 n 1 n 1 ( Y ( Y Yˆ ) Y ) R dev spegata dev totale R dev errore 1 dev totale 3

24 L R VARIA SEMPRE TRA 0 E 1. PUÒ ESSERE INTERPRETATO COME LA PERCENTUALE DI VARIANZA (%) DELLA VD SPIEGATA DALLE VI CONSIDERATE NEL MODELLO. OPPURE COME LA % DI RIDUZIONE DELL ERRORE NELLA PREVISIONE DELLA VI. NELL UTILIZZO DELL R DUE ASPETTI DEVONO ESSERE SOTTOLINEATI: È DIPENDENTE DAL CAMPIONE. DUE MODELLI APPLICATI SU DUE CAMPIONI POSSONO AVERE DEI PARAMETRI b IDENTICI MA R DIFFERENTI; QUESTO È DETERMINATO DALLA DIVERSA VARIANZA DI Y; È INFLUENZATO DAL NUMERO DI PREDITTORI. A PARITÀ DI CAMPIONE PER CONFRONTARE DUE MODELLI È NECESSARIO CALCOLARE UN VALORE CORRETTO (ADJUSTED R ) (WONNACOTT, WONNACOTT, 1979). R R k n 1 n 1 n k 1 UN ALTRA STATISTICA COMUNEMENTE IMPIEGATA PER LA VALUTAZIONE DELLA BONTÀ DI ADATTAMENTO DEL MODELLO (goodness-of-ft) È L ERRORE STANDARD DELLA STIMA, CHE VIENE STIMATO CON LA SEGUENTE FORMULA: s e n 1 Y Yˆ n s e devanza _ resdua gdl( dev _ res) 4

25 SIGNIFICATIVITÀ DELLA PREVISIONE Scomposzone Devanza totale, nelle component d errore e d effetto SQ tot SQ reg SQ err La somma de quadrat totale (SQ tot ) è data da una componente d errore (SQ err ) e da una componente spegata dalla regressone (SQ reg ) SIGNIFICATIVITÀ DELLA PREVISIONE SQ tot SQ reg SQ err DEVIANZA TOTALE SQ tot Y Y Yˆ Y Y Yˆ DEVIANZA SPIEGATA dalla regressone SQ reg SQ err DEVIANZA NON SPIEGATA o RESIDUA (somma d e) 5

26 NELLA RICERCA PSICOLOGICA NON SIAMO INTERESSATI ESCLUSIVAMENTE ALLA STIMA DEI PARAMETRI DELLA POPOLAZIONE, MA SIAMO INTERESSATI A VOLER VERIFICARE SE I PARAMETRI CAMPIONARI SONO VICINI A QUELLI DELLA POPOLAZIONE, VALE A DIRE ALLA VERIFICA DELLE IPOTESI. CIÒ AVVIENE MEDIANTE IL TEST DELLA SIGNIFICATIVITÀ STATISTICA CHE VALUTA LO SCOSTAMENTO DEL PARAMETRO OSSERVATO DAL VALORE ATTESO SECONDO L IPOTESI NULLA (H 0 ). Per verfcare se la prevsone è sgnfcatva la varanza spegata dalla regressone deve essere maggore d quella resdua. Le varanze s calcolano dvdendo le devanze per grad d lbertà opportun. GDL tot GDL reg GDL err N 1 ( k) ( N k 1) 6

27 Per confrontare la due varanze e verfcare se quella spegata dalla regressone è maggore d quella resdua, s calcola la statstca F. La varanza spegata dalla regressone va al numeratore, quella resdua al denomnatore F crtco(k,n-k-1). F Var Var reg res Dev k Dev N k reg res 1 : la varanza spegata è uguale a quella resdua (casuale) H 0 PER IL MODELLO COMPLESSIVO, CON k VI, L IPOTESI NULLA (H 0 ) è LA SEGUENTE: H k 0 H o o o... o k 0 Un modo alternatvo per defnre l test statstco della verfca è medante l valore dell R : R k 1 R n k 1 F F var spegata var errore k gdl F n k 1 7

28 PER CIASCUN PREDITTORE VIENE POI DEFINITA UNA SPECIFICA IPOTESI NULLA (H 0 ). H 0 0 H 1 0 IL TEST STATISTICO APPROPRIATO È IL VALORE t: t b H0 s b b s b gdl t n k 1..PROVIAMO ESERCITAZIONE INTRODUZIONE ALLA REGRESSIONE MULTIPLA 8

29 ESEMPIO MODELLO TEORICO 1 SEX QDV MODELLO TEORICO SEX ETÀ QDV VARIABILI DUMMY Il modello della regressone lneare può essere esteso faclmente per nserre predttor msurat su scala dcotomca, nclus set d varabl dcotomzzate o varabl dummy (s veda Lews-Beck, 1980; Berry e Feldman, 1985; Hardy, 1993). Es. SESSO: 1=M; =F; LIVELLO SOCIO-ECONOMICO: 1=Basso; =Medo; 3=Alto. COD SESSO LSE COD M MEDIO ALTO NdE -1 9

30 Qualtà della vta (QDV) COD SEX QDV QDV (SEX ) QDV (0) QDV (1) Meda femmne Meda masch OUTPUT REGRESSIONE QDV F 58 QDV M MODELLO TEORICO 1 30

31 MODELLO TEORICO ESEMPIO Nel modello 1 e nel modello la relazone tra età e qualtà della vta è stata forzata essere uguale per gl uomn e per le donne. Tuttava è possble (ved Fgura) che c sa una dfferenza sgnfcatva. Un modo per verfcare questa potes è nserre l nterazone tra le varabl. Vale a dre una nuova varable che è l prodotto tra le due (sesso età) MODELLO TEORICO 3 SEX QDV ETÀ SEX ETÀ QDV 31

32 MODELLO TEORICO 3..È NECESSARIO SAPERE CHE TECNICHE DI REGRESSIONE MULTIPLA 3

33 NELLA PRATICA LA REGRESSIONE MULTIPLA PUÒ ESSERE USATA UTILIZZANDO DIVERSE STRATEGIE. TALI STRATEGIE DIFFERISCONO PREVALENTEMENTE NEL CRITERIO CHE DEFINISCE L ORDINE DI ENTRATA DELLE VI NELL EQUAZIONE DI REGRESSIONE. L ORDINE DI INTRODUZIONE, INFATTI, DETERMINA LA PARTE DI VARIANZA DELLA VD UTILIZZATA PER LA VERIFICA DELLE IPOTESI SU CIASCUNA VI. LA PRIMA VARIABILE HA A DISPOSIZIONE TUTTA LA VARIANZA DELLA VD (100%), LA SECONDA AVRÀ A DISPOSIZIONE SOLO LA VARIANZA RESIDUA, E COSÌ PER TUTTE LE SUCCESSIVE VARIABILI. TRE SONO LE STRATEGIE MAGGIORMENTE IMPIEGATE NELLA PRATICA: LA REGRESSIONE STANDARD (ESPLICATIVA). CONSENTE DI VERIFICARE L ENTITÀ DELLA RELAZIONE COMPLESSIVA TRA VI E VD, E IL CONTRIBUTO SPECIFICO DI CIASCUNA VI CONTROLLATO PER TUTTE LE VI IN EQUAZIONE. LA REGRESSIONE GERARCHICA (COMPARATIVA). CONSENTE DI VALUTARE QUAL È IL CONTRIBUTO AGGIUNTIVO DELLA/E VARIABILE/I X INSERITA/E DOPO X 1. LAREGRESSIONE STATISTICA (PREDITTIVA). CONSENTE DI IDENTIFICARE LA MIGLIORE COMBINAZIONE PREDITTIVA TRA LE VI CONSIDERATE. 33

34 REGRESSIONE MULTIPLA STANDARD Tutte le VI vengono nserte contemporaneamente. ognuna, nfatt, è trattata come se fosse l ultma. ad ogn VI corrsponde solo quella parte d varabltà che condvde UNICAMENTE con la VD. Vene qund nterpretato l modello complessvo e l contrbuto d cascun predttore sulla VD. questa seconda nterpretazone s avvale dell utlzzo de coeffcent d regressone parzale. L ampezza dell R è determnata dalla porzone unca d cascun predttore e dalla porzone comune a tutte le larabl che aumenta all aumentare della collneartà tra le VI. REGRESSIONE MULTIPLA GERARCHICA L ordne d nsermento delle varabl vene specfcato dal rcercatore. Ogn VI è valutata per quanto aggunge nella spegazone della VD rspetto a quanto è stato spegato dalle varabl nserte precedentemente. L ordne vene stablto dal rcercatore n funzone delle consderazon teorche o logche. Il cambamento vene valutato medante le varazon osservate ne termn dell R la cu sgnfcatvtà e po valutata medante l valore F. 34

35 35 B B A M M M D Un modello A (M A ) s dce nested n un modello B (M B ) se l modello A è composto da alcun de termn contenut nel modello B, e non ve ne sono d dvers, mentre nel modello B v sono anche termn agguntv. b a M A c b a M B REGRESSIONE MULTIPLA GERARCHICA Nella regressone gerarchca, modell sono confrontabl quando sono gerarchcamente organzzabl o ndfcat o nested. PER PORRE A CONFRONTO DIFFERENTI MODELLI È POSSIBILE UTILIZZARE LA STATISTICA F PER VALUTARE SE IL CONTRIBUTO DIFFERENZIALE È SIGNIFICATIVO. r k r k k k k k k k X X X X X X X Y E ) ( IN QUESTO CASO SI È INTERESSATI A VERIFICARE L EFFETTO CHE L AGGIUNTA DEGLI r PREDITTORI HA NELLA FUNZIONALITÀ DEL MODELLO: 0 H 1 0 r k k k 1 1 F r k n R r R R m DOVE R m CORRISPONDE AL COEFFICIENTE R OTTENUTO SENZA GLI r PREDITTORI.

36 a b c d a b c d Dev Totale R Totale a b c d a b a b c d a b c d a b c d R Sem-Parzale R Parzale b a b c d b b c d POSSIBILI R E RELATIVE INTERPRETAZIONE R totale del modello s ottene facendo l rapporto tra DEV spegata e DEV totale della VD. Corrsponde alla capactà esplcatva totale d tutte le varabl nel modello (ndstntamente). R sem-parzale (ΔR ) s ottene facendo l rapporto tra DEV spegata da una sngola VI e DEV totale della VD. Corrsponde alla capactà esplcatva unca d una sngola VI rspetto alla varabltà totale della VD. Ovvero la parte della varanza spegata attrbuble uncamente dalla varable consderata. R parzale s ottene facendo l rapporto tra DEV spegata dalla sngola varable e (DEV totale DEV spegata_dalle_altre_vi ). Corrsponde alla capactà esplcatva unca d una sngola VI rspetto alla varabltà della VD non spegata dalle altre VI. Ovvero la proporzone della varanza resdua del modello precedente spegata dalla VI consderata. 36

37 REGRESSIONE MULTIPLA STATISTICA L ordne d nsermento delle varabl vene determnato algebrcamente. generalmente l termne d rfermento è l coeffcene d correlazone parzale. Esstono tre prncpal tecnche: forward (n cu s aggungono le VI sgnfcatvamente assocate alla VD); backward (n cu s elmnano le VI non assocate sgnfcatvamente alla VD); stepwse (n cu s aggungono le v assocate sgnfcatvamente alla VD, ma se a passagg successv perdono la forza assocatva vengono elmnate). MEDIANTE L R SI VALUTA IL MODELLO FINALE, SI VALUTA L ORDINE DI INGRESSO DELLE VARIABILI E IL CONTRIBUTO DI CIASCUNA...ASSUNZIONI LE ASSUNZIONI NELLA REGRESSIONE MULTIPLA 37

38 INDIPENDENTEMENTE DALLA TECNICA SCELTA, PER UNA CORRETTA APPLICAZIONE DEL MODELLO DELLA REGRESSIONE, QUINDI, PER UNA CORRETTA STIMA DEI PARAMETRI DELLA POPOLAZIONE E PER LA VERIFICA DELLE IPOTESI È NECESSARIO CHE LE ASSUNZIONI PREVISTE DAL MODELLO SIANO VERIFICATE. IN CASO DI VIOLAZIONE, IL RISCHIO IN CUI SI PUÒ INCORRERE DIPENDE DAL TIPO DI VIOLAZIONE OSSERVATA...ASSUNZIONI TUTTE LE VARIABILI DEVONO ESSERE MISURATE SU SCALA ALMENO AD INTERVALLI E SENZA ERRORE LA VARIABILE DIPENDENTE È FUNZIONE LINEARE DELLA COMPONENTE DETERMINISTICA (X 1 + X + X X k ) PER OGNI SET DELLE k VARIABILI INDIPENDENTI (X 1 ; X ; X 3 ; ; X k ), E( ) = 0 PER OGNI SET DELLE k VARIABILI INDIPENDENTI, VAR E( ) = (COSTANTE) 38

39 ..ASSUNZIONI PER OGNI COPPIA DELLE k VARIABILI INDIPENDENTI, COV (, h ) = 0 (GLI ERRORI NON DEVONO ESSERE COMUNI) PER OGNI VARIABILE INDIPENDENTE X, COV (X, ) = 0 NON CI DEVE ESSERE UNA PERFETTA COLLINEARITÀ TRA LE VI NEL MODELLO PER OGNI SET DELLE k VARIABILI INDIPENDENTI DEVE ESSERE NORMALMENTE DISTRIBUITO Se prm 6 assunt sono rspettat (n base al teorema d Gauss-Markov) è possble affermare che le formule d stma dervate dal prncpo de mnm quadrat (LS) sono effcent e senza bas; e vengono dette BLUE (BEST LINEAR UNBIASED ESTIMATOR). Il teorema, tuttava, vale solo se gl assunt sono rspettat. In genere, l metodo pù utle per verfcare l adeguatezza del modello è l anals de resdu de valor stmat dalla regressone per ogn valore osservato: e Y Yˆ 39

40 L ASSUNTO DELLA MULTICOLLINEARITÀ UNA PRIMA DISTINZIONE DEVE ESSERE FATTA TRA LA PERFETTA MULTICOLLINEARITÀ E LE FORME MENO ESTREME DI MULTICOLLINEARITÀ. LA PERFETTA COLLINEARITÀ ESISTE QUANDO UNA O PIÙ VI È PERFETTAMENTE CORRELATA (r = 1) AD UNA O PIÙ DELLE ALTRE VI NELL EQUAZIONE. X.3X 3 oppure X X 3 1 FORTUNATAMENTE NELLA PRATICA PSICOLOGICA NON CAPITANO QUASI MAI CASI DI QUESTO TIPO (DOVE LA STIMA DEI PARAMETRI RISULTA NON POSSIBILE). MOLTO PIÙ SPESSO ABBIAMO A CHE FARE CON IL CASO IN CUI SI ASSISTE A FORME MENO ESTREME DI COLLINEARITÀ. 40

41 NEGLI ESPERIMENTI, AD ESEMPIO, QUESTO PROBLEMA VIENE PERFETTAMENTE RISOLTO DAL MOMENTO CHE LE VARIABILI SONO MANIPOLATE DALLO SPERIMENTATORE IN MODO DA RENDERLE INDIPENDENTI. NELLA PRATICA È BENE CONSIDERARE LA COLLINEARITÀ COME UN GRADIENTE. La presenza della multcollneartà non altera la valdtà dell ols, ma nflusce sull nterpretazone della sgnfcatvtà delle stme de coeffcent parzal. Infatt, quando due o pù varabl ndpendent sono altamente correlate è IMPOSSIBILE conoscere l contrbuto d cascuna delle due varabl sulla varable dpendente. Da un punto d vsta statstco l nfluenza della collneartà s osserva nella stma del coeffcente d errore (s) che nevtablmente aumenta e ne conseguent test d sgnfcatvtà (t) dove s osserva una rduzone de valor. 41

42 Gl effett della multcollneartà sono IRRILEVANTI se l nostro modello s pone come obettvo la predzone della vd (MODELLO PREDITTIVO); dventano molto pù SERI se l obettvo della regressone è quello d defnre la rlevanza de sngol predttor (MODELLO INTERPRETATIVO). Tranne nel caso della perfetta multcollneartà, nella pratca non esstono test che consentono d defnre se questo problema esste o meno. FORTUNATAMENTE, PERÒ, ESISTONO DEI SEGNALI CHE POSSONO PORTARCI SOSPETTARNE LA PRESENZA. ALCUNI QUANDO: SEGNALI POSSONO ESSERE RICONOSCIUTI IL MODELLO MOSTRA UN BUON FIT CON I DATI E TUTTAVIA SI OSSERVA CHE TUTTI I COEFFICIENTI PARZIALI SONO NON SIGNIFICATIVI; LE STIME DEI COEFFICIENTI PARZIALI NON SONO STABILI NEI DIVERSI CAMPIONI O NELLO STESSO CAMPIONE A SEGUITO DI LEGGERE VARIAZIONI DEL MODELLO. SE I SI RILEVANO TALI SEGNALI È POSSIBILE IMPIEGARE ALCUNI TEST PER PROCEDERE AD UNA PIÙ DIRETTA VERIFICA. 4

43 43

44 44

TECNICHE DI ANALISI DEI DATI MODELLI LINEARI

TECNICHE DI ANALISI DEI DATI MODELLI LINEARI TECNICHE DI ANALISI DEI DATI AA 017/018 PROF. V.P. SENESE Quest materal sono dsponbl per tutt gl student al seguente ndrzzo: https://goo.gl/hxl9zg Unverstà della Campana Lug Vanvtell Dpartmento d Pscologa

Dettagli

TECNICHE DI ANALISI DEI DATI MODELLI LINEARI

TECNICHE DI ANALISI DEI DATI MODELLI LINEARI TECNICHE DI ANALISI DEI DATI AA 16/17 PROF. V.P. SENESE Quest materal sono dsponbl per tutt gl student al seguente ndrzzo: https://goo.gl/rwabbd Seconda Unverstà d Napol (SUN) Dpartmento d Pscologa TECNICHE

Dettagli

Contenuti: o Specificazione del modello. o Ipotesi del modello classico. o Stima dei parametri. Regressione semplice Roberta Siciliano 2

Contenuti: o Specificazione del modello. o Ipotesi del modello classico. o Stima dei parametri. Regressione semplice Roberta Siciliano 2 Corso d STATISTICA Prof. Roberta Sclano Ordnaro d Statstca, Unverstà d Napol Federco II Professore supplente, Unverstà della Baslcata a.a. 0/0 Contenut: o Specfcazone del modello o Ipotes del modello classco

Dettagli

REGRESSIONE LINEARE. È caratterizzata da semplicità: i modelli utilizzati sono basati essenzialmente su funzioni lineari

REGRESSIONE LINEARE. È caratterizzata da semplicità: i modelli utilizzati sono basati essenzialmente su funzioni lineari REGRESSIONE LINEARE Ha un obettvo mportante: nvestgare sulle relazon emprche tra varabl allo scopo d analzzare le cause che possono spegare un determnato fenomeno È caratterzzata da semplctà: modell utlzzat

Dettagli

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI METODI PER LO STUDIO DEL LEGAME TRA VARIABILI IN UN RAPPORTO DI CAUSA ED EFFETTO I MODELLI DI REGRESSIONE Prof.ssa G. Sero, Prof. P. Trerotol, Cattedra

Dettagli

I MODELLI LINEARI GENERALIZZATI GLM

I MODELLI LINEARI GENERALIZZATI GLM I MODELLI LINEARI GENERALIZZATI GLM Secondo la teoria dei Modelli Lineari Generalizzati (GLM), la regressione lineare, l analisi della varianza (ANOVA), la regressione logistica e i modelli log-lineari

Dettagli

a) Individuare l intervallo di confidenza al 90% per la media di popolazione;

a) Individuare l intervallo di confidenza al 90% per la media di popolazione; Eserczo Il responsable marketng d una catena d negoz vuole analzzare l volume delle vendte mensl d un determnato bene d largo consumo. Una socetà che conduce rcerche d mercato è ncarcata d effettuare un

Dettagli

03/03/2012. Campus di Arcavacata Università della Calabria

03/03/2012. Campus di Arcavacata Università della Calabria Campus d Arcavacata Unverstà della Calabra Corso d statstca RENDE a.a 0-00 3 4 5 6 7 8 9 0 3 4 5 6 7 8 9 Concentrazone Un altro aspetto d un nseme d dat che s aggunge alla meda e alla varabltà è costtuto

Dettagli

La Regressione X Variabile indipendente o esplicativa. La regressione. La Regressione. Y Variabile dipendente

La Regressione X Variabile indipendente o esplicativa. La regressione. La Regressione. Y Variabile dipendente Unverstà d Macerata Dpartmento d Scenze Poltche, della Comuncazone e delle Relaz. Internazonal La Regressone Varable ndpendente o esplcatva Prezzo n () () 1 1 Varable dpendente 15 1 1 1 5 5 6 6 61 6 1

Dettagli

Laboratorio 2B A.A. 2012/2013. Elaborazione Dati. Lab 2B CdL Fisica

Laboratorio 2B A.A. 2012/2013. Elaborazione Dati. Lab 2B CdL Fisica Laboratoro B A.A. 01/013 Elaborazone Dat Lab B CdL Fsca Lab B CdL Fsca Elaborazone dat spermental Prncpo della massma verosmglanza Quando eseguamo una sere d msure relatve ad una data grandezza fsca, quanto

Dettagli

Regressione e correlazione

Regressione e correlazione Regressone e correlazone Corso d statstca socale prof. Natale Carra - Unverstà degl Stud d Bergamo a.a. 005-06 Regressone Questo modello d anals bvarata esamna le relazon fra coppe d varabl contnue. Un

Dettagli

materiale didattico I incontro

materiale didattico I incontro Pano Nazonale Lauree Scentfche (PLS 2016-2017) Statstca Laboratoro d Statstca Le relazon tra varabl prof.ssa Angela Mara D'Uggento angelamara.duggento@unba.t materale ddattco I ncontro Dall anals statstca

Dettagli

Relazioni tra variabili: Correlazione e regressione lineare

Relazioni tra variabili: Correlazione e regressione lineare Dott. Raffaele Casa - Dpartmento d Produzone Vegetale Modulo d Metodologa Spermentale Febbrao 003 Relazon tra varabl: Correlazone e regressone lneare Anals d relazon tra varabl 6 Produzone d granella (kg

Dettagli

Campo di applicazione

Campo di applicazione Unverstà del Pemonte Orentale Corso d Laurea n Botecnologa Corso d Statstca Medca Correlazone Regressone Lneare Corso d laurea n botecnologa - Statstca Medca Correlazone e Regressone lneare semplce Campo

Dettagli

Oltre la regressione lineare

Oltre la regressione lineare Oltre la regressone lneare Modello d regressone lneare (semplce o multpla: - varabl esplcatve X quanttatve e qualtatve (nserte tramte uso d varabl dummy - varable dpendente Y è quanttatva Y = b + b X +

Dettagli

L analisi della correlazione lineare

L analisi della correlazione lineare L anals della correlazone lneare Corso d STATISTICA Prof. Roberta Sclano Ordnaro d Statstca, Unverstà d apol Federco II Professore supplente, Unverstà della Baslcata a.a. 20/202 Prof. Roberta Sclano Statstca

Dettagli

Correlazione lineare

Correlazione lineare Correlazone lneare Varable dpendente Mortaltà per crros 50 45 40 35 30 5 0 15 10 5 0 0 5 10 15 0 5 30 Consumo d alcool Varable ndpendente Metodologa per l anals de dat spermental L anals d stud con varabl

Dettagli

Corso di. Dott.ssa Donatella Cocca

Corso di. Dott.ssa Donatella Cocca Corso d Statstca medca e applcata 3 a Lezone Dott.ssa Donatella Cocca Concett prncpale della lezone I concett prncpal che sono stat presentat sono: Mede forme o analtche (Meda artmetca semplce, Meda artmetca

Dettagli

IL LEGAME TRA DUE VARIABILI I METODI DELLA CORRELAZIONE

IL LEGAME TRA DUE VARIABILI I METODI DELLA CORRELAZIONE IL LEGAME TRA DUE VARIABILI I METODI DELLA CORRELAZIONE CORRELAZIONE Legame - Assocazone - Accordo Relazone tra varabl valutare l grado d recproca nfluenza tra due varabl; valutare l grado d assocazone

Dettagli

La regressione. La Regressione. La Regressione. min. min. Var X. X Variabile indipendente (data) Y Variabile dipendente

La regressione. La Regressione. La Regressione. min. min. Var X. X Variabile indipendente (data) Y Variabile dipendente Unverstà d Macerata Facoltà d Scenze Poltche - Anno accademco - La Regressone Varable ndpendente (data) Varable dpendente Dpendenza funzonale (o determnstca): f ; Da un punto d vsta analtco, valor della

Dettagli

Capitolo 3. Cap. 3-1

Capitolo 3. Cap. 3-1 Statstca Captolo 3 Descrzone Numerca de Dat Cap. 3-1 Obettv del Captolo Dopo aver completato l captolo, sarete n grado d: Calcolare ed nterpretare la meda, la medana e la moda d un set tdd dat Trovare

Dettagli

Relazione funzionale e statistica tra due variabili Modello di regressione lineare semplice Stima puntuale dei coefficienti di regressione

Relazione funzionale e statistica tra due variabili Modello di regressione lineare semplice Stima puntuale dei coefficienti di regressione 1 La Regressone Lneare (Semplce) Relazone funzonale e statstca tra due varabl Modello d regressone lneare semplce Stma puntuale de coeffcent d regressone Decomposzone della varanza Coeffcente d determnazone

Dettagli

Regressione Multipla e Regressione Logistica: concetti introduttivi ed esempi

Regressione Multipla e Regressione Logistica: concetti introduttivi ed esempi Regressone Multpla e Regressone Logstca: concett ntroduttv ed esemp I Edzone ottobre 014 Vncenzo Paolo Senese vncenzopaolo.senese@unna.t Indce Note prelmnar alla I edzone 1 Regressone semplce e multpla

Dettagli

LA VARIABILITA. IV lezione di Statistica Medica

LA VARIABILITA. IV lezione di Statistica Medica LA VARIABILITA IV lezone d Statstca Medca Sntes della lezone Il concetto d varabltà Campo d varazone Dfferenza nterquartle La varanza La devazone standard Scostament med Il concetto d varabltà S defnsce

Dettagli

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI CONFRONTO DI PIU MEDIE IL METODO DI ANALISI DELLA VARIANZA

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI CONFRONTO DI PIU MEDIE IL METODO DI ANALISI DELLA VARIANZA NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI CONFRONTO DI PIU MEDIE IL METODO DI ANALISI DELLA VARIANZA IL PROBLEMA Supponamo d voler studare l effetto d 4 dverse dete su un campone casuale d 4

Dettagli

Correlazione, Regressione, Test non parametrici

Correlazione, Regressione, Test non parametrici Correlazone, Regressone, Test non parametrc Correlazone 1 Anals della Correlazone L anals della Correlazone è usata per msurare la forza dell assocazone (relazone lneare) tra due varabl Correlazone rguarda

Dettagli

PREVEDONO: Capitolo 17 del libro di testo. Copyright 2005 The McGraw-Hill Companies srl

PREVEDONO: Capitolo 17 del libro di testo. Copyright 2005 The McGraw-Hill Companies srl Le Inferenze sul modello d regressone PREVEDONO: Assunzone d normaltà degl error e nferenza su parametr Anals della Varanza Inferenza per la rsposta meda e la prevsone Anals de resdu Valor anomal Captolo

Dettagli

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 17/09/2012

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 17/09/2012 CdL n SCIENZE DELL ORGANIZZAZIONE ESAME d STATISTICA ESERCIZIO 1 (+.5+.5+3) La tabella seguente rporta la dstrbuzone d frequenza del peso X n gramm d una partta d mele provenent da un certo frutteto. X=peso

Dettagli

y. E' semplicemente la media calcolata mettendo

y. E' semplicemente la media calcolata mettendo COME FUNZIONA L'ANOVA A UN FATTORE: SI CONFRONTANO TANTE MEDIE SCOMPONENDO LA VARIABILITA' TOTALE Per testare l'potes nulla che la meda d una varable n k popolazon sa la stessa, s suddvde la varabltà totale

Dettagli

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI IL LEGAME TRA DUE VARIABILI I METODI DELLA CORRELAZIONE Prof.ssa G. Sero, Prof. P. Trerotol, Cattedra d Statstca Medca, Unverstà d Bar 1/19 IL PROBLEMA

Dettagli

Statistica Descrittiva

Statistica Descrittiva Statstca Descrttva Corso d Davd Vettur Dat osservat Sano note le seguent msure dello spessore d una lastra d materale polmerco espresse n mllmetr 3.71 3.83 3.85 3.96 3.84 3.8 3.94 3.55 3.76 3.63 3.88 3.86

Dettagli

PIANIFICAZIONE DEI TRASPORTI

PIANIFICAZIONE DEI TRASPORTI Unverstà d Caglar DICAAR Dpartmento d Ingegnera Cvle, Ambentale e archtettura Sezone Trasport PIANIFICAZIONE DEI TRASPORTI Eserctazone su modell d generazone A.A. 2016-2017 Ing. Francesco Pras Ing. Govann

Dettagli

LA VARIABILITA. Nella metodologia statistica si distinguono due aspetti della variabilità:

LA VARIABILITA. Nella metodologia statistica si distinguono due aspetti della variabilità: LA VARIABILITA LA VARIABILITA E L ATTITUDINE DEL FENOMENO QUANTITATIVO AD ASSUMERE DIVERSE MODALITA, O MEGLIO LA TENDENZA DI OGNI SINGOLA OSSERVAZIONE AD ASSUMERE VALORI DIFFERENTI RISPETTO AL VALORE MEDIO.

Dettagli

Lezioni di Statistica (25 marzo 2013) Docente: Massimo Cristallo

Lezioni di Statistica (25 marzo 2013) Docente: Massimo Cristallo UNIVERSITA DEGLI STUDI DI BASILICATA FACOLTA DI ECONOMIA Corso d laurea n Economa Azendale Lezon d Statstca (25 marzo 2013) Docente: Massmo Crstallo QUARTILI Dvdono la dstrbuzone n quattro part d uguale

Dettagli

3 CAMPIONAMENTO DI BERNOULLI E DI POISSON

3 CAMPIONAMENTO DI BERNOULLI E DI POISSON 3 CAMPIOAMETO DI ROULLI E DI POISSO 3. ITRODUZIOE In questo captolo esamneremo due schem d camponamento che dversamente dal camponamento casuale semplce non producono campon d dmensone fssa ma varable.

Dettagli

Analisi degli errori. Introduzione J. R. Taylor, Introduzione all analisi degli errori, Zanichelli, Bo 1986

Analisi degli errori. Introduzione J. R. Taylor, Introduzione all analisi degli errori, Zanichelli, Bo 1986 Anals degl error Introduzone J. R. Taylor, Introduzone all anals degl error, Zanchell, Bo 1986 Sstem d untà d msura, rappresentazone numerca delle quanttà fsche e cfre sgnfcatve Resnck, Hallday e Krane

Dettagli

Sistemi Intelligenti Stimatori e sistemi lineari - III

Sistemi Intelligenti Stimatori e sistemi lineari - III Sstem Intellgent Stmator e sstem lnear - III Alberto Borghese Unverstà degl Stud d Mlano Laboratory of Appled Intellgent Systems (AIS-Lab) Dpartmento d Informatca borghese@d.unm.t /6 http:\\borghese.d.unm.t\

Dettagli

Modelli con varabili binarie (o qualitative)

Modelli con varabili binarie (o qualitative) Modell con varabl bnare (o qualtatve E( Y X α + βx + ε quando Y è una varable benoullana Y 1 0 s ha l modello lneare d probabltà Pr( Y 1 X α + βx + ε dove valor stmat della Y assumono l sgnfcato d probabltà.

Dettagli

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill Statstca - metodologe per le scenze economche e socal /e S Borra, A D Cacco - McGraw Hll Es Soluzone degl esercz del captolo 7 In base agl arrotondament effettuat ne calcol, s possono rscontrare pccole

Dettagli

1) Le medie e le varianze calcolate su n osservazioni relative alle variabili quantitative X ed Y sono tali che. σ x

1) Le medie e le varianze calcolate su n osservazioni relative alle variabili quantitative X ed Y sono tali che. σ x TEORIA 1) Le mede e le varanze calcolate su n osservazon relatve alle varabl quanttatve X ed Y sono tal che 1 e. Consderando le corrspondent varabl standardzzate delle seguent affermazon rsulta vera 1

Dettagli

STATISTICA A K (63 ore) Marco Riani

STATISTICA A K (63 ore) Marco Riani STATISTICA A K (63 ore) Marco Ran mran@unpr.t http://www.ran.t Rcham sulla regressone MODELLO DI REGRESSIONE y a + b + e dove: 1,, n a + b rappresenta una retta: a ordnata all orgne ntercetta b coeff.

Dettagli

PRIMA PROVA INTERMEDIA DI STATISTICA (COD /6045/5047/4038/371/377) 26 ottobre 2015 COMPITO D

PRIMA PROVA INTERMEDIA DI STATISTICA (COD /6045/5047/4038/371/377) 26 ottobre 2015 COMPITO D FIRMA DELLO STUDENTE Cognome PRIMA PROVA INTERMEDIA DI STATISTICA (COD. 3000/6045/5047/4038/37/377) 26 ottobre 20 Nome Numero d matrcola Corso d Laurea Cod. corso COMPITO D A fn della valutazone s terrà

Dettagli

La t di Student. Per piccoli campioni si definisce la variabile casuale. = s N. detta t di Student.

La t di Student. Per piccoli campioni si definisce la variabile casuale. = s N. detta t di Student. Pccol campon I parametr della dstrbuzone d una popolazone sono n generale ncognt devono essere stmat dal campone de dat spermental per pccol campon (N N < 30) z = (x µ)/ )/σ non ha pù una dstrbuzone gaussana

Dettagli

Soluzione esercizi seconda settimana

Soluzione esercizi seconda settimana Soluzone esercz seconda settmana Es. 7 famgle Spesa per manfestazo n cultural (Z) A 00,9 B 40 4,0 C 50,5 D 70,6 E 80, F 300,8 G 00,5 Reddto mensle del capofamgla (x 000 Euro) (Y) Costrure l dagramma d

Dettagli

Misure indipendenti della stessa grandezza, ciascuna con una diversa precisione.

Misure indipendenti della stessa grandezza, ciascuna con una diversa precisione. Msure ndpendent della stessa grandezza, cascuna con una dversa precsone. Consderamo d avere due msure o n generale della stessa grandezza, ndpendent, caratterzzate da funzone denstà d probabltà d Gauss.

Dettagli

Laboratorio 2B A.A. 2013/2014. Elaborazione Dati. Lab 2B CdL Fisica

Laboratorio 2B A.A. 2013/2014. Elaborazione Dati. Lab 2B CdL Fisica Laboratoro B A.A. 013/014 Elaborazone Dat Lab B CdL Fsca Elaborazone dat spermental Come rassumere un nseme d dat spermental? Una statstca è propro un numero calcolato a partre da dat stess. La Statstca

Dettagli

ANALISI STATISTICA DELLE INCERTEZZE CASUALI

ANALISI STATISTICA DELLE INCERTEZZE CASUALI AALISI STATISTICA DELLE ICERTEZZE CASUALI Consderamo l caso della msura d una grandezza fsca che sa affetta da error casual. Per ottenere maggor nformazone sul valore vero della grandezza rpetamo pù volte

Dettagli

Metodi Quantitativi per Economia, Finanza e Management

Metodi Quantitativi per Economia, Finanza e Management Metod Quanttatv per Economa, Fnanza e Management Lezone n 10 Regressone Logstca: Le potes del modello, la stma del modello, l nterpretazone del del modello L mpostazone del problema Reddtvtà = rcav - cost

Dettagli

Esame di Statistica tema B Corso di Laurea in Economia Prof.ssa Giordano Appello del 15/07/2011

Esame di Statistica tema B Corso di Laurea in Economia Prof.ssa Giordano Appello del 15/07/2011 Esame d Statstca tema B Corso d Laurea n Economa Prof.ssa Gordano Appello del 15/07/011 Cognome Nome Matr. Teora Dmostrare la propretà assocatva della meda artmetca. Eserczo 1 L accesso al credto è sempre

Dettagli

RAPPRESENTAZIONE DI MISURE. carta millimetrata

RAPPRESENTAZIONE DI MISURE. carta millimetrata carta mllmetrata carta mllmetrata non è necessaro rportare sul foglo la tabella (ma auta; l mportante è che sta da qualche parte) carta mllmetrata 8 7 6 5 4 3 smbolo della grandezza con untà d msura!!!

Dettagli

L ANALISI MONOVARIATA: Variabilità e mutabilità. Prof. Maria Carella

L ANALISI MONOVARIATA: Variabilità e mutabilità. Prof. Maria Carella L AALISI MOOVARIATA: Varabltà e mutabltà Prof. Mara Carella Varabltà Le msure d tendenza centrale non sono suffcent alla comprensone de fenomen. Una sntes approprata deve tener conto del modo n cu s dstrbuscono

Dettagli

Appunti di Econometria

Appunti di Econometria Appunt d Econometra ARGOMENTO [4]: VARIABILI DIPENDENTI BINARIE Mara Lusa Mancus Unverstà Boccon Novembre 200 Introduzone Ne modell econometrc studat fno ad ora la varable dpendente, y, è sempre stata

Dettagli

Definizione di campione

Definizione di campione Defnzone d campone S consder una popolazone fnta U = {1, 2,..., N}. Defnamo campone ordnato d dmensone n qualsas sequenza d n etchette della popolazone anche rpetute. s = ( 1, 2,..., n ), dove j è l etchetta

Dettagli

Misure dirette utilizzate per il calcolo della misura indiretta X:

Misure dirette utilizzate per il calcolo della misura indiretta X: Propagazone degl error Msure drette utlzzate per l calcolo della msura ndretta X: ( ) a a a = ± Δ b = ( b ± Δ b) Il calcolo dell errore assoluto X ( espresso nella stessa untà d msura della grandezza X

Dettagli

Analisi statistica degli errori casuali

Analisi statistica degli errori casuali Anals statstca degl error casual error casual: dovut a ncertezze spermental non controllabl che comunque spngono l valore msurato con ugual probabltà n alto od n basso rspetto al valore vero. Quest error

Dettagli

Fisica Generale I Misure di grandezze fisiche e incertezze di misura Lezione 3 Facoltà di Ingegneria Livio Lanceri

Fisica Generale I Misure di grandezze fisiche e incertezze di misura Lezione 3 Facoltà di Ingegneria Livio Lanceri Fsca Generale I Msure d grandezze fsche e ncertezze d msura Lezone 3 Facoltà d Ingegnera Lvo Lancer Indce Abbamo mparato: Orgne e classfcazone delle ncertezze (error) d msura Rappresentazone delle ncertezze

Dettagli

L ANALISI MONOVARIATA: Variabilità e mutabilità. Prof. Maria Carella

L ANALISI MONOVARIATA: Variabilità e mutabilità. Prof. Maria Carella L AALISI MOOVARIATA: Varabltà e mutabltà Prof. Mara Carella Varabltà Le msure d tendenza centrale non sono suffcent alla comprensone de fenomen. Una sntes approprata deve tener conto del modo n cu s dstrbuscono

Dettagli

Strada B. Classe Velocità valore frequenza Frequ. ass Frequ. % hi Freq. Cum

Strada B. Classe Velocità valore frequenza Frequ. ass Frequ. % hi Freq. Cum Eserczo SINTESI S supponga d avere eseguto 70 msure della veloctà stantanea de vecol che transtano nelle sezon d due strade A e B. S supponga che tal msure sano state eseguta n corrspondenza d valor modest

Dettagli

Fisica Generale I Misure di grandezze fisiche e incertezze di misura Lezione 3 Facoltà di Ingegneria Livio Lanceri

Fisica Generale I Misure di grandezze fisiche e incertezze di misura Lezione 3 Facoltà di Ingegneria Livio Lanceri Fsca Generale I Msure d grandezze fsche e ncertezze d msura Lezone 3 Facoltà d Ingegnera Lvo Lancer Indce Abbamo mparato: Orgne e classfcazone delle ncertezze (error) d msura Rappresentazone delle ncertezze

Dettagli

La likelihood. , x 3. , x 2. ,...x N

La likelihood. , x 3. , x 2. ,...x N La lkelhood È dato un set d msure {x 1, x 2, x 3,...x N } (cascuna delle qual può essere multdmensonale) Supponamo che la pdf (f) dpenda da un parametro (anch'esso eventualmente multdmensonale) La verosmglanza

Dettagli

si utilizzano per confrontare le distribuzioni

si utilizzano per confrontare le distribuzioni Dspersone o Varabltà Defnzone: Le Msure d Dspersone: sono par a zero n caso d dspersone nulla s utlzzano per confrontare le dstrbuzon permettono d valutare la rappresentatvtà delle msure d centraltà. 89

Dettagli

L'Analisi in Componenti Principali. Luigi D Ambra Dipartimento di Matematica e Statistica Università di Napoli Federico II

L'Analisi in Componenti Principali. Luigi D Ambra Dipartimento di Matematica e Statistica Università di Napoli Federico II L'Anals n Component Prncpal Lug D Ambra Dpartmento d Matematca e Statstca Unverstà d Napol Federco II ANALISI MULTIDIMENSIONALE DEI DATI (AMD) L Anals Multdmensonale de Dat (AMD) è una famgla d tecnche

Dettagli

IL MODELLO DI MACK. Materiale didattico a cura di Domenico Giorgio Attuario Danni di Gruppo Società Cattolica di Assicurazioni

IL MODELLO DI MACK. Materiale didattico a cura di Domenico Giorgio Attuario Danni di Gruppo Società Cattolica di Assicurazioni IL MODELLO DI MACK Materale ddattco a cura d Domenco Gorgo Attuaro Dann d Gruppo Socetà Cattolca d Asscurazon CHAIN-LADDE CLASSICO Metodo pù utlzzato per la stma della rserva snstr. Semplctà. Dstrbuton-ree

Dettagli

Scienze Geologiche. Corso di Probabilità e Statistica. Prove di esame con soluzioni

Scienze Geologiche. Corso di Probabilità e Statistica. Prove di esame con soluzioni Scenze Geologche Corso d Probabltà e Statstca Prove d esame con soluzon 004-005 1 Corso d laurea n Scenze Geologche - Probabltà e Statstca Appello del 1 gugno 005 - Soluzon 1. (Punt 3) In una certa zona,

Dettagli

Analisi di Regressione Multipla

Analisi di Regressione Multipla Analisi di Regressione Multipla Stima OLS della relazione Test Score/STR : TestScore! = 698.9.8 STR, R =.05, SER = 18.6 (10.4) (0.5) E una stima credibile dell effetto causale sul rendimento nei test di

Dettagli

Ad esempio, potremmo voler verificare la legge di caduta dei gravi che dice che un corpo cade con velocità uniformemente accellerata: v = v 0 + g t

Ad esempio, potremmo voler verificare la legge di caduta dei gravi che dice che un corpo cade con velocità uniformemente accellerata: v = v 0 + g t Relazon lnear Uno de pù mportant compt degl esperment è quello d nvestgare la relazone tra due varabl. Il caso pù mportante (e a cu spesso c s rconduce, come vedremo è quello n cu la relazone che s ntende

Dettagli

Regressione lineare con un singolo regressore

Regressione lineare con un singolo regressore Regressone lneare con un sngolo regressore Eduardo Ross 2 2 Unverstà d Pava (Italy) Marzo 2013 Ross Regressone lneare semplce Econometra - 2013 1 / 45 Outlne 1 Introduzone 2 Lo stmatore OLS 3 Esempo 4

Dettagli

Lezione 4. Politica Economica Avanzata

Lezione 4. Politica Economica Avanzata Lezone 4 Poltca Economca Avanzata Come msuramo la rendta d Conoscamo la def. Teorca. un mpresa? Dvdamo n base al valore medano tra mprese a bassa ed alta rendta. Che legame con la crescta della produttvtà

Dettagli

Test delle Ipotesi e Analisi della Varianza (ANalysis Of VAriance: ANOVA)

Test delle Ipotesi e Analisi della Varianza (ANalysis Of VAriance: ANOVA) delle Ipotes e Anals della Varanza (ANalyss Of VArance: ANOVA) delle Ipotes sulla meda Introduzone Defnzon baslar Teora per l caso d varanza nota Rsch nel test delle potes Teora per l caso d varanza non

Dettagli

Probabilità cumulata empirica

Probabilità cumulata empirica Probabltà cumulata emprca Se s effettua un certo numero d camponament da una popolazone con dstrbuzone cumulata F(y), s avranno allora n campon y, y,, y n. E possble consderarne la statstca d ordne, coè

Dettagli

La regressione nella stima immobiliare

La regressione nella stima immobiliare La regressone nella stma mmoblare Paolo Rosato Dpartmento d Ingegnera Cvle e Archtettura Pazzale Europa 1-34127 Treste. Itala Tel: +39-040-5583569. Fax: +39-040-55835 80 E-mal: paolo.rosato@da.unts.t 26/04/2017

Dettagli

Principio di massima verosimiglianza

Principio di massima verosimiglianza Prncpo d massma verosmglana Sa data una grandea d cu s conosce la unone denstà d probabltà ; che dpende da un nseme de parametr ndcat con d valore sconoscuto. S vuole determnare la mglor stma de parametr.

Dettagli

Principio di massima verosimiglianza

Principio di massima verosimiglianza Prncpo d massma verosmglana Sa data una grandea d cu s conosce la unone denstà d probabltà ; che dpende da un nseme de parametr ndcat con d valore sconoscuto. S vuole determnare la mglor stma de parametr.

Dettagli

Propagazione degli errori

Propagazione degli errori Propagazone degl error Msure drette: la grandezza sca vene msurata drettamente (ad es. Spessore d una lastrna). Per questo tpo d msure, la teora dell errore svluppata nelle lezone precedent é sucente per

Dettagli

Metodologie informatiche per la chimica

Metodologie informatiche per la chimica Metodologe nforatche per la chca Dr. Sergo Brutt Anals de dat 6 Y Rcaptolo generale Dato un nsee d sure sperental d una varable dpendente al varare d una varable ndpendente è possble edante l crtero de

Dettagli

Regressioni con variabili strumentali

Regressioni con variabili strumentali Regresson con varabl strumental 3 mportant mnacce alla valdtà nterna del modello: Bas dovuta alle varabl omesse, varabl correlate con X ma non osservate e che per questo non possono essere ncluse nella

Dettagli

Capitolo 3 Covarianza, correlazione, bestfit lineari e non lineari

Capitolo 3 Covarianza, correlazione, bestfit lineari e non lineari Captolo 3 Covaranza, correlazone, bestft lnear e non lnear ) Covaranza e correlazone Ad un problema s assoca spesso pù d una varable quanttatva (es.: d una persona possamo determnare peso e altezza, oppure

Dettagli

SERIE STORICHE, TREND, MEDIE MOBILI, REGRESSIONE Andrea Prevete

SERIE STORICHE, TREND, MEDIE MOBILI, REGRESSIONE Andrea Prevete SERIE STORICHE, TREND, MEDIE MOBILI, REGRESSIONE Andrea Prevete Una sere storca o temporale è un nseme d dat costtut da una sequenza d osservazon su un fenomeno d nteresse X, effettuate n stant (per le

Dettagli

Ettore Limoli. Lezioni di Matematica Prof. Ettore Limoli. Sommario. Calcoli di regressione

Ettore Limoli. Lezioni di Matematica Prof. Ettore Limoli. Sommario. Calcoli di regressione Sto Personale d Ettore Lmol Lezon d Matematca Prof. Ettore Lmol Sommaro Calcol d regressone... 1 Retta d regressone con Ecel... Uso della funzone d calcolo della tendenza... 4 Uso della funzone d regressone

Dettagli

PROBLEMA DI SCELTA FRA DUE REGIMI DI

PROBLEMA DI SCELTA FRA DUE REGIMI DI PROBLEMA DI SCELTA FRA DUE REGIMI DI CAPITALIZZAZIONE Prerequst: legge d captalzzazone semplce legge d captalzzazone composta logartm e loro propretà dervate d una funzone pendenza d una curva n un punto

Dettagli

Precisione e Cifre Significative

Precisione e Cifre Significative Precsone e Cfre Sgnfcatve Un numero (una msura) è una nformazone! E necessaro conoscere la precsone e l accuratezza dell nformazone. La precsone d una msura è contenuta nel numero d cfre sgnfcatve fornte

Dettagli

Esame di Statistica tema A Corso di Laurea in Economia Prof.ssa Giordano Appello del 15/07/2011

Esame di Statistica tema A Corso di Laurea in Economia Prof.ssa Giordano Appello del 15/07/2011 Esame d Statstca tema A Corso d Laurea n Economa Prof.ssa Gordano Appello del /07/0 Cognome Nome atr. Teora Dmostrare che la somma degl scart dalla meda artmetca è zero. Eserczo L accesso al credto è sempre

Dettagli

Analisi bivariata con variabili quantitative

Analisi bivariata con variabili quantitative Anals bvarata con varabl quanttatve Regressone lneare Correlazone lneare LA REGRESSIONE LINEARE In un campone d 33 donne, d età compresa tra 22 e 81 ann, è stata msurata la pressone sstolca (n mm d mercuro).

Dettagli

una variabile casuale è continuase può assumere un qualunque valore in un intervallo

una variabile casuale è continuase può assumere un qualunque valore in un intervallo Varabl casual contnue Se samo nteressat alla temperatura massma gornaleraquesta è una varable casuale msurata n un ntervallo contnuoe qund è una v.c. contnua una varable casuale è contnuase può assumere

Dettagli

STATISTICA PSICOMETRICA a.a. 2004/2005 Corsi di laurea. Scienze e tecniche neuropsicologiche Modulo 3 Statistica Inferenziale

STATISTICA PSICOMETRICA a.a. 2004/2005 Corsi di laurea. Scienze e tecniche neuropsicologiche Modulo 3 Statistica Inferenziale STATISTICA PSICOMETRICA a.a. 004/005 Cors d laurea Scenze e tecnche neuropscologche Modulo 3 Statstca Inferenzale Probabltà Dstrbuzon d probabltà Dstrbuzon camponare Stma ntervallare Verfca delle potes

Dettagli

Modelli descrittivi, statistica e simulazione

Modelli descrittivi, statistica e simulazione Modell descrttv, statstca e smulazone Master per Smart Logstcs specalst Roberto Cordone (roberto.cordone@unm.t) Statstca descrttva Cernusco S.N., govedì 28 gennao 2016 (9.00/13.00) 1 / 15 Indc d poszone

Dettagli

Statistica multivariata Donata Rodi 17/10/2016

Statistica multivariata Donata Rodi 17/10/2016 Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare

Dettagli

C.I. di Metodologia clinica

C.I. di Metodologia clinica C.I. d Metodologa clnca I metod per la sntes e la comuncazone delle nformazon sulla salute Come possamo trarre concluson attendbl su parametr a partre dalle stme camponare? I metod per la produzone delle

Dettagli

Dipartimento di Statistica Università di Bologna. Matematica finanziaria aa lezione 2: 21 febbraio 2013

Dipartimento di Statistica Università di Bologna. Matematica finanziaria aa lezione 2: 21 febbraio 2013 Dpartmento d Statstca Unverstà d Bologna Matematca fnanzara aa 2012-2013 lezone 2: 21 febbrao 2013 professor Danele Rtell www.unbo.t/docent/danele.rtell 1/25? Defnzone. f : R R s dce addtva se per ogn

Dettagli

S O L U Z I O N I. 1. Effettua uno studio qualitativo della funzione. con particolare riferimento ai seguenti aspetti:

S O L U Z I O N I. 1. Effettua uno studio qualitativo della funzione. con particolare riferimento ai seguenti aspetti: S O L U Z I O N I 1 Effettua uno studo qualtatvo della funzone con partcolare rfermento a seguent aspett: f ( ) ln( ) a) trova l domno della funzone b) ndca qual sono gl ntervall n cu f() rsulta postva

Dettagli

Argomenti della lezione:

Argomenti della lezione: Lezione 7 Argomenti della lezione: La regressione semplice Il modello teorico Il calcolo dei parametri Regressione lineare Esamina la relazione lineare tra una o più variabili esplicative (o indipendenti,

Dettagli

Misure Ripetute ed Indipendenti

Misure Ripetute ed Indipendenti Msure Rpetute ed Indpendent Una delle metodologe pù semplc per valutare l affdabltà d una msura consste nel rpeterla dverse volte, nelle medesme condzon, ed esamnare dvers valor ottenut. Ovvamente, una

Dettagli

Propagazione delle incertezze

Propagazione delle incertezze Propagazone delle ncertezze In questa Sezone vene trattato l problema della propagazone delle ncertezze quando s msurano pù grandezze dfferent,,,z soggette a error d tpo casuale e po s utlzzano tal grandezze

Dettagli

Dipartimento di Statistica Università di Bologna. Matematica finanziaria aa lezione 2: 18 febbraio 2014

Dipartimento di Statistica Università di Bologna. Matematica finanziaria aa lezione 2: 18 febbraio 2014 Dpartmento d Statstca Unverstà d Bologna Matematca fnanzara aa 2013-2014 lezone 2: 18 febbrao 2014 professor Danele Rtell www.unbo.t/docent/danele.rtell 1/19? Defnzone. f : R R s dce moltplcatva se per

Dettagli

Tutorato di Complementi di Analisi Matematica e Statistica 23 e 30 marzo 2017

Tutorato di Complementi di Analisi Matematica e Statistica 23 e 30 marzo 2017 Tutorato d Complement d Anals Matematca e Statstca 23 e 30 marzo 2017 Gl esercz con l smbolo eo sono tratt da prove d esame del 2016 ( eo gorno/mese eo) Esercz dagl ncontr precedent 3. Una varable X può

Dettagli

Teoria degli errori. La misura implica un giudizio sull uguaglianza tra la grandezza incognita e la grandezza campione. Misure indirette: velocita

Teoria degli errori. La misura implica un giudizio sull uguaglianza tra la grandezza incognita e la grandezza campione. Misure indirette: velocita Teora degl error Processo d msura defnsce una grandezza fsca. Sstema oggetto. Apparato d msura 3. Sstema d confronto La msura mplca un gudzo sull uguaglanza tra la grandezza ncognta e la grandezza campone

Dettagli