Statistica descrittiva: analisi di regressione
|
|
- Erico Bellucci
- 5 anni fa
- Visualizzazioni
Transcript
1 Statistica descrittiva: analisi di regressione L analisi di regressione permette di esplorare le relazioni tra due insiemi di valori (p.e. i valori di due attributi di un campione) alla ricerca di associazioni. Per esempio possiamo usare l analisi di regressione per determinare se: le spese in pubblicità sono associate con le vendite il fumo è associato con le malattie cardiache la dieta mediterranea è associata con la durata della vita
2 Scatter plots (diagrammi a punti) Un primo approccio all analisi di regressione è la creazione di uno scatter plot, che mostra su un piano XY un punto per ogni coppia di valori Per esempio se abbiamo un campione che riporta per ciascuna famiglia le entrate mensili, le spese per attività culturali, le spese per attività sportive ecc., possiamo creare uno scatter plot che usa le coppie entrate-spese culturali per indagare l esistenza di una relazione
3 Scatter plots in Excel Excel consente la creazione di scatter plots mediante lo strumento chart wizard Il chart wizard oltre a consentire la creazione del grafico a partire dalla selezione delle liste di valori di cui si vuole studiare l associazione, consente: di generare la trendline, ovvero la curva che meglio approssima l andamento dell insieme di valori sulle ordinate rispetto all insieme di valori sulle ascisse di generare l equazione di regressione ovvero l equazione della trendline trendline e equazione di regressione ci permettono di classificare l associazione: lineare, logaritmica, esponenziale ecc.
4 Esempio: entrate e spese familiari A partire dal file EXPENSES.XLS trovare: l associazione tra entrate e spese per cultura l associazione tra entrate e spese per sport l associazione tra spese per sport e spese per cultura
5 Misure di associazione: covarianza La covarianza quantifica la la forza della relazione tra due insiemi di valori, ovvero misura quanto lineare e` la dipendenza tra i due insiemi; La covarianza e` la media del prodotto delle deviazioni dei valori dalla media degli insiemi dei dati In formula: n X X Y Y X,Y ( ) ( i 1 i cov( ) n i ) un valore positivo indica una variazione di X e Y nella stessa direzione, un valore negativo l opposto
6 Misure di associazione: correlazione un limite della misura di covarianza come misura descrittiva e` la sua dipendenza dall unita` di misura usata per i valori; per esempio possiamo gonfiare il fattore covarianza per un fattore 1000, semplicemente sostituendo come unita` di misura euro in luogo di migliaia di euro (naturalmente se le unita` sono appropriate) La misura di correlazione risolve il problema producendo un risultato indipendente dalle unita` di misura e compreso tra 1 e 1 In formula Cov( X,Y) Corr( X, Y) Stdev( X ) Stdev( Y)
7 Misure di associazione: correlazione Un valore della correlazione e` vicino a 1 indica che i due insiemi di valori tendono a variare in senso opposto Un valore della correlazione vicino a +1 indica che i due insiemi di valori tendono a variare nello stesso senso Una indipendenza nelle variazioni dei due valori produce un indice di correlazione uguale a 0 Ma, attenzione: l indice di correlazione e` rilevante solo per relazioni lineari L indice puo` risultare vicino a 0 anche se esiste una relazione non lineare tra i due insiemi di valori.
8 Coefficiente di correlazione (Pearson) r = σ n i=1(xi X)(Y i Y) σ n i=1 (X i X) 2 σ n i=1 (Y i Y) 2
9 R 2 coefficiente di determinazione Misura la percentuale di variazione della variabile dipendente spiegata dalla variazione della variabile indipendente. Il range è 0..1 Per esempio un valore 0,8 può essere interpretato come l 80% delle variazioni è spiegato dalle variazioni della variabile indipendente, il 20% possono esser dovute da variabilità random Nel caso di regressione lineare coincide con il quadrato del coefficiente di correlazione
10 Calcolo del coefficiente di determinazione R 2 = ESSΤ TSS = 1 RSSΤ TSS n ESS =σ i=1 ( y i y) 2 devianza spiegata dal modello n TSS = σ i=1 (y i y) 2 devianza totale RSS= σn i=1 (y i y i ) 2 devianza residua Con y i dati osservati y media dei dati osservati y i dati previsti dal modello
11 Regressione lineare Se i dati di uno scatter plot cadono approssimativamente su una retta, la regressione lineare consente di calcolare la migliore retta che approssima i dati La retta di regressione è descritta da una equazione y= a + bx dove y è la variabile dipendente e x la variabile indipendente a e b i coefficienti, rispettivamente il termine costante e b il coefficiente angolare (slope) I residui sono le differenze tra i valori dati e quelli stimati dalla retta
12 Calcolo dei coefficienti L idea è di trovare una retta che minimizzi la somma dei residui al quadrato ovvero la distanza totale dei valori osservati dai valori stimati, al quadrato per evitare il condizionamento dsel segno. Somma dei residui al quadrato n (y i y i ) 2 i=1
13 Metodo dei minimi quadrati b = σ n i=1 (xi x)(y i y) n (x i x) 2 σ i=1 a = y bx
14 Statistiche di regressione Statistiche finalizzate a valutare l adeguatezza di un modello lineare E possibile usare Analysis Toolpack di Excel per calcolare le statistiche di regressione. Si faccia riferimento al file BCANCER: Contiene dati di uno studio del 1965 che analizza le relazioni tra la temperatura media annuale e la percentuale di mortalità per certi tipi di cancro al seno. I soggetti dell analisi provengono da 16 regioni diverse in Gran Bretagna, Norvegia e Svezia Region Temperature Mortality 1 31,8 67,3 2 34,0 52,5 3 40,2 68,1 4 42,1 84,6 5 42,3 65,1
15 Calcolo della retta di regressione 120,0 100,0 80,0 y = 2,3577x - 21,795 R² = 0,7654 Mortality 60,0 40,0 20,0 0,0 0,0 10,0 20,0 30,0 40,0 50,0 60,0
16 Statistiche della regressione usando la funzione Regression dell Analysis Toolpack
17 Output dell analisi di regressione
18 Output dell analisi di regressione L output è organizzato su 5 aree: Statistiche di regressione Analisi di varianza (ANOVA) Stima dei parametri Residui grafici
19 Statistiche di regressione Statistica della regressione R multiplo 0, R al quadrato 0, R al quadrato corretto 0, Errore standard 7, Osservazioni 16 - R-multiplo è la radice quadrata di R al quadrato, ed è uguale al valore assoluto della correlazione tra la variabile dipendente e la variabile predittore - R al quadrato corretto viene calcolato in caso di regressione con più di un predittore - L errore standard misura la tipica deviazione di un valore osservato (x,y) dalla retta di regressione (media delle deviazioni dalla retta di regressione). - La formula dell errore standard per un campione è σ(y y ) 2 n 2 - Dove n è la numerosità del campione, y è il valore osservato e y il valore atteso.
20 Analisi di varianza ANALISI VARIANZA gdl SQ MQ F Significatività F Regressione , ,534 45, ,20184E-06 Residuo , ,92184 Totale , La tabella di Analisi di Varianza (ANOVA) analizza la variabilità dell indice di mortalità La variabilità è divisa in due parti: la prima è la variabilità dovuta alla retta di regressione e la seconda dovuta a variabilità casuale (random) - Gdl indica il grado di libertà per ciascuna parte. La somma dei due è uguale al numero di osservazioni meno 1. Nell esempio un grado di libertà è attribuito alla retta di regressione e 14 alla variabilità random. - SQ è la somma dei quadrati, ovvero la somma delle deviazioni al quadrato della variabile dipendente dalla media divisa in due parti: somma dei quadrati di regressione (somma delle deviazioni quadrate tra la retta di regressione e la media) e somma dei quadrati residua (somma delle deviazioni quadrate della variabile dipendente dalla retta di regressione)
21 Analisi di varianza (Cont.) ANALISI VARIANZA gdl SQ MQ F Significatività F Regressione , ,534 45, ,20184E-06 Residuo , ,92184 Totale , La percentuale della somma dei quadrati totale che viene attribuita alla regressione è il valore R quadro, che misura la percentuale di variabilità spiegato dalla retta di regressione - MQ è la media dei quadrati ovvero la somma dei quadrati divisa per i gradi di libertà ed è uguale al quadrato dell errore standard - F (F-ratio) è il rapporto del quadrato medio della regressione (2599,5) con l errore quadratico medio dei residui (56,9). Un grande valore di F indica che la regressione può essere statisticamente significativa
22 Stima dei parametri Coefficienti Errore standard Stat t Valore di significatività Inferiore 95% Superiore 95% Inferiore 95,0% Superiore 95,0% Intercetta -21, , , , , , , , Temperature 2, , , ,20184E-06 1, , , , La prima colonna riporta i valori calcolati del termine noto (intercetta) e del coefficiente angolare (Temperatura nell esempio) - La colonna successiva riporta gli errori standard per questi due valori stimati in accordo a una distribuzione t con n-2 gradi di libertà (vedi la parte di statistica inferenziale) - I valori significativi sono gli intervalli stimati al 95% di confidenza per il termine noto [-55,4;11,8] e [1,6;3,1] per il coefficiente angolare. - Conclusione per l esempio dato: possiamo affermare con confidenza del 95% che per ciascun grado di aumento della temperatura annuale l indice di mortalità della regione aumenta di un valore nell intervallo [1,6;3,1]
23 La retta come modello Fare il fitting con altre possibili curve della trendline E verificare se altre hanno un R-quadro migliore
24 Distribuzione normale dei residui I residui normalizzati dovrebbero distribuirsi in accordo a una normale con media 0 e deviazione standard 1 I residui normalizzati dovrebbero cadere nell intervallo [-2; 2] (Nota: il valore preciso dipende dalla t-distribution e dai gradi di libertà) Residui standard Come si vede un solo residuo è ai bordi dell intervallo di accettazione. Non ci sono outlier, ovvero valori con un residuo al di fuori dell intervallo di [-2 ;2 ] che in accordo alla distribuzione normale contiene il 95% dei valori.
25 Ancora un esempio Vedi EXPENSES Salary Culture Sports Dining $ $1.020 $990 $1.510 $ $1.100 $460 $1.180 $ $900 $780 $1.590 $ $570 $860 $1.750 $ $900 $1.390 $2.120 $ $820 $1.880 $3.090 $ $1.340 $710 $1.540 $ $1.250 $680 $1.800 $ $1.190 $1.220 $2.330 $ $640 $1.480 $2.670 $ $900 $820 $2.850 $ $710 $1.080 $2.200 $ $1.240 $1.230 $2.430 $ $1.270 $1.000 $2.110 $ $1.180 $690 $1.820 $ $810 $1.490 $2.100 $ $840 $730 $920 Studiamo la regressione tra Salary e Sports
26 Diagramma XY e retta di regressione $2.000 y = -0,0024x ,4 R² = 0,0066 Sports $1.000 $0 $0 $10.000$20.000$30.000$40.000$50.000$60.000$70.000$80.000$ Plot dei residui normalizzati 4 Residui standard
27 Limiti del coefficiente di correlazione il coefficiente di correlazione è suscettibile alla presenza di outlier (verificare con esempi che l eliminazione di outliers incrementa il coefficiente di correlazione di Pearson Il calcolo del coefficiente assume una relazione lineare
28 Correlation is not necessarily causation Una forte correlazione con buone statistiche per la regressione non è una prova di causalità, che può solo essere dimostrata da ragionamenti legati alla natura del fenomeno da studiare. Se no a cosa servirebbero sociologi, economisti e scienziati in genere?
29 Esercitazione (1) Il responsabile del personale della Beta Tecnologies Inc. sta cercando di individuare la variabile che meglio spiega le variazioni di stipendio degli impiegati usando un campione che riporta i dati di 52 impiegati a tempo pieno. I dati sono nel file IMPIEGATI.XLS. Si generino diagrammi XY per determinare quale delle seguenti variabili ha la relazione lineare più forte con lo stipendio annuale: sesso età numero di anni di esperienza lavorativa prima dell assunzione in azienda numero di anni di impiego in azienda numero di anni di educazione post-secondaria.
Statistica descrittiva: misure di associazione
Statistica descrittiva: misure di associazione L analisi di regressione permette di esplorare le relazioni tra due insiemi di valori (p.e. i valori di due attributi di un campione) alla ricerca di associazioni.
DettagliEsplorazione dei dati. Lucidi e dataset tratti da Turini - Analisi dei Dati, Dip. Inf. Unipi
Esplorazione dei dati Lucidi e dataset tratti da Turini - Analisi dei Dati, Dip. Inf. Unipi Analisi mono e bivariata Si utilizzano indicatori sintetici che individuano, con un singolo valore, proprieta`
DettagliAnalisi univariata Analisi bivariata Analisi multivariata
L analisi esplorativa dei dati evidenzia, tramite grafici ed indicatori sintetici, le caratteristiche di ciascun attributo presente in un dataset. Il processo di esplorazione consiste di tre fasi: Analisi
DettagliCorrelazione tra due variabili
Correlazione tra due variabili Federico Plazzi 26 Novembre 2015 Correlazione tra due variabili Correlazione tra due variabili Variabili dipendenti e variabili indipendenti La variabile indipendente è quella
DettagliRegressione Lineare Semplice e Correlazione
Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)
DettagliRappresentazioni grafiche di distribuzioni doppie
Rappresentazioni grafiche di distribuzioni doppie Distribuzione doppia di frequenze Tabella di contingenza Tabella di correlazione Stereogramma Distribuzione unitaria doppia di 2 caratteri quantitativi
DettagliCORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Associazione, correlazione e dipendenza tra caratteri In un collettivo di 11 famiglie è stata
DettagliSTATISTICA A K (60 ore)
STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta
DettagliPsicometria con Laboratorio di SPSS 2
Psicometria con Laboratorio di SPSS 2 Regressione lineare semplice (vers. 1.2, 20 marzo 2018) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2017-18
DettagliEsercitazione del
Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36
DettagliCapitolo 12 La regressione lineare semplice
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri
DettagliESERCITAZIONI N. 3 corso di statistica
ESERCITAZIONI N. 3corso di statistica p. 1/18 ESERCITAZIONI N. 3 corso di statistica Marco Picone Università Roma Tre ESERCITAZIONI N. 3corso di statistica p. 2/18 Introduzione Media e Varianza Covarianza
DettagliNel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0.
Regressione [] el modello di regressione lineare si assume una relazione di tipo lineare tra il valore medio della variabile dipendente Y e quello della variabile indipendente X per cui Il modello si scrive
DettagliStatistica di base per l analisi socio-economica
Laurea Magistrale in Management e comunicazione d impresa Statistica di base per l analisi socio-economica Giovanni Di Bartolomeo gdibartolomeo@unite.it Definizioni di base Una popolazione è l insieme
DettagliRegressione lineare semplice
Regressione lineare semplice Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Statistica con due variabili var. nominale, var. nominale: gruppo sanguigno - cancro
DettagliUniversità del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare
Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione
DettagliR - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre
R - Esercitazione 6 Andrea Fasulo fasulo.andrea@yahoo.it Università Roma Tre Venerdì 22 Dicembre 2017 Il modello di regressione lineare semplice (I) Esempi tratti da: Stock, Watson Introduzione all econometria
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@unina.it Università degli studi di Cassino () Statistica 1 / 1 Outline 1 () Statistica 2 / 1 Outline 1 2 () Statistica 2 / 1 Outline 1 2 3 () Statistica 2 / 1
DettagliAnalisi bivariata. Il caso di caratteri quantitativi
Analisi bivariata Il caso di caratteri quantitativi Pagina 382 Rappresentazioni grafiche di distribuzioni doppie Distribuzione doppia di frequenze Tabella di contingenza Tabella di correlazione Stereogramma
DettagliStatistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1
Statistica Capitolo 1 Regressione Lineare Semplice Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Spiegare il significato del coefficiente di correlazione lineare
DettagliCorso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII
Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Un breve richiamo sul test t-student Siano A exp (a 1, a 2.a n ) e B exp (b 1, b 2.b m ) due set di dati i cui
DettagliRegressione Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007
Regressione Esempio Un azienda manifatturiera vuole analizzare il legame che intercorre tra il costo mensile Y di produzione e il corrispondente volume produttivo X per uno dei propri stabilimenti. Volume
DettagliUniversità del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare
Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione
DettagliL'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale
L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile Corso di Metodologia della ricerca sociale L analisi della varianza (ANOVA) La tecnica con cui si esplorano le relazioni
DettagliIndice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza
XIII Presentazione del volume XV L Editore ringrazia 3 1. Introduzione alla Statistica 5 1.1 Definizione di Statistica 6 1.2 I Rami della Statistica Statistica Descrittiva, 6 Statistica Inferenziale, 6
Dettagli3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17
C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica
DettagliSTATISTICA MULTIVARIATA SSD MAT/06
Università degli studi di Ferrara Dipartimento di Matematica A.A. 2018/2019 I semestre STATISTICA MULTIVARIATA SSD MAT/06 LEZIONE 4 - Questioni di analisi e applicazione della regressione lineare Pratica
DettagliEsercizi di statistica
Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..
DettagliArgomenti della lezione:
Lezione 7 Argomenti della lezione: La regressione semplice Il modello teorico Il calcolo dei parametri Regressione lineare Esamina la relazione lineare tra una o più variabili esplicative (o indipendenti,
DettagliOld Faithful, Yellowstone Park. Statistica e biometria. D. Bertacchi. Dati congiunti. Tabella. Scatterplot. Covarianza. Correlazione.
Coppie o vettori di dati Spesso i dati osservati sono di tipo vettoriale. Ad esempio studiamo 222 osservazioni relative alle eruzioni del geyser Old Faithful. Old Faithful, Yellowstone Park. Old Faithful
DettagliCorrelazione e regressione
Correlazione e regressione Correlazione 1 Come posso determinare il legame tra due o più variabili? Correlazione COEFFICIENTE DI CORRELAZIONE (r di Pearson) massimo consumo di ossigeno e prestazione nelle
DettagliVogliamo determinare una funzione lineare che meglio approssima i nostri dati sperimentali e poter decidere sulla bontà di questa approssimazione.
S.S.I.S. TOSCANA F.I.M. II anno FUNZIONI DI REGRESSIONE E METODO DEI MINIMI QUADRATI Supponiamo di star conducendo uno studio sulla crescita della radice di mais in funzione del contenuto di saccarosio
DettagliCorso in Statistica Medica
Corso in Statistica Medica Introduzione alle tecniche statistiche di elaborazione dati Regressione e correlazione Dott. Angelo Menna Università degli Studi di Chieti G. d Annunziod Annunzio Anno Accademico
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative
DettagliLa regressione lineare semplice
La regressione lineare semplice Il modello di regressione lineare semplice - 1 y = β 0 + βx + ε 10 8 Una retta nel piano Variabile Y 6 4 2 0 0 1 2 3 4 Variabile X 1 Il modello di regressione lineare semplice
DettagliMetodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo
Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è
DettagliCHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)
CHEMIOMETRIA Applicazione di metodi matematici e statistici per estrarre (massima) informazione chimica (affidabile) da dati chimici INCERTEZZA DI MISURA (intervallo di confidenza/fiducia) CONFRONTO CON
DettagliESERCITAZIONI N. 3 corso di statistica
ESERCITAZIONI N 3corso di statistica p 1/18 ESERCITAZIONI N 3 corso di statistica Marco Picone Università Roma Tre ESERCITAZIONI N 3corso di statistica p 2/18 Introduzione Decomposizione della devianza
DettagliIl modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)
Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Quesito: Posso stimare il numero di ore passate a studiare statistica sul voto conseguito all esame? Potrei calcolare il coefficiente di correlazione.
DettagliUniversità del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica
Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Regressione Lineare e Correlazione Argomenti della lezione Determinismo e variabilità Correlazione Regressione Lineare
DettagliStatistica multivariata Donata Rodi 17/10/2016
Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare
DettagliPROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA
PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURA/TECNICA DI ANALISI DEI DATI SPECIFICAMENTE DESTINATA A STUDIARE LA RELAZIONE TRA UNA VARIABILE NOMINALE (ASSUNTA
DettagliStatistica economica
Statistica economica a.a. 013/14 Dr. Luca Secondi 10.a. Output tipico di un modello di regressione lineare multipla 1 Le analisi basate sul modello di regressione prevedono la stima dei coefficienti associati
DettagliIndipendenza, Dipendenza e interdipendenza
Indipendenza, Dipendenza e interdipendenza In analisi bivariata la tabella di contingenza consente di esaminare congiuntamente due variabili consente di rilevare le relazioni esistenti tra le variabili
DettagliDipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli
Dipartimento di Sociologia e Ricerca Sociale Corso di Laurea in Sociologia Insegnamento di Statistica (a.a. 2018-2019) dott.ssa Gaia Bertarelli Esercitazione n. 6 1. Si consideri un campione di 69 persone
Dettaglis a Inferenza: singolo parametro Sistema di ipotesi: : β j = β j0 H 1 β j0 statistica test t confronto con valore t o p-value
Inferenza: singolo parametro Sistema di ipotesi: H 0 : β j = β j0 H 1 : β j β j0 statistica test t b j - b s a jj j0 > t a, 2 ( n-k) confronto con valore t o p-value Se β j0 = 0 X j non ha nessuna influenza
DettagliApplicazione del t-test a dati accoppiati
Applicazione del t-test a dati accoppiati La t-distribution è utile per confrontare dati accoppiati, ovvero osservazioni organizzate a coppie in cui si vuol valutare la differenza tra le coppie L esempio
DettagliRegressione & Correlazione
Regressione & Correlazione Monia Ranalli Ranalli M. Dipendenza Settimana # 4 1 / 20 Sommario Regressione Modello di regressione lineare senplice Stima dei parametri Adattamento del modello ai dati Correlazione
DettagliComprendere i fenomeni vuol dire studiare le relazioni tra 2 o più variabili. Esiste un legame tra le variabili?
Comprendere i fenomeni vuol dire studiare le relazioni tra 2 o più variabili. Esiste un legame tra le variabili? Quale tipo di legame? Quanto forte? Siamo sicuri che non sia dovuto al caso? Tutti i modelli
DettagliStatistica13-23/11/2015
Statistica13-23/11/2015 Voglio studiare due fattori dipendenti uno dall altro L esempio classico sono le rese di macellazione: il peso di un organo aumenta infatti all aumentare del peso dell animale (quale
DettagliRegressione e Correlazione (cap. 11) Importazione dati da file di testo
Regressione e Correlazione (cap. 11) Importazione dati da file di testo Introduzione Nella statistica applicata si osserva la relazione (dipendenza) tra due o più grandezze. Esigenza: determinare una funzione
DettagliSommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25
Sommario Presentazione dell edizione italiana Prefazione xv xiii Capitolo 1 I dati e la statistica 1 Statistica in pratica: BusinessWeek 1 1.1 Le applicazioni in ambito aziendale ed economico 3 Contabilità
DettagliLa media e la mediana sono indicatori di centralità, che indicano un centro dei dati.
La media e la mediana sono indicatori di centralità, che indicano un centro dei dati. Un indicatore che sintetizza in un unico numero tutti i dati, nascondendo quindi la molteplicità dei dati. Per esempio,
DettagliSTATISTICA. Regressione-3 L inferenza per il modello lineare semplice
STATISTICA Regressione-3 L inferenza per il modello lineare semplice Regressione lineare: GRAFICO DI DISPERSIONE & & analisi residui A. Valutazione preliminare se una retta possa essere una buona approssimazione
DettagliMetodi statistici per la ricerca sociale Capitolo 12. Confronto fra gruppi: L analisi della varianza. Esercitazione
Metodi statistici per la ricerca sociale Capitolo 12. Confronto fra gruppi: L analisi della varianza Esercitazione Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università
DettagliMetodologie Quantitative
Metodologie Quantitative Regressione Lineare Nozioni di base M Q Marco Perugini Milano-Bicocca 1 I COMUNICAZIONE MERCOLEDI 11 NOVEMBRE NON CI SARA LEZIONE DI MQ Concetti base Con l analisi di regressione
DettagliStatistica Applicata all edilizia: il modello di regressione
Statistica Applicata all edilizia: il modello di regressione E-mail: orietta.nicolis@unibg.it 27 aprile 2009 Indice Il modello di Regressione Lineare 1 Il modello di Regressione Lineare Analisi di regressione
DettagliLM 88 SOCIOLOGIA E RICERCA SOCIALE. Metodi Statistici per la Ricerca Sociale. Regressione lineare e correlazione
LM 88 SOCIOLOGIA E RICERCA SOCIALE Metodi Statistici per la Ricerca Sociale Regressione lineare e correlazione 1. Su un campione di individui sono rilevati i caratteri X (peso in Kg) e Y (altezza in cm),
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2015-2016 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliSettimana 3. G. M. Marchetti. Marzo 2017
Settimana 3 G. M. Marchetti Marzo 2017 1 / 26 Prima parte Relazioni tra variabili e regressione lineare 2 / 26 Una legge fisica approssimata Il fisico scozzese Forbes 3 / 26 L esperimento di Forbes Sulla
Dettaglilezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1
lezione n. 6 (a cura di Gaia Montanucci) METODO MASSIMA VEROSIMIGLIANZA PER STIMARE β 0 E β 1 Distribuzione sui termini di errore ε i ε i ~ N (0, σ 2 ) ne consegue : ogni y i ha ancora distribuzione normale,
DettagliSTATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE
STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 2 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1.1
DettagliStatistica descrittiva in due variabili
Statistica descrittiva in due variabili 1 / 65 Statistica descrittiva in due variabili 1 / 65 Supponiamo di misurare su un campione statistico due diverse variabili X e Y. Indichiamo come al solito con
DettagliVerifica delle ipotesi
Statistica inferenziale Stima dei parametri Verifica delle ipotesi Concetti fondamentali POPOLAZIONE o UNIVERSO Insieme degli elementi cui si rivolge il ricercatore per la sua indagine CAMPIONE Un sottoinsieme
DettagliMatematica Lezione 22
Università di Cagliari Corso di Laurea in Farmacia Matematica Lezione 22 Sonia Cannas 14/12/2018 Indici di posizione Indici di posizione Gli indici di posizione, detti anche misure di tendenza centrale,
DettagliRegressione lineare. Lo studio della relazione lineare tra due variabili. X e Y caratteri entrambi quantitativi. variabile dipendente
Regressione lineare Se la correlazione misura l intensità e il segno del legame lineare tra due variabili, l obiettivo delle tecniche di regressione è, invece, quello di individuare il tipo di relazione
Dettaglilezione 4 AA Paolo Brunori
AA 2016-2017 Paolo Brunori dove eravamo arrivati - abbiamo individuato la regressione lineare semplice (OLS) come modo immediato per sintetizzare una relazione fra una variabile dipendente (Y) e una indipendente
Dettagliper togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione
Rapporti statistici di composizione la parte rispetto al tutto percentuali di derivazione per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione di frequenza (tassi) rapporti
DettagliDispensa di Statistica
Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza
DettagliCOGNOME.NOME...MATR..
STATISTICA 29.01.15 - PROVA GENERALE (CHALLENGE) Modalità A (A) ai fini della valutazione verranno considerate solo le risposte riportate dallo studente negli appositi riquadri bianchi: in caso di necessità
DettagliREGRESSIONE E CORRELAZIONE
REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.
DettagliEsercitazioni di Statistica Dott.ssa Cristina Mollica
Esercitazioni di Statistica Dott.ssa Cristina Mollica cristina.mollica@uniroma.it Regressione Esercizio. Siano dati i seguenti valori per le due variabili X ed Y: 4 5 3 5 3 3 Con riferimento al modello
DettagliCasa dello Studente. Casa dello Studente
Esercitazione - 14 aprile 2016 ESERCIZIO 1 Di seguito si riporta il giudizio (punteggio da 0 a 5) espresso da un gruppo di studenti rispetto alle diverse residenze studentesche di un Ateneo: a) Si calcolino
DettagliCAPITOLO 11 ANALISI DI REGRESSIONE
VERO FALSO CAPITOLO 11 ANALISI DI REGRESSIONE 1. V F Se c è una relazione deterministica tra due variabili,x e y, ogni valore dato di x,determinerà un unico valore di y. 2. V F Quando si cerca di scoprire
DettagliEsercitazioneII. In questa esercitazione faremi un ripasso generale: rappresentazioni grafiche, medie e varianze;
EsercitazioneII In questa esercitazione faremi un ripasso generale: rappresentazioni grafiche, medie e varianze; la correlazione; la regressione; introduzione alla probabilità. 1 Esercizio 1 Gli stipendi
DettagliCorso di STATISTICA EGA - Classe 1 aa Docenti: Luca Frigau, Claudio Conversano
Corso di STATISTICA EGA - Classe 1 aa 2017-2018 Docenti: Luca Frigau, Claudio Conversano Il corso è organizzato in 36 incontri, per un totale di 72 ore di lezione. Sono previste 18 ore di esercitazione
DettagliESERCIZI. Regressione lineare semplice CAPITOLO 12 Levine, Krehbiel, Berenson, Statistica II ed., 2006 Apogeo
Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università di Padova Docenti: Prof. L. Salmaso, Dott. L. Corain ESERCIZI Regressione lineare semplice
DettagliTest per la correlazione lineare
10 Test per la correlazione lineare Istituzioni di Matematica e Statistica 2015/16 E. Priola 1 Introduzione alla correlazione lineare Problema: In base ai dati che abbiamo possiamo dire che c è una qualche
DettagliMetodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale
DIPARTIMENTO DI SCIENZE AGRARIE E AMBIENTALI PRODUZIONE, TERRITORIO, AGROENERGIA Marco Acutis marco.acutis@unimi.it www.acutis.it CdS Scienze della Produzione e Protezione delle Piante (g59) CdS Biotecnologie
DettagliCorrelazione e regressione
Correlazione e regressione Il termine associazione è largamente usato nella letteratura scientifica ed esprime la relazione che esiste tra due variabili Per studiare l associazione tra due variabili bisogna
DettagliMetodi statistici per la ricerca sociale Capitolo 13. Combinare regressione e ANOVA: predittori categoriali e quantitativi Esercitazione
Metodi statistici per la ricerca sociale Capitolo 13. Combinare regressione e ANOVA: predittori categoriali e quantitativi Esercitazione Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni
DettagliMedia: è la più comune misura di tendenza centrale. Può essere calcolata per variabili numeriche.
Misure di tendenza centrale e di variabilità: Media: è la più comune misura di tendenza centrale. Può essere calcolata per variabili numeriche. Il valore medio di una variabile in un gruppo di osservazioni
DettagliCorso di Psicometria Progredito
Corso di Psicometria Progredito 5. La correlazione lineare Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014 Sommario 1 Tipi di relazione
DettagliCORSO DI LAUREA IN INFERMIERISTICA. LEZIONI DI STATISTICA Parte II Elaborazione dei dati Variabilità
CORSO DI LAUREA IN INFERMIERISTICA LEZIONI DI STATISTICA Parte II Elaborazione dei dati Variabilità Lezioni di Statistica VARIABILITA Si definisce variabilità la proprietà di alcuni fenomeni di assumere
DettagliEsercizio 2: voto e ore dedicate allo studio
La seguente tabella riporta il voto riportato da 10 studenti all esame di Statistica Sociale e il numero di ore di lezione non seguite dallo studente (il corso prevede 30 ore di lezione). Ci si chiede
DettagliEsercitazione 1. 6 Marzo 2019
Esercitazione 1 6 Marzo 019 Esercizio 1 Su un collettivo di 100 appartamenti ubicati nella stessa zona della città vengono rilevati i seguenti caratteri: X 1 affitto mensile pagato dal locatario (in Euro)
DettagliMetodi statistici per la ricerca sociale Capitolo 9. Regressione Lineare e Correlazione Esercitazione
Metodi statistici per la ricerca sociale Capitolo 9. Regressione Lineare e Correlazione Esercitazione Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università degli Studi
DettagliMETODO DEI MINIMI QUADRATI
METODO DEI MINIMI QUADRATI Torniamo al problema della crescita della radice di mais in funzione del contenuto di saccarosio nel terreno di coltura. Ripetendo varie volte l esperimento con diverse quantità
DettagliLezione 18. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 18. A. Iodice
Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 45 Outline 1 2 3 4 5 () Statistica 2 / 45 Modello di In molte applicazioni il ruolo delle variabili
DettagliREGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori
REGRESSIONE lineare e CORRELAZIONE Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori Y X La NATURA e la FORZA della relazione tra variabili si studiano con la REGRESSIONE
DettagliStatistica inferenziale
Dipartimento di Fisica a.a. 2004/2005 Fisica Medica 2 Statistica inferenziale 6/5/2005 Relazione tra dati Possono esistere in uno studio connessioni tra dati differenti che possono legare caratteristiche:
DettagliStima dei parametri di modelli lineari
Stima dei parametri di modelli lineari Indice Introduzione................................ 1 Il caso studio................................ 2 Stima dei parametri............................ 3 Bontà delle
DettagliEsercitazione di Statistica Indici di associazione
Esercitazione di Statistica Indici di associazione 28/10/2015 La relazione tra caratteri Indipendenza logica Quando si suppone che tra due caratteri non ci sia alcuna relazione di causa-effetto. Indipendenza
DettagliSommario. 2 I grafici Il sistema di coordinate cartesiane Gli istogrammi I diagrammi a torta...51
Sommario 1 I dati...15 1.1 Classificazione delle rilevazioni...17 1.1.1 Esperimenti ripetibili (controllabili)...17 1.1.2 Rilevazioni su fenomeni non ripetibili...18 1.1.3 Censimenti...19 1.1.4 Campioni...19
DettagliFacoltà di Psicologia Università di Padova Anno Accademico Corso di Psicometria - Modulo B
Facoltà di Psicologia Università di Padova Anno Accademico 2010-2011 Corso di Psicometria - Modulo B Dott. Marco Vicentini marco.vicentini@unipd.it Rev. 27/12/2010 Regressione lineare Modello geometrico
DettagliRingraziamenti dell Editore
Indice Elenco dei simboli e delle abbreviazioni in ordine di apparizione Ringraziamenti dell Editore XI XVII 1 Introduzione FAQ e qualcos altro, da leggere prima 1 1.1 QuestoèunlibrodiStatistica....................
DettagliStatistica 1 A.A. 2015/2016
Corso di Laurea in Economia e Finanza Statistica 1 A.A. 2015/2016 (8 CFU, corrispondenti a 48 ore di lezione frontale e 24 ore di esercitazione) Prof. Luigi Augugliaro 1 / 35 Il modello di regressione
Dettagli