L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale
|
|
- Damiano Bono
- 5 anni fa
- Visualizzazioni
Transcript
1 L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile Corso di Metodologia della ricerca sociale
2 L analisi della varianza (ANOVA) La tecnica con cui si esplorano le relazioni fra una variabile categoriale (nominale oppure ordinale) e una variabile cardinale (o quasi cardinale) si chiama analisi della varianza. L analisi della varianza serve a studiare la relazione tra una variabile categoriale (X) e una variabile cardinale (Y): X è in ipotesi indipendente, le sue singole categorie (modalità) si definiscono gruppi ; Y è in ipotesi dipendente da X. Prof. Stefano Nobile L'analisi bivariata (analisi della varianza e correlazione) 2
3 L analisi della varianza (ANOVA) Le modalità di una variabile cardinale sono troppo numerose perché una tavola di contingenza risulti leggibile, d altro canto è possibile utilizzare misure di sintesi (medie e varianze) non utilizzabili per le variabili categoriali. Dunque se la X è categoriale e la Y è cardinale possiamo confrontare queste misure di sintesi calcolate per la Y entro i gruppi definiti dalla X. Lo scopo dell analisi della varianza è testare l ipotesi che la varianza di Y dipenda da X, o in altre parole che le medie dei gruppi costituiti dalle modalità di X sulla variabile Y siano significativamente differenti. Prof. Stefano Nobile L'analisi bivariata (analisi della varianza e correlazione) 3
4 L analisi della varianza (ANOVA) Esempio: i tassi di omicidio dipendono dal tipo di città nei quali avvengono. L analisi della varianza verifica l ipotesi nulla: H 0 : tutte le medie sono uguali tra di loro Cioè: H 0 : il tasso di omicidi non dipende dal tipo di città dove si verificano L ipotesi alternativa è: Cioè: H 1 : almeno una media è diversa dalle altre H 1 : esiste almeno un gruppo identificato dal tipo di città per cui il tasso di omicidi ha una media diversa da quella di un altra. L ipotesi nulla viene rifiutata se c è almeno un gruppo con una media significativamente diversa da quella di un altro. Prof. Stefano Nobile L'analisi bivariata (analisi della varianza e correlazione) 4
5 Modello teorico: la devianza La devianza rappresenta la somma dei quadrati degli scostamenti tra ogni punteggio e la media. La formula della devianza: N i=1 SQ = y i Ym 2 Viene riferita alle sue due componenti: I diversi tipi di devianza: la devianza totale è la somma dei quadrati degli scarti (differenza tra i singoli punteggi e la media generale della variabile); devianza tra i gruppi: è la somma dei quadrati degli scarti (differenza tra i punteggi medi di gruppo e la media generale), ovvero la variabilità tra i diversi gruppi; devianza entro i gruppi: è la somma dei quadrati degli scarti tra i punteggi di ogni soggetto e la relativa media di gruppo, ovvero alla variabilità dei soggetti all interno di ogni gruppo Prof. Stefano Nobile L'analisi bivariata (analisi della varianza e correlazione) 5
6 La scomposizione della varianza y i y m = (y i y m ) + (y i y m ) Ossia: singolo valore media generale = (singolo valore media entro il gruppo) + (media di gruppo media generale). Elevando al quadrato entrambi i membri dell equazione, si ottiene la devianza, ossia il numeratore della varianza. Prof. Stefano Nobile L'analisi bivariata (analisi della varianza e correlazione) 6
7 p n å i j=1 La scomposizione della varianza å ( y ij - y) 2 º ån ( i y i - y) 2 Å y ij - y i i=1 p i=1 p å i=1 n å i j=1 ( ) 2 Dove p è il numero dei gruppi, n è il numero dei casi, y ij il singolo valore della distribuzione, ŷ la media generale, ŷ i la media dei gruppi. Somma interna dei quadrati (devianza non spiegata) Somma esterna dei quadrati (devianza spiegata) Prof. Stefano Nobile L'analisi bivariata (analisi della varianza e correlazione) 7
8 Devianza spiegata e non spiegata Il concetto di devianza spiegata (e quello di devianza non spiegata) fa riferimento alla capacità esplicativa della variabile categoriale (indipendente): la devianza spiegata è la parte di variabilità della variabile dipendente attribuibile alla variabile indipendente (nell esempio è la parte della variabilità del tasso di omicidi attribuibile al tipo di città); la devianza non spiegata è la parte di variabilità di Y non attribuibile a X (cioè la parte di variabilità del tasso di omicidi non attribuibile al tipo di città). Prof. Stefano Nobile L'analisi bivariata (analisi della varianza e correlazione) 8
9 La devianza totale La variabilità totale della variabile dipendente Y è descritta dalla devianza totale (cioè dalla somma dei quadrati degli scarti dalla media). La somma dei quadrati (SQ) di quanto il tasso di omicidi di ciascuna città si discosta dalla media generale del tasso di omicidi. Prof. Stefano Nobile L'analisi bivariata (analisi della varianza e correlazione) 9
10 La devianza spiegata La variabilità fra i gruppi (definiti dalle modalità di X) è descritta dalla devianza tra i gruppi (cioè dalla somma dei quadrati degli scarti tra le medie dei gruppi e la media generale, detta anche somma esterna dei quadrati o devianza spiegata): La somma dei quadrati di quanto il tasso di omicidi di ciascun gruppo individuato dal tipo di città si discosta dalla media generale del tasso di omicidi. Prof. Stefano Nobile L'analisi bivariata (analisi della varianza e correlazione) 10
11 La scomposizione della varianza Ad ognuna delle devianze sono associati i gradi di libertà: la devianza totale ha n 1 gradi di libertà (dove n è la numerosità dei casi); la devianza tra gruppi ha p 1 gradi di libertà (dove p è il numero dei gruppi); la devianza entro i gruppi ha n p gradi di libertà. Prof. Stefano Nobile L'analisi bivariata (analisi della varianza e correlazione) 11
12 La scomposizione della varianza Dividendo la devianza per i gradi di libertà si ottiene la stima della varianza della popolazione. p ån i i=1 ( y i - y) 2 p-1 p å i=1 n å i ( y ij - y ) 2 i j=1 n- p Varianza tra i gruppi Varianza entro i gruppi Prof. Stefano Nobile L'analisi bivariata (analisi della varianza e correlazione) 12
13 I gradi di libertà Per ottenere le stime della variabile dipendente, una volta che si hanno le somme dei quadrati, sarà sufficiente dividere ciascuna di esse per il numero dei gradi di libertà. N 1 = (N k) + (k 1) Gradi di libertà totali Gradi di libertà interni Gradi di libertà esterni Prof. Stefano Nobile L'analisi bivariata (analisi della varianza e correlazione) 13
14 L analisi della varianza (ANOVA) Tassi di omicidio Città industriali Città commerciali Città politiche Totali 4,3 5,1 12,5 2,8 6,2 3,1 12,3 1,8 1,6 16,3 9,5 6,2 5,9 4,1 3,8 7,7 3,6 7,1 9,1 11,2 11,4 10,2 3,3 1,9 Somme 68,6 44,8 47,6 161,0 Medie 8, ,95 6,71 Numero casi Prof. Stefano Nobile L'analisi bivariata (analisi della varianza e correlazione) 14
15 L analisi della varianza (ANOVA): somma dei quadrati interna Tassi di omicidio Città industriali Città commerciali Città politiche Totali (4,3-8,58) 2 (5,1-5,60) 2 (12,5 5,95) 2 (2,8-8,58) 2 (6,2-5,60) 2 (3,1 5,95) 2 (12,3-8,58) 2 (1,8-5,60) 2 (1,6 5,95) 2 (16,3-8,58) 2 (9,5-5,60) 2 (6,2 5,95) 2 (5,9-8,58) 2 (4,1-5,60) 2 (3,8 5,95) 2 (7,7-8,58) 2 (3,6-5,60) 2 (7,1 5,95) 2 (9,1-8,58) 2 (11,2-5,60) 2 (11,4 5,95) 2 (10,2-8,58) 2 (3,3-5,60) 2 (1,9 5,95) 2 Somme 136,15 73,16 122,06 331,235 Prof. Stefano Nobile L'analisi bivariata (analisi della varianza e correlazione) 15
16 L analisi della varianza (ANOVA): somma dei quadrati esterna Tassi di omicidio Città industriali Città commerciali Città politiche Totali (8,58 6,71) 2 (5,60 6,71) 2 (5,95 6,71) 2 (8,58 6,71) 2 (5,60 6,71) 2 (5,95 6,71) 2 (8,58 6,71) 2 (5,60 6,71) 2 (5,95 6,71) 2 (8,58 6,71) 2 (5,60 6,71) 2 (5,95 6,71) 2 (8,58 6,71) 2 (5,60 6,71) 2 (5,95 6,71) 2 (8,58 6,71) 2 (5,60 6,71) 2 (5,95 6,71) 2 (8,58 6,71) 2 (5,60 6,71) 2 (5,95 6,71) 2 (8,58 6,71) 2 (5,60 6,71) 2 (5,95 6,71) 2 Somme 27,9752 9,8568 4, ,4528 Prof. Stefano Nobile L'analisi bivariata (analisi della varianza e correlazione) 16
17 L analisi della varianza (ANOVA): somma dei quadrati totale SQ totale = SQ interna + SQ esterna SQ totale = 331, ,303 = 373,538 SQ GL Stima Totale 373,538 N 1 = 23 Esterna 42,453 K 1 = 2 21,23 Interna 331,235 N k = 20 16,56 Rapporto F 21,23/16,53 1,28 Prof. Stefano Nobile L'analisi bivariata (analisi della varianza e correlazione) 17
18 Il test F di Fisher Infine, si calcola il test F, che serve a verificare l ipotesi di uguaglianza delle medie confrontando varianza spiegata e varianza non spiegata: varianza tra gruppi F = varianza entro i gruppi Se l ipotesi nulla è vera le due stime della varianza sono uguali; se è falsa la stima esterna è maggiore di quella interna. La statistica F ha una distribuzione campionaria conosciuta, segue una distribuzione F di Fisher, cioè si conosce il suo valore critico in base al quale respingere o accettare H 0 a seconda dei gradi di libertà delle due stime. Esistono tabelle dei valori critici a seconda della significatività e la regola decisionale è: Rifiuto H 0 se F (calcolato) > Fα (tabulato). Prof. Stefano Nobile L'analisi bivariata (analisi della varianza e correlazione) 18
19 La forza della relazione: eta quadrato Il confronto tra le medie dei gruppo può rendere conto della forza della relazione: tanto più le medie differiscono tra loro maggiore sarà la forza della relazione. Esistono però diversi coefficienti per quantificare questa forza, il più semplice è l eta-quadrato, dato dal rapporto tra la somma dei quadrati esterna (cioè la devianza spiegata) e la somma dei quadrati totale (la devianza totale). η 2 = SQ esterna SQ totale Prof. Stefano Nobile L'analisi bivariata (analisi della varianza e correlazione) 19
20 La forza della relazione: eta quadrato Varia tra 0 (assenza di relazione) e 1 (relazione perfetta, tutta la devianza di Y è attribuibile a X) ed è chiamato anche rapporto di correlazione di Pearson. L eta-quadrato risente del numero delle categorie della variabile categoriale, quindi si deve fare attenzione nel confrontare etaquadrati di una stessa Y con X aventi un numero di modalità differenti, inoltre presenta dei problemi se il numero dei casi in ogni gruppo è troppo ridotto. Prof. Stefano Nobile L'analisi bivariata (analisi della varianza e correlazione) 20
21 Correlazione e regressione Nel caso entrambe le variabili siano cardinali è possibile analizzare sia la forza che la forma della relazione, ma è necessario utilizzare due differenti strumenti: la correlazione serve ad analizzare la forza di una relazione; la regressione (la più semplice e utilizzata è quella lineare) permette di analizzarne la forma. Prof. Stefano Nobile L'analisi bivariata (analisi della varianza e correlazione) 21
22 Relazione lineare diretta Prof. Stefano Nobile L'analisi bivariata (analisi della varianza e correlazione) 22
23 Relazione lineare inversa Prof. Stefano Nobile L'analisi bivariata (analisi della varianza e correlazione) 23
24 Relazione non lineare Prof. Stefano Nobile L'analisi bivariata (analisi della varianza e correlazione) 24
25 Assenza di relazione Prof. Stefano Nobile L'analisi bivariata (analisi della varianza e correlazione) 25
26 Correlazione e regressione Questi due strumenti si differenziano anche per quanto riguarda la direzione della relazione: la correlazione serve a quantificare la forza della relazione, dunque non dipende dalla sua direzione (il valore del coefficiente è lo stesso sia che Y dipenda da X sia che X dipenda da Y); la regressione identificando la forma della relazione cambia a seconda della sua direzione: se ipotizziamo che Y dipenda da X avremo una funzione diversa di quella che otterremmo ipotizzando che X dipenda da Y. Prof. Stefano Nobile L'analisi bivariata (analisi della varianza e correlazione) 26
27 Il coefficiente di correlazione Il coefficiente di correlazione r, detto anche coefficiente di correlazione di Bravais- Pearson, misura la forza di una relazione tra due variabili cardinali: Prof. Stefano Nobile L'analisi bivariata (analisi della varianza e correlazione) 27
28 Il coefficiente di correlazione E il rapporto tra la covarianza fra X e Y e il prodotto delle deviazioni standard di X e di Y (se infatti dividiamo tutto per N, cioè per la numerosità campionaria otteniamo la covarianza al numeratore e il prodotto tra le varianze al denominatore). Questo coefficiente non dipende dalla direzione della relazione, e assume valore +1 in caso di perfetta relazione positiva; -1 in caso di perfetta relazione negativa e 0 in assenza di relazione (in caso di relazione perfetta i punti sono tutti allineati su una retta di regressione). Si tratta inoltre di un numero puro, quindi non risente dell unità di misura delle due variabili in analisi. Prof. Stefano Nobile L'analisi bivariata (analisi della varianza e correlazione) 28
29 Coefficiente di correlazione di Pearson Il coefficiente di correlazione di Pearson ha diversi pregi: È insensibile ai mutamenti di scala È sensibile alla vicinanza dei punti alla retta di regressione e quindi misura l esattezza con cui tale retta riproduce i valori di Y sulla base dei valori di y, ossia misura il grado di adattamento. Il suo valore oscilla tra -1 (massima correlazione negativa) e +1 (massima correlazione positiva) Prof. Stefano Nobile L'analisi bivariata (analisi della varianza e correlazione) 29
30 La regressione lineare semplice Descrive la relazione che associa due variabili Viene identificata una funzione matematica (retta) che esprime i valori assunti da un carattere come funzione dei valori assunti da un altro carattere Si cerca di individuare la retta che rappresenti al meglio i punti empirici (dati) viene usato il metodo dei minimi quadrati che minimizza la somma degli scarti tra i valori osservati e quelli teorici (sulla retta). la retta di regressione migliora la previsione del carattere dipendente quando si conosce la modalità del carattere indipendente. Prof. Stefano Nobile L'analisi bivariata (analisi della varianza e correlazione) 30
31 La regressione lineare semplice Prof. Stefano Nobile L'analisi bivariata (analisi della varianza e correlazione) 31
32 La regressione lineare semplice: distorsioni imputabili agli outliers Prof. Stefano Nobile L'analisi bivariata (analisi della varianza e correlazione) 32
33 Il coefficiente di determinazione La devianza totale di un modello di regressione può essere scomposta in due termini: devianza della regressione attribuibile cioè alla relazione che sussiste fra y ed Y, calcolata come differenza dalla retta di regressione dal valore medio. devianza dell errore (devianza residua) che non è imputabile alla relazione fra y ed Y ma ad altri fattori. Calcolata come differenza tra il valore osservato di Y e quello stimato. Prof. Stefano Nobile L'analisi bivariata (analisi della varianza e correlazione) 33
34 Il coefficiente di determinazione R 2 In formula: Il coefficiente di determinazione R 2 : 0 R 2 1 Prof. Stefano Nobile L'analisi bivariata (analisi della varianza e correlazione) 34
35 Il coefficiente di determinazione R 2 Il quadrato del coefficiente r è l Rquadrato. Dunque, se r è pari a 0,5 da un lato possiamo dire che il 25% della variazione della variabile dipendente è spiegata da quella della variabile indipendente, dall altro non possiamo interpretare un r = 0,5 come pari alla metà della correlazione perfetta. Prof. Stefano Nobile L'analisi bivariata (analisi della varianza e correlazione) 35
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Associazione, correlazione e dipendenza tra caratteri In un collettivo di 11 famiglie è stata
DettagliPROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA
PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURA/TECNICA DI ANALISI DEI DATI SPECIFICAMENTE DESTINATA A STUDIARE LA RELAZIONE TRA UNA VARIABILE NOMINALE (ASSUNTA
DettagliStatistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione.
Statistica inferenziale La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione. Verifica delle ipotesi sulla medie Quando si conduce una
DettagliAnalisi della varianza
Analisi della varianza Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona ANALISI DELLA VARIANZA - 1 Abbiamo k gruppi, con un numero variabile di unità statistiche.
DettagliRegressione lineare semplice
Regressione lineare semplice Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Statistica con due variabili var. nominale, var. nominale: gruppo sanguigno - cancro
DettagliIL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI
IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI Perchè confrontare le varianze stimate in due campioni? Torniamo all'esempio dei frinosomi Per poter applicare il test t avevamo detto che le varianze, e
DettagliArgomenti della lezione:
Lezione 13 L analisi della Varianza (ANOVA): il modello lineare Argomenti della lezione: Modello lineare Disegni a una via L Analisi della Varianza (ANOVA): Esamina differenze tra le medie di due o più
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2015-2016 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
Dettaglilezione 4 AA Paolo Brunori
AA 2016-2017 Paolo Brunori dove eravamo arrivati - abbiamo individuato la regressione lineare semplice (OLS) come modo immediato per sintetizzare una relazione fra una variabile dipendente (Y) e una indipendente
DettagliCorso in Statistica Medica
Corso in Statistica Medica Introduzione alle tecniche statistiche di elaborazione dati Regressione e correlazione Dott. Angelo Menna Università degli Studi di Chieti G. d Annunziod Annunzio Anno Accademico
DettagliEsercizi di statistica
Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..
DettagliESEMPI DI DOMANDE PER LA PROVA SCRITTA DI STATISTICA SOCIALE
ESERCITAZIONE DI FINE CORSO ESEMPI DI DOMANDE PER LA PROVA SCRITTA DI STATISTICA SOCIALE 1. Si prenda in esame la seguente tabella che riporta la suddivisione di una popolazione femminile per titolo di
DettagliL Analisi della Varianza ANOVA (ANalysis Of VAriance)
L Analisi della Varianza ANOVA (ANalysis Of VAriance) 1 Concetti generali: Confronto simultaneo tra più di due popolazioni, esempi... La analisi della varianza estende il confronto a p gruppi con p>2.
DettagliNel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0.
Regressione [] el modello di regressione lineare si assume una relazione di tipo lineare tra il valore medio della variabile dipendente Y e quello della variabile indipendente X per cui Il modello si scrive
DettagliLezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria
Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata Prof. Massimo Aria aria@unina.it Il concetto di interpolazione In matematica, e in particolare in
DettagliCapitolo 12 La regressione lineare semplice
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università
DettagliStatistica multivariata Donata Rodi 17/10/2016
Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare
DettagliAnalisi della varianza
1. 2. univariata ad un solo fattore tra i soggetti (between subjects) 3. univariata: disegni fattoriali 4. univariata entro i soggetti (within subjects) 5. : disegni fattoriali «misti» L analisi della
DettagliTecniche statistiche di analisi del cambiamento
Tecniche statistiche di analisi del cambiamento 07a-Ripasso: Anova ad un fattore (v. 1.9a, 29 dicembre 2018) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca
DettagliCorso di Psicometria Progredito
Corso di Psicometria Progredito 5. La correlazione lineare Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014 Sommario 1 Tipi di relazione
DettagliLa regressione lineare semplice
La regressione lineare semplice Il modello di regressione lineare semplice - 1 y = β 0 + βx + ε 10 8 Una retta nel piano Variabile Y 6 4 2 0 0 1 2 3 4 Variabile X 1 Il modello di regressione lineare semplice
DettagliESERCITAZIONI N. 3 corso di statistica
ESERCITAZIONI N. 3corso di statistica p. 1/18 ESERCITAZIONI N. 3 corso di statistica Marco Picone Università Roma Tre ESERCITAZIONI N. 3corso di statistica p. 2/18 Introduzione Media e Varianza Covarianza
DettagliCorrelazione e regressione
Correlazione e regressione Correlazione 1 Come posso determinare il legame tra due o più variabili? Correlazione COEFFICIENTE DI CORRELAZIONE (r di Pearson) massimo consumo di ossigeno e prestazione nelle
DettagliUniversità del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare
Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione
Dettagli3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17
C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica
DettagliSTATISTICA. Esercitazione 5
STATISTICA Esercitazione 5 Esercizio 1 Ad un esame universitario sono stati assegnati in modo casuale due compiti diversi con i seguenti risultati: Compito A Compito B Numero studenti 102 105 Media dei
DettagliArgomenti della lezione:
Lezione 7 Argomenti della lezione: La regressione semplice Il modello teorico Il calcolo dei parametri Regressione lineare Esamina la relazione lineare tra una o più variabili esplicative (o indipendenti,
DettagliIndipendenza, Dipendenza e interdipendenza
Indipendenza, Dipendenza e interdipendenza In analisi bivariata la tabella di contingenza consente di esaminare congiuntamente due variabili consente di rilevare le relazioni esistenti tra le variabili
DettagliREGRESSIONE E CORRELAZIONE
REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.
DettagliRegressione & Correlazione
Regressione & Correlazione Monia Ranalli Ranalli M. Dipendenza Settimana # 4 1 / 20 Sommario Regressione Modello di regressione lineare senplice Stima dei parametri Adattamento del modello ai dati Correlazione
Dettagliper togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione
Rapporti statistici di composizione la parte rispetto al tutto percentuali di derivazione per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione di frequenza (tassi) rapporti
DettagliLa regressione lineare. Rappresentazione analitica delle distribuzioni
La regressione lineare Rappresentazione analitica delle distribuzioni Richiamiamo il concetto di dipendenza tra le distribuzioni di due caratteri X e Y. Ricordiamo che abbiamo definito dipendenza perfetta
DettagliMetodi statistici per la ricerca sociale Capitolo 12. Confronto fra gruppi: L analisi della varianza. Esercitazione
Metodi statistici per la ricerca sociale Capitolo 12. Confronto fra gruppi: L analisi della varianza Esercitazione Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università
DettagliVariabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.
Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:
DettagliRegressione Lineare Semplice e Correlazione
Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)
DettagliMetodi statistici per la ricerca sociale Capitolo 11. Regressione Multipla e Correlazione
Metodi statistici per la ricerca sociale Capitolo 11. Regressione Multipla e Correlazione Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università degli Studi di Firenze
DettagliTeoria e tecniche dei test. Concetti di base
Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi
DettagliMetodi statistici per la ricerca sociale Capitolo 13. Combinare regressione e ANOVA: predittori categoriali e quantitativi
Metodi statistici per la ricerca sociale Capitolo 13. Combinare regressione e ANOVA: predittori categoriali e quantitativi Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA)
DettagliRappresentazioni grafiche di distribuzioni doppie
Rappresentazioni grafiche di distribuzioni doppie Distribuzione doppia di frequenze Tabella di contingenza Tabella di correlazione Stereogramma Distribuzione unitaria doppia di 2 caratteri quantitativi
DettagliLM 88 SOCIOLOGIA E RICERCA SOCIALE. Metodi Statistici per la Ricerca Sociale. Regressione lineare e correlazione
LM 88 SOCIOLOGIA E RICERCA SOCIALE Metodi Statistici per la Ricerca Sociale Regressione lineare e correlazione 1. Su un campione di individui sono rilevati i caratteri X (peso in Kg) e Y (altezza in cm),
DettagliLEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell
LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Strumenti statistici in Excell Pacchetto Analisi di dati Strumenti di analisi: Analisi varianza: ad un fattore Analisi
DettagliUniversità del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare
Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione
Dettaglis a Inferenza: singolo parametro Sistema di ipotesi: : β j = β j0 H 1 β j0 statistica test t confronto con valore t o p-value
Inferenza: singolo parametro Sistema di ipotesi: H 0 : β j = β j0 H 1 : β j β j0 statistica test t b j - b s a jj j0 > t a, 2 ( n-k) confronto con valore t o p-value Se β j0 = 0 X j non ha nessuna influenza
DettagliSommario. 2 I grafici Il sistema di coordinate cartesiane Gli istogrammi I diagrammi a torta...51
Sommario 1 I dati...15 1.1 Classificazione delle rilevazioni...17 1.1.1 Esperimenti ripetibili (controllabili)...17 1.1.2 Rilevazioni su fenomeni non ripetibili...18 1.1.3 Censimenti...19 1.1.4 Campioni...19
DettagliStatistica economica
Statistica economica a.a. 013/14 Dr. Luca Secondi 10.a. Output tipico di un modello di regressione lineare multipla 1 Le analisi basate sul modello di regressione prevedono la stima dei coefficienti associati
DettagliSTATISTICA MULTIVARIATA SSD MAT/06
Università degli studi di Ferrara Dipartimento di Matematica A.A. 2018/2019 I semestre STATISTICA MULTIVARIATA SSD MAT/06 LEZIONE 4 - Questioni di analisi e applicazione della regressione lineare Pratica
DettagliEsercitazione del
Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36
DettagliSTATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE
STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 2 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1.1
DettagliMetodologie Quantitative
Metodologie Quantitative Regressione Lineare Nozioni di base M Q Marco Perugini Milano-Bicocca 1 I COMUNICAZIONE MERCOLEDI 11 NOVEMBRE NON CI SARA LEZIONE DI MQ Concetti base Con l analisi di regressione
DettagliUniversità del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica
Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Regressione Lineare e Correlazione Argomenti della lezione Determinismo e variabilità Correlazione Regressione Lineare
DettagliR - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre
R - Esercitazione 6 Andrea Fasulo fasulo.andrea@yahoo.it Università Roma Tre Venerdì 22 Dicembre 2017 Il modello di regressione lineare semplice (I) Esempi tratti da: Stock, Watson Introduzione all econometria
DettagliCONFRONTO TRA LA MEDIE DI DUE CAMPIONI INDIPENDENTI
CONFRONTO TRA LA MEDIE DI DUE CAMPIONI INDIPENDENTI ipotesi sul confronto tra le medie di due campioni indipendenti Obiettivo: decidere, attraverso il confronto tra le medie dei due campioni indipendenti,
DettagliAnalisi della varianza a una via
Analisi della varianza a una via Statistica descrittiva e Analisi multivariata Prof. Giulio Vidotto PSY-NET: Corso di laurea online in Discipline della ricerca psicologico-sociale SOMMARIO Modelli statistici
DettagliTRACCIA DI STUDIO. Test di confronto per misure qualitative. Verifica di ipotesi
TRACCIA DI STUDIO Verifica di ipotesi Nelle analisi statistiche di dati sperimentali riguardanti più gruppi di studio (talvolta più variabili) si pone come ipotesi da verificare la cosiddetta ipotesi zero:
DettagliTECNICHE DI ANALISI DEI DATI
TECNICE DI ANALISI DEI DATI AA 08/09 PRO. V.P. SENESE Questi materiali sono disponibili per tutti gli studenti al seguente indirizzo: https://goo.gl/xy5fr Seconda Università di Napoli (SUN) Dipartimento
DettagliMetodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo
Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è
DettagliElementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 19-Rapporto fra varianze e 20-Introduzione all Anova vers. 1.0 (5 dicembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia,
DettagliPremessa: la dipendenza in media
Premessa: la dipendenza in media Supponiamo di avere K diversi livelli di un fattore che potrebbero influire su una determinata variabile. Per esempio supponiamo di domandarci se la diversificazione (intesa
DettagliMetodi statistici per la ricerca sociale Capitolo 13. Combinare regressione e ANOVA: predittori categoriali e quantitativi Esercitazione
Metodi statistici per la ricerca sociale Capitolo 13. Combinare regressione e ANOVA: predittori categoriali e quantitativi Esercitazione Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni
DettagliSTATISTICA. Regressione-2
STATISTICA Regressione-2 Esempio Su un campione di =5unità sono state osservate due variabili, ed : x i 1 2 3 4 5 y i 1.5 2.5 3 2.5 3.5 1. Rappresentare l andamento congiunto di in funzione di mediante
DettagliUlteriori Conoscenze di Informatica e Statistica
Ulteriori Conoscenze di Informatica e Statistica Carlo Meneghini Dip. di fisica via della Vasca Navale 84, st. 83 (I piano) tel.: 06 55 17 72 17 meneghini@fis.uniroma3.it Tassi e proporzioni Classi nominali:
DettagliMetodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale
DIPARTIMENTO DI SCIENZE AGRARIE E AMBIENTALI PRODUZIONE, TERRITORIO, AGROENERGIA Marco Acutis marco.acutis@unimi.it www.acutis.it CdS Scienze della Produzione e Protezione delle Piante (g59) CdS Biotecnologie
DettagliDispensa di Statistica
Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza
DettagliEsercizi su Regressione e Connessione
Esercizi su Regressione e Connessione Stefano Cabras 31 marzo 2009 Sommario Questa serie di esercizi è principalmente incentrata sulla regressione e la connessione, tuttavia in alcuni esercizi le soluzioni
DettagliContenuti: Capitolo 14 del libro di testo
Test d Ipotesi / TIPICI PROBLEMI DI VERIFICA DI IPOTESI SONO Test per la media Test per una proporzione Test per la varianza Test per due campioni indipendenti Test di indipendenza Contenuti Capitolo 4
DettagliModelli e procedure per l educazione degli adulti
CdL SEAFC a.a. 2016-2017 II semestre Pedagogia sperimentale. Modelli e procedure per l educazione degli adulti francesco.agrusti@uniroma3.it T6. Modelli e procedure di valutazione Ultimo appuntamento con
DettagliCorso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII
Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Un breve richiamo sul test t-student Siano A exp (a 1, a 2.a n ) e B exp (b 1, b 2.b m ) due set di dati i cui
DettagliMatematica Lezione 22
Università di Cagliari Corso di Laurea in Farmacia Matematica Lezione 22 Sonia Cannas 14/12/2018 Indici di posizione Indici di posizione Gli indici di posizione, detti anche misure di tendenza centrale,
DettagliLezione 4 a - Misure di dispersione o di variabilità
Lezione 4 a - Misure di dispersione o di variabilità Abbiamo visto che la media è una misura della localizzazione centrale della distribuzione (il centro di gravità). Popolazioni con la stessa media possono
DettagliStatistica descrittiva: analisi di regressione
Statistica descrittiva: analisi di regressione L analisi di regressione permette di esplorare le relazioni tra due insiemi di valori (p.e. i valori di due attributi di un campione) alla ricerca di associazioni.
DettagliElementi di Psicometria (con laboratorio software 1)
Elementi di Psicometria (con laboratorio software 1) 05-La verifica delle ipotesi con le medie dei campioni (v. 1.0, 15 aprile 2019) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia,
DettagliTest F per la significatività del modello
Test F per la significatività del modello Per verificare la significatività dell intero modello si utilizza il test F Si vuole verificare l ipotesi H 0 : β 1 = 0,, β k = 0 contro l alternativa che almeno
DettagliCasa dello Studente. Casa dello Studente
Esercitazione - 14 aprile 2016 ESERCIZIO 1 Di seguito si riporta il giudizio (punteggio da 0 a 5) espresso da un gruppo di studenti rispetto alle diverse residenze studentesche di un Ateneo: a) Si calcolino
DettagliCorso di STATISTICA EGA - Classe 1 aa Docenti: Luca Frigau, Claudio Conversano
Corso di STATISTICA EGA - Classe 1 aa 2017-2018 Docenti: Luca Frigau, Claudio Conversano Il corso è organizzato in 36 incontri, per un totale di 72 ore di lezione. Sono previste 18 ore di esercitazione
DettagliStatistica multivariata Donata Rodi 08/11/2016
Statistica multivariata Donata Rodi 08/11/2016 MANOVA: Multivariate Analysis of Variance Due o più variabili dipendenti quantitative Una o più variabili indipendenti categoriali (con più livelli) Residui
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2016-2017 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliESERCITAZIONI N. 3 corso di statistica
ESERCITAZIONI N 3corso di statistica p 1/18 ESERCITAZIONI N 3 corso di statistica Marco Picone Università Roma Tre ESERCITAZIONI N 3corso di statistica p 2/18 Introduzione Decomposizione della devianza
DettagliApplicazioni statistiche e utilizzo del package statistico Spss - 7
Applicazioni statistiche e utilizzo del package statistico Spss - 7 CISI 27 gennaio 2005 ricercapsicologica@tiscali.it Illustrare le principali statistiche mono e bivariate. Valutare quando è opportuno
DettagliCognome e nome Tempo disponibile: 75 minuti
Corso di Laurea in Biotecnologia Statistica medica. A.A. 2010-2011 21 giugno 2011 Cognome e nome Tempo disponibile: 75 minuti 1. Immaginate di condurre uno studio sperimentale in cui si confronta l effetto
DettagliAnalisi della varianza
Università degli Studi di Padova Facoltà di Medicina e Chirurgia Facoltà di Medicina e Chirurgia - A.A. 2009-10 Scuole di specializzazione Lezioni comuni Disciplina: Statistica Docente: dott.ssa Egle PERISSINOTTO
DettagliSTATISTICA A K (60 ore)
STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta
DettagliLA REGRESSIONE LINEARE SEMPLICE
LA REGRESSIONE LINEARE SEMPLICE Se due variabili X e Y sono tra loro correlate, e sono entrambe su scala a intervalli o rapporti equivalenti, la tecnica statistica della regressione lineare consente di
DettagliAnova e regressione. Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Universitá degli Studi di Perugia 22 marzo 2011
Anova e regressione Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Universitá degli Studi di Perugia 22 marzo 2011 Nella sperimentazione agronomica e biologica in genere è normale organizzare
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2018-2019 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliMetodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale
DIPARTIMENTO DI SCIENZE AGRARIE E AMBIENTALI PRODUZIONE, TERRITORIO, AGROENERGIA Marco Acutis marco.acutis@unimi.it www.acutis.it CdS Scienze della Produzione e Protezione delle Piante (g59) CdS Biotecnologie
DettagliCapitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson. Casa editrice: Pearson
Levine, Krehbiel, Berenson Statistica II ed. Casa editrice: Pearson Capitolo 10 Test basati su due campioni e ANOVA a una via Insegnamento: Statistica Corsi di Laurea Triennale in Economia Dipartimento
DettagliSTATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo
STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)
DettagliStatistica descrittiva
Luigi Vajani Statistica descrittiva r,,, I o -:i f e l ~ 1 (f"i I - / I I - ETASLIBRI Indice XIII Presentazione Parte prima - Introduzione 3 Capitolo 1 - Concetti generali 1.1 - Introduzione; l.2 - La
DettagliL'analisi monovariata
L'analisi monovariata Prof. Stefano Nobile Corso di Metodologia della ricerca sociale Concetti introduttivi: analisi mono-, bi- e multivariata ANALISI MONOVARIATA Una tecnica di analisi di dice monovariata
DettagliSCOPO DELL ANALISI DI CORRELAZIONE
CORRELAZIONE 1 SCOPO DELL ANALISI DI CORRELAZIONE STUDIARE LA RELAZIONE TRA DUE VARIABILI X E Y 2 diagrammi di dispersione un diagramma di dispersione (o grafico di dispersione) èuna rappresentazione grafica
DettagliLa statistica è la scienza che permette di conoscere il mondo intorno a noi attraverso i dati.
RICHIAMI DI STATISTICA La statistica è la scienza che permette di conoscere il mondo intorno a noi attraverso i dati. Quale è la media della distribuzione del reddito dei neolaureati? Per rispondere dovremmo
DettagliRegressione lineare. Lo studio della relazione lineare tra due variabili. X e Y caratteri entrambi quantitativi. variabile dipendente
Regressione lineare Se la correlazione misura l intensità e il segno del legame lineare tra due variabili, l obiettivo delle tecniche di regressione è, invece, quello di individuare il tipo di relazione
DettagliLa media e la mediana sono indicatori di centralità, che indicano un centro dei dati.
La media e la mediana sono indicatori di centralità, che indicano un centro dei dati. Un indicatore che sintetizza in un unico numero tutti i dati, nascondendo quindi la molteplicità dei dati. Per esempio,
DettagliLa media e la mediana sono indicatori di centralità, che indicano un centro dei dati.
La media e la mediana sono indicatori di centralità, che indicano un centro dei dati. Un indicatore che sintetizza in un unico numero tutti i dati, nascondendo quindi la molteplicità dei dati. Per esempio,
DettagliRingraziamenti dell Editore
Indice Elenco dei simboli e delle abbreviazioni in ordine di apparizione Ringraziamenti dell Editore XI XVII 1 Introduzione FAQ e qualcos altro, da leggere prima 1 1.1 QuestoèunlibrodiStatistica....................
DettagliRelazioni Statistiche
Relazioni Statistiche L analisi congiunta di due o più caratteri è utile per studiare le relazioni tra di essi. Analisi dell associazione Indipendenza Interdipendenza Dipendenza Tipi di relazioni tra caratteri
Dettagli