Metodi statistici per le ricerche di mercato
|
|
- Adriano Campo
- 4 anni fa
- Visualizzazioni
Transcript
1 Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per la comunicazione d'impresa» Un grafico per studiare la relazione tra caratteri quantitativi: lo Scatter-Plot o Grafico di Dispersione Rappresenta la distribuzione unitaria doppia di 2 caratteri quantitativi Sull asse delle ascisse (X) e su quello delle ordinate (Y) sono riportati rispettivamente i valori numerici delle modalità assunti dalle due variabili rilevate su ogni u.s. L insieme di punti così ottenuto si chiama nuvola di punti e consente di studiare la dispersione delle u.s. e la loro somiglianza La forma della nuvola può suggerire l esistenza e la forma della relazione tra i due caratteri Rmer
2 Esempio Distribuzione Unitaria Doppia Unità Vendite Statistica Spesa per pubblicità su radio e TV V en d ite Scatter Plot Spesa per pubblicità radio e TV U.S Rmer Interdipendenza tra due caratteri quantitativi Si considera la distribuzione unitaria di 2 caratteri quantitativi X e Y Si analizza l associazione dei due caratteri attraverso l analisi dello scatter plot o mediante indici simmetrici che valutano la presenza di Concordanza: u.s. con valori piccoli (grandi) di un carattere presentano più frequentemente valori piccoli (grandi) dell altro carattere Discordanza: u.s. con valori piccoli (grandi) di un carattere possiedono più frequentemente valori grandi (piccoli) dell altro carattere 2
3 ...si puo analizzare l interdipendenza graficamente 1. Concordanza: nuvola allungata verso alto a destra 2. Discordanza: nuvola allungata verso alto a sinistra 3. Assenza di interdipendenza lineare: punti sparsi Interdipendenza tra due caratteri quantitativi Per misurare il legame che esiste tra due caratteri quantitativi si utilizza la covarianza, definita come la media dei prodotti degli scostamenti delle variabili X e Y dalle rispettive medie: xy n i 1 ( x M i ) ( y M ) x n i y Questo valore sarà : Nullo nel caso di indipendenza statistica Positivo in caso di concordanza perché al crescere della X anche la Y crescerà di conseguenza le differenze avranno lo stesso segno. Negativo in caso di discordanza, perché all aumentare della X corrisponderà una diminuzione della Y e viceversa. se dividiamo la covarianza per il prodotto delle deviazioni standard delle 2 variabili, otteniamo un valore standardizzato, che oscilla fra 1 e +1: il coefficiente di correlazione r di Pearson 3
4 IL Coefficiente di correlazione lineare di Bravais e Pearson è una misura della relazione lineare esistente tra due variabili ovvero una misura della l interdipendenza che esiste tra le due distribuzioni. r misura una relazione simmetrica di tipo lineare cha varia tra -1 e +1. Convenzionalmente: Esercizio Rappresentare graficamente la relazione tra vendite e spese per pubblicità. Che cosa si può dedurre? Calcolare il coefficiente di correlazione tra i due caratteri. 4
5 Step per calcolare il coefficiente di correlazione 1. Calcolare la media aritmetica di ciascun carattere 2. Calcolare per ciascuna modalità di ciascun carattere gli scarti dalla rispettiva media 3. Ottenere la covarianza Moltiplicare per ciascuna modalità gli scarti dei due caratteri ottenuti al punto 2. Sommare i prodotti così ottenuti. Dividere questa somma dei prodotti per il numero di unità statistiche. 4. Ottenere gli scarti quadratici medi Elevare al quadrato gli scarti dalla media di ciascuna modalità Sommare per ogni carattere i quadrati così ottenuti Dividere ciascuna di queste somme per il numero di unità statistiche per ottenere le varianze. Estrarre le radici quadrate per ottenere gli scarti quadratici medi- 5. Ottenere r 1. Dividere la covarianza (ottenuta al punto 3) per il prodotto degli FSSC scarti quadratici medi dei due caratteri (ottenuti al punto 4). Correlazione e relazione lineare 5
6 Correlazione e relazione lineare r=0,976 Le caratteristiche dei punti-unità espresse dalle due variabili (le due dimensioni del piano cartesiano) possono essere riassunte da una sola la retta. r=0,002 Non è possibile individuare una retta che riassuma le due variabili poiché esse sono indipendenti. Correlazione: esempi Tasso di attività delle donne Tasso di disoccupazione Tasso di disoccupazione giovanile Tasso di disoccupazione Min o r e n n i d e n u n cia ti p e r m in o r e n n i Tasso di disoccupazione Correlazioni tasso di disocc. Correlazione di Pearson Somma dei quadrati e dei prodotti incrociati Covarianza N Minorenni denunciati per 100 Tasso di Tasso di minorenni attività delle disoccupazion in età donne e giovanile anni -,897,976 -, , ,602-45,033-35, ,769-2,
7 Uso del software : la correlazione Analisi della dipendenza lineare tra due variabili quantitative L analisi della dipendenza è asimmetrica: date due variabili quantitative, X e Y, si è interessati a studiare se e in che misura la variabile Y (variabile dipendente ) sia influenzata dalla X (variabile indipendente). Scelta la variabile indipendente X e quella dipendente Y, la rappresentazione grafica della distribuzione unitaria doppia di tali variabili attraverso il grafico di dispersione, consente di individuare la eventuale relazione lineare tra X ed Y. Si è visto che è possibile tracciare una retta, detta interpolante, tra i punti dello scatterplot tale che si avvicini a tutti i punti riproducendo, con una certa approssimazione, la nuvola. 7
8 La funzione della retta La funzione di una retta è la seguente: Y= a+bx dove: a è l intercetta della retta sull asse delle ordinate Y, cioè è il punto in cui la retta interseca l asse Y e quindi è il valore di Y che corrisponde ad un valore di X=0; b è il coefficiente angolare della retta, cioè il valore che indica la sua inclinazione. Se b>0 la retta è ascendente, ossia inclinata dal basso a sinistra verso l alto a destra; se b<0 la retta è discendente, ossia inclinata dal basso a destra verso l alto a sinistra. Nello studio empirico della relazione di dipendenza lineare tra X ed Y l obiettivo è quello di individuare per ciascun punto P i un nuovo punto che sia il più vicino possibile al punto P i pur giacendo sulla retta che passa nella nuvola di punti. La funzione della retta interpolante La differenza tra il valore y i osservato e quello teorico è definito residuo La migliore retta individuabile è quella che rende minimi tali residui 8
9 La relazione lineare tra X e Y e la retta di regressione Come individuare questa retta? Secondo il metodo dei minimi quadrati la migliore retta è quella che rende minima la somma dei quadrati dei residui: questa retta viene chiamata retta di regressione. I. Mingo Come si calcola la retta di regressione: che cosa sono i parametri a e b? I. Mingo
10 Il coefficiente di regressione e il coefficiente di correlazione Come si interpreta Il coefficiente di regressione 10
11 Esercizio Riprendendo la tabella 5 dell esercizio precedente calcolare il coefficiente di regressione tra le vendite (variabile dipendente) e le spese in pubblicità (variabile indipendente), e l intercetta della retta di regressione. Scrivere l equazione della retta di regressione. b=20,03/16,81=1,19 a = M(Y) bm(x) a=10,83-(1,19*11,17)=-2,4623 y i = 2,46 + 1,19x i Valutare la bontà di adattamento della retta di regressione 11
12 Criterio per valutare la bontà di adattamento: il coefficiente di determinazione R 2 Come si interpreta R 2 12
13 Uso del software: regressione Uso del software:output beta=b * DSx/DSy): È un coefficiente indipendente dalle unità di x e y, poiché le variabili indipendenti sono espresse in forma standardizzata (Z-score) - Nella regressione lineare bivariata corrisponde alla r di Pearson Ŷ i =-2,474 +1,192X i R 2 = /3908=0,879 R2 corretto tiene conto dei gradi di libertà del modello, cioè del numero di unità statistiche e del numero di variabili indipendenti (k) e si utilizza nella regressione multipla. gl k n-k+1 N-1 13
14 Esercizio A partire dall output seguente : Disegnare la retta di regressione tra Reddito del nucleo familiare e Costo di richiesta di indennizzo Qual è la correlazione tra le due variabili? Come si può valutare l adattamento della retta di regressione ai punti empirici? Utilizzando il modello lineare, quale sarà il costo di indennizzo medio a fronte di un reddito familiare pari a 91(in migliaia)? Esercizio In una popolazione statistica si è osservato che la relazione tra anni di istruzione (x) e reddito annuo (y) può essere espressa dalla relazione seguente: ŷ= x Se la deviazione standard di x=2 e quella di y=16000, qual è la correlazione tra le due variabili? calcolo 14
15 Numero di variabili e tipi di regressione La regressione multipla I modelli di regressione multipla rappresentano una estensione della regressione bivariata, si utilizzano nei casi in cui la variabile quantitativa dipendente Y è espressa in funzione di più variabili quantitative, definite regressori, che si suppongono indipendenti e di cui si vuole controllare l effetto su quella dipendente. Le variabili devono essere del seguente tipo: variabile dipendente (Y): quantitativa variabili indipendenti (X 1, X 2 X k ): quantitative o dicotomiche. In presenza di due variabili indipendenti si ottiene un piano di regressione In presenza di più di due variabili indipendenti si ottiene un iperpiano. 15
16 La relazione lineare nel caso di più di due variabili Y i = a + b 1 X i1 + b 2 X i2 + b p X ip + ε i = k b p p 1 a ip la variabile osservata Y, nell individuo i-esimo, viene espressa in funzione di p regressori; il parametro a, detto intercetta o costante, è il valore assunto da Y quando tutti i p regressori considerati sono pari a zero, i parametri b p esprimono la variazione media di Y dovuta da ogni variazione unitaria di ciascuno regressore tenendo costanti tutti gli altri. Ogni coefficiente b p esprime l effetto lineare di ogni variabile X p al netto degli effetti delle altre variabili incluse nel modello. Il parametro ε rappresenta l errore che si commette nel predire il valore effettivo di Y mediante il modello lineare adottato. La regressione multipla Si tratta di individuare il migliore iperpiano possibile cioè quello che più si approssima ai valori osservati e dunque che rende minime le differenze tra i valori che il modello ci consente di predire e i valori empirici. Ŷ i = a + b 1 X i1 + b 2 X i2 + b k X ik i 2 k 2 ˆ 2 [ a b )] min i i p 1 p ip 16
17 I coefficienti di regressione parziali ogni coefficiente di regressione b k tra la variabile dipendente e ciascuna variabile indipendente esprime la variazione media del valore della variabile dipendente prodotta da ogni variazione unitaria di ogni regressore, tenendo costanti i valori assunti da tutti gli altri. mediante questo controllo possiamo separare gli effetti netti esercitati da ogni variabile indipendente X k da quelli esercitati dagli altri regressori; Questi coefficienti vengono definiti parziali, perché tengono anche conto dell interdipendenza tra i regressori e della dipendenza della variabile dipendente anche da tutti gli altri regressori inclusi nel modello. Per due regressori: Regressione multipla : usa del software 17
18 R è la correlazione multipla: rappresenta il gradi di associazione globale tra la variabile dipendente e quelle indipendenti. ŷ i = 25,630 +0,093x i1 1,418x i2 R-quadrato è il coefficiente di detrminazione F= (3834,363/2)/(73,637/141)=3671) Test F Si usa nell inferenza. Verifica se il valore campionario di R 2 è significativamente diverso da 0 F è uguale al rapporto tra la devianza media spiegata dalla regressione (media dei quadrati) e la devianza media residua.. Regressione multipla: la multicollinearità La multicollinearità rappresenta un problema per la corretta interpretazione dei coefficienti di regressione Consiste nella eventuale presenza di correlazione tra le variabili indipendenti. Si parla di collinearità perfetta quando tale correlazione è pari a 1, in tal caso l iperpiano di regressione non è univocamente identificabile, poiché è possibile individuare infinite superfici che si adattano ai dati empirici. Nella pratica di ricerca il caso più comune è quello della quasicollinearità) tanto da incidere sull accuratezza dei risultati della regressione: Tanto più elevata è la correlazione tra le variabili indipendenti tanto più instabili saranno i risultati e dunque più difficile stabilirne la significatività statistica. 18
19 Come individuare la multicollinearità 1. Analizzare il coefficiente correlazione bivariato tra le variabili indipendenti a due a due accertando che non sia molto elevato e che non sia maggiore di quello calcolato tra ciascuna delle variabili indipendenti e quella dipendente. 2. Utilizzare gli indici di Tolleranza (tolerance) e VIF (Variance inflaction factor o fattore di accrescimento della varianza). Il primo indice T i = (1-R i ²), in cui R i ² è il coefficiente di determinazione nella regressione della variabile indipendente i-esima sugli altri regressori misura la quantità di varianza di questa variabile che non è spiegata dalle altre variabili indipendenti. Se T i = 1 la collinearietà non esiste; viceversa se T i = 0 allora si è in presenza del problema della collinearità perfetta. Il secondo indice VIF i = 1/ T i costituisce il reciproco di T i, pertanto in caso di multicollinearità il suo valore aumenta perché il denominatore si approssima allo zero. Uso del software 19
20 La Tolleranza *100 è la percentuale della varianza di un dato regressore che non può essere spiegato dall altro regressore. I valori della Tolleranza mostrano che solo il 12% della varianza di ciascun regressore non può essere spiegata dall altro, mentre l 88%può essere spiegata dall altro. L Un fattore di inflazione della varianza (VIF) maggiore di 2 è di solito considerato problematico. In tabella VIF=8,36! Pertanto tra i due regressori esiste collinearità. E opportuno eliminare il regressore meno significativo per il modello. Analisi della dipendenza tra un carattere quantitativo e uno qualitativo L analisi della dipendenza tra due caratteri X e Y, di cui il primo qualitativo e l altro quantitativo, può essere compiuta confrontando i valori medi del carattere quantitativo calcolati nell ambito di ciascuna delle modalità assunte dal carattere qualitativo. Tali valori si definiscono medie condizionate. Si segue un approccio asimmetrico: Si ipotizza che siano le diverse modalità del carattere qualitativo ad influire sui valori che in media il carattere quantitativo assume sulle unità statistiche: si parlerà allora di dipendenza o indipendenza in media di Y da X. Diremo che: Y è indipendente in media da X se i valori medi di Y condizionatamente alle K modalità di X, non variano, cioè: Y è dipendente in media da X se le medie condizionate di Y rispetto a X non sono tutte uguali. Tanto maggiore è la variabilità di tali medie tanto più forte è la dipendenza tra i due caratteri. 20
21 Esempio La spesa media mensile per un determinato prodotto è di euro 42,93. Si evidenziano spese medie differenti a seconda della posizione nella professione degli acquirenti. Spesa media per il prodotto BB per categoria occupazionale degli intervistati. Occupazione Spesa media mensile Freq. Assoluta Varianza di Dirigente 59, ,51 Impiegato 41, ,48 Commerciante 33, ,04 Agricoltore 36, ,8 Artigiano 41, ,41 Operaio 31, ,90 Totale 42, ,76 Si può concludere che sulla spesa per il prodotto BB influisca la categoria occupazionale? L indice è ottenuto rapportandola variabilità spiegata. Indice per misurare la forza di associazione: Eta quadrato L indice eta quadrato rapporta la variabilità spiegata ossia la parte della variabilità totale di Y riprodotta dalle medie condizionate, alla varianza totale di Y. con Variabilità Variabilità totale di Y riprodotta dalle medie condizionate Varianza totale di Y Può assumere valori compresi tra 0 e 1. Tra questi due estremi, i valori di eta quadrato possono essere interpretati come la proporzione della variabilità di un carattere imputabile alle differenti categorie di un altro. 21
22 La varianza delle medie della spesa media (M(Y X)) spiegata dalle categorie occupazionali (X) può essere calcolata nel modo seguente: Eta sarà: In questo caso possiamo dunque concludere che il 57% circa della variabilità della spesa media per il prodotto BB dipende dalla categoria occupazionale dei clienti. 22
23 Uso del software: Valori medi per sottogruppi di popolazione. Confronta medie Uso del software :output La variabilità riprodotta dalle medie condizionate è prossima allo 0% I livelli di soddisfazione riguardanti i due items considerati non si diversificano significativamente tra maschi e femmine. 23
24 Esercizio Il premio ramo vita medio erogato da un assicurazione è di 827 mila euro. Si evidenziano premi differenti a seconda delle ripartizioni delle agenzie. Sapendo che la varianza del premio è di , si può concludere che ci sia una relazione tra ammontare medio del premio e ripartizione geografica? Premi ramo vita Ripartizioni Media N nord-ovest nord-est centro sud isole Totale
Metodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2015-2016 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2018-2019 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliRelazioni Statistiche
Relazioni Statistiche L analisi congiunta di due o più caratteri è utile per studiare le relazioni tra di essi. Analisi dell associazione Indipendenza Interdipendenza Dipendenza Tipi di relazioni tra caratteri
DettagliRappresentazioni grafiche di distribuzioni doppie
Rappresentazioni grafiche di distribuzioni doppie Distribuzione doppia di frequenze Tabella di contingenza Tabella di correlazione Stereogramma Distribuzione unitaria doppia di 2 caratteri quantitativi
DettagliAnalisi bivariata. Il caso di caratteri quantitativi
Analisi bivariata Il caso di caratteri quantitativi Pagina 382 Rappresentazioni grafiche di distribuzioni doppie Distribuzione doppia di frequenze Tabella di contingenza Tabella di correlazione Stereogramma
DettagliCORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Associazione, correlazione e dipendenza tra caratteri In un collettivo di 11 famiglie è stata
DettagliIndice di contingenza quadratica media (phi quadro) χ n
Indice di contingenza quadratica media (phi quadro) Φ χ n Proprietà L influenza del numero di unità n è eliminata Assume valore 0 se X e Y sono perfettamente indipendenti Pagina Indice di Cramer V min
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 015-016 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per la
DettagliStesso valore medio per distribuzioni diverse
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2018-2019 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliL'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale
L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile Corso di Metodologia della ricerca sociale L analisi della varianza (ANOVA) La tecnica con cui si esplorano le relazioni
DettagliRegressione & Correlazione
Regressione & Correlazione Monia Ranalli Ranalli M. Dipendenza Settimana # 4 1 / 20 Sommario Regressione Modello di regressione lineare senplice Stima dei parametri Adattamento del modello ai dati Correlazione
DettagliStesso valore medio per distribuzioni diverse
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 017-018 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per la
Dettaglix, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y )
Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 0/03 lezioni di statistica del 5 e 8 aprile 03 - di Massimo Cristallo - A. Le relazioni tra i fenomeni
DettagliCorso in Statistica Medica
Corso in Statistica Medica Introduzione alle tecniche statistiche di elaborazione dati Regressione e correlazione Dott. Angelo Menna Università degli Studi di Chieti G. d Annunziod Annunzio Anno Accademico
DettagliESERCITAZIONI N. 3 corso di statistica
ESERCITAZIONI N. 3corso di statistica p. 1/18 ESERCITAZIONI N. 3 corso di statistica Marco Picone Università Roma Tre ESERCITAZIONI N. 3corso di statistica p. 2/18 Introduzione Media e Varianza Covarianza
DettagliAnalisi bivariata Il caso di caratteri qualitativi
Analisi bivariata Il caso di caratteri qualitativi Che cosa è l analisi bivariata? E lo studio congiunto di due caratteri Esempio nel caso di caratteri qualitativi: I valori delle celle derivano dall analisi
DettagliAnalisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali
Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Introduzione : analisi delle relazioni tra due caratteristiche osservate sulle stesse unità statistiche studio del comportamento di due caratteri
DettagliLa regressione lineare. Rappresentazione analitica delle distribuzioni
La regressione lineare Rappresentazione analitica delle distribuzioni Richiamiamo il concetto di dipendenza tra le distribuzioni di due caratteri X e Y. Ricordiamo che abbiamo definito dipendenza perfetta
DettagliESERCITAZIONI N. 3 corso di statistica
ESERCITAZIONI N 3corso di statistica p 1/18 ESERCITAZIONI N 3 corso di statistica Marco Picone Università Roma Tre ESERCITAZIONI N 3corso di statistica p 2/18 Introduzione Decomposizione della devianza
DettagliIndipendenza, Dipendenza e interdipendenza
Indipendenza, Dipendenza e interdipendenza In analisi bivariata la tabella di contingenza consente di esaminare congiuntamente due variabili consente di rilevare le relazioni esistenti tra le variabili
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative
DettagliLezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria
Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata Prof. Massimo Aria aria@unina.it Il concetto di interpolazione In matematica, e in particolare in
DettagliSTATISTICA. Esonero 8 novembre 2014 Soluzione. Quesito 1.
STATISTICA Esonero 8 novembre 2014 Soluzione Quesito 1. Si consideri la seguente distribuzione unitaria dei salari degli impiegati di una compagnia (migliaia di euro): 2 3 5 3 2 9 3 7 8 1 a) calcolare
DettagliLezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo
UIVERSITA DEGLI STUDI DI BASILICATA FACOLTA DI ECOOMIA Corso di laurea in Economia Aziendale anno accademico 2012/2013 Lezioni di Statistica del 15 e 18 aprile 2013 Docente: Massimo Cristallo LA RELAZIOE
DettagliCapitolo 12 La regressione lineare semplice
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università
DettagliREGRESSIONE E CORRELAZIONE
REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2016-2017 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliESEMPI DI DOMANDE PER LA PROVA SCRITTA DI STATISTICA SOCIALE
ESERCITAZIONE DI FINE CORSO ESEMPI DI DOMANDE PER LA PROVA SCRITTA DI STATISTICA SOCIALE 1. Si prenda in esame la seguente tabella che riporta la suddivisione di una popolazione femminile per titolo di
DettagliArgomenti della lezione:
Lezione 7 Argomenti della lezione: La regressione semplice Il modello teorico Il calcolo dei parametri Regressione lineare Esamina la relazione lineare tra una o più variabili esplicative (o indipendenti,
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2017-2018 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri
DettagliRegressione Lineare Semplice e Correlazione
Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)
DettagliTeoria e tecniche dei test. Concetti di base
Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi
DettagliSTATISTICA (I modulo - Statistica Descrittiva) Esercitazione I 24/02/2006
STATISTICA (I modulo - Statistica Descrittiva) Esercitazione I 24/02/2006 La seguente tabella contiene i dati inerenti le unità del settore della ristorazione in un dato comune: Unità X 1 X 2 X 3 X 4 X
DettagliPROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA
PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURA/TECNICA DI ANALISI DEI DATI SPECIFICAMENTE DESTINATA A STUDIARE LA RELAZIONE TRA UNA VARIABILE NOMINALE (ASSUNTA
DettagliRegressione lineare. Lo studio della relazione lineare tra due variabili. X e Y caratteri entrambi quantitativi. variabile dipendente
Regressione lineare Se la correlazione misura l intensità e il segno del legame lineare tra due variabili, l obiettivo delle tecniche di regressione è, invece, quello di individuare il tipo di relazione
DettagliMatematica Lezione 22
Università di Cagliari Corso di Laurea in Farmacia Matematica Lezione 22 Sonia Cannas 14/12/2018 Indici di posizione Indici di posizione Gli indici di posizione, detti anche misure di tendenza centrale,
DettagliAssociazione tra caratteri quantitativi: gli indici di correlazione
Associazione tra caratteri quantitativi: gli indici di correlazione Per correlazione si intende una relazione tra due variabili tale che a ciascun valore della prima variabile corrisponda con una certa
DettagliSTATISTICA. Esonero 8 novembre 2014 Soluzione. Quesito 1.
STATISTICA Esonero 8 novembre 2014 Soluzione Quesito 1. Si consideri la seguente distribuzione unitaria dei salari degli impiegati di una compagnia (migliaia di euro): 3 4 6 4 3 10 4 8 9 2 a) calcolare
DettagliCorso di Psicometria Progredito
Corso di Psicometria Progredito 5. La correlazione lineare Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014 Sommario 1 Tipi di relazione
DettagliCorrelazione e regressione
Correlazione e regressione Correlazione 1 Come posso determinare il legame tra due o più variabili? Correlazione COEFFICIENTE DI CORRELAZIONE (r di Pearson) massimo consumo di ossigeno e prestazione nelle
DettagliAnalisi bivariata. Il caso di caratteri qualitativi
Analisi bivariata Il caso di caratteri qualitativi Pagina 337 Che cosa è l analisi bivariata? E lo studio congiunto di due caratteri Esempio nel caso di caratteri qualitativi: I valori delle celle derivano
DettagliLezione 6 Corso di Statistica. Francesco Lagona
Lezione 6 Corso di Statistica Francesco Lagona Università Roma Tre F. Lagona (francesco.lagona@uniroma3.it) 1 / 19 obiettivi della lezione familiarizzare con le ditribuzioni bivariate delle variabili quantitative
DettagliLezione 6 Corso di Statistica. Domenico Cucina
Lezione 6 Corso di Statistica Domenico Cucina Università Roma Tre D. Cucina (domenico.cucina@uniroma3.it) 1 / 17 obiettivi della lezione familiarizzare con le ditribuzioni bivariate delle variabili quantitative
DettagliProva d esame di Statistica - II canale - nuovo ordinamento Dott.ssa C. Conigliani 19/06/2003
19/06/2003 Compito A Esercizio 1. [14 punti] Data la seguente distribuzione doppia secondo i caratteri reddito familiare mensile () e spesa alimentare mensile (): 0 300 300 600 600 e più tot 0 1000 25
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 016-017 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per la
DettagliFondamenti e metodi analisi empirica nelle scienze sociali
CORSO DI FONDAMENTI E METODI PER L'ANALISI EMPIRICA NELLE SCIENZE SOCIALI Distribuzioni statistiche multiple AA 2017/2018 1. Introduzione: il processo di rilevazione e le distribuzioni statistiche. 2.
DettagliEsercitazione di Statistica Indici di associazione
Esercitazione di Statistica Indici di associazione 28/10/2015 La relazione tra caratteri Indipendenza logica Quando si suppone che tra due caratteri non ci sia alcuna relazione di causa-effetto. Indipendenza
DettagliCompiti tematici dai capitoli 2,3,4
Compiti tematici dai capitoli 2,3,4 a cura di Giovanni M. Marchetti 2016 ver. 0.8 1. In un indagine recente, i rispondenti sono stati classificati rispetto al sesso, lo stato civile e l area geografica
DettagliStatistica Descrittiva Soluzioni 7. Interpolazione: minimi quadrati
ISTITUZIONI DI STATISTICA A. A. 2007/2008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona
DettagliLezione 7 Corso di Statistica. Domenico Cucina
Lezione 7 Corso di Statistica Domenico Cucina Università Roma Tre D. Cucina (domenico.cucina@uniroma3.it) 1 / 12 obiettivi della lezione comprendere la retta di regressione e le sue proprietà D. Cucina
DettagliEsercitazione III Soluzione
Esercitazione III Soluzione Esercizio 1 a) Frequenze congiunte assolute: n ij Reddito mensile Titolo di studio 1000-000 000-5000 5000-8000 Totale Laurea triennale 4 1 0 5 Laurea magistrale 1 4 7 Dottorato
DettagliFonti e strumenti statistici per la comunicazione
Fonti e strumenti statistici per la comunicazione Introduzione all analisi bivariata: il caso di caratteri qualitativi Prof.ssa Isabella Mingo A.A. 016-017 Che cosa è l analisi bivariata? E lo studio congiunto
DettagliIl modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)
Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Quesito: Posso stimare il numero di ore passate a studiare statistica sul voto conseguito all esame? Potrei calcolare il coefficiente di correlazione.
DettagliCorrelazione tra due variabili
Correlazione tra due variabili Federico Plazzi 26 Novembre 2015 Correlazione tra due variabili Correlazione tra due variabili Variabili dipendenti e variabili indipendenti La variabile indipendente è quella
DettagliR - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre
R - Esercitazione 6 Andrea Fasulo fasulo.andrea@yahoo.it Università Roma Tre Venerdì 22 Dicembre 2017 Il modello di regressione lineare semplice (I) Esempi tratti da: Stock, Watson Introduzione all econometria
DettagliCORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Misura dell associazione tra due caratteri Uno store manager è interessato a studiare la relazione
DettagliLa regressione lineare semplice
La regressione lineare semplice Il modello di regressione lineare semplice - 1 y = β 0 + βx + ε 10 8 Una retta nel piano Variabile Y 6 4 2 0 0 1 2 3 4 Variabile X 1 Il modello di regressione lineare semplice
DettagliNel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0.
Regressione [] el modello di regressione lineare si assume una relazione di tipo lineare tra il valore medio della variabile dipendente Y e quello della variabile indipendente X per cui Il modello si scrive
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2017-2018 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliDispense Associazione PRELIMINARY DRAFT
Dispense Associazione PRELIMINARY DRAFT Cristina Mollica & Jan Martin Rossi January 3, 2019 1 Esercizio 3 - Prova scritta 12-01-2018 Esercizio 3. Si consideri la distribuzione doppia di un campione di
DettagliMetodologie Quantitative
Metodologie Quantitative Regressione Lineare Nozioni di base M Q Marco Perugini Milano-Bicocca 1 I COMUNICAZIONE MERCOLEDI 11 NOVEMBRE NON CI SARA LEZIONE DI MQ Concetti base Con l analisi di regressione
DettagliCorso di Statistica. Distribuzioni doppie Relazioni tra due variabili. Prof.ssa T. Laureti a.a
Corso di Statistica Distribuzioni doppie Relazioni tra due variabili Prof.ssa T. Laureti a.a. 2013-2014 1 Distribuzione doppia di frequenza Addet ti Genere respons 6 M 6 M 10 F 10 F 7 M 3 M 3 M 6 F 4 F
DettagliCorrelazione lineare e regressione
7c e regressione Se i due caratteri sono entrambi quantitativi, X e Y, possiamo studiare la loro correlazione lineare. Prima di tutto cerchiamo di capire di cosa si tratta. Se elenchiamo le N osservazioni
DettagliRELAZIONE TRA DUE VARIABILI QUANTITATIVE
RELAZIONE TRA DUE VARIABILI QUANTITATIVE Quando si considerano due o più caratteri (variabili) si possono esaminare anche il tipo e l'intensità delle relazioni che sussistono tra loro. Nel caso in cui
DettagliCORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Sintesi a cinque e misure di variabilità rispetto ad un centro Una catena di fast-food ha selezionato
DettagliStesso valore medio per distribuzioni diverse
Fonti e strumenti statistici per la comunicazione Prof.ssa Isabella Mingo A.A. 014-015 Stesso valore medio per distribuzioni diverse u i X 11 X 1 X 13 A 1 1 B 8 1 C 0 1 D 3 3 1 E 19 34 1 F 0 41 1 Un uguale
DettagliSCOPO DELL ANALISI DI CORRELAZIONE
CORRELAZIONE 1 SCOPO DELL ANALISI DI CORRELAZIONE STUDIARE LA RELAZIONE TRA DUE VARIABILI X E Y 2 diagrammi di dispersione un diagramma di dispersione (o grafico di dispersione) èuna rappresentazione grafica
DettagliSTATISTICA (I modulo - Statistica Descrittiva) Soluzione Esercitazione I ( )
STATISTICA (I modulo - Statistica Descrittiva) Soluzione Esercitazione I (09.10.2003) Esercizio A. a) L unità statistica è lo studente che ha sostenuto l esame conclusivo nell ultima sessione. Il collettivo
DettagliLa variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali
Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Introduzione [1/2] Gli indici di variabilità consentono di riassumere le principali caratteristiche di una distribuzione (assieme alle medie) Le
Dettaglidocente: J. Mortera/P. Vicard Nome
A opportuni passaggi). Verrà accettato in consegna solo il presente plico. 2. [9] Una certa zona è servita da 4 compagnie telefoniche. Per ciascuna compagnia è stato rilevato il costo al minuto (in centesimi
DettagliRegressione lineare semplice
Regressione lineare semplice Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Statistica con due variabili var. nominale, var. nominale: gruppo sanguigno - cancro
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@unina.it Università degli studi di Cassino () Statistica 1 / 1 Outline 1 () Statistica 2 / 1 Outline 1 2 () Statistica 2 / 1 Outline 1 2 3 () Statistica 2 / 1
Dettagli3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17
C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica
DettagliDispensa di Statistica
Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza
DettagliIndici di variabilità relativa
Fonti e strumenti statistici per la comunicazione Prof.ssa Isabella Mingo A.A. 2014-2015 Indici di variabilità relativa Consentono di effettuare confronti sulla variabilità di fenomeni che presentano unità
DettagliStatistica descrittiva in due variabili
Statistica descrittiva in due variabili 1 / 65 Statistica descrittiva in due variabili 1 / 65 Supponiamo di misurare su un campione statistico due diverse variabili X e Y. Indichiamo come al solito con
DettagliCopyright Esselibri S.p.A.
70 3000 500 000 1500 1000 500 A B C D (a) Capitolo Terzo A B C D 500 1000 1500 000 5003000 3500 Fig. 1 - Ortogramma a colonne (a) e ortogramma a nastri (b) 4. MISURE DI ASSOCIAZIONE E DI COGRADUAZIONE
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2018-2019 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliMetodi Quantitativi per Economia, Finanza e Management. Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello
Metodi Quantitativi per Economia, Finanza e Management Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello 1. Introduzione ai modelli di regressione 2. Obiettivi 3. Le
DettagliConsideriamo due variabili quantitative Y e X, e supponiamo di essere interessati a comprendere come la Y
1 Analisi della interdipendenza lineare Quando si analizzano due o più caratteri quantitativi si può cercare di individuare una funzione che descriva in modo dettagliato la relazione che emerge dai dati,
DettagliDistribuzioni secondo due caratteri. Rappresentazioni e prime sintesi
Distribuzioni secondo due caratteri Rappresentazioni e prime sintesi Rappresentazioni delle distribuzioni doppie Quando per ogni unità del collettivo rileviamo due caratteri otteniamo una Esempio. Ad alcuni
DettagliAnalisi di Regressione Multipla
Analisi di Regressione Multipla Stima OLS della relazione Test Score/STR : TestScore! = 698.9.8 STR, R =.05, SER = 18.6 (10.4) (0.5) E una stima credibile dell effetto causale sul rendimento nei test di
DettagliUniversità del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare
Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione
DettagliLa media e la mediana sono indicatori di centralità, che indicano un centro dei dati.
La media e la mediana sono indicatori di centralità, che indicano un centro dei dati. Un indicatore che sintetizza in un unico numero tutti i dati, nascondendo quindi la molteplicità dei dati. Per esempio,
Dettaglis a Inferenza: singolo parametro Sistema di ipotesi: : β j = β j0 H 1 β j0 statistica test t confronto con valore t o p-value
Inferenza: singolo parametro Sistema di ipotesi: H 0 : β j = β j0 H 1 : β j β j0 statistica test t b j - b s a jj j0 > t a, 2 ( n-k) confronto con valore t o p-value Se β j0 = 0 X j non ha nessuna influenza
DettagliDipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli
Dipartimento di Sociologia e Ricerca Sociale Corso di Laurea in Sociologia Insegnamento di Statistica (a.a. 2018-2019) dott.ssa Gaia Bertarelli Esercitazione n. 4 1. La seguente tabella riporta la distribuzione
DettagliStatistica descrittiva: analisi di regressione
Statistica descrittiva: analisi di regressione L analisi di regressione permette di esplorare le relazioni tra due insiemi di valori (p.e. i valori di due attributi di un campione) alla ricerca di associazioni.
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@unina.it Università degli studi di Cassino () Statistica 1 / 24 Outline 1 () Statistica 2 / 24 Outline 1 2 () Statistica 2 / 24 Outline 1 2 3 () Statistica 2 /
DettagliSTATISTICA (I modulo - Statistica descrittiva) Esercitazione I ( )
STATISTICA (I modulo - Statistica descrittiva) Esercitazione I (11.19.2003) Esercizio A. Il docente di un corso universitario ha raccolto alcuni dati di un gruppo di studenti che hanno sostenuto l esame
DettagliMetodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo
Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è
DettagliSTATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE
STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 2 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1.1
DettagliMetodi statistici per la ricerca sociale Capitolo 12. Confronto fra gruppi: L analisi della varianza. Esercitazione
Metodi statistici per la ricerca sociale Capitolo 12. Confronto fra gruppi: L analisi della varianza Esercitazione Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università
DettagliStatistica descrittiva
Luigi Vajani Statistica descrittiva r,,, I o -:i f e l ~ 1 (f"i I - / I I - ETASLIBRI Indice XIII Presentazione Parte prima - Introduzione 3 Capitolo 1 - Concetti generali 1.1 - Introduzione; l.2 - La
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2013-2014 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliVogliamo determinare una funzione lineare che meglio approssima i nostri dati sperimentali e poter decidere sulla bontà di questa approssimazione.
S.S.I.S. TOSCANA F.I.M. II anno FUNZIONI DI REGRESSIONE E METODO DEI MINIMI QUADRATI Supponiamo di star conducendo uno studio sulla crescita della radice di mais in funzione del contenuto di saccarosio
DettagliESERCITAZIONE IV - Soluzioni
umero di omicidi ESERCITAZIOE IV - Soluzioni Esercizio I. a),00 12,00 10,00 8,00 6,00 4,00 2,00 0,00 0 5 10 15 20 25 Popolazione povera (%) b) Poiché i due caratteri in analisi sono quantitativi per calcolare
Dettagli