Lezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo

Documenti analoghi
Associazione tra caratteri quantitativi: gli indici di correlazione

REGRESSIONE E CORRELAZIONE

Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA

Esercitazione del

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5

SCOPO DELL ANALISI DI CORRELAZIONE

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica

Capitolo 12. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 12.1: Suggerimento

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare

Statistica. Alfonso Iodice D Enza

Esercitazione di Statistica Indici di associazione

Corso di Psicometria Progredito

Statistica. Alfonso Iodice D Enza

STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Σ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

Teoria e tecniche dei test. Concetti di base

Statistica multivariata Donata Rodi 17/10/2016

Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale)

A1. La curva normale (o di Gauss)

Distribuzioni secondo due caratteri. Rappresentazioni e prime sintesi

Statistica di base per l analisi socio-economica

Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale

Esempio sulla media geometrica

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell

Statistiche e relazioni

Indice. 1. Premessa Le relazioni tra coppie di caratteri L analisi della contingenza L analisi della correlazione...

Statistica. Alfonso Iodice D Enza

DISTRIBUZIONE CAMPIONARIA CONGIUNTA

Correlazione. Daniela Valenti, Treccani Scuola 1

Scale Logaritmiche. Matematica con Elementi di Statistica a.a. 2015/16

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

Test per la correlazione lineare

ESERCITAZIONE IV - Soluzioni

Tema d esame del 15/02/12

STATISTICA (modulo I - Statistica Descrittiva) Soluzione Esercitazione I

1 4 Esempio 2. Si determini la distribuzione di probabilità della variabile casuale X = punteggio ottenuto lanciando un dado. Si ha immediatamente:

DISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a Prerequisiti Popolazione, unità, carattere Come nascono i dati:

Statistica Descrittiva III

Trasformazioni Logaritmiche

Università degli Studi di Padova Facoltà di Scienze Politiche

Principi di analisi causale Lezione 3

Analisi delle corrispondenze

Il modello di regressione

Minimi quadrati pesati per la Regressione Lineare

Ringraziamenti dell Editore

Matricola: Corso: 1. (4 Punti) Stimare la variazione del reddito quando il prezzo del prodotto finale raddoppia.

Il Modello di Scomposizione

Indicatori di Posizione e di Variabilità. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica

UNITÀ DIDATTICA 2 LE FUNZIONI

ESERCIZI CORRELAZIONE

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione

E la rappresentazione grafica, in questo caso, è la dispersione x,y, cioè una nuvola di punti nel piano cartesiano

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 4

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura

Esercitazioni di statistica

Capitolo uno STATISTICA DESCRITTIVA BIVARIATA

RELAZIONE TRA DUE VARIABILI QUANTITATIVE

Interpolazione Statistica

ITCS Erasmo da Rotterdam. Anno Scolastico 2014/2015. CLASSE 4^ M Costruzioni, ambiente e territorio

Statistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione

LA RAPPRESENTAZIONE E LA SINTESI DEI DATI

RELAZIONE FINALE DEL DOCENTE. Materia: MATEMATICA E COMPLEMENTI DI MATEMATICA Classe 3PTVE A. S. 2015/2016

UNITÀ DIDATTICA 5 LA RETTA

Fonte: Esempio a fini didattici

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII

Geometria analitica di base (seconda parte)

Statistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione

TEORIA DEGLI ERRORI DI MISURA, IL CALCOLO DELLE INCERTEZZE

Esame di Statistica Seconda Prova Parziale Cognome Nome Matricola

METODO DEI MINIMI QUADRATI

Docente: Fabio Aiello A.A. 2010/11 1

Esercitazioni di statistica

Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii

LEZIONE N. 11 ( a cura di MADDALENA BEI)

Esercizi Svolti. 2. Costruire la distribuzione delle frequenze cumulate del tempo di attesa

Esercitazione II Statistica e Calcolo delle Probabilità (con soluzioni)

Statistica. Campione

Capitolo 3 Sintesi e descrizione dei dati quantitativi

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)

La media da calcolare è rappresentata da (per distribuzioni di frequenza): k

Integrazioni al corso di Economia Politica (anno accademico ) Marianna Belloc

Lezione 4 a - Misure di dispersione o di variabilità

I principali tipi di grafici

Università degli Studi del Piemonte Orientale Facoltà di Scienze M.F.N. Precorso di Matematica APPUNTI (preparati da Pier Luigi Ferrari)

ANALISI DELLE CORRISPONDENZE MULTIPLE (ACM)

Università degli Studi di Napoli Parthenope. Facoltà di Scienze Motorie a.a. 2010/2011 STATISTICA. Docente: Paolo Mazzocchi

Geometria analitica di base. Equazioni di primo grado nel piano cartesiano Funzioni quadratiche Funzioni a tratti Funzioni di proporzionalità inversa

Piano cartesiano e Retta

le scale di misura scala nominale scala ordinale DIAGNOSTICA PSICOLOGICA lezione si basano su tre elementi:

La matrice delle correlazioni è la seguente:

8. ANALISI DELLA COVARIANZA (ANCOVA)

Lab. 2 - Excel. Prof. De Michele e Farina

I 5 principi dell estimo

Transcript:

UIVERSITA DEGLI STUDI DI BASILICATA FACOLTA DI ECOOMIA Corso di laurea in Economia Aziendale anno accademico 2012/2013 Lezioni di Statistica del 15 e 18 aprile 2013 Docente: Massimo Cristallo

LA RELAZIOE TRA FEOMEI In molte applicazioni pratiche si è interessati a stabilire se determinate circostanze influenzano un certo carattere statistico e, nel caso in cui l influenza esista, indagare i modi e l intensità con cui essa si manifesti. Se vi è assenza di qualsiasi legame tra due caratteri X e Y, cioè X è indipendente da X, allora qualunque valore di X non modifica la distribuzione di Y. ESEMPIO (dipendenza tra due caratteri) A) Relazione del carattere reddito con la spesa per consumi.

AALISI DELLA REGRESSIOE Fase 1- Diagramma di dispersione Una relazione fra due caratteri quantitativi si rappresenta ponendo la variabile indipendente sull' asse delle ascisse (simbolizzato da una x) e la variabile dipendente sull'asse delle ordinate (simbolizzata da una y) di un diagramma a dispersione. In corrispondenza di ogni intensità xi, con i = 1, 2,,, si dispone delle manifestazioni di una certa circostanza concomitante. Ogni punto (xi, yi) rappresenta la coppia di valori relativa ad un singolo caso osservato..

AALISI DELLA REGRESSIOE Fase 2 Scelta del tipo di funzione - La rappresentazione grafica dei dati osservati potrà orientarci sulla scelta del tipo di funzione da utilizzare nei casi concreti, salvo che disponiamo di una conoscenza specifica riguardo alla relazione che lega i due caratteri quantitativi in esame. - Per questioni di semplicità, ci limiteremo al caso di una funzione lineare (cioè ad una retta, poiché si dispone di due caratteri quantitativi x e y).

AALISI DELLA REGRESSIOE Fase 3 Stima dei parametri della retta yˆ = α + β x ove si dimostra (con il metodo dei minimi quadrati) che : β = n i = 1 x y i i x y Var ( x) è il coefficiente di regressione di y da x α = y β x è l'intercetta della retta in cui x e y sono, rispettivamente, la media dei caratteri x e y.

AALISI DELLA REGRESSIOE Fase 4 Verifica della bontà di adattamento del modello Esistono una serie di indici che permettono di stabilire se il modello stimato presenta, o meno, un buon adattamento ai dati osservati. L indice più usato al riguardo è l indice di determinazione: R 2 i= 1 i= 1 ( yˆ y ) ( y y ) 2 2 che varia tra 0 (caso di indipendenza) e 1 (caso di perfetto legame funzionale tra i due caratteri). = i i Se il modello è buono, può essere utilizzato per fare previsioni oggetto di indagine. sul fenomeno

AALISI DELL ITERDIPEDEZA In molte situazioni in cui vengono rilevati due caratteri quantitativi x e y non è possibile stabilire quale dei due caratteri sia quello antecedente, pur essendoci tra gli stessi un certo grado di associazione. Si parla in questi casi di analisi dell interdipendenza. Anche in tale analisi, per poter stabilire il tipo di relazione tra i due caratteri, può risultare utile rappresentare i dati osservati, cioè gli punti di coordinate (xi,yi), su un sistema di assi cartesiani ortogonali.

ASPETTI DELL ITERDIPEDEZA Aspetti dell interdipendenza sono la concordanza e la discordanza. Si ha concordanza tra due caratteri quantitativi se ai valori più piccoli di un carattere corrispondono generalmente valori più piccoli dell altro, e se a quelli più grandi corrispondono in genere i valori più grandi. In caso contrario, cioè se ai valori più piccoli di un carattere corrispondono generalmente valori più grandi dell altro, e se a quelli più grandi corrispondono in genere i valori più piccoli, parleremo di discordanza..

UA MISURA ASSOLUTA DELL ITERDIPEDEZA - La Codevianza E evidente che nel caso di concordanza, gli scarti delle diverse modalità dei caratteri x e y rispetto alle rispettive medie saranno, per la maggior parte, entrambi positivi o entrambi negativi, quindi il loro prodotto sarà senz altro positivo. Viceversa, nel caso di discordanza, gli scarti delle diverse modalità dei caratteri x e y rispetto alle rispettive medie saranno, per la maggior parte, di segno contrario, quindi il loro prodotto sarà senz altro negativo. Una misura dell interdipendenza si ottiene, allora, nel modo seguente: ( )( ) Codev(x, y) = x x y y = x y x y i i i i i= 1 i = 1 che, ovviamente, assume valori positivi o negativi, a sec onda che vi sia, rispettivamente, concordanza o discordanza.

UA MISURA DELL ITERDIPEDEZA - La Covarianza Un indicatore più utile è la covarianza, ottenuta rapportando la codevianza al numero delle unità rilevate, in modo da eliminare l influenza della numerosità delle osservazioni. Per le cose dette si ottiene, allora, la seguente formula: ( )( ) xi x yi y xi yi i= 1 i= 1 Cov (x, y) = = x y cheassume valori positivi o negativi a seconda che vi sia, rispettivamente, concordanza o discordanza..b. Si noti la similitudine della formula della covarianza con quella della varianza.infatti,se i caratteri x e y sono coincidenti si ottiene esattamente la formula della varianza.

UA MISURA RELATIVA DELL ITERDIPEDEZA - Il coefficiente di correlazione di Bravais - Pearson La covarianza misura l associazione lineare tra due caratteri quantitativi. Tale misura, però, ha il difetto di essere influenzata dal grado di variabilità dei caratteri esaminati. Per avere un indicatore dell associazione lineare tra due variabili x e y, che risulti indipendente dalla loro variabilità, si ricorre al coefficiente di correlazione r di Bravais Pearson: Cov ( x, y) Codev ( x, y) r = = Var ( x) Var ( y) Dev ( x) Dev ( y) ove il denominatore rappresenta il massimo valore che può assumere il numeratore, e quindi r può assumere valoricompresi tra -1(massima discordanza) e +1 (massima concordanza).

Interpretazione del coefficiente di correlazione di Bravais - Pearson L interpretazione del coefficiente di correlazione è in alcuni casi complicata dalla circostanza che altri fattori variabili influiscono più o meno fortemente quelli presi in considerazione. In questi casi la correlazione tra x e y è per la maggior parte dovuta a quella esistente tra ciascuna variabile e una o più altre variabili. Esempio La correlazione positiva tra la produzione nel tempo di alcune coppie di prodotti agricoli, come ad esempio il grano e il vino, potrebbe essere dovuta all influenza esercitata dalle condizioni meterologiche su entrambi i prodotti considerati.