materiale didattico I incontro

Documenti analoghi
La Regressione X Variabile indipendente o esplicativa. La regressione. La Regressione. Y Variabile dipendente

REGRESSIONE LINEARE. È caratterizzata da semplicità: i modelli utilizzati sono basati essenzialmente su funzioni lineari

LA VARIABILITA. Nella metodologia statistica si distinguono due aspetti della variabilità:

Regressione e correlazione

a) Individuare l intervallo di confidenza al 90% per la media di popolazione;

Contenuti: o Specificazione del modello. o Ipotesi del modello classico. o Stima dei parametri. Regressione semplice Roberta Siciliano 2

TECNICHE DI ANALISI DEI DATI MODELLI LINEARI

TECNICHE DI ANALISI DEI DATI MODELLI LINEARI

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI

Correlazione lineare

Campo di applicazione

Laboratorio 2B A.A. 2012/2013. Elaborazione Dati. Lab 2B CdL Fisica

STATISTICA A K (63 ore) Marco Riani

La regressione. La Regressione. La Regressione. min. min. Var X. X Variabile indipendente (data) Y Variabile dipendente

Relazioni tra variabili: Correlazione e regressione lineare

Relazione funzionale e statistica tra due variabili Modello di regressione lineare semplice Stima puntuale dei coefficienti di regressione

03/03/2012. Campus di Arcavacata Università della Calabria

Ettore Limoli. Lezioni di Matematica Prof. Ettore Limoli. Sommario. Calcoli di regressione

L analisi della correlazione lineare

PIANIFICAZIONE DEI TRASPORTI

I coefficienti di elasticità della domanda: un esposizione algebrico-grafica 1

1) Le medie e le varianze calcolate su n osservazioni relative alle variabili quantitative X ed Y sono tali che. σ x

SERIE STORICHE, TREND, MEDIE MOBILI, REGRESSIONE Andrea Prevete

Correlazione, Regressione, Test non parametrici

Lezioni di Statistica (25 marzo 2013) Docente: Massimo Cristallo

Corso di. Dott.ssa Donatella Cocca

Oltre la regressione lineare

Capitolo 3. Cap. 3-1

IL LEGAME TRA DUE VARIABILI I METODI DELLA CORRELAZIONE

Soluzione esercizi seconda settimana

Esame di Statistica tema B Corso di Laurea in Economia Prof.ssa Giordano Appello del 15/07/2011

Esame di Statistica tema A Corso di Laurea in Economia Prof.ssa Giordano Appello del 15/07/2011

Lezione 4. Politica Economica Avanzata

PREVEDONO: Capitolo 17 del libro di testo. Copyright 2005 The McGraw-Hill Companies srl

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI

Corsi di Laurea in Farmacia e CTF Prova di Matematica

Analisi bivariata con variabili quantitative

RAPPRESENTAZIONE DI MISURE. carta millimetrata

LA VARIABILITA. IV lezione di Statistica Medica

LA CALIBRAZIONE NELL ANALISI STRUMENTALE

Corso di Teoria dei Campioni Facoltà di Economia Corso di Laurea SIGI

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 17/09/2012

PRIMA PROVA INTERMEDIA DI STATISTICA (COD /6045/5047/4038/371/377) 26 ottobre 2015 COMPITO D

REALTÀ E MODELLI SCHEDA DI LAVORO

Scienze Geologiche. Corso di Probabilità e Statistica. Prove di esame con soluzioni

Laboratorio 2B A.A. 2013/2014. Elaborazione Dati. Lab 2B CdL Fisica

Ad esempio, potremmo voler verificare la legge di caduta dei gravi che dice che un corpo cade con velocità uniformemente accellerata: v = v 0 + g t

Sistemi Intelligenti Relazione tra ottimizzazione e statistica - IV Alberto Borghese

S O L U Z I O N I. 1. Effettua uno studio qualitativo della funzione. con particolare riferimento ai seguenti aspetti:

Sistemi di Acquisizione Dati Prof. Alessandro Pesatori

Metodologie informatiche per la chimica

Appunti di statistica descrittiva Versione provvisoria

Fisica Generale I Misure di grandezze fisiche e incertezze di misura Lezione 3 Facoltà di Ingegneria Livio Lanceri

Analisi degli errori. Introduzione J. R. Taylor, Introduzione all analisi degli errori, Zanichelli, Bo 1986

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

Esame di Statistica Corso di Laurea in Economia Prof.ssa Giordano 14 Settembre 2012

Fisica Generale I Misure di grandezze fisiche e incertezze di misura Lezione 3 Facoltà di Ingegneria Livio Lanceri

La t di Student. Per piccoli campioni si definisce la variabile casuale. = s N. detta t di Student.

Regressione lineare con un singolo regressore

La regressione nella stima immobiliare

si utilizzano per confrontare le distribuzioni

Equilibrio e stabilità di sistemi dinamici. Stabilità dell equilibrio di sistemi dinamici non lineari per linearizzazione

PROBLEMA DI SCELTA FRA DUE REGIMI DI

Statistica Descrittiva

ANALISI STATISTICA DELLE INCERTEZZE CASUALI

Matematica II: Calcolo delle Probabilità e Statistica Matematica

Precisione e Cifre Significative

Esame di Statistica TEMA B Corso di Laurea in Economia Prof.ssa S. Giordano 15 Febbraio 2013

Modelli descrittivi, statistica e simulazione

L ANALISI MONOVARIATA: Variabilità e mutabilità. Prof. Maria Carella

Le soluzioni della prova scritta di Matematica per il corso di laurea in Farmacia (raggruppamento M-Z)

Teoria degli errori. La misura implica un giudizio sull uguaglianza tra la grandezza incognita e la grandezza campione. Misure indirette: velocita

Tutorato di Complementi di Analisi Matematica e Statistica 23 e 30 marzo 2017

Probabilità cumulata empirica

Appunti di Matematica 3 - Statistica - Statistica. Introduzione

Elementi di statistica

Capitolo 3 Covarianza, correlazione, bestfit lineari e non lineari

Esame di Statistica Corso di Laurea in Economia Prof.ssa Giordano

Metodologie informatiche per la chimica

I MODELLI LINEARI GENERALIZZATI GLM

Definizione di campione

Misure dirette utilizzate per il calcolo della misura indiretta X:

Università degli Studi di Napoli Parthenope. Facoltà di Scienze Motorie a.a. 2011/2012. Statistica. Lezione IV

Regression analysis. Statistica per la Ricerca Sociale Rocco Micciolo. Es. Table 9.1 Variabili quantitative Response variables Explanatory variables

IL MODELLO DI MACK. Materiale didattico a cura di Domenico Giorgio Attuario Danni di Gruppo Società Cattolica di Assicurazioni

UNIVERSITÀ DEGLI STUDI DI TORINO CORSO DI LAUREA IN CHIMICA Dispense ad esclusivo uso introduttivo per il modulo di Fisica C

Indici di variabilità

Test delle Ipotesi e Analisi della Varianza (ANalysis Of VAriance: ANOVA)

ELEMENTI DI STATISTICA

Lezione n La concentrazione

STATISTICA DESCRITTIVA - SCHEDA N. 5 REGRESSIONE LINEARE

L ANALISI MONOVARIATA: Variabilità e mutabilità. Prof. Maria Carella

x 0 x 50 x 20 x 100 CASO 1 CASO 2 CASO 3 CASO 4 X n X n X n X n

Sistemi Intelligenti Stimatori e sistemi lineari - III

TEMA B. Esame di Statistica del 20 Giugno 2014 Corso di Laurea in Economia Docente: S. Giordano

Sommario. Obiettivo. Quando studiarla? La concentrazione. X: carattere quantitativo tra le unità statistiche. Quando studiarla?

LE FREQUENZE CUMULATE

Appunti di Econometria

Transcript:

Pano Nazonale Lauree Scentfche (PLS 2016-2017) Statstca Laboratoro d Statstca Le relazon tra varabl prof.ssa Angela Mara D'Uggento angelamara.duggento@unba.t materale ddattco I ncontro

Dall anals statstca esploratva a A seconda del numero d varabl consderate, è possble effettuare un anals UNIVARIATA BIVARIATA MULTIVARIATA modell

Anals statstca unvarata Consdera una sola varable quanttatva/qualtatva per volta, ad esempo età, voto, numero scrtt, altezza, resdenza, ttolo studo, genere, ecc. Gl strument d anals: 1. Mede e rappresentazon grafche 2. Varabltà 3. Numer ndc

Anals statstca bvarata Studa due varabl quanttatve/qualtatve contemporaneamente, ad esempo peso/altezza, voto matera X/voto matera Y, numero scrtt/sesso, ttolo d studo/voto d laurea, rsparmo/consumo, ecc. Gl strument: 1. Anals della dpendenza (Regressone semplce) 2. Anals della nterdpendenza (Correlazone semplce) 3. Anals dell ndpendenza (c^2)

Anals statstca multvarata Studa l nfluenza contemporanea d tre o pù varabl Tecnche statstche: 1. Anals fattorale 2. Cluster analyss 3. Scalng Multdmensonale 4. Regressone multpla 5. Correlazone canonca 6. Anals corrspondenze

Regressone, Correlazone, Indpendenza REGRESSIONE CORRELAZIONE INDIPENDENZA Anals della DIPENDENZA tra Y (dpendente) n funzone d due o pù varabl statstche ndpendent X 1,X 2, X n (regressor) Anals della INTERDIPENDENZA ASSOCIAZIONE tra due o pù varabl statstche X 1,X 2, X n Il varare d una delle due varabl statstche X 1 e X 2 NON INFLUENZA, non produce alcun effetto sull altra

Regressone Supponamo d essere nteressat alla relazone tra cfra nvestta n pubblctà (X) e l rtorno n termn d vendte (Y). In realtà c sono altr fattor che nfluenzano l valore d Y per un dato valore d X qual tpo prodotto, fattor economc, luogo d vendta, ecc. Nella raccolta dat s rlevano le coppe d osservazon (x, y ) per ottenere una sere d n coppe d dat: (x 1, y 1 ) (x 2, y 2 ), (x, y ) (x n, y n ). Il grafco che le rappresenta è l grafco a dspersone o scatter plot Altr esemp: X= dmensone della casa (n m 2 ); Y=prezzo d vendta X = n.ro clent contattat; Y = n.ro contratt conclus X= reddto; Y=consumo

Regressone Esempo: un'agenza mmoblare rleva seguent dat: abtazone prezzo (Euro) dmensone (mq) N.ro camere letto N.ro servz 1 689.500 400,0 4 3,5 2 385.000 340,0 5 3,0 3 449.900 326,9 4 2,5 4 949.900 530,0 5 4,0 5 848.000 557,5 4 3,5 6 559.900 368,7 4 3,5 Lo scopo della regressone lneare semplce è quello d ndvduare la eventuale relazone tra le due varabl (rappresentata grafcamente dal grafco a dspersone o scatter) esplctandola attraverso una funzone matematca. Tale modello matematco predce l valore d Y come una funzone lneare della varable ndpendente X. I modell d regressone multpla predcono l valore d Y come funzone d una sere d varabl ndpendent X 1, X 2. X n

Prezzo La varable Y vene detta varable rsposta (o varable dpendente), la varable X vene detta varable esplcatva (o varable ndpendente o regressore). Regressone Per verfcare la presenza d una relazone è opportuno fare l grafco e, qund, ndvduare l modello ed suo parametr Costo delle abtazon 1000000 800000 600000 400000 200000 0 0,0 100,0 200,0 300,0 400,0 500,0 600,0 dmenson della casa (n mq)

Regressone lneare semplce La relazone tra le due varabl è, per semplctà, supposta lneare, pertanto sarà studata attraverso la funzone della retta d regressone che, con dat camponar, è: y 0 1x Varazone casuale dovuta ad altr fattor non msurabl Intercetta. Valore d Y per x=o Coeffcente angolare. Vara tra + e -. Indca come vara n meda Y al varare untaro d X.

Regressone lneare La stma de parametr ncognt della funzone d regressone avvene con l metodo de mnm quadrat. Tale metodo consste nel rendere mnma la dfferenza al quadrato tra valor teorc (valor da modello) e valor emprc (dat osservat) n 1 2 ˆ ) mn y y

Regressone lneare Uguaglando a zero le dervate parzal rspetto a due parametr b 0 e b 1, s gunge al sstema rsolutvo con le formule : ) ) ) ) ( ), var( ) ( ), ( 1 2 1 1 1 0 X Var Y X Co X Dev Y X Codev x x y y x x b x b y b N N

I parametr della retta d regressone b 0 è l ntercetta o termne noto ed esprme l valore d Y quando x=0; b 1 è l coeffcente angolare della retta e qund b E anche detto coeffcente d regressone ed esprme la varazone meda del carattere Y al varare untaro del carattere X. Se b 1 >0 c è dpendenza dretta tra X e Y, coè Y aumenta n meda all aumentare d X; se b 1 <0 c è dpendenza nversa tra X e Y, coè Y dmnusce n meda all aumentare d X; se b 1 =0 v è ndpendenza d Y da X.

Interpolazone ed estrapolazone L nterpolazone s usa per predre valor d Y servendos de valor d X che s trovano all nterno dell ntervallo de dat. L estrapolazone s usa per predre valor d Y servendos de valor d X che s trovano all esterno dell ntervallo de dat. La prma è pù attendble perché non abbamo garanza dell nvaranza del comportamento del fenomeno al d fuor dell ntervallo.

Esempo d calcolo de parametr della retta d regressone X n.ro contatt Y n.ro scrtt 20 14 25 18 30 26 40 32 50 38 x) x y) y x x) y y) x ) 2 x Codev (X,Y) Dev (X) Usare Excel Per stmare parametr Intercetta (per calcolare b 0 ) Pendenza (per calcolare b 1 ) Per vsualzzare equazone ed R^2: Selezonare una delle coppe d punt Premendo l tasto destro del mouse /aggung lnea d tendenza/vsualzza equazone/vsualzza R^2 Per lo svolgmento s veda fle Excel presente nel materale ddattco

Correlazone semplce La correlazone msura l nterdpendenza tra due caratter X 1 ed X 2. n termn d concordanza o dscordanza. In tal caso non è possble dstnguere l carattere dpendente da quello ndpendente. Una msura assoluta della concordanza/dscordanza è la codevanza. Codev( X, Y ) x x) y y) 1 La correlazone s msura con l coeffcente d correlazone r d Bravas Pearson N

Correlazone semplce Codevanza r N N 1 x x) y y) 2 x ) x y y) N 1 1 2 =+1 max concordanza =0 ndfferenza =-1 max dscordanza 1 r 1 Devanza d X e Devanza d Y Il coeffcente d correlazone è anche denotato con r ed ha la stessa nterpretazone

Relazone tra retta d regressone e r (coeffcente d correlazone)

Varanza d regressone Analogamente a quanto detto per la meda, è possble studare la dspersone de valor osservat d Y ntorno alla retta d regressone. Dspersone elevata sgnfca lmtata attendbltà delle prevson fatte con l modello scelto (retta d regressone); l contraro se la dspersone è bassa. L adattamento s msura con R 2. Le tre devanze sono date rspettvamente dalla somma de quadrat de segment vertcal tratteggat. S dmostra che Dev(Y)=Dev(R)+Dev(E)

Indce d determnazone R 2 R R 2 2 0 Dev( R) Dev( Y ) Dev( R) Dev( Y ) N ) yˆ y 1 N 1 1 R 2 1 y y) Dev( E) Dev( Y ) 2 2 1 N ) y yˆ 1 N y y) 1 2 2 R 2 esprme la bontà d adattamento del modello d regressone coè quanta parte della devanza totale d Y è spegata dalla retta scelta R 2 =+1 quando Dev(E)=0 coè tutt punt sono perfettamente allneat su retta regressone R 2 =0 quando Dev(R)=0 coè b 1 =0 coè ndpendenza n meda