Appunti di statistica descrittiva Versione provvisoria



Documenti analoghi
Ettore Limoli. Lezioni di Matematica Prof. Ettore Limoli. Sommario. Calcoli di regressione

Capitolo 3. Cap. 3-1

1) Le medie e le varianze calcolate su n osservazioni relative alle variabili quantitative X ed Y sono tali che. σ x

materiale didattico I incontro

Laboratorio 2B A.A. 2012/2013. Elaborazione Dati. Lab 2B CdL Fisica

TECNICHE DI ANALISI DEI DATI MODELLI LINEARI

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI

TECNICHE DI ANALISI DEI DATI MODELLI LINEARI

Regressione e correlazione

PIANIFICAZIONE DEI TRASPORTI

Corsi di Laurea in Farmacia e CTF Prova di Matematica

Modelli descrittivi, statistica e simulazione

Corso di. Dott.ssa Donatella Cocca

La Regressione X Variabile indipendente o esplicativa. La regressione. La Regressione. Y Variabile dipendente

S O L U Z I O N I. 1. Effettua uno studio qualitativo della funzione. con particolare riferimento ai seguenti aspetti:

a) Individuare l intervallo di confidenza al 90% per la media di popolazione;

STATISTICA DESCRITTIVA CON EXCEL

REGRESSIONE LINEARE. È caratterizzata da semplicità: i modelli utilizzati sono basati essenzialmente su funzioni lineari

Relazioni tra variabili: Correlazione e regressione lineare

y. E' semplicemente la media calcolata mettendo

* PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE *

Campo di applicazione

Ad esempio, potremmo voler verificare la legge di caduta dei gravi che dice che un corpo cade con velocità uniformemente accellerata: v = v 0 + g t

03/03/2012. Campus di Arcavacata Università della Calabria

PRIMA PROVA INTERMEDIA DI STATISTICA (COD /6045/5047/4038/371/377) 26 ottobre 2015 COMPITO D

Contenuti: o Specificazione del modello. o Ipotesi del modello classico. o Stima dei parametri. Regressione semplice Roberta Siciliano 2

L analisi della correlazione lineare

STATISTICA DESCRITTIVA - SCHEDA N. 5 REGRESSIONE LINEARE

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 17/09/2012

Lezioni di Statistica (25 marzo 2013) Docente: Massimo Cristallo

Correlazione lineare

PROCEDURA INFORMATIZZATA PER LA COMPENSAZIONE DELLE RETI DI LIVELLAZIONE. (Metodo delle Osservazioni Indirette) - 1 -

La t di Student. Per piccoli campioni si definisce la variabile casuale. = s N. detta t di Student.

x 0 x 50 x 20 x 100 CASO 1 CASO 2 CASO 3 CASO 4 X n X n X n X n

STATISTICA A K (63 ore) Marco Riani

Matematica Computazionale(6cfu) Ottimizzazione(8cfu)

IL LEGAME TRA DUE VARIABILI I METODI DELLA CORRELAZIONE

L ANALISI MONOVARIATA: Variabilità e mutabilità. Prof. Maria Carella

Esame di Statistica tema B Corso di Laurea in Economia Prof.ssa Giordano Appello del 15/07/2011

REALTÀ E MODELLI SCHEDA DI LAVORO

LA CALIBRAZIONE NELL ANALISI STRUMENTALE

Matematica II: Calcolo delle Probabilità e Statistica Matematica

LEZIONE 2. Riassumere le informazioni: LE MEDIE MEDIA ARITMETICA MEDIANA, MODA, QUANTILI. La media aritmetica = = N

ANALISI STATISTICA DELLE INCERTEZZE CASUALI

Scienze Geologiche. Corso di Probabilità e Statistica. Prove di esame con soluzioni

L'Analisi in Componenti Principali. Luigi D Ambra Dipartimento di Matematica e Statistica Università di Napoli Federico II

RAPPRESENTAZIONE DI MISURE. carta millimetrata

L ANALISI MONOVARIATA: Variabilità e mutabilità. Prof. Maria Carella

Lezione 2 a - Statistica descrittiva per variabili quantitative

Sommario. Obiettivo. Quando studiarla? La concentrazione. X: carattere quantitativo tra le unità statistiche. Quando studiarla?

I generatori dipendenti o pilotati e gli amplificatori operazionali

Misure dirette utilizzate per il calcolo della misura indiretta X:

LABORATORIO II. 1 La retta di regressione. NB create un nuovo foglio di lavoro

Capitolo 3 Covarianza, correlazione, bestfit lineari e non lineari

Misure indipendenti della stessa grandezza, ciascuna con una diversa precisione.

Esame di Statistica Corso di Laurea in Economia Prof.ssa Giordano

Relazione funzionale e statistica tra due variabili Modello di regressione lineare semplice Stima puntuale dei coefficienti di regressione

Esame di Statistica tema A Corso di Laurea in Economia Prof.ssa Giordano Appello del 15/07/2011

Analisi degli errori. Introduzione J. R. Taylor, Introduzione all analisi degli errori, Zanichelli, Bo 1986

Esame di Statistica Corso di Laurea in Economia Prof.ssa Giordano 14 Settembre 2012

Propagazione delle incertezze

La regressione. La Regressione. La Regressione. min. min. Var X. X Variabile indipendente (data) Y Variabile dipendente

Lezione 2 le misure di sintesi: le medie

Elementi di statistica

Sistemi Intelligenti Stimatori e sistemi lineari - III

4.6 Dualità in Programmazione Lineare

LA VARIABILITA. Nella metodologia statistica si distinguono due aspetti della variabilità:

Laboratorio 2B A.A. 2013/2014. Elaborazione Dati. Lab 2B CdL Fisica

Correlazione, Regressione, Test non parametrici

Lezione 2 a - Statistica descrittiva per variabili quantitative

3 CAMPIONAMENTO DI BERNOULLI E DI POISSON

Le soluzioni della prova scritta di Matematica per il corso di laurea in Farmacia (raggruppamento M-Z)

INTRODUZIONE ALL ESPERIENZA 4: STUDIO DELLA POLARIZZAZIONE MEDIANTE LAMINE DI RITARDO

Le quote e q sono incognite. Il sistema è ridondante: 3 equazioni (osservazioni) e 2 incognite.

PREVEDONO: Capitolo 17 del libro di testo. Copyright 2005 The McGraw-Hill Companies srl

ELEMENTI DI STATISTICA

Modello del Gruppo d Acquisto

Soluzione esercizi seconda settimana

SERIE STORICHE, TREND, MEDIE MOBILI, REGRESSIONE Andrea Prevete

Richiami di modelli di utilità aleatoria

UNIVERSITÀ DEGLI STUDI DI TORINO CORSO DI LAUREA IN CHIMICA Dispense ad esclusivo uso introduttivo per il modulo di Fisica C

RICHIAMI SULLA RAPPRESENTAZIONE IN COMPLEMENTO A 2

Università di Cassino Corso di Statistica 1 Esercitazione del 17/10/2006 Dott. Alfonso Piscitelli. Esercizio 1

Corso di Architettura (Prof. Scarano) 25/03/2002

si utilizzano per confrontare le distribuzioni

CORRETTA RAPPRESENTAZIONE DI UN RISULTATO: LE CIFRE SIGNIFICATIVE

Funzione di matrice. c i λ i. i=0. i=0. m 1. γ i A i. i=0. Moltiplicando entrambi i membri di questa equazione per A si ottiene. α i 1 A i α m 1 A m

Università degli Studi di Urbino Facoltà di Economia

Variabili statistiche - Sommario

Regressioni con variabili strumentali

IMPIANTI E PROCESSI CHIMICI. Tema A 13 Giugno 2011 Colonna binaria

Specifica calcolo soddisfazione discenti

La resistività apparente viene ricavata dalla relazione:

Incertezza di sensibilità < fluttuazione intrinseca delle misure.

Fisica Generale I Misure di grandezze fisiche e incertezze di misura Lezione 3 Facoltà di Ingegneria Livio Lanceri

Statistica descrittiva

Esercitazione 8 del corso di Statistica (parte 1)

POLITECNICO DI TORINO

Transcript:

Alessandro Benedett UnCAM-SSIS-FIM.04/3 Appunt d statstca descrttva Versone provvsora (v. allegato foglo Excel LDS4_Correlazone.xls) Correlazone e Regressone lneare La teora della correlazone s propone d stablre quanto stretta sa l nterdpendenza tra due caratter quanttatv d un dato fenomeno. La teora della regressone s occupa d formalzzare l legame funzonale tra due varabl che esprmono due caratter quanttatv X e Y, esprmendolo nella forma Y=f(X). Se l legame è lneare, coè del tpo Y=aX+b, s parlerà d regressone lneare; s dovranno valutare parametr a e b. Correlazone calcolo dalla formula Se la dpendenza tra due varabl è d tpo lneare, l loro grado d nterdpendenza è valutato dal coeffcente d correlazone lneare r, defnto dalla formula ( x x) ( y y) r = ( x x) ( y y) Intanto possamo costrure un grafco a dspersone utlzzando la creazone gudata de grafc n Excel. 1. Selezonare dat B4:C3; dat nella colonna B rappresentano le x, dat della colonna C le y.. Clc sul pulsante Creazone gudata Grafco. 3. Nel prmo passaggo della creazone gudata selezonare la scheda Tp standard e fare clc sul tpo d grafco Dspers. (XY). Verfcare che nel rquadro Scelte dsponbl sa selezonato l modello Grafco a dspersone. Confronta coppe d valor. Per vedere n anteprma l grafco, tenere premuto l apposto pulsante Tenere premuto per vsualzzare l esempo. Clc su Avant. 4. Nel secondo passaggo (Dat d orgne del grafco), verfcare nella scheda Intervallo dat che sa mpostata la zona B4:C3 e che quest dat sano controllat n colonna. Se c s fosse dmentcat d marcare dat n precedenza, l s può defnre adesso. Nella scheda Sere verfcare che dat della zona B4:B3 sano usat come valor x e dat C4:C3 come y, correggendol nel caso. Clc su Avant. 5. Nel terzo passaggo (Opzon del grafco nella scheda Ttol) nserre nella casella Ttolo del grafco la dctura Proftto scolastco, nella casella Asse de valor (X) la dctura Ore d studo settmanal e nella casella Asse de valor (Y) la dctura Vot. Selezonare la scheda Grgla e dsattvare tutte le opzon. Selezonare la scheda Legenda e dsattvare la casella Mostra legenda. Clc su Avant. 6. Nel quarto passaggo (Poszone grafco), verfcare che l grafco venga nserto nel foglo d lavoro corrente. Clc su Fne. 7. S può mglorare l aspetto del grafco, facendo doppo clc su un numero qualunque dell asse x, e, sulla fnestra che compare, sulla scheda Scala dgtare: Valore mnmo: 0; Valore massmo: 35; Untà prncpale: 5; Untà secondara: 1; Interseca al valore: 0. 8. Doppo clc su un numero qualunque dell asse y, e, sulla fnestra che compare, sulla scheda Scala dgtare: Valore mnmo: 4; Valore massmo: 10; Untà prncpale: ; Untà secondara: 0,4; Interseca al valore: 4 9. Doppo clc sull area grga del grafco; nella scheda Motvo sceglere Assente sa per l Bordo, sa per l Area. Constatato che la nuvola de punt può essere approssmata da una retta, s può procedere per l calcolo de termn della formula. S calcola sulle caselle B4 e C4 rspettvamente la meda delle x e delle y. 1

Alessandro Benedett UnCAM-SSIS-FIM.04/3 S predspone la prma rga della tabella, ponendo sulle caselle D4 e E4 rspettvamente lo scarto della x e della y. Su F4 e su G4 s calcola lo scarto quadratco rspettvamente della x e della y e su H4 l prodotto degl scart. S copa la zona D4:H4 nella zona sottostante D4:H3. Sulle celle F4, G4 ed H4 s sommano dat precedentemente calcolat. Sono pront tutt gl element per l calcolo del coeffcente d correlazone lneare nella casella E6. Calcolo del coeffcente d correlazone lneare con la funzone CORRELAZIONE Excel mette a dsposzone una funzone per l calcolo del coeffcente d correlazone: CORRELAZIONE(matrce1;matrce) Matrce1 è un ntervallo d celle d valor. Matrce è l secondo ntervallo d celle d valor. In questo modo s raggunge mmedatamente l rsultato, che evdentemente concde con l precedente. Calcolo del Coeffcente d correlazone lneare con la funzone COVARIANZA COV ( X, Y ) La funzone CORRELAZIONE utlzza la formula r = dove σ σ 1 COV ( X, Y ) = ( x x)( y y) n Con un calcolo alternatvo, l coeffcente d correlazone lneare s realzza con le funzon Excel x y VAR.POP(num1;num;...) che rappresenta la varanza dell ntera popolazone usando la formula Inserre nella cella E35 la formula =COVARIANZA(B4:B3;C4:C3) Inserre nella cella E36 la formula =COVARIANZA(B4:B3;C4:C3)/RADQ(VAR.POP(B4:B3)*VAR.POP(C4:C3)) n x n ( x ) Calcolo del coeffcente d correlazone lneare con Strument Anals dat Correlazone Dopo aver marcato la zona B3:C3, selezonare Strument Anals dat Correlazone. Predsporre dat come n fgura. Al clc su OK vene prodotta la tabella della zona A30:C3, che rappresenta la matrce d correlazone tra coppe d varabl. I valor delle dagonal sono 1 a ndcare che ogn varable ha una correlazone perfetta con se stessa. Il valore 0,86343883 è l

Alessandro Benedett UnCAM-SSIS-FIM.04/3 coeffcente d correlazone tra Ore d studo e Voto e concde con valor trovat con metod precedent. Lo strumento Correlazone permette d confrontare la correlazone anche tra tre o pù varabl, n quanto produce una matrce d correlazone multpla. Se per esempo avessmo raccolto, oltre dat su Ore d studo e Voto anche una ulterore sere d dat relatvamente al Reddto famlare, avremmo potuto confrontare gl ndc d correlazone tra Ore d studo, Voto e Reddto famlare, ndvduando dove fosse maggore la correlazone. Regressone lneare S assume come mglor curva quella tale che la somma de quadrat delle dstanze vertcal tra valor effettv d Y e la lnea sa la pù pccola possble. L obettvo che s ntende persegure è traccare tale retta (lnea d tendenza) drettamente sul grafco precedentemente ottenuto. 1. Portando l cursore su cascun punto vene evdenzato un rquadro del tpo Sere 1 Punto 5 (5;5,4). Clc su un punto qualunque del grafco a dspersone. Vengono marcat tutt punt della Sere 1 e sulla barra della formula compare =SERIE seguta dagl ndrzz che defnscono dat della sere.. Clc con tasto destro su un punto del grafco. S presenta un menu d scelta rapda, dal quale selezonare Aggung lnee d tendenza... In alternatva, selezonare dalla barra de menu Grafco Aggung lnee d tendenza... 3. Sulla scheda Tpo marcare Lneare, come n fg. qu sopra 4. Sulla scheda Opzon marcare le caselle come n fg. a fanco. 5. Il rsultato è presentato nella fg. qu sotto. Proftto scolastco 10,0 8,0 Voto 6,0 y = 0,1431x + 5,797 R = 0,7436 4,0 0 5 10 15 0 5 30 35 Ore d studo settm anal 3

Alessandro Benedett UnCAM-SSIS-FIM.04/3 Interpretazone de dat L ntercetta (b) dell equazone è 5,797, l che vuol curosamente dre che studando 0 ore s ha un voto d 5,797. La ragone è che nella sere statstca lo studente che studa meno d tutt lo fa per 4 ore, prendendo po l voto 6,3. S può pensare che nella classe nessuno stud meno d 4 ore. Il coeffcente angolare dell equazone (a) è 0,1431 e ndca l ncremento del voto all aumentare dello studo d un ora. Il parametro R (= 0,7436) ndca che approssmatvamente l 74,36 % della varazone de vot può essere spegato da un modello lneare utlzzando l numero d ore d studo. Lo strumento Anals d Regressone Per ottenere un quadro pù approfondto della relazone tra le due varabl, s può usare la seguente procedura, utle per statstca avanzata, ma dffclmente trasferble per un corso d scuola secondara superore 1. Clc su Strument Anals Dat ; selezonare la voce Regressone.. Sulla scheda Regressone s predspongano dat come n fg. (negl ntervall vanno comprese anche le ntestazon delle colonne). 3. Vengono generate dverse tabelle e grafc che qu non commentamo. Altre funzon d Excel per la regressone S elencano d seguto alcune funzon Excel utl per la regressone, per l approfondmento delle qual s rmanda alla guda n lnea. INTERCETTA(y_nota;x_nota) Y_nota è l'nseme dpendente d osservazon o d dat. X_nota è l'nseme ndpendente d osservazon o d dat. Calcola l punto n cu una retta nterseca l'asse y utlzzando valor x e y esstent. Tale punto è basato su una retta d regressone lneare ottmale traccata attraverso valor x_nota e y_nota. Utlzzare l'ntercetta per determnare l valore della varable dpendente nel caso n cu la varable ndpendente sa uguale a 0 (zero). PENDENZA(y_nota;x_nota) Y_nota è una matrce o un ntervallo d celle d valor numerc dpendent. X_nota è l'nseme de valor ndpendent. Resttusce la pendenza della retta d regressone lneare tramte valor n y_nota e x_nota. La pendenza è la dstanza vertcale dvsa per la dstanza orzzontale tra due valor qualsas sulla retta, ovvero l grado d varazone lungo la retta d regressone. RQ(y_nota;x_nota) 4

Alessandro Benedett UnCAM-SSIS-FIM.04/3 Y_nota è una matrce o un ntervallo d valor. X_nota è una matrce o un ntervallo d valor. Resttusce l quadrato del coeffcente r della retta d regressone lneare tramte valor n y_nota e x_nota. Per ulteror nformazon, vedere la funzone PEARSON. Il quadrato del coeffcente r può essere nterpretato come l rapporto della varanza n y attrbuble alla varanza n x. ERR.STD.YX(y_nota;x_nota) Y_nota è una matrce o un ntervallo d dat dpendent. X_nota è una matrce o un ntervallo d dat ndpendent. Resttusce l'errore standard del valore prevsto per y per cascun valore d x nella regressone. L'errore standard è una msura che ndca la quanttà d error commess nella prevsone del valore d y per cascun valore d x. PREVISIONE(x;y_nota;x_nota) X è la varable d cu s desdera prevedere un valore. Y_nota è la matrce o l'ntervallo d dat dpendente. X_nota è la matrce o l'ntervallo d dat ndpendente. Calcola, o predce, un valore futuro utlzzando valor esstent. Il valore prevsto è un valore y corrspondente a un valore x dato. I valor not sono valor x e y esstent e l nuovo valore vene calcolato n base a una regressone lneare. S può utlzzare questa funzone per prevedere le vendte future, l'approvvgonamento delle scorte d magazzno o le tendenze de consumator. TENDENZA(y_nota;x_nota;nuova_x;cost) Y_nota è l'nseme de valor y gà not dalla relazone y = mx + b. X_nota è un nseme facoltatvo d valor x che possono essere gà not dalla relazone y = mx + b. Nuova_x sono nuov valor x per qual TENDENZA restturà valor y corrspondent. Cost è un valore logco che specfca se la costante b deve essere uguale a 0. Se cost è VERO o è omesso, b verrà calcolata secondo la normale procedura. Se cost è FALSO, b verrà mpostata a 0 e valor m verranno corrett n modo che y = mx. Resttusce valor lungo una tendenza lneare. Utlzzando l metodo de mnm quadrat, calcola una retta che concde con le matrc y_nota e x_nota e resttusce valor y lungo la retta per la matrce d nuova_x specfcata. REGR.LIN(y_nota;x_nota;cost;stat) Y_nota è l'nseme de valor y gà not dalla relazone y = mx + b. X_nota è un nseme facoltatvo d valor x che possono essere gà not dalla relazone y = mx + b. Cost è un valore logco che specfca se la costante b deve essere uguale a 0. Se cost è VERO o è omesso, b verrà calcolata secondo la normale procedura. Se cost è FALSO, b verrà mpostata a 0 è valor m verranno corrett n modo che y = mx. Stat è un valore logco che specfca se restture statstche agguntve d regressone. Se stat è VERO, REGR.LIN restturà le statstche agguntve d regressone. D conseguenza, la matrce resttuta sarà {mn;mn-1;...;m1;b\sn;sn-1;...;s1;sb\r;sy\f;gdl\sqreg\sqres}. Se stat è FALSO o è omesso, REGR.LIN restturà solo coeffcent m e la costante b. Calcola le statstche per una lnea utlzzando l metodo de mnm quadrat per calcolare la retta che meglo rappresenta dat e resttusce una matrce che descrve la retta. Dal momento che questa funzone resttusce una matrce d valor, deve essere mmessa come formula n forma d matrce. L'equazone della retta è: y = mx + b oppure y = m1x1 + mx +... + b (se c sono ntervall multpl d valor x) dove l valore della varable dpendente y è una funzone de valor della varable ndpendente x. I valor m sono coeffcent che corrspondono ad ogn valore d x, mentre b è una costante. S not che y, x e m possono essere de vettor. Il tpo d matrce resttuto da REGR.LIN è {mn;mn-1;...;m1;b}. REGR.LIN può anche restture statstche agguntve d regressone. 5