Statistica. Alfonso Iodice D Enza
|
|
- Arnoldo Di Giacomo
- 7 anni fa
- Visualizzazioni
Transcript
1 Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33
2 Outline () Statistica 2 / 33
3 Misura del legame Nel caso di variabili quantitative preferibile utilizzare una misura del legame che coinvolga, oltre le frequenze, anche le modalità (numeriche) delle variabili. Le componenti della variabile doppia X e Y possono essere caratterizzate da diversa posizione e variabilità, risulta in genere che µ x µ y e σ x σ y Volendo misurare le variazioni congiunte delle modalità di X ed Y, si fa riferimento alla versione standardizzata delle variabili, data da Z x = X µx σ x e Z y = Y µy σ y questo per escludere dalla misura del legame gli effetti della differente media e varianza (essendo µ x µ y e σ x σ y) () Statistica 3 / 33
4 di Pearson ρ L indice corrispondente alla media aritmetica del prodotto delle modalità standardizzate delle variabili si definisce coefficiente di Pearson ρ ed dato da ρ xy = 1 (z x,i z y,i ) = 1 ( xi µ x n n σ x y ) i µ y σ y Con piccole trasformazioni si ottiene la presente formalizzazione ρ xy = 1 n n (x i µ x)(y i µ y) σ xσ y = σxy σ xσ y La quantità al numeratore si definisce covarianza: essa corrisponde alla media del prodotto degli scarti delle modalità di X e Y dalle rispettive medie. La covarianza misura la contenporanea variazione di X e Y con riferimento alle loro medie. () Statistica 4 / 33
5 Proprietà del coefficiente se X e Y sono indipendenti, allora ρ xy = 0 (NON vale il contrario) se ρ xy = 1, allora Y = α + βx (ovvero Y una trasformazione di X ) se ρ xy = 1, allora Y = α βx (ovvero Y una trasformazione di X ) ρ xy = ρ yx ρ xx = 0 () Statistica 5 / 33
6 di Pearson ρ Esercizio Si considerino i voti riportati da n = studenti negli esami di matematica e statistica. matematica(x i ) statistica(y i ) Si misuri il legame che caratterizza le due variabili () Statistica 6 / 33
7 di Pearson ρ Svolgimento É necessario calcolare le medie aritmetiche µ e gli scarti quadratici medi σ Il voto medio ottenuto dagli studenti all esame di matematica è x µ m = i = n 197 = Il voto medio ottenuto dagli studenti all esame di statistica è µ s = y i n x i y i x i µ x y i µ y (x i µ x) 2 (y i µ y) T ot = 203 = (x i µ m) scarti quadratici medi: σ m = = = 3.7 n (y i µ s) σ s = = = 3.05 n () Statistica 7 / 33
8 di Pearson ρ Svolgimento Per calcolare il coefficiente resta da calcolare la covarianza, ovvero la media aritmetica del prodotto degli scarti dalla media. La covarianza è x i y i x i µ x y i µ y (x i µ x) (y i µ y) T ot σ ms = (x i µ m)(y i µ s) É ora possibile calcolare il coefficiente dato da n = = 13.9 ρ ms = σms 13.9 = σ mσ s = () Statistica / 33
9 Metodo alternativo per il calcolo di ρ Da un punto di vista computazionale risulta conveniente l utilizzo della seguente formulazione alternativa del coefficiente ρ basata sulle somme delle modalità delle componenti ( n x i, n y i), sulle somme dei quadrati delle modalità delle componenti ( n (x i) 2, n (y i) 2 ), sulla somma dei prodotti tra le modalità ( n x iy i ) n n ρ = x iy i n x n i y i (n n (x i) 2 [ n x ] 2)(n n i (y i) 2 [ n 2) y i] () Statistica 9 / 33
10 Metodo alternativo per il calcolo di ρ x i y i x 2 i yi 2 x i y i x = 197 y = 203 x 2 = 4971 y 2 = 5267 xy = 5110 n n ρ = x iy i n x n i y i (n n (x i) 2 [ n x ] 2)(n n i (y i) 2 [ n y ] = 2) i = 5110 ( ) ( 4971 (197) 2 ) ( 5267 (203) 2 ) = () Statistica 10 / 33
11 Coefficiente : esempi di casi limite () Statistica 11 / 33
12 Coefficiente : esempi di casi limite () Statistica 11 / 33
13 Coefficiente : esempi di casi limite () Statistica 11 / 33
14 Coefficiente : esempi di casi limite () Statistica 11 / 33
15 Dipendenza Lo studio della relazione tra caratteri statistici è, nel caso della inter, di tipo simmetrico: due caratteri quantitativi X e Y hanno lo stesso ruolo e si vuole studiare se essi siano indipendenti o meno. A questo scopo sono stati introdotti gli indici di covarianza σ xy e ρ. Si consideri di aver osservato due caratteri quantitativi X ed Y. Si riportano i valori e il grafico di dispersione: Y X Il diagramma di dispersione (scatter plot) () Statistica 12 / 33
16 Dipendenza covarianza e coefficiente 10 µ x = x i = µ y = y i = σ x = (x i µx)2 = σ y = (y i µy )2 = σ xy = (x i µx)(y i µy ) = ρ xy = σxy σxσy = 0.97 Dipendenza funzionale Essendo il valore del coefficiente prossimo ad 1 esiste una forte relazione tra X ed Y. Come confermato dal grafico di dispersione, i dati sono approssimativamente allineati lungo una retta crescente. Ci si può dunque aspettare che sussista una relazione funzionale tra i dati del tipo Y = f(x) = b 0 + b 1 X che rappresenta l equazione di una retta passante attraverso la nube di punti di coordinate (x i, y i ). () Statistica 13 / 33
17 rette passanti per la nube di punti fornisce una approssimazione della dei valori di Y dai valori di X. La relazione di non è esattamente riprodotta dalla retta; i valori yi = b 0 + b 1 x i sono dunque i valori teorici, ovvero i valori che la variabile Y assume, secondo il modello Y = b 0 + b 1 X, in corrispondenza dei valori x i osservati. Determinazione della retta di L identificazione della retta avviene attraverso la determinazione dei valori di b 0, l intercetta, e b 1, il coefficiente angolare o pendenza. La retta migliore è quella che passa più vicina ai punti osservati. In altre parole, si vuole trovare la retta per la quale le differenze tra i valori teorici yi e i valori osservati y i siano minime. () Statistica 14 / 33
18 I residui le differenze tra i valori teorici yi e i valori osservati y i vengono definite residui. è tale che la somma dei residui al quadrato sia minima. Formalmente Ricerca dei parametri della retta di :(b 0 ) e 2 n i = (y i y i )2 = (y i b 0 b 1 x i ) 2 2 (y i b 0 b 1 x i ) = Il problema consiste dunque nel ricercare b 0 e b 1 che minimizzano la precedente espressione. Da un punto di vista n operativo bisogna risolvere il seguente sistema di equazioni y i n b 0 b 1 x i = 0 (y i b 0 b 1 x i ) 2 = 0 b 0 = µ y b 1 µ x b 0 (y i b 0 b 1 x i ) 2 = 0 b 1 () Statistica 15 / 33
19 I residui le differenze tra i valori teorici yi e i valori osservati y i vengono definite residui. La retta di è tale che la somma dei residui al quadrato sia minima. Ricerca dei parametri della retta di :(b 1 ) Formalmente e 2 i = n (y i y i )2 = = (y i b 0 b 1 x i ) 2 Il problema consiste dunque nel ricercare b 0 e b 1 che minimizzano la precedente espressione. Da un punto di vista operativo bisogna risolvere il seguente sistema di equazioni 2 x i (y i b 0 b 1 x i ) = 0 n n x i y i b 0 x i b 1 x 2 i = 0 n b 1 x 2 n ( i = n y n ) i x i x i y i x i b 1 n n b 1 (n x 2 n ) i ( x i ) 2 n = n x i y i x i y i b 1 = n n x i y i n x n i y i (y i b 0 b 1 x i ) 2 n n x 2 i ( n x i ) 2 = σxy σx 2 = 0 b 0 (y i b 0 b 1 x i ) 2 = 0 b 1 () Statistica 16 / 33
20 Determinazione della retta di Calcolo dei coefficienti Richiamando le quantità calcolate in precedenza e le formule per il calcolo dei parametri si ha b 1 = σxy σ x 2 = 2.55 b 0 = µ y b 1 µ x = 37.6 ( ) = 0.62 La retta migliore () Statistica 17 / 33
21 Interpretazione dei valori dei coefficienti di b 0 rappresenta l intercetta della retta di ed indica il valore della variabile di risposta Y quando il predittore X assume valore 0. b 1 rappresenta l inclinazione della retta di, ovvero la variazione della variabile di risposta Y in conseguenza di un aumento unitario del predittore X. () Statistica 1 / 33
22 Bontà di adattamento Esistono diversi strumenti grafici ed analitici per valutare la bontà dell adattamento della retta di ai dati Strumenti grafici: plot dei residui Strumenti analitici:coefficiente di determinazione R 2 () Statistica 19 / 33
23 Plot dei residui Perchè la retta possa essere considerata una buona approssimazione della relazione che intercorre tra Y ed X è necessario che i residui abbiano un andamento casuale rispetto ai valori della X. Se, ad esempio, all aumentare dei valori della X aumentassero sistematicamente anche i residui, allora la relazione potrebbe non essere non : la retta di ne sarebbe dunque una cattiva approssimazione. Plot dei residui Per verificare che l andamento dei residui sia effettivamente casuale rispetto ad X, è possibile utilizzare un diagramma di dispesione tra i valori x i ed i corrispondenti residui e i (i = 1,..., n) () Statistica 20 / 33
24 coefficiente di determinazione R 2 Ricordando che la devianza il numeratore della varianza... Dev y = (y i µ y) 2 = (y i ŷ i + ŷ i µ y) 2 = = (y i ŷ i ) 2 + (ŷ i µ y) (y i ŷ i )(ŷ i µ y) = (y i ŷ i ) 2 + (ŷ i µ y) 2 + 2( y i ŷ i )( ŷ i nµ y) Il metodo dei minimi quadrati assicura che n ŷ i = n y i, quindi Dev(y) = (y i ŷ i ) 2 + (ŷ i µ y) ( ŷ i nµ y) = (ŷ i µ y) 2 + (y i ŷ i ) 2 = Dev r + Dev e () Statistica 21 / 33
25 Decomposizione della devianza La devianza può essere decomposta dunque nelle seguenti quantità Dev y = Dev r + Dev e Dev y = n (y i µ y) 2 devianza totale Dev r = n (ŷ i µ y) 2 devianza di Dev e = n (y i ŷ i ) 2 devianza dei residui Interpretazione grafica () Statistica 22 / 33
26 Bontà dell adattamento Intituitivamente, l adattamento della retta è migliore quanto maggiore sarà proporzione di variabilità totale che la retta di riesce a spiegare; ovvero, l adattamento della retta è migliore quanto minore sarà la variabilità residua. Una misura di come il modello approssima i dati osservati è data dal coefficiente di determinazione R 2, dato da ovvero esempio di calcolo R 2 Dev y = n (y i µ y) 2 = n R 2 = Devr (ŷ i µ y) 2 = Dev n y (y i µ y) 2 n R 2 = 1 Deve (y i ŷ i ) 2 = 1 Dev n y (y i µ y) 2 Dev r = n (ŷ i µ y) 2 = Dev e = n (y i ŷ i ) 2 = R 2 = Devr Dev y = = 0.94 ovvero R 2 = 1 Deve = = = 0.94 Dev y () Statistica 23 / 33
27 Influenza di un outlier sulla Un piccolo esempio Si considerino le seguenti osservazioni Retta di La induce a concludere che vi sia una relazione di proporzionalità inversa: poichè la retta è decrescente si deduce che all aumentare di X, la variabile dipendente Y diminuisce. () Statistica 24 / 33
28 Influenza di un outlier sulla Retta di Un (altro) piccolo esempio Si considerino le osservazioni precedenti a cui è aggiunta un unica coppia di valori (, ). I dati sono In questo caso, la sola presenza della nuova osservazione conduce all identificazione di una retta di diversa dalla prima: l inclinazione positiva della retta indica una relazione di diretta proporzionalità. Tuttavia tale è unicamente dovuta dalla presenza dell osservazione (, ) che pertanto induce a valutare la relazione di tra Y ed X in maniera errata. L osservazione (, ) si definisce pertanto un outlier. L identificazione e la conseguente eliminazione degli eventuali outlier è un elemento molto importante nello studio della tra fenomeni. () Statistica 25 / 33
29 Esercizio : distribuzione doppia di frequenze Si consideri di aver osservato su 10 rivenditori di componenti informatiche le variabili numero di punti vendita e Fatturato settimanale complessivo. Si studi la del fatturato dal numero di punti vendita. fino a 2 tra 2 e 4 tra 4 e 6 fino a tra 5000 e Si stimino i coefficienti della retta di. Si valuti la bontà di adattamento della retta ai dati. () Statistica 26 / 33
30 Esercizio : distribuzione doppia di frequenze Essendo le modalità delle variabili qualitative espresse in intervalli di valori, è necessario fare riferimento ai centri di ciascun intervallo. La tabella è dunque data da Y /X Tot Tot Le medie aritmetiche si ottengono a partire dalle distribuzioni marginali di frequenze: µ x = 1 k x j n.j = (1 4) + (3 4) + (5 2) = = 2.6 n j= µ y = 1 h y i n i. = (2500 5) + (7500 5) = = 5000 n dove h rappresenta numero di righe della tabella, k il numero di colonne della tabella. () Statistica 27 / 33
31 Esercizio : distribuzione doppia di frequenze Per calcolare le varianze si fa riferimento agli scarti dalla media al quadrato Y /X (1 2.6) 2 (3 2.6) 2 (5 2.6) 2 Tot ( ) ( ) Tot Le varianze si ottengono a partire dalle distribuzioni marginali di frequenze: σ 2 x = 1 k (x j µ x) 2 n.j = 1 n j=1 10 ((1 2.6)2 4) + ((3 2.6) 2 4)+ + ((5 2.6) ) = = σ 2 y = 1 h (y i µ y) 2 n i. = 1 n 10 (2500 5)2 + (7500 5) = = dove h rappresenta numero di righe della tabella, k il numero di colonne della tabella. () Statistica 2 / 33
32 Esercizio : distribuzione doppia di frequenze Per calcolare la covarianza si deve fare riferimento alle distribuzioni condizionate di frequenza. Y /X (1 2.6) (3 2.6) (5 2.6) Tot ( ) ( ) Tot y i x i y i µ y x i µ x ( ) (1-2.6) ( ) (1-2.6) ( ) (1-2.6) ( ) (3-2.6) ( ) (3-2.6) ( ) (1-2.6) ( ) (3-2.6) ( ) (3-2.6) ( ) (5-2.6) ( ) (5-2.6) σ xy = 1 h k (y i µ y) (x j µ x) n ij = n j=1 = 1 (( )(1 2.6) 3 + ( )(3 2.6) ( )(1 2.6) 1 + ( )(3 2.6) ( )(5 2.6) 2) = = () Statistica 29 / 33
33 Esercizio : distribuzione doppia di frequenze Avendo calcolato le quantità µ x = 2.6, µ y = 5000, σ 2 x = 2.24 e σ xy = 2000, è possibile calcolare i coefficienti della retta di Calcolo dei coefficienti b 1 = σxy = 2000 σx = b 0 = µ y b 1 µ x = 5000 ( ) = quindi l equazione della retta di è y = b 0 + b 1 x = x Dunque, il valore stimato ŷ i corrispondente ad un valore x i assegnato è ŷ i = b 0 + b 1 x. () Statistica 30 / 33
34 Valutazione della bontà di adattamento Ricordando che ovvero con Dev y = Dev r + Dev e n R 2 = Devr (ŷ i µ y) 2 = Dev n y (y i µ y) 2 n R 2 = 1 Deve (y i ŷ i ) 2 = 1 Dev n y (y i µ y) 2 Dev y = n (y i µ y) 2 devianza totale Dev r = n (ŷ i µ y) 2 devianza di Dev e = n (y i ŷ i ) 2 devianza dei residui Per ottenere R 2, misura della bontà di adattamento, si deve calcolare solo la devianza dei residui, avendo già calcolato σ 2 y. () Statistica 31 / 33
35 Calcolo della devianza dei residui Dev e = n (y i ŷ i ) 2 devianza dei residui in base alla retta di stimata, i valori ŷ i stimati in funzione dei valori x i sono ŷ 1 = b 0 + b 1 x 1 = = ŷ 2 = b 0 + b 1 x 2 = = ŷ 3 = b 0 + b 1 x 3 = = () Statistica 32 / 33
36 Calcolo della devianza dei residui Per calcolare i residui y i ŷ i nel caso di si procede come segue y i /ŷ j ŷ 1 = ŷ 2 = ŷ 3 = Tot y 1 = y 2 = Tot Dev e = h k ((y i ŷ j ) 2 ) n ij devianza dei residui per tabella doppia calcolo della devianza dei residui h k Dev e = ((y i ŷ j ) 2 ) n ij = (( ) 2 ) 3 + (( ) 2 ) 2+ j=1 + (( ) 2 ) 1 + (( ) 2 ) 2 + (( ) 2 ) 2 = = dev y = (y i µ y) 2 = σ 2 y n = = R 2 = 1 deve dev y = = 0.29 () Statistica 33 / 33
Statistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 41 Outline 1 2 3 4 5 () Statistica 2 / 41 Misura del legame Data una variabile doppia (X, Y ), la
DettagliStatistica. Esercitazione 16. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice
Esercitazione 16 Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () 1 / 24 Studio della relazione tra due variabili Commonly Asked Questions Qual è la relazione tra la spesa
DettagliLezione 8. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 8. A. Iodice. Relazioni tra variabili
Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 26 Outline 1 2 3 4 () Statistica 2 / 26 Misura del legame Data una variabile doppia (X, Y ), la misura
DettagliStatistica. Alfonso Iodice D Enza
Statistica Il e Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 21 Outline Il e 1 2 3 Il 4 e 5 () Statistica 2 / 21 Il e Due distribuzioni aventi stessa posizione
DettagliREGRESSIONE E CORRELAZIONE
REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.
DettagliSTATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE
STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 2 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1.1
DettagliStatistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2010/2011 Statistica Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza
DettagliEsercitazione del
Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36
DettagliLezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria
Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata Prof. Massimo Aria aria@unina.it Il concetto di interpolazione In matematica, e in particolare in
DettagliSTATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo
STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)
DettagliStatistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill
Statistica - metodologie per le scienze economiche e sociali /e S Borra, A Di Ciaccio - McGraw Hill Es 6 Soluzione degli esercizi del capitolo 6 In base agli arrotondamenti effettuati nei calcoli, si possono
DettagliESERCITAZIONE IV - Soluzioni
umero di omicidi ESERCITAZIOE IV - Soluzioni Esercizio I. a),00 12,00 10,00 8,00 6,00 4,00 2,00 0,00 0 5 10 15 20 25 Popolazione povera (%) b) Poiché i due caratteri in analisi sono quantitativi per calcolare
DettagliESERCIZI SVOLTI Giuliano Bonollo - Michele Bonollo
ESERCIZI SVOLTI Giuliano Bonollo - Michele Bonollo 1 La seguente tabella riporta le frequenze relative riguardanti gli studenti di un università e gli esiti dell esame da essi sostenuto. Qual è la percentuale
DettagliEsercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale)
Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale) Esercizio 1: Un indagine su 10.000 famiglie ha dato luogo, fra le altre, alle osservazioni riportate nella
DettagliMetodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo
Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è
DettagliIstituzioni di Statistica e Statistica Economica
Istituzioni di Statistica e Statistica Economica Università degli Studi di Perugia Facoltà di Economia, Assisi, a.a. 2013/14 Esercitazione n. 1 A. I dati riportati nella seguente tabella si riferiscono
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@unina.it Università degli studi di Cassino () Statistica 1 / 1 Outline () Statistica 2 / 1 La curtosi La curtosi è la caratteristica della forma della distribuzione
Dettagli3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17
C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica
DettagliStatistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2011/2012 Statistica Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate.
DettagliEsercizi Svolti. 2. Costruire la distribuzione delle frequenze cumulate del tempo di attesa
Esercizi Svolti Esercizio 1 Per una certa linea urbana di autobus sono state effettuate una serie di rilevazioni sui tempi di attesa ad una determinata fermata; la corrispondente distribuzione di frequenza
DettagliE la rappresentazione grafica, in questo caso, è la dispersione x,y, cioè una nuvola di punti nel piano cartesiano
Capitolo uno STATISTICA DESCRITTIVA BIVARIATA La statistica bidimensionale o bivariata si occupa dello studio del grado di dipendenza di due caratteri distinti della stessa unità statistica. E possibile,
DettagliAssociazione tra caratteri quantitativi: gli indici di correlazione
Associazione tra caratteri quantitativi: gli indici di correlazione Per correlazione si intende una relazione tra due variabili tale che a ciascun valore della prima variabile corrisponda con una certa
DettagliMETODO DEI MINIMI QUADRATI
METODO DEI MINIMI QUADRATI Torniamo al problema della crescita della radice di mais in funzione del contenuto di saccarosio nel terreno di coltura. Ripetendo varie volte l esperimento con diverse quantità
DettagliSTATISTICA: esercizi svolti sulla DIPENDENZA IN MEDIA
STATISTICA: esercizi svolti sulla DIPEDEZA I MEDIA 1 1 LA DIPEDEZA I MEDIA 2 1 LA DIPEDEZA I MEDIA 1. La popolazione in migliaia di unità occupata in Piemonte nel 1985 per reddito annuo Y (migliaia di
DettagliEsercitazioni di statistica
Esercitazioni di statistica Misure di associazione: Indipendenza assoluta e in media Stefania Spina Universitá di Napoli Federico II stefania.spina@unina.it 22 ottobre 2014 Stefania Spina Esercitazioni
DettagliStatistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi
Esercitazione 14 Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () 1 / 14 Ex.1: Verifica Ipotesi sulla media (varianza nota) Le funi prodotte da un certo macchinario hanno una
DettagliCORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Misura dell associazione tra due caratteri Uno store manager è interessato a studiare la relazione
DettagliLezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo
UIVERSITA DEGLI STUDI DI BASILICATA FACOLTA DI ECOOMIA Corso di laurea in Economia Aziendale anno accademico 2012/2013 Lezioni di Statistica del 15 e 18 aprile 2013 Docente: Massimo Cristallo LA RELAZIOE
DettagliTest per la correlazione lineare
10 Test per la correlazione lineare Istituzioni di Matematica e Statistica 2015/16 E. Priola 1 Introduzione alla correlazione lineare Problema: In base ai dati che abbiamo possiamo dire che c è una qualche
DettagliLezione 4. Statistica. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Lezione 4. A. Iodice. Indici di posizione.
Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 28 Outline 1 Indici 2 3 mediana distribuzioni 4 5 () Statistica 2 / 28 Indici robusti (o ): La moda
DettagliCapitolo uno STATISTICA DESCRITTIVA BIVARIATA
Capitolo uno STATISTICA DESCRITTIVA BIVARIATA La statistica unidimensionale si occupa di studiare una sola variabile statistica. La statistica bidimensionale o bivariata si occupa dello studio congiunto
DettagliStatistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione
Statistica Esercitazione alessandro polli facoltà di scienze politiche, sociologia, comunicazione Obiettivo Questa esercitazione ha l obiettivo di consolidare ulteriormente gli strumenti di analisi bivariata
DettagliStatistica di base per l analisi socio-economica
Laurea Magistrale in Management e comunicazione d impresa Statistica di base per l analisi socio-economica Giovanni Di Bartolomeo gdibartolomeo@unite.it Definizioni di base Una popolazione è l insieme
DettagliCasa dello Studente. Casa dello Studente
Esercitazione - 14 aprile 2016 ESERCIZIO 1 Di seguito si riporta il giudizio (punteggio da 0 a 5) espresso da un gruppo di studenti rispetto alle diverse residenze studentesche di un Ateneo: a) Si calcolino
DettagliDISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a Prerequisiti Popolazione, unità, carattere Come nascono i dati:
DISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a. 2007-2008 Prerequisiti Popolazione, unità, carattere Come nascono i dati: osservazione e sperimentazione Popolazione: reale e virtuale Classificazione
DettagliLa dipendenza. Antonello Maruotti
La dipendenza Antonello Maruotti Outline 1 Distribuzioni doppie 2 Medie e varianze condizionate 3 Indici di associazione Distribuzione doppia Definizione Una distribuzione doppia si ha quando su di uno
DettagliUniversità del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica
Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Regressione Lineare e Correlazione Argomenti della lezione Determinismo e variabilità Correlazione Regressione Lineare
DettagliTema d esame del 15/02/12
Tema d esame del 15/0/1 Volendo aprire un nuovo locale, una catena di ristoranti chiede ad un consulente di valutare la posizione geografica ideale all interno di un centro abitato. A questo scopo, avvalendosi
DettagliUniversità del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare
Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione
DettagliIndici di variabilità ed eterogeneità
Indici di variabilità ed eterogeneità Corso di STATISTICA Prof. Roberta Siciliano Ordinario di Statistica, Università di apoli Federico II Professore supplente, Università della Basilicata a.a. 011/01
DettagliTeoria e tecniche dei test. Concetti di base
Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi
DettagliSTATISTICA (modulo I - Statistica Descrittiva) Soluzione Esercitazione I
2. e 3. STATISTICA (modulo I - Statistica Descrittiva) Soluzione Esercitazione I 1. Le unità statistiche sono costituite dai singoli ristoranti, mentre la popolazione è costituita da tutte le unità del
DettagliMATEMATICA CORSO A II COMPITINO (Tema 1) 5 Aprile 2013
MATEMATICA CORSO A II COMPITINO (Tema 1) 5 Aprile 2013 Soluzioni 1. Due sperimentatori hanno rilevato rispettivamente 25 e 5 misure di una certa grandezza lineare e calcolato le medie che sono risultate
DettagliPROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA
PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURA/TECNICA DI ANALISI DEI DATI SPECIFICAMENTE DESTINATA A STUDIARE LA RELAZIONE TRA UNA VARIABILE NOMINALE (ASSUNTA
Dettagli1/4 Capitolo 4 Statistica - Metodologie per le scienze economiche e sociali 2/ed Copyright 2008 The McGraw-Hill Companies srl
1/4 Capitolo 4 La variabilità di una distribuzione Intervalli di variabilità Box-plot Indici basati sullo scostamento dalla media Confronti di variabilità Standardizzazione Statistica - Metodologie per
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@unina.it Università degli studi di Cassino () Statistica 1 / 27 Outline 1 () Statistica 2 / 27 Outline 1 2 () Statistica 2 / 27 Outline 1 2 3 () Statistica 2 /
DettagliEsempio sulla media geometrica
Media geometrica La media geometrica di un insieme di n valori positivi x, x 2,, x n di un carattere quantitativo X è pari alla radice n-esima del prodotto dei singoli valori: x g n x x2 K x n Esempio
DettagliVersione di Controllo
Università degli Studi di Trento test di ammissione ai corsi di laurea in Fisica - Matematica - Informatica Ingegneria dell Informazione e Organizzazione d Impresa Ingegneria dell Informazione e delle
DettagliSommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25
Sommario Presentazione dell edizione italiana Prefazione xv xiii Capitolo 1 I dati e la statistica 1 Statistica in pratica: BusinessWeek 1 1.1 Le applicazioni in ambito aziendale ed economico 3 Contabilità
DettagliStatistica Applicata all edilizia: il modello di regressione
Statistica Applicata all edilizia: il modello di regressione E-mail: orietta.nicolis@unibg.it 27 aprile 2009 Indice Il modello di Regressione Lineare 1 Il modello di Regressione Lineare Analisi di regressione
DettagliΣ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica
13. Regressione lineare parametrica Esistono numerose occasioni nelle quali quello che interessa è ricostruire la relazione di funzione che lega due variabili, la variabile y (variabile dipendente, in
DettagliStatistica Descrittiva III
Serie Bi-variate Statistica Descrittiva III Definizioni Serie statistiche bi-variate Rappresentazioni tabellari e grafiche Indici di posizione e di variabilità Dipendenza lineare: retta di regressione
DettagliIl campionamento e l inferenza. Il campionamento e l inferenza
Il campionamento e l inferenza Popolazione Campione Dai dati osservati mediante scelta campionaria si giunge ad affermazioni che riguardano la popolazione da cui essi sono stati prescelti Il campionamento
DettagliStatistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione
Statistica Esercitazione alessandro polli facoltà di scienze politiche, sociologia, comunicazione Obiettivo Esercizio 1. Questo e alcuni degli esercizi che proporremo nei prossimi giorni si basano sul
DettagliCapitolo 12. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 12.1: Suggerimento
Capitolo Suggerimenti agli esercizi a cura di Elena Siletti Esercizio.: Suggerimento Per verificare se due fenomeni sono dipendenti in media sarebbe necessario confrontare le medie condizionate, in questo
DettagliVariabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.
Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:
DettagliIndicatori di Posizione e di Variabilità. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica
Indicatori di Posizione e di Variabilità Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica Indici Sintetici Consentono il passaggio da una pluralità
DettagliCORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Sintesi a cinque e misure di variabilità rispetto ad un centro Una catena di fast-food ha selezionato
DettagliCorso di Laurea in Ingegneria Informatica e Automatica (M-Z) Università di Roma La Sapienza
Corso di Laurea in Ingegneria Informatica e Automatica (M-Z) Università di Roma La Sapienza CALCOLO DELLE PROBABILITÀ E STATISTICA ESAME DEL 16/06/2016 NOME: COGNOME: MATRICOLA: Esercizio 1 Cinque lettere
DettagliStatistica multivariata Donata Rodi 17/10/2016
Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare
DettagliLa Variabilità statistica
La Variabilità statistica Una peculiarità dei caratteri rilevati nelle unità statistiche di un collettivo, è quella di presentare valori o attributi in tutto o in parte diversi. Si chiama variabilità (nel
DettagliLa matrice delle correlazioni è la seguente:
Calcolo delle componenti principali tramite un esempio numerico Questo esempio numerico puó essere utile per chiarire il calcolo delle componenti principali e per introdurre il programma SPAD. IL PROBLEMA
DettagliSTATISTICA DESCRITTIVA (canale B)
STATISTICA DESCRITTIVA (canale B) compito n. 1 del 28 marzo 2008 nome e cognome: corso di laurea: Astronomia matricola: Parte teorica Si ricorda che la corretta risposta ai quesiti della parte teorica
DettagliAnalisi della varianza
Analisi della varianza Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona ANALISI DELLA VARIANZA - 1 Abbiamo k gruppi, con un numero variabile di unità statistiche.
DettagliEsercitazione di Statistica Indici di associazione
Esercitazione di Statistica Indici di associazione 28/10/2015 La relazione tra caratteri Indipendenza logica Quando si suppone che tra due caratteri non ci sia alcuna relazione di causa-effetto. Indipendenza
Dettaglilezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1
lezione n. 6 (a cura di Gaia Montanucci) METODO MASSIMA VEROSIMIGLIANZA PER STIMARE β 0 E β 1 Distribuzione sui termini di errore ε i ε i ~ N (0, σ 2 ) ne consegue : ogni y i ha ancora distribuzione normale,
DettagliLezione 12. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 12. A. Iodice.
discrete uniforme Bernoulli Poisson Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 56 Outline discrete uniforme Bernoulli Poisson 1 2 discrete 3
DettagliStatistica. Matematica con Elementi di Statistica a.a. 2015/16
Statistica La statistica è la scienza che organizza e analizza dati numerici per fini descrittivi o per permettere di prendere delle decisioni e fare previsioni. Statistica descrittiva: dalla mole di dati
DettagliStatistica. Alfonso Iodice D Enza iodicede@unicas.it
Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 2 Outline 1 2 3 4 () Statistica 2 / 2 Misura del legame Data una variabile doppia (X, Y ), la misura
DettagliEsercitazione 4 del corso di Statistica (parte 2)
Esercitazione 4 del corso di Statistica (parte ) Dott.ssa Paola Costantini Febbraio Esercizio n. Il tempo di percorrenza del treno che collega la stazione di Roma Termini con l aeroporto di Fiumicino è
DettagliDocente: Fabio Aiello A.A. 2010/11 1
LA REGRESSIOE LIEARE SEMPLICE La regressione lineare fu introdotta per la prima volta da F. Galton (8-9), per studiare la relazione tra la statura di un gruppo di padri e quella dei loro figli. Galton
DettagliESERCIZI STATISTICA DESCRITTIVA
ESERCIZI STATISTICA DESCRITTIVA Frequenze assolute e relative Titolo di studio Frequenze assolute Frequenze relative Proporzioni Percentuali Senza titolo 30 0,025 2,5 Lic. elementare 509 0,424 42,4 Licenza
DettagliStatistica descrittiva II
Probabilità e Statistica Esercitazioni a.a. 009/010 C.d.L.: Ingegneria Elettronica e delle Telecomunicazioni, Ingegneria Informatica Statistica descrittiva II Ines Campa Probabilità e Statistica - Esercitazioni
DettagliUNIVERSITÀ DEGLI STUDI DI ROMA LA SAPIENZA
UNIVERSITÀ DEGLI STUDI DI ROMA LA SAPIENZA - 9.Statistica - CTF Matematica - Seconda Parte Codice Compito: - Numero d Ordine D. 1 Un veicolo marcia per 50 km alla velocita v, e per altri 50 km alla velocita
DettagliEsame di Statistica (10 o 12 CFU) CLEF 11 febbraio 2016
Esame di Statistica 0 o CFU) CLEF febbraio 06 Esercizio Si considerino i seguenti dati, relativi a 00 clienti di una banca a cui è stato concesso un prestito, classificati per età e per esito dell operazione
DettagliCORSO DI STATISTICA (parte 1) - ESERCITAZIONE 4
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 4 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Differenze semplici medie, confronti in termini di mutua variabilità La distribuzione del prezzo
DettagliIntervallo di fiducia del coefficiente angolare e dell intercetta L intervallo di fiducia del coefficiente angolare (b 1 ) è dato da:
Analisi chimica strumentale Intervallo di fiducia del coefficiente angolare e dell intercetta L intervallo di fiducia del coefficiente angolare (b 1 ) è dato da: (31.4) dove s y è la varianza dei valori
DettagliIl modello di regressione lineare multipla. Il modello di regressione lineare multipla
Introduzione E la generalizzazione del modello di regressione lineare semplice: per spiegare il fenomeno d interesse Y vengono introdotte p, con p > 1, variabili esplicative. Tale generalizzazione diventa
DettagliRingraziamenti dell Editore
Indice Elenco dei simboli e delle abbreviazioni in ordine di apparizione Ringraziamenti dell Editore XI XVII 1 Introduzione FAQ e qualcos altro, da leggere prima 1 1.1 QuestoèunlibrodiStatistica....................
DettagliStatistiche e relazioni
tatistiche descrittive per frequenze e misure Frequenze e misure Per le frequenze e le misure, molte di queste statistiche perdono senso. In compenso, esistono indici appropriati, inutilizzabili per i
DettagliTest F per la significatività del modello
Test F per la significatività del modello Per verificare la significatività dell intero modello si utilizza il test F Si vuole verificare l ipotesi H 0 : β 1 = 0,, β k = 0 contro l alternativa che almeno
DettagliCorso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII
Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Un breve richiamo sul test t-student Siano A exp (a 1, a 2.a n ) e B exp (b 1, b 2.b m ) due set di dati i cui
DettagliCapitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica
Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università
DettagliAlgebra lineare con R
Università di Napoli Federico II cristina.tortora@unina.it Standardizzare una variabile Standardizzazione Data una variabile X distribuita secondo una media µ e una varianza σ 2 la standardizzazione permette
DettagliStatistica Analisi bidimensionale La dipendenza in media. alessandro polli facoltà di scienze politiche, sociologia, comunicazione
Statistica Analisi bidimensionale La dipendenza in media alessandro polli facoltà di scienze politiche, sociologia, comunicazione Obiettivo Nella sezione precedente abbiamo esaminato i principali metodi
DettagliUniversità degli studi della Tuscia. Principi di Statistica dr. Luca Secondi A.A. 2014/2015. Esercitazione di riepilogo Variabili casuali
Università degli studi della Tuscia Principi di Statistica dr. Luca Secondi A.A. 014/015 Esercitazione di riepilogo Variabili casuali ESERCIZIO 1 Il peso delle compresse di un determinato medicinale si
DettagliProgrammazione con Foglio di Calcolo Cenni di Statistica Descrittiva
Fondamenti di Informatica Ester Zumpano Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva Lezione 5 Statistica descrittiva La statistica descrittiva mette a disposizione il calcolo di
DettagliCapitolo 6 La distribuzione normale
Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 6 La distribuzione normale Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università
DettagliNote sulla probabilità
Note sulla probabilità Maurizio Loreti Dipartimento di Fisica Università degli Studi di Padova Anno Accademico 2002 03 1 La distribuzione del χ 2 0.6 0.5 N=1 N=2 N=3 N=5 N=10 0.4 0.3 0.2 0.1 0 0 5 10 15
DettagliMetodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale
DIPARTIMENTO DI SCIENZE AGRARIE E AMBIENTALI PRODUZIONE, TERRITORIO, AGROENERGIA Marco Acutis marco.acutis@unimi.it www.acutis.it CdS Scienze della Produzione e Protezione delle Piante (g59) CdS Biotecnologie
DettagliStatistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)
Statistica La statistica può essere vista come la scienza che organizza ed analizza dati numerici per fini descrittivi o per permettere di prendere delle decisioni e fare previsioni. Statistica descrittiva:
DettagliEsercitazione 4 del corso di Statistica 2 Prof. Domenico Vistocco
Esercitazione 4 del corso di Statistica 2 Prof. Domenico Vistocco Alfonso Iodice D Enza May 23, 2007 1 Esercizio Si consideri un mazzo di carte francesi di 2 carte e si supponga di stare giocando a poker.
DettagliMinimi quadrati pesati per la Regressione Lineare
Minimi quadrati pesati per la Regressione Lineare Salto in alto oltre le formule Ing. Ivano Coccorullo Perchè? La tabella che segue riporta il raggio medio dell orbita R ed il periodo di rivoluzione T
DettagliSTATISTICA DESCRITTIVA BIVARIATA
STATISTICA DESCRITTIVA BIVARIATA Si parla di Analisi Multivariata quando su ogni unità statistica, appartenente ad una determinata popolazione, si rileva un certo numero s di caratteri X, X 2,,X s. Si
DettagliSTATISTICA: esercizi svolti sulla DISTRIBUZIONE NORMALE
STATISTICA: esercizi svolti sulla DISTRIBUZIONE NORMALE 1 2 Tavole della normale standard. Φ(x) = x 1 2π e t2 2 dt z.00.01.02.03.04.05.06.07.08.09 0.0 0.0 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279
DettagliCapitolo 6. La distribuzione normale
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 6 La distribuzione normale Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università
DettagliStatistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione.
Statistica inferenziale La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione. Verifica delle ipotesi sulla medie Quando si conduce una
DettagliN.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.
N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle abelle riportate alla fine del documento. Esercizio 1 La concentrazione media di sostanze inquinanti osservata nelle acque di un fiume
Dettaglib) Calcolare la devianza tra i gruppi (devianza esterna), la devianza entro i gruppi (devianza interna) e la devianza totale
ESERCIZIO 1 La tendenza recente del mercato dell auto vede i veicoli SUV ed i fuoristrada sempre di più soppiantare le macchine tradizionali. Il loro utilizzo, soprattutto nei centri cittadini, viene criticato
Dettagli