LA VARIABILITA LA VARIABILITA E L ATTITUDINE DEL FENOMENO QUANTITATIVO AD ASSUMERE DIVERSE MODALITA, O MEGLIO LA TENDENZA DI OGNI SINGOLA OSSERVAZIONE AD ASSUMERE VALORI DIFFERENTI RISPETTO AL VALORE MEDIO. µ ESEMPIO: x
LA VARIABILITA Nella metodologa statstca s dstnguono due aspett della varabltà:. La dspersone che caratterzza l maggore o mnore addensamento delle osservazon ntorno ad una meda prestablta;. La dsuguaglanza che evdenza la dverstà delle vare osservazon tra loro.
LA VARIABILITA OSSERVATE LE SEGUENTI DISTRIBUZIONI. SECONDO VOI VI E VARIABILITA O MEGLIO DISPERSIONE O DISUGUAGLIANZA? VOTO = --------- MEDIA = MODA= MEDIANA = VARIABILITA =? VOTO = 0---3-4-5-6-7-8- MEDIA =4 MODA=? MEDIANA= 4 VARIABILITA= OCCORRE CALCOLARLA
INDICI DI VARIABILITA Gl ndc d varabltà msurano la varabltà d una dstrbuzone d frequenza:. Rspetto ad un centro rappresentatvo (dspersone) e sono dett scostament med e s ottengono determnando gl scart tra le modaltà del carattere e una sua meda;. Tra le untà statstche a due a due (dsuguaglanza) e sono dett dfferenze mede e s ottengono determnando le dfferenze n valore assoluto delle modaltà del carattere prese a due a due.
INDICI DI VARIABILITA Gl ndc s dstnguono n:. Indc d varabltà assoluta, che sono espress nella stessa untà d msura del fenomeno osservato;. Indc d varabltà relatva, che prescndono dall untà d msura.
INDICI DI VARIABILITA ASSOLUTA. CAMPO DI VARIAZIONE;. SCARTO SEMPLICE MEDIO; 3. SCARTO QUADRATICO MEDIO; 4. VARIANZA; 5. DEVIANZA; 6. DIFFERENZA MEDIA.
INDICE DI VARIABILITA RELATIVA. INDICI DI VARIABILITA RELATIVI;. CONCENTRAZIONE.
LA VARIABILITA CAMPO DI VARIAZIONE W = x x max mn VOTO 0---3-4-5-6 W=6-0=6
LA VARIABILITA Scarto semplce medo DISTRIBUZIONE SEMPLICE DISTRIBUZIONE PO NDERATA δ N = = x N µ s x µ δ = = N n
LA VARIABILITA Scarto semplce medo- Semplce dstrbuzone X VOTO 0 x µ δ N x 6 = = µ = = N 5, 3 4 Totale 0 6 Scarto semplce medo dato dal rapporto tra la somma degl scart n valore assoluto ed l numero complessvo delle osservazon
LA VARIABILITA Scarto semplce medo-dstrbuzone ponderata δ X n µ 0 3 4 x s 0 0 30 0 0 90 µ = = = = N n 80 90 x 0 x µ n 0 0 0 0 0 80 Somma del prodotto degl scart per le rspettve frequenze fratto l numero complessvo delle osservazon
VARIABILITA SCARTO QUADRATICO MEDIO DISTRIBUZIONE SEMPLICE DISTRIBUZIONE PONDERATA N s x N x x x N = = = + + + = ) ( )...( ) ( ) ( µ µ µ µ σ N n s x N n x n x n x s s = = = + + + = ) ( )...( ) ( ) ( µ µ µ µ σ
VARIABILITA SCARTO QUADRATICO MEDIO 3 4 Totale ( x µ ) ( ) - 0 x µ X ( x µ ) 0-4 0 σ = = = = =, 4 0 4 0 s N Radce quadrata della somma degl scart al quadrato dvso l numero complessvo delle osservazon 5
VARIABILITA SCARTO QUADRATICO MEDIO X n ( x µ ) ( ( ) x ) µ x µ n 0 3 4 tot 3 9 σ = s = - - 0 ( x N µ ) n = 4 0 4 9 =, = 4 0 4
VARIANZA Elevando al quadrato lo scarto quadratco medo s ottene la varanza.
DISTRIBUZIONE SEMPLICE VARIABILITA VARIANZA DISTRIBUZIONE PONDERATA σ N = = ( x µ) N σ s = = ( x µ) N n
X 0 3 4 Totale σ N ( x = = N VARIANZA ( x µ ) ( ) - - 0 µ ) = 0 5 x = µ 4 0 4 0
VARIANZA X n ( ) µ x ( x µ ) ( x ) µ n 0 3 4 tot 3 9 σ s - - 0 µ ) ( x = = N n 4 0 4 = =, 9 4 0 4
DEVIANZA La devanza è data dal numeratore della varanza DISTRIBUZIONE SEMPLICE Dev( x) = ( x µ ) DISTRIBUZIONE PONDERATA ) Dev( x) = ( x µ n
DIFFERENZA MEDIA DI GINI E un ndce d dsuguaglanza dato dalla meda delle dfferenze tra cascuna quanttà e tutte le altre.
CALCOLO INDICI DI VARIABILITA CON SPSS
Calcolo ndc varabltà con excel
LA CONCENTRAZIONE LA CONCENTRAZIONE SI CALCOLA PER I CARATTERI CHE GODONO DELLA PROPRIETA DELLA TRASFERIBILITA (PER CALCOLARLA OCCORRE ORDINARE I DATI IN SENSO CRESCENTE).
LA CONCENTRAZIONE n Osservat valor ordnat d una varable, x x... x n s è nteressat a studare come l ammontare del carattere A = n x = sa rpartto fra le dverse untà statstche. S possono avere due stuazon estreme: equdstrbuzone; massma concentrazone. X
LA CONCENTRAZIONE Equdstrbuzone: ognuna delle n untà possede /n dell ammontare complessvo del carattere; Massma concentrazone: l ntero ammontare del carattere è posseduto da una sola untà.
RAPPORTO DI CONCENTRAZIONE R = N p = N p q = p = /N frazone degl reddter 0 R MIN q = A /A N quota d reddto posseduto da ogn sngolo reddtere = numerazone de reddter N = Numero complessvo ntervstat A = frequenza cumulata d reddto MAX
CALCOLO RAPPORTO DI CONCENTRAZIONE X p = /N A q =A /A n p -q 00 00 p =/5=0, 0 p =/5=0,4 00 300 q =00/500=0,06 q =300/500=0, 0,0-0,06=0,4 0,4-0,=0, 300 3 p 3 =3/5=0,6 600 q 3 =600/500=0,4 0,6-0,4=0, 400 4 p 4 =4/5=0,8 000 q 4 =000/500=0,6 0,8-0,6=0, 500 5 p 5 =5/5= 500 q 5 =500/500= -=0 3 0,74
FORMULA RAPPORTO DI CONCENTRAZIONE N R = p q 0,74 = = = N p 3 = 0,
CURVA DI CONCENTRAZIONE Q P
INDICI DI FORMA La forma d una dstrbuzone d frequenza è valutable dal confronto della curva d frequenza della dstrbuzone con la curva normale o gaussana.
INDICI DI FORMA La relazone esstente tra meda, moda e medana DI UNA VARIABILE O CARATTERE STATISTICO DI TIPO CONTINUO consente d verfcare se una dstrbuzone s presenta smmetrca o asmmetrca SIMMETRICA SE MEDIA =MEDIANA=MODA ASIMMETRICA POSITIVA SE MODA<MEDIANA<MEDIA ASIMMETRICA NEGATIVA SE MEDIA<MEDIANA<MODA
DISTRIBUZIONE SIMMERICA 0,8 0,6 0,4 0, 0,0 0,08 0,06 0,04 0,0 0,00 MEDIA=MODA=MEDIANA 55,0 57,5 60,0 6,5 65,0 67,5 70,0 7,5 75,0
DISTRIBUZIONI ASIMMETRICHE ASIMMETRICA NEGATIVA SE MEDIA<MEDIANA<MODA ASIMMETRICA POSITIVA SE MODA<MEDIANA<MEDIA
CURVA NORMALE % 8 6 4 0 55 70 85 300 35 330 345 ^ β V.S. DIVISA IN INTERVALLI ISTOGRAMMA RIDUZIONE INTERVALLI LINEA PASSANTE PER I PUNTI CENTRALI DI OGNI RETTANGOLO ORIGINA UNA CURVA NORMALE O GAUSSIANA
CURVA NORMALE LA MAGGIOR PARTE DELLE DISTRIBUZIONI O VARIABILI STATISTICHE QUANTITATIVE E DI TIPO CONTINUO TENDONO A DISTRIBUIRSI SECONDO UNA CURVA NORMALE, OSSIA LE SINGOLE OSSERVAZIONI DI UN FENOMENO COLLETIVO TENDONO AD ADDENSARSI INTORNO AL VALORE MEDIO DELLA OSSERVAZIONE STESSA. LA CURVA NORMALE E PERFETTAMENTE SIMMETRICA OSSIA LA CODA SINISTRA E UGUALE ALLA CODA DESTRA.
Varable o carattere statstco d tpo contnuo Tempo 0-5 6-0 -5 6-30 3-35 36-40 4-45 Totale frequenze 0 0 30 70 0 0 5 65
CURVA NORMALE PARTENDO DALLE RICERCHE DI GAUSS SULLA DISTRIBUZIONE DEGLI ERRORI DI OSSERVAZIONI DI UNA STESSA GRANDEZZA MISURATA PIU VOLTE,(varable statstca contnua) SI DIMOSTRA CHE L ESPRESSIONE ALGEBRICA DI QUESTA CURVA DIPENDE SOLTANTO DAL NUMERO DELLE OSSREVAZIONI N, DALLA MEDIA E DALLO SCARTO QUADRATICO MEDIO.
GRAFICO CURVA NORMALE 0,8 0,6 0,4 0, 0,0 0,08 0,06 0,04 0,0 0,00 55,0 57,5 60,0 6,5 65,0 67,5 70,0 7,5 75,0
FUNZIONE DELLA CURVA NORMALE Y = N e σ ( x µ ) σ π Π=3,4 e=,7 N=osservazon σ=scarto quadratco medo µ=meda artmetca
CURVA NORMALE LA FUNZIONE PRECEDENTE CI PERMETTE DI CALCOLARE TUTTA L AREA SOTTESA DALLA CURVA NORMALE, MA PER CALCOLARE UNA PORZIONE DI AREA TRA A E B DEVO UTILIZZARE IL SEGUENTE INTEGRALE a N e ( x µ ) σ dx = N b σ π Con l calcolo dell ntegrale possamo saper n valore assoluto cas compres nell ntervallo a e b.
CURVA NORMALE V.S. ETA MEDIA=65 DEVIANZA STANDARD,5 0,8 0,6 0,4 0, 0,0 Punto d flesso 0,08 0,06 0,04 0,0 0,00 55,0 57,5 60,0 6,5 65,0 67,5 70,0 7,5 75,0 LA PUNTA PIU ALTA INDICA IL VALORE MEDIO MEDIA=MEDIANA=MODA ANDAMENTO PERFETTAMENTE SIMMETRICO ASINTOTICA ASSE X OSSIA NON TOCCA ASSE X
AREA CURVA NORMALE 0,8 0,6 0,4 0, 0,0 0,08 0,06 0,04 AREA DA CALCOLARE CON L INTEGRAL E 0,0 0,00 55,0 57,5 60,0 6,5 65,0 67,5 70,0 7,5 75,0
Curva normale con spss
ANALISI STATISTICA UNIVARIATA UNA SOLA VARIABILE. ESEMPIO: ETA, ALTEZZA, PESO, ECC. TECNICHE STATISTICHE:. Mede;. Varabltà; 3. Numer ndc.
ANALISI STATISTICA BIVARIATA DUE VARIABILI: ALTEZZA E PESO. TECNICHE STATISTICHE:.CORRELAZIONE;.REGRESSIONE.
CONCETTO DI INDIPENDENZA In matematca s dce che la varable Y non dpende dalla varable X quando essa rmane costante al varare de valor assunt da X. A fondamento dello studo della correlazone, c è l concetto d ndpendenza
CORRELAZIONE Per correlazone s ntende una relazone tra due varabl tale che a cascun valore della prma varable corrsponda con una certa regolartà un valore della seconda. Non s tratta necessaramente d un rapporto d causa ed effetto ma semplcemente della tendenza d una varable a varare n funzone d un'altra.
CORRELAZIONE r = N N = ( x x)( y y) N ( x x) ( y y) = = +=concordanza 0= -=dscordanza + r
X Pan e 0 Y Past a 30 ( x) x ( y) -0 y ( x x)( y y) ( ) -0 400 x x ( y y) 400 400 0 40-0 -0 00 00 00 30 50 0 0 0 0 0 40 60 0 0 00 00 00 50 70 0 0 400 400 400 000 000 000 r = 000 000*000 =
Calcolo correlazone con spss
Correlazone con excel
REGRESSIONE ANALISI DELLA DIPENDENZA DELLA VARIABILE X IN FUNZIONE DELA VARIABILE Y. X = VARIABILE INDIPENDENTE Y = VARIABILE DIPENDENTE X = ORE FREQUENZA ALLE LEZIONI DI STATISTICA Y = VOTO ESAME DI STATISTICA
Dat rlevat durante l ntervsta Intervstat X Ore frequenza Y Voto 3 4 5 6 7 0 0 30 40 50 60 70 4 5 6 7 8??
COPPIE DI VALORI VOTO STATISTICA 35 30 5 0 5 0 5 0 0 0 0 30 40 50 60 ORE FREQUENZA Indvduare la relazone tra la nuvola d punt o scatter con una funzone matematca o, meglo, occorre ndvduare un modello che analzz la relazone tra le due varabl.
REGRESSIONE La relazone tra punt del grafco precedente s defnsce con la funzone retta d regressone e l obettvo è quello d stmare due parametr ncognt della funzone retta a e b. y = a + bx
REGRESSIONE La stma de parametr ncognt della funzone d regressone avvene con la tecnca de mnm quadrat che consste nel rendere mnma la dfferenza al quadrato tra valor teorc ed valor emprc. a b = = y bx N = ( x x)( y y) N ( x x) = b=coeffce nte d regressone b>0 b<0 b=0
X Ore freque nza 0 Y Vot o 4 ( x) x ( y) -0 y ( x x)( y y) ( x ) x - 40 400 y = 3 + 0, x y = 3 + 0,*0 = 4 0 5-0 - 0 00 y = 3 + 0,*0 = 5 30 40 50 60 70 6 7 8?? 0 0 0 0 0 0 40 00 0 00 400 000 y = 3 + 0,*30 = y y y y = 3 + 0,* 40 = = 3 + 0,*50 = = 3 + 0,* 60 = = 3 + 0,* 70 = 6 7 8 9 30 y = 3 + 0, * x
REGRESSIONE a b = = y bx = 6 0,*30 = 3 N ( x x)( y y) = N = = 0, ( x x) = 00 000 y = 3+ 0, * x
CALCOLO REGRESSIONE E CORRELAZIONE SPSS
CALCOLO REGRESSIONE CON EXCEL
ANALISI STATISTICA MULTIVARIATA TECNICHE STATISTICHE:. Anals fattorale;. Cluster analyss; 3. Scalng Multdmensonal; 4. Regressone multpla; 5. Correlazone canonca; 6. Anals corrspondenze.