LA VARIABILITA. Nella metodologia statistica si distinguono due aspetti della variabilità:

Documenti analoghi
Lezioni di Statistica (25 marzo 2013) Docente: Massimo Cristallo

,29 7. Distribuzioni di frequenza. x 1 n 1 n 1 n 1 /N n 1 /N*100 x 2 n 2 n 1 +n 2 n 2 /N n 2 /N*100

Corso di. Dott.ssa Donatella Cocca

materiale didattico I incontro

LA VARIABILITA. IV lezione di Statistica Medica

Indici di variabilità

L ANALISI MONOVARIATA: Variabilità e mutabilità. Prof. Maria Carella

L ANALISI MONOVARIATA: Variabilità e mutabilità. Prof. Maria Carella

Capitolo 3. Cap. 3-1

a) Individuare l intervallo di confidenza al 90% per la media di popolazione;

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI

LE MEDIE ESEGUITA LA RILEVAZIONE STATISTICA SI PASSA ALL ELABORAZIONE DEI DATI SECONDA FASE

03/03/2012. Campus di Arcavacata Università della Calabria

INDICI STATISTICI MEDIA, MODA, MEDIANA, VARIANZA

Modelli descrittivi, statistica e simulazione

1) Le medie e le varianze calcolate su n osservazioni relative alle variabili quantitative X ed Y sono tali che. σ x

Lezione 2 a - Statistica descrittiva per variabili quantitative

Statistica Descrittiva

Laboratorio 2B A.A. 2012/2013. Elaborazione Dati. Lab 2B CdL Fisica

Sommario. Obiettivo. Quando studiarla? La concentrazione. X: carattere quantitativo tra le unità statistiche. Quando studiarla?

si utilizzano per confrontare le distribuzioni

Contenuti: o Specificazione del modello. o Ipotesi del modello classico. o Stima dei parametri. Regressione semplice Roberta Siciliano 2

Lezione 2 le misure di sintesi: le medie

TECNICHE DI ANALISI DEI DATI MODELLI LINEARI

REGRESSIONE LINEARE. È caratterizzata da semplicità: i modelli utilizzati sono basati essenzialmente su funzioni lineari

Esame di Statistica tema A Corso di Laurea in Economia Prof.ssa Giordano Appello del 15/07/2011

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 17/09/2012

Soluzione esercizi seconda settimana

Teoria degli errori. La misura implica un giudizio sull uguaglianza tra la grandezza incognita e la grandezza campione. Misure indirette: velocita

Strada B. Classe Velocità valore frequenza Frequ. ass Frequ. % hi Freq. Cum

Campo di applicazione

Università di Cassino Corso di Statistica 1 Esercitazione del 17/10/2006 Dott. Alfonso Piscitelli. Esercizio 1

LEZIONE 2. Riassumere le informazioni: LE MEDIE MEDIA ARITMETICA MEDIANA, MODA, QUANTILI. La media aritmetica = = N

TECNICHE DI ANALISI DEI DATI MODELLI LINEARI

ANALISI STATISTICA DELLE INCERTEZZE CASUALI

ELEMENTI DI STATISTICA

Università di Cassino. Esercitazioni di Statistica 1 del 19 Febbraio Dott. Mirko Bevilacqua

Elementi di statistica

Relazione funzionale e statistica tra due variabili Modello di regressione lineare semplice Stima puntuale dei coefficienti di regressione

STATISTICA 1 ESERCITAZIONE 6

Lezione 2 a - Statistica descrittiva per variabili quantitative

Scienze Geologiche. Corso di Probabilità e Statistica. Prove di esame con soluzioni

Relazioni tra variabili: Correlazione e regressione lineare

Regressione e correlazione

S O L U Z I O N I. 1. Effettua uno studio qualitativo della funzione. con particolare riferimento ai seguenti aspetti:

STATISTICA PSICOMETRICA a.a. 2004/2005 Corsi di laurea. Scienze e tecniche neuropsicologiche Modulo 3 Statistica Inferenziale

Esame di Statistica tema B Corso di Laurea in Economia Prof.ssa Giordano Appello del 15/07/2011

x 0 x 50 x 20 x 100 CASO 1 CASO 2 CASO 3 CASO 4 X n X n X n X n

Due distribuzioni, stessa media ma in quale delle due la media rappresenta, sintetizza meglio la situazione?

Indicatori di dimensione e di concentrazione

Teoria e tecniche dei test. Concetti di base

L analisi della correlazione lineare

La t di Student. Per piccoli campioni si definisce la variabile casuale. = s N. detta t di Student.

1) Dato un carattere X il rapporto tra devianza entro e devianza totale è 0.25 e la devianza totale è 40. La devianza tra vale: a) 10 b) 20 c) 30

STATISTICA A K (63 ore) Marco Riani

Corsi di Laurea in Farmacia e CTF Prova di Matematica

Definizione di campione

Analisi degli errori. Introduzione J. R. Taylor, Introduzione all analisi degli errori, Zanichelli, Bo 1986

Statistica Descrittiva II

Due distribuzioni, stessa media ma in quale delle due la media rappresenta, sintetizza meglio la situazione?

La variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

Analisi statistica degli errori casuali

INDICI DI VARIABILITÀ. Proprietà essenziali

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva

Esplorazione dei dati

IL MODELLO DI MACK. Materiale didattico a cura di Domenico Giorgio Attuario Danni di Gruppo Società Cattolica di Assicurazioni

Università di Cassino Corso di Statistica 1 Esercitazione del 28/01/2008 Dott. Alfonso Piscitelli. Esercizio 1

Università di Cassino Esercitazioni di Statistica 1 del 5 Febbraio Dott. Mirko Bevilacqua

Università di Cassino. Esercitazione di Statistica 1 del 4 dicembre Dott.ssa Simona Balzano

Statistica Descrittiva II

STIME STATISTICHE. Consideriamo il caso della misura di una grandezza fisica che sia affetta da errori casuali. p. 2/2

Una distribuzione può essere descritta per mezzo dei suoi frattili.

Matematica Lezione 22

STATISTICA. Esonero 8 novembre 2014 Soluzione. Quesito 1.

PRIMA PROVA INTERMEDIA DI STATISTICA (COD /6045/5047/4038/371/377) 26 ottobre 2015 COMPITO D

ESERCIZIO 4.1 Si consideri una popolazione consistente delle quattro misurazioni 0, 3, 12 e 20 descritta dalla seguente distribuzione di probabilità:

Analisi della Varianza

Corso di Laurea triennale Tecniche della Prevenzione PERCORSO STRAORDINARIO 2007/08. Insegnamento di STATISTICA MEDICA. Modulo II

ANALISI ESPLORATIVA DI SERIE DI OSSERVAZIONI

IL LEGAME TRA DUE VARIABILI I METODI DELLA CORRELAZIONE

La Regressione X Variabile indipendente o esplicativa. La regressione. La Regressione. Y Variabile dipendente

Statistica descrittiva

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI CONFRONTO DI PIU MEDIE IL METODO DI ANALISI DELLA VARIANZA

tabelle grafici misure di

TIPI DI ANALISI DEI DATI ORGANIZZATI IN MATRICI CASI X VARIABILI

Lezione n La concentrazione

SERIE STORICHE, TREND, MEDIE MOBILI, REGRESSIONE Andrea Prevete

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI

y. E' semplicemente la media calcolata mettendo

Distribuzione Normale

RAPPRESENTAZIONE DI MISURE. carta millimetrata

Variabilità = Informazione

1/4 Capitolo 4 Statistica - Metodologie per le scienze economiche e sociali 2/ed Copyright 2008 The McGraw-Hill Companies srl

STATISTICA DESCRITTIVA. Elementi di statistica medica GLI INDICI INDICI DI DISPERSIONE STATISTICA DESCRITTIVA

Università degli Studi di Urbino Facoltà di Economia

Ministero della Salute D.G. della programmazione sanitaria --- GLI ACC - L ANALISI DELLA VARIABILITÀ METODOLOGIA

UNIVERSITÀ DEGLI STUDI DI TORINO CORSO DI LAUREA IN CHIMICA Dispense ad esclusivo uso introduttivo per il modulo di Fisica C

STATISTICA. Esonero 8 novembre 2014 Soluzione. Quesito 1.

Transcript:

LA VARIABILITA LA VARIABILITA E L ATTITUDINE DEL FENOMENO QUANTITATIVO AD ASSUMERE DIVERSE MODALITA, O MEGLIO LA TENDENZA DI OGNI SINGOLA OSSERVAZIONE AD ASSUMERE VALORI DIFFERENTI RISPETTO AL VALORE MEDIO. µ ESEMPIO: x

LA VARIABILITA Nella metodologa statstca s dstnguono due aspett della varabltà:. La dspersone che caratterzza l maggore o mnore addensamento delle osservazon ntorno ad una meda prestablta;. La dsuguaglanza che evdenza la dverstà delle vare osservazon tra loro.

LA VARIABILITA OSSERVATE LE SEGUENTI DISTRIBUZIONI. SECONDO VOI VI E VARIABILITA O MEGLIO DISPERSIONE O DISUGUAGLIANZA? VOTO = --------- MEDIA = MODA= MEDIANA = VARIABILITA =? VOTO = 0---3-4-5-6-7-8- MEDIA =4 MODA=? MEDIANA= 4 VARIABILITA= OCCORRE CALCOLARLA

INDICI DI VARIABILITA Gl ndc d varabltà msurano la varabltà d una dstrbuzone d frequenza:. Rspetto ad un centro rappresentatvo (dspersone) e sono dett scostament med e s ottengono determnando gl scart tra le modaltà del carattere e una sua meda;. Tra le untà statstche a due a due (dsuguaglanza) e sono dett dfferenze mede e s ottengono determnando le dfferenze n valore assoluto delle modaltà del carattere prese a due a due.

INDICI DI VARIABILITA Gl ndc s dstnguono n:. Indc d varabltà assoluta, che sono espress nella stessa untà d msura del fenomeno osservato;. Indc d varabltà relatva, che prescndono dall untà d msura.

INDICI DI VARIABILITA ASSOLUTA. CAMPO DI VARIAZIONE;. SCARTO SEMPLICE MEDIO; 3. SCARTO QUADRATICO MEDIO; 4. VARIANZA; 5. DEVIANZA; 6. DIFFERENZA MEDIA.

INDICE DI VARIABILITA RELATIVA. INDICI DI VARIABILITA RELATIVI;. CONCENTRAZIONE.

LA VARIABILITA CAMPO DI VARIAZIONE W = x x max mn VOTO 0---3-4-5-6 W=6-0=6

LA VARIABILITA Scarto semplce medo DISTRIBUZIONE SEMPLICE DISTRIBUZIONE PO NDERATA δ N = = x N µ s x µ δ = = N n

LA VARIABILITA Scarto semplce medo- Semplce dstrbuzone X VOTO 0 x µ δ N x 6 = = µ = = N 5, 3 4 Totale 0 6 Scarto semplce medo dato dal rapporto tra la somma degl scart n valore assoluto ed l numero complessvo delle osservazon

LA VARIABILITA Scarto semplce medo-dstrbuzone ponderata δ X n µ 0 3 4 x s 0 0 30 0 0 90 µ = = = = N n 80 90 x 0 x µ n 0 0 0 0 0 80 Somma del prodotto degl scart per le rspettve frequenze fratto l numero complessvo delle osservazon

VARIABILITA SCARTO QUADRATICO MEDIO DISTRIBUZIONE SEMPLICE DISTRIBUZIONE PONDERATA N s x N x x x N = = = + + + = ) ( )...( ) ( ) ( µ µ µ µ σ N n s x N n x n x n x s s = = = + + + = ) ( )...( ) ( ) ( µ µ µ µ σ

VARIABILITA SCARTO QUADRATICO MEDIO 3 4 Totale ( x µ ) ( ) - 0 x µ X ( x µ ) 0-4 0 σ = = = = =, 4 0 4 0 s N Radce quadrata della somma degl scart al quadrato dvso l numero complessvo delle osservazon 5

VARIABILITA SCARTO QUADRATICO MEDIO X n ( x µ ) ( ( ) x ) µ x µ n 0 3 4 tot 3 9 σ = s = - - 0 ( x N µ ) n = 4 0 4 9 =, = 4 0 4

VARIANZA Elevando al quadrato lo scarto quadratco medo s ottene la varanza.

DISTRIBUZIONE SEMPLICE VARIABILITA VARIANZA DISTRIBUZIONE PONDERATA σ N = = ( x µ) N σ s = = ( x µ) N n

X 0 3 4 Totale σ N ( x = = N VARIANZA ( x µ ) ( ) - - 0 µ ) = 0 5 x = µ 4 0 4 0

VARIANZA X n ( ) µ x ( x µ ) ( x ) µ n 0 3 4 tot 3 9 σ s - - 0 µ ) ( x = = N n 4 0 4 = =, 9 4 0 4

DEVIANZA La devanza è data dal numeratore della varanza DISTRIBUZIONE SEMPLICE Dev( x) = ( x µ ) DISTRIBUZIONE PONDERATA ) Dev( x) = ( x µ n

DIFFERENZA MEDIA DI GINI E un ndce d dsuguaglanza dato dalla meda delle dfferenze tra cascuna quanttà e tutte le altre.

CALCOLO INDICI DI VARIABILITA CON SPSS

Calcolo ndc varabltà con excel

LA CONCENTRAZIONE LA CONCENTRAZIONE SI CALCOLA PER I CARATTERI CHE GODONO DELLA PROPRIETA DELLA TRASFERIBILITA (PER CALCOLARLA OCCORRE ORDINARE I DATI IN SENSO CRESCENTE).

LA CONCENTRAZIONE n Osservat valor ordnat d una varable, x x... x n s è nteressat a studare come l ammontare del carattere A = n x = sa rpartto fra le dverse untà statstche. S possono avere due stuazon estreme: equdstrbuzone; massma concentrazone. X

LA CONCENTRAZIONE Equdstrbuzone: ognuna delle n untà possede /n dell ammontare complessvo del carattere; Massma concentrazone: l ntero ammontare del carattere è posseduto da una sola untà.

RAPPORTO DI CONCENTRAZIONE R = N p = N p q = p = /N frazone degl reddter 0 R MIN q = A /A N quota d reddto posseduto da ogn sngolo reddtere = numerazone de reddter N = Numero complessvo ntervstat A = frequenza cumulata d reddto MAX

CALCOLO RAPPORTO DI CONCENTRAZIONE X p = /N A q =A /A n p -q 00 00 p =/5=0, 0 p =/5=0,4 00 300 q =00/500=0,06 q =300/500=0, 0,0-0,06=0,4 0,4-0,=0, 300 3 p 3 =3/5=0,6 600 q 3 =600/500=0,4 0,6-0,4=0, 400 4 p 4 =4/5=0,8 000 q 4 =000/500=0,6 0,8-0,6=0, 500 5 p 5 =5/5= 500 q 5 =500/500= -=0 3 0,74

FORMULA RAPPORTO DI CONCENTRAZIONE N R = p q 0,74 = = = N p 3 = 0,

CURVA DI CONCENTRAZIONE Q P

INDICI DI FORMA La forma d una dstrbuzone d frequenza è valutable dal confronto della curva d frequenza della dstrbuzone con la curva normale o gaussana.

INDICI DI FORMA La relazone esstente tra meda, moda e medana DI UNA VARIABILE O CARATTERE STATISTICO DI TIPO CONTINUO consente d verfcare se una dstrbuzone s presenta smmetrca o asmmetrca SIMMETRICA SE MEDIA =MEDIANA=MODA ASIMMETRICA POSITIVA SE MODA<MEDIANA<MEDIA ASIMMETRICA NEGATIVA SE MEDIA<MEDIANA<MODA

DISTRIBUZIONE SIMMERICA 0,8 0,6 0,4 0, 0,0 0,08 0,06 0,04 0,0 0,00 MEDIA=MODA=MEDIANA 55,0 57,5 60,0 6,5 65,0 67,5 70,0 7,5 75,0

DISTRIBUZIONI ASIMMETRICHE ASIMMETRICA NEGATIVA SE MEDIA<MEDIANA<MODA ASIMMETRICA POSITIVA SE MODA<MEDIANA<MEDIA

CURVA NORMALE % 8 6 4 0 55 70 85 300 35 330 345 ^ β V.S. DIVISA IN INTERVALLI ISTOGRAMMA RIDUZIONE INTERVALLI LINEA PASSANTE PER I PUNTI CENTRALI DI OGNI RETTANGOLO ORIGINA UNA CURVA NORMALE O GAUSSIANA

CURVA NORMALE LA MAGGIOR PARTE DELLE DISTRIBUZIONI O VARIABILI STATISTICHE QUANTITATIVE E DI TIPO CONTINUO TENDONO A DISTRIBUIRSI SECONDO UNA CURVA NORMALE, OSSIA LE SINGOLE OSSERVAZIONI DI UN FENOMENO COLLETIVO TENDONO AD ADDENSARSI INTORNO AL VALORE MEDIO DELLA OSSERVAZIONE STESSA. LA CURVA NORMALE E PERFETTAMENTE SIMMETRICA OSSIA LA CODA SINISTRA E UGUALE ALLA CODA DESTRA.

Varable o carattere statstco d tpo contnuo Tempo 0-5 6-0 -5 6-30 3-35 36-40 4-45 Totale frequenze 0 0 30 70 0 0 5 65

CURVA NORMALE PARTENDO DALLE RICERCHE DI GAUSS SULLA DISTRIBUZIONE DEGLI ERRORI DI OSSERVAZIONI DI UNA STESSA GRANDEZZA MISURATA PIU VOLTE,(varable statstca contnua) SI DIMOSTRA CHE L ESPRESSIONE ALGEBRICA DI QUESTA CURVA DIPENDE SOLTANTO DAL NUMERO DELLE OSSREVAZIONI N, DALLA MEDIA E DALLO SCARTO QUADRATICO MEDIO.

GRAFICO CURVA NORMALE 0,8 0,6 0,4 0, 0,0 0,08 0,06 0,04 0,0 0,00 55,0 57,5 60,0 6,5 65,0 67,5 70,0 7,5 75,0

FUNZIONE DELLA CURVA NORMALE Y = N e σ ( x µ ) σ π Π=3,4 e=,7 N=osservazon σ=scarto quadratco medo µ=meda artmetca

CURVA NORMALE LA FUNZIONE PRECEDENTE CI PERMETTE DI CALCOLARE TUTTA L AREA SOTTESA DALLA CURVA NORMALE, MA PER CALCOLARE UNA PORZIONE DI AREA TRA A E B DEVO UTILIZZARE IL SEGUENTE INTEGRALE a N e ( x µ ) σ dx = N b σ π Con l calcolo dell ntegrale possamo saper n valore assoluto cas compres nell ntervallo a e b.

CURVA NORMALE V.S. ETA MEDIA=65 DEVIANZA STANDARD,5 0,8 0,6 0,4 0, 0,0 Punto d flesso 0,08 0,06 0,04 0,0 0,00 55,0 57,5 60,0 6,5 65,0 67,5 70,0 7,5 75,0 LA PUNTA PIU ALTA INDICA IL VALORE MEDIO MEDIA=MEDIANA=MODA ANDAMENTO PERFETTAMENTE SIMMETRICO ASINTOTICA ASSE X OSSIA NON TOCCA ASSE X

AREA CURVA NORMALE 0,8 0,6 0,4 0, 0,0 0,08 0,06 0,04 AREA DA CALCOLARE CON L INTEGRAL E 0,0 0,00 55,0 57,5 60,0 6,5 65,0 67,5 70,0 7,5 75,0

Curva normale con spss

ANALISI STATISTICA UNIVARIATA UNA SOLA VARIABILE. ESEMPIO: ETA, ALTEZZA, PESO, ECC. TECNICHE STATISTICHE:. Mede;. Varabltà; 3. Numer ndc.

ANALISI STATISTICA BIVARIATA DUE VARIABILI: ALTEZZA E PESO. TECNICHE STATISTICHE:.CORRELAZIONE;.REGRESSIONE.

CONCETTO DI INDIPENDENZA In matematca s dce che la varable Y non dpende dalla varable X quando essa rmane costante al varare de valor assunt da X. A fondamento dello studo della correlazone, c è l concetto d ndpendenza

CORRELAZIONE Per correlazone s ntende una relazone tra due varabl tale che a cascun valore della prma varable corrsponda con una certa regolartà un valore della seconda. Non s tratta necessaramente d un rapporto d causa ed effetto ma semplcemente della tendenza d una varable a varare n funzone d un'altra.

CORRELAZIONE r = N N = ( x x)( y y) N ( x x) ( y y) = = +=concordanza 0= -=dscordanza + r

X Pan e 0 Y Past a 30 ( x) x ( y) -0 y ( x x)( y y) ( ) -0 400 x x ( y y) 400 400 0 40-0 -0 00 00 00 30 50 0 0 0 0 0 40 60 0 0 00 00 00 50 70 0 0 400 400 400 000 000 000 r = 000 000*000 =

Calcolo correlazone con spss

Correlazone con excel

REGRESSIONE ANALISI DELLA DIPENDENZA DELLA VARIABILE X IN FUNZIONE DELA VARIABILE Y. X = VARIABILE INDIPENDENTE Y = VARIABILE DIPENDENTE X = ORE FREQUENZA ALLE LEZIONI DI STATISTICA Y = VOTO ESAME DI STATISTICA

Dat rlevat durante l ntervsta Intervstat X Ore frequenza Y Voto 3 4 5 6 7 0 0 30 40 50 60 70 4 5 6 7 8??

COPPIE DI VALORI VOTO STATISTICA 35 30 5 0 5 0 5 0 0 0 0 30 40 50 60 ORE FREQUENZA Indvduare la relazone tra la nuvola d punt o scatter con una funzone matematca o, meglo, occorre ndvduare un modello che analzz la relazone tra le due varabl.

REGRESSIONE La relazone tra punt del grafco precedente s defnsce con la funzone retta d regressone e l obettvo è quello d stmare due parametr ncognt della funzone retta a e b. y = a + bx

REGRESSIONE La stma de parametr ncognt della funzone d regressone avvene con la tecnca de mnm quadrat che consste nel rendere mnma la dfferenza al quadrato tra valor teorc ed valor emprc. a b = = y bx N = ( x x)( y y) N ( x x) = b=coeffce nte d regressone b>0 b<0 b=0

X Ore freque nza 0 Y Vot o 4 ( x) x ( y) -0 y ( x x)( y y) ( x ) x - 40 400 y = 3 + 0, x y = 3 + 0,*0 = 4 0 5-0 - 0 00 y = 3 + 0,*0 = 5 30 40 50 60 70 6 7 8?? 0 0 0 0 0 0 40 00 0 00 400 000 y = 3 + 0,*30 = y y y y = 3 + 0,* 40 = = 3 + 0,*50 = = 3 + 0,* 60 = = 3 + 0,* 70 = 6 7 8 9 30 y = 3 + 0, * x

REGRESSIONE a b = = y bx = 6 0,*30 = 3 N ( x x)( y y) = N = = 0, ( x x) = 00 000 y = 3+ 0, * x

CALCOLO REGRESSIONE E CORRELAZIONE SPSS

CALCOLO REGRESSIONE CON EXCEL

ANALISI STATISTICA MULTIVARIATA TECNICHE STATISTICHE:. Anals fattorale;. Cluster analyss; 3. Scalng Multdmensonal; 4. Regressone multpla; 5. Correlazone canonca; 6. Anals corrspondenze.