La media da calcolare è rappresentata da (per distribuzioni di frequenza): k

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "La media da calcolare è rappresentata da (per distribuzioni di frequenza): k"

Transcript

1 bruno delle donne Esercitazioni di Statistica - modulo base - a.a ESERCIZIO MEDIE AALITICHE Data la distribuzione del peso corporeo di un gruppo di malati adulti, appresso riportata, si calcoli la media aritmetica Classe di peso n. malati Per il calcolo della media, visto che quella data è una distribuzione in classi, occorre individuare il valore centrale della classe; per poterlo fare è necessario procedere attraverso i seguenti punti: è necessario stabilire per la prima classe un ragionevole estremo inferiore, scegliamolo in 45 visto che trattasi di adulti; è necessario stabilire per l'ultima un ragionevole estremo superiore, scegliamolo in 00 vista la tendenza al soprappeso delle popolazioni occidentali; le classi sono chiuse a destra quindi includono l'estremo superiore ma non quello inferiore; pertanto le classi andrebbero lette come 46-50, 5-55, 56-60, 6-65, 66-75, 7-85, Disponendo delle classi come indicato basterà effettuare la semisomma degli estremi per disporre del valore centrale; pertanto la distribuzione può essere così riscritta: valore centrale della classe frequenza , , La media da calcolare è rappresentata da (per distribuzioni di frequenza): k M = x i n i media aritmetica (il simbolo più correttamente dovrebbe essere M ) i= Per lo sviluppo della formula si deve calcolare il prodotto delle modalità per le frequenze; pertanto viste le dimensioni dei calcoli converrà adottare una origine arbitraria (ad es. 43 = 0) e fissare un intervallo tra l origine ed i successivi valori (ad es. 5) così che i valori centrali diventeranno (=43+*5), (=43+*5), 3 (=43+3*5), 4 (=43+4*5), 5,5 (=43+5,5*5), 7,5 (=43+7,5*5), 0 (=43+0*5); pertanto la distribuzione diventa:

2 bruno delle donne Esercitazioni di Statistica - modulo base - a.a valore centrale della classe frequenza ,5 67 7, Per effettuare i conteggi sopra indicati conviene impostare i calcoli in una tabella con una serie di colonne in cui svolgiamo i calcoli delle diverse formule: x i n i x i *n i , , totale Con tali valori possiamo ottenere: M = 88 = 5, La media ottenuta è tuttavia riferita all origine iniziale ed all incremento fissati arbitrariamente per comodità di calcolo; per avere il vero valore della media bisogna tener conto che la variabile effettiva è una trasformata (espressione =ax+b) di quella arbitraria secondo la seguente relazione =5x+43; conoscendo la trasformazione ed applicando la proprietà della media aritmetica avremo: media = 5*5, = 7,55. ESERCIZIO MEDIE AALITICHE Data la distribuzione appresso riportata, si calcolino le medie aritmetica, geometrica, quadratica e si verifichi la proprietà delle medie di potenza modalità frequenza 3, ,

3 bruno delle donne Esercitazioni di Statistica - modulo base - a.a Le medie da calcolare sono rappresentate da (per distribuzioni di frequenza): M = k i= k M g = = i M = = i x i n i k x ni i x i n i media aritmetica (il simbolo più correttamente dovrebbe essere M ) media geometrica (il simbolo più correttamente dovrebbe essere M 0 ) media quadratica Per lo sviluppo delle diverse formule si deve calcolare: il prodotto delle modalità per le frequenze; le potenze delle modalità con esponente le frequenze e le produttorie successive dei risultati; i quadrati delle modalità ed il loro prodotto per le frequenze. Per effettuare i conteggi sopra indicati conviene impostare i calcoli in una tabella con una serie di colonne in cui svolgiamo i calcoli delle diverse formule: n x i n i x i *n i n i x i x j j x i x i *n i 3 3,00,00 3,00, ,63 6 6,5 8, , ,00 45,00 5,5 30, ,5 60, , ,00 49, , ,00 64, , ,00 00,00 totale 7 7 ==== ======= ==== 440,5 Con tali valori possiamo ottenere: M = 7 = 4, 06 7 ; M , 97 7 g = = ; M = 440, 5 = 5, Per verificare la proprietà delle medie di potenza, data da M s M s M s+, è sufficiente ricordare quanto indicato nei simboli delle medie (la media aritmetica è M e quella geometrica M 0 ) per verificare che: 3, 97( M g = M0 ) 4, 06( M = M ) 5, 089( M ) ESERCIZIO 3 MEDIE LASCHE È stata rilevata la distribuzione del numero di studenti secondo la votazione attribuita in un esame universitario, ottenendo i seguenti risultati:

4 bruno delle donne Esercitazioni di Statistica - modulo base - a.a votazione giudizio voto n. studenti insufficiente mediocre 8-5 discreto buono 6-9 ottimo 30 7 Calcolare la moda, la mediana, il terzo quartile ed il 9 percentile, il calcolo deve essere riferito sia al giudizio che al voto. Dopo aver rilevato le frequenze cumulate pari a: (ottenute dalla frequenza - n. studenti - scrivendo la prima, sommando la seconda alla prima, sommando la terza al risultato ottenuto, sommando la quarta al risultato ottenuto e sommando la quinta al risultato ottenuto) è possibile stabilire: la moda è il giudizio insufficiente (o il voto 0-7) essendo la modalità con la massima frequenza; la mediana è il giudizio insufficiente (o il voto 0-7), che presenta una frequenza cumulata tra e 03, essendo la modalità che biseca la distribuzione ordinata: visto che è pari la modalità che occupa i posti 00 (/) e 0 (/+) oppure il posto 00,5 (00+/); il terzo quartile è il giudizio discreto (o il voto 3-5), che presenta una frequenza cumulata tra 55 e 8, essendo la modalità che lascia a sinistra i ¾ delle frequenze (quindi 75=00*3/4); il 9 percentile è il giudizio buono (o il voto 6-9), che presenta una frequenza cumulata tra 8 e 93, essendo la modalità che lascia a sinistra il 9% delle frequenze (quindi 8=00*9/00). Per la mediana è possibile, limitatamente al voto, individuare il voto esatto con la formula x x x + ( Fe e ) in cui, con riferimento alla classe che individua la media lasca, x ne ed x sono gli estremi inferiore e superiore, n e è la frequenza, F e il valore esatto calcolato in precedenza ed e- è la frequenza cumulata della classe precedente. Pertanto risulterà: 7 0 mediana = 0 + ( 00, 5 0) = 6, ESERCIZIO 4 VARIABILITÀ Si calcoli per la distribuzione appresso riportata: il campo di variazione, la differenza interquartilica, lo scarto quadratico medio, la varianza, il coefficiente di variazione e l escursione relativa; si verifichi inoltre la proprietà dello scarto semplice dalla media aritmetica (somma degli scarti uguale zero)

5 bruno delle donne Esercitazioni di Statistica - modulo base - a.a età n. dipendenti totale 500 I valori da calcolare sono rappresentati (per distribuzioni di frequenza) da: R = x - x campo di variazione Δ = q 3 - q k i= differenza interquartilica σ = ( xi M ) n i scarto quadratico medio ( M M ) σ = varianza C v δ σ M R σ = coefficiente di variazione = escursione relativa Per effettuare i conteggi sopra indicati conviene impostare i calcoli in una tabella con una serie di colonne in cui svolgiamo i calcoli delle diverse formule: x i n i i x i *n i x i - M (x i - M)*n i (x i - M) (x i - M) *n i x i x i *n i ,48-65,83 0,09 743, ,48-77,58, 68, ,48-93,60 6,6 480, ,48-50,39,0 74, ,48-0,60 0,3 5, ,5 30,56 0,7 5, ,5,96,30 86, ,5 66,9 6,34 48, ,5 65,35,38 58, ,5,95 0,4 50, totale 500 === 4 === 0 === 3634,84 === Con le frequenze cumulate possiamo individuare il quartile che risulta 4 (frequenze da 89 a 66) cioè la modalità che lascia a sinistra ¼ dei casi (5=500/4) ed il 3 quartile che risulta 47 (frequenze da 363 a 48) cioè la modalità che lascia a sinistra ¾ dei casi (375=500*3/4). Il

6 bruno delle donne Esercitazioni di Statistica - modulo base - a.a calcolo degli scarti ha richiesto l individuazione della media aritmetica che è 44,48 (=.4/500). Con tali valori possiamo ottenere: campo di variazione R = = 9 differenza interquartilica Δ = 47 4 = 5 scarto quadratico medio σ = 3634, 84 =, varianza σ = 99959/500 44,48 coefficiente di variazione C v =,696/44,48 = 0,06 escursione relativa δ = 9/,696 = 3,338 Si rammenta che gli ultimi due indici, essendo coefficienti relativi, consentono un eventuale confronto con altre distribuzioni. Per quanto attiene, infine, alla verifica della proprietà dello scarto dalla media, questa risulta già in tabella (sesta colonna) essendo la sua sommatoria uguale a zero. ESERCIZIO 5 MUTABILITÀ Data la distribuzione del n. degli abitanti di un comune per sesso e condizione professionale, appresso riportata, si calcoli l indice di Gini, distintamente per maschi e femmine, sia assoluto che relativo; si individui quale dei due sessi presenta maggiore mutabilità. sesso condizione professionale Maschi femmine studenti 0 3 disoccupati 50 4 casalinghe 4 34 dipendenti commercianti 4 35 artigiani Liberi professionisti 4 5 pensionati L indice assoluto di Gini è espresso dalla formula: k n i S = = f i i = i = mentre quello relativo risulta S S k = max S k k

7 bruno delle donne Esercitazioni di Statistica - modulo base - a.a Per il calcolo dell indice di Gini occorrono quindi le frequenze relative ed il loro quadrato; pertanto conviene impostare la seguente tabella: maschi femmine x i n i f i f i n i f i f i studenti 0 0,70 0,09 3 0,9 0,037 disoccupati 50 0,083 0, ,064 0,004 casalinghe 4 0,040 0, ,49 0,4 dipendenti 54 0,57 0, ,077 0,006 commercianti 4 0,040 0, ,055 0,003 artigiani 64 0,07 0,0 33 0,05 0,003 liberi professionisti 4 0,070 0, ,03 0,00 pensionati 40 0,33 0, ,047 0,00 totale 600,000 0,76 640,000 0,96 Con tali valori possiamo ottenere: indice assoluto di Gini (S): = 0,76 = 0,84 per i maschi ; = 0,96 = 0,704 per le femmine indice relativo di Gini (S/maxS): = 0,84 * 7/6 = 0,96 per i maschi ; = 0,704 * 7/6 = 0,8 per le femmine Gli indici relativi, che consentono il confronto tra distribuzioni diverse, evidenziano una maggiore mutabilità dei maschi rispetto a quella delle femmine; in effetti dall analisi della stessa distribuzione si evidenzia una maggiore distribuzione delle frequenze dei maschi nelle diverse modalità rispetto ad un notevole accentramento di quelle delle femmine intorno a poche modalità (studenti e casalinghe). ESERCIZIO 6 DEVIAZA Una popolazione è suddivisa nelle seguenti sottopopolazioni; calcolare la devianza di ciascun gruppo e dell'intera popolazione; verificare la proprietà sulla scomposizione della devianza. Popolazioni di riferimento W W W 3 x i n i x i n i x i n i La devianza può essere ottenuta con la formula: Dev( T ) = ( M M ) = ( x ) x Per poter effettuare i calcoli predisponiamo la tabella per ciascun gruppo (singole popolazioni W) e per l intera popolazione:

8 bruno delle donne Esercitazioni di Statistica - modulo base - a.a Popolazione W x i n i x i *n i x i x i *n i totale === 807 media = 75/50 = 5,50 Dev(W ) = 50*(807/50 5,5 ) = 94,50 Popolazione W x i n i x i *n i x i x i *n i === 3 media = 4/40 = 5,35 Dev(W ) = 40*(3/40-5,35 ) = 87,0 Popolazione W 3 x i n i x i *n i x i x i *n i === 505 media = 47/60 = 7,85 Dev(W ) = 60*(505/60-7,85 ) = 353,65 Popolazione totale x i n i x i *n i x i x i *n i

9 bruno delle donne Esercitazioni di Statistica - modulo base - a.a totale === 8090 media = 960/50 = 6,40 Dev(T) = 50*(8090/50-6,4 ) = 946,00 La proprietà sulla scomposizione della devianza afferma che la devianza totale (intera popolazione) è data dalla somma delle devianze dei singoli gruppi Dev(W) più la devianza delle medie Dev(B); pertanto se i gruppi fossero m (nel nostro caso 3) la proprietà sarebbe espressa dalla relazione: Dev m ( T ) = Dev( W ) + Dev( B) i = i Disponiamo già della somma delle devianze dei singoli gruppi che risulta pari a: 94,5 + 87, ,65 = 735,5; occorre ancora calcolare la devianza delle medie. Per poter effettuare quest ultimo calcolo scriviamo la distribuzione delle medie (medie dei singoli gruppi con la loro frequenza) ed effettuiamo i soliti calcoli. Popolazioni medie x i n i x i *n i x i x i *n i 5, ,500 5,50 5, ,65 44,90 7, , ,35 totale === 6354,75 media = 960/50 = 6,40 Dev(B) = 50*(6354,8/50-6,4 ) = 0,75 I conteggi effettuati sulla distribuzione delle medie consentono di: affermare innanzitutto che la media della popolazione divisa in gruppi (media di tutta la pop. = 6,4) è pari alla media delle medie; verificare la proprietà della scomposizione della devianza; infatti se aggiungiamo alla somma delle devianze dei gruppi (735,5) la devianza delle medie (0,75) otteniamo 946 che è la devianza dell intera popolazione. Sia data la seguente seriazione doppia ESERCIZIO 7 RELAZIOI (REGRESSIOE e CORRELAZIOE)

10 bruno delle donne Esercitazioni di Statistica - modulo base - a.a x i i Calcolare: la regressione di Y su X e quella di X su Y; il coefficiente di correlazione tra X ed Y; verificare infine la relazione esistente tra il coefficiente di Bravais-Pearson e i due coefficienti di regressione. La regressione di Y su X stima la dipendenza della variabile dipendente Y dalla variabile indipendente X; per il calcolo della regressione dobbiamo calcolare i due parametri della retta σ x =b /x x+b 0 dati da: b = e B 0 = b x x σ x x mentre la regressione di X su Y stima la dipendenza della variabile dipendente X dalla variabile σ x indipendente Y ed è espressa dalla retta x=b x/ +B 0 i cui coefficienti risultano: b x = e σ B 0 = x b x Il coefficiente di correlazione di Bravais-Pearson, infine, stima l interdipendenza tra le due variabili X ed Y (nessuna delle quali è antecedente all altra) ed è espresso dalla formula r = σ σ x x σ Risulta quindi necessario calcolare la covarianza ed i due scarti quadratici medi; utilizzando le formule semplificate per il calcolo di entrambi valori (si rammenta che i simboli sopra segnati indicano le medie quadratiche ed aritmetiche): σ x = x x ; σ = ; σ x = xi i x Impostiamo pertanto la seguente tabella di calcolo: x i i x i i x i i tot da cui è possibile ottenere: media aritmetica della variabile x - x = 3 5 = 4, 6 ;

11 bruno delle donne Esercitazioni di Statistica - modulo base - a.a media quadratica al quadrato della variabile x - x = = 7 5 ; 7 media aritmetica della variabile - = =, 4 5 ; 5 media quadratica al quadrato della variabile - = = 3 5 Con le medie sopra calcolate, possiamo ottenere: 3 covarianza - σ x = 4, 6, 4 =, 84 5 x = scarto della var. x - σ = 7 4, 6, 47 = scarto della var. - σ = 3, 4, 00 Disponendo di tutti gli elementi necessari possiamo calcolare i parametri delle rette di regressione: regressione di Y su X:, 84 b = = 0, 35 ; B 0 =,4-(-0,35)*4,6 =,849 quindi =-0,35x+,849 x, 47 regressione di X su Y:, 84 b x = =, 769 ; B 0 = 4,6-(-,769)*,4 = 7,077 quindi x=-,769+7,077, 00 Inoltre è possibile calcolare anche il coefficiente di correlazione di Bravais-Pearson:, 84 r = = 0, 747, 47*, 00 Dai risultati dell esercizio è possibile dedurre: la regressione della Y sulla X è negativa e la retta è decrescente (vuol dire che la variabile dipendente Y ha un andamento inverso a quello della variabile indipendente X); stessa analisi per la regressione della X sulla Y; non è possibile quantificare l incidenza della dipendenza della Y sulla X o di quella della X sulla Y essendo i coefficiente di regressione indici che possono assumere qualsiasi valore; la correlazione tra le due variabili è negativa, risultato che era deducibile dall andamento inverso delle due variabili; la correlazione è più che significativa risultando il coefficiente r pari al 74,7% (si rammenta che il coefficiente r varia tra - e +). Infine, la relazione tra coefficiente di correlazione e quelli di regressione è rappresentata da: il coefficiente di correlazione è la media geometrica (presa con il segno della covarianza) dei due coefficienti di regressione ; pertanto la relazione stessa è data da: r = b b x = 0, 35, 769 = 0, 747 (il segno meno deriva da quello della covarianza) x

12 bruno delle donne Esercitazioni di Statistica - modulo base - a.a ESERCIZIO 8 RELAZIOI (DIPEDEZA I MEDIA) La distribuzione dei contribuenti secondo i caratteri X: condizione professionale e Y: classe di età - valori in migliaia (le classi includono l'estremo superiore e non quello inferiore) è quella appresso riportata; si stimi la dipendenza in media del carattere Y dal carattere X; si commenti il risultato ottenuto. X: Condizione Y: Classi di età totale professionale Dipendenti Artig. e Comm Liberi profess Totale Essendo la distribuzione del carattere Y in classi è necessario individuare i valori centrali; si deve osservare che le classi presentano estremi inferiori non inclusi quindi si dovrebbero leggere come 5-5, 6-40, 4-45, e Poste in quest ultimo modo le diverse classi del carattere Y, è possibile ottenere il valore centrale con il solito criterio della semisomma degli estremi di ciascuna classe; pertanto la tabella riscritta avendo sostituito alle modalità del carattere Y i i valori centrali delle classi, risulta: X: Condizione Y: età (valori centrali) totale professionale Dipendenti Artig. e Comm Liberi profess totale Per il calcolo dell'indipendenza in media è necessario calcolare il rapporto di correlazione di Pearson, cioè: Dev( ) σ η = = Dev σ x ( ) Occorre quindi calcolare lo scarto quadratico medio della variabile Y (denominatore della formula) e quello delle medie delle varie distribuzioni parziali della stessa variabile per ciascuna modalità del carattere X (numeratore della formula). Moltiplichiamo le modalità del carattere Y (valori centrali delle classi) per le frequenze di ciascuna distribuzione del carattere Y vincolata a ciascuna modalità del carattere X (cioè le varie righe) e facciamo lo stesso per la riga dei totali (distribuzione marginale che rappresenta frequenze del carattere Y indipendentemente dal carattere X) per ottenere la media di Y; su questi ultimi due valori (modalità di Y e frequenze totali) facciamo anche i quadrati per la corrispondente media quadratica.

13 bruno delle donne Esercitazioni di Statistica - modulo base - a.a X: Condizione Y: età (valori centrali) professionale totale Dipendenti Artig. e Comm Liberi profess j *n j j === j *n j La media generale del carattere Y è 47,65 (=9530/00), il quadrato della media quadratica è 430,55 (=4860/00), mentre la devianza e lo scarto risultano: Dev σ ( Y ) = ( M M ) = 00 ( 430, 55 47, 65 ) 3006 Dev ( Y ) = = = =, 650 Con riferimento alle distribuzioni parziali, avendo calcolato su ciascuna riga la somma dei prodotti delle modalità per le rispettive frequenze, possiamo ottenere la media di ciascuna distribuzione dividendo il totale di riga per il corrispondente totale della tabella di partenza (totale delle frequenze di ciascuna distribuzione parziale del carattere Y vincolata a ciascuna modalità del carattere X): la media Dipendenti è pari a 45,65 (=5475/0), quella degli Artigiani e Commercianti pari a 47,475 (=899/40) e quella del Liberi professionisti è 53,9 (=56/40). Riscriviamo la distribuzione delle medie (singole medie con le loro frequenze) sui cui dobbiamo calcolare la devianza e lo scarto quadratico medio: X: Condizione professionale j n j j n j Dipendenti 45, , ,88 Artig. e Comm. 47, , ,03 Liberi profess. 53, , 608,40 totale ===== ===== 45660,30 La media risulta pari a 47,65 (=9530/00) come quella generale (si rammenta che la media di una popolazione divisa in gruppi è la media delle medie) ed il quadrato della media quadratica è pari a 80,80 (=45660,30/00); pertanto la devianza e lo scarto quadratico risultano: ( Y ) = 00 ( 80, 80 47, 65 ) 055, 8 Dev = σ 055, 8 00 = = 3, 06 Disponendo dei due scarti quadratici medi è possibile ottenere l'eta di Pearson che è pari a (vedi formula sopra indicata) 0,53 (=3,06/,65). j j n j

14 bruno delle donne Esercitazioni di Statistica - modulo base - a.a Commento Il risultato ottenuto consente di affermare che la dipendenza in media risulta scarsamente significativa essendo lo scarto quadratico medio delle medie appena il 5,3% di quello totale; si rammenta che l'eta varia tra 0 ( indipendenza) e (perfetta concordanza) ESERCIZIO 9 RELAZIOI (ITERDIPEDEZA CO MUTABILI) La distribuzione di un collettivo secondo i caratteri X: stato civile e Y: zona di residenza,.è risultata quella appresso riportata; si stimi la dipendenza tra i due caratteri; si commenti il risultato ottenuto. (valori x.000) X: Zona di Y: stato civile residenza celibi coniugati separati divorziati vedovi totale ord Centro Sud Isole totale Per il calcolo dell'indipendenza in una tabella di contingenza è necessario calcolare il Chi quadro, cioè: r s Cij χ = * in cui Cij = n ij n ij e n i = j = ij n n n * i j ij Occorre quindi calcolare n ij * (frequenza di indipendenza) e C ij (contingenza) per ogni cella della tabella a doppia entrata; si deve cioè ottenere la tabella d'indipendenza (scrivendo in ciascuna casella il totale della sua riga per il totale della sua colonna diviso per il totale generale) Tabella di indipendenza X Y = totale 4,3 9,6 59,4 3,4 4,3 70,5 0,0 55,0 30,0,5 50,6 5, 5,8 8,8,6 40,6 5, 5,8 8,8,6 40 totale (ad es. la prima casella prima riga e prima colonna risulta dall operazione 90*70/000; la casella della terza riga e della quarta colonna risulta dall operazione 0*40/000, ecc.). Successivamente si può calcolare la tabella del Chi quadro facendo (per ogni casella) la differenza tra la tabella effettiva e quella di indipendenza (ottenere cioè le cosiddette contingenze), elevare al quadrato la differenza e dividere il risultato per la tabella di indipendenza.

15 bruno delle donne Esercitazioni di Statistica - modulo base - a.a Tabella del Chi quadro X Y totale 0,070 5,057 6,467,844 0,8 4,656,878 0,000,64 0,33 0,544 3,79 5,007 0,834,09 0,7,07 0,339 0,33,67 5,345,689 7,9 7,633 totale 7,68 8,057 5,86 5,939 9,897 46,347 Il totale della tabella rappresenta il Chi quadro (l'indice di indipendenza cercato); tale indice, come noto, ha la dimensione di una frequenza assoluta. Commento L'indice ottenuto, essendo una misura assoluta legata alla frequenza assoluta, non consente di indicare se la dipendenza può ritenersi elevata o meno; per tale motivo è necessario dapprima depurare l'indice della dimensione dovuta al totale delle frequenze e successivamente rapportare il risultato al suo massimo; cioè si debbono calcolare i due indici: 46, 347 Phi quadro φ = χ = = 0, Cramer C φ 0, 0463 = = 0, 054 min min( 4, 5 ) = ( r,s) L'ultimo indice varia tra 0 (indipendenza) e (massima concordanza) e consente di affermare che tra i due caratteri esiste quasi indipendenza risultando la dipendenza appena,54%. ESERCIZIO 9 RELAZIOI (ITERDIPEDEZA e DIPEDEZA I MEDIA) La distribuzione del numero degli assicurati di una Compagnia di assicurazioni secondo il carattere X: zona territoriale e Y: età (valori in migliaia) è rappresentata da: X: zona Y: età (valori centrali delle classi) territoriale totale ord-ovest ord-est Centro Sud Isole totale Si analizzi la dipendenza tra i due caratteri sia in termini di interdipendenza che di dipendenza in media e si commentino i risultati ottenuti.

16 bruno delle donne Esercitazioni di Statistica - modulo base - a.a interdipendenza Per l'interdipendenza tra i due caratteri (associazione in cui almeno uno dei caratteri è una mutabile) si deve calcolare il Chi quadro, quindi: r s Cij χ = * in cui Cij = n ij n ij è la contingenza e n i = j = di indipendenza ij n ni n j = la frequenza * ij Tabella di indipendenza (n ij *=n i. n.j /) X: zona Y: età (valori centrali delle classi) territoriale totale ord-ovest,5 37, ord-est,5 33, ,5 36,5 80 Centro,5 33, ,5 36,5 80 Sud Isole Totale Tabella del Chi quadro: C ij /n ij * X: zona Y: età (valori centrali delle classi) territoriale totale ord-ovest 4,500 8,67 0,400 0,00,05 4,840 9,3 ord-est 0,939 4,446 9,000 0,747 5,444 5, 35,788 Centro 0,450,557,000 0,500 0,08 0,900 4,435 Sud 0,900 7,633 3,78,000 3,000 6,050 6,365 Isole 0,00 3,067,563,7 0,50 5,900 70,70 Totale 6,989 44,870 5,744 5,69 48,747 79,90 69,355 Pertanto χ = 69,355 da cui si può ottenere φ = χ φ / = 0,087 e C = = min( r, s) 0,0. L'ultimo indice varia tra 0 ed e indica quindi una interdipendenza tra i due caratteri quasi nulla (appena,%). dipendenza in media Calcoliamo adesso la dipendenza in media di Y (il carattere quantitativo) sul carattere X; tale dipendenza è stimata dall'eta di Pearson, quindi: σ η = σ x

17 bruno delle donne Esercitazioni di Statistica - modulo base - a.a Per il calcolo individuiamo le distribuzioni parziali e quella marginale del carattere Y ed effettuiamo il prodotto delle modalità per le frequenze (per comodità di calcolo dividiamo per 0 le modalità del carattere Y). distribuzione modalità del carattere Y carattere Y totali parziale parziale parziale parziale parziale marginale Calcoliamo anche la media quadratica del carattere Y Y 4,0 9,0 6,0 5,0 36,0 49,0 === Y *n.j 00,0 350,0 560,0 4500,0 5760,0 4900,0 970,0 E possibile quindi calcolare le singole medie delle distribuzioni parziali, quella dell intera distribuzione Y (marginale) e la media quadratica al quadrato di quest ultima: = j n j = = 4 65 ; = j n j = = 4, = j n3 j = = ; 4 = j n4 j = = 5, = j n5 j = = ; = j n j = = 4, = j n j = = , 3, 5,, pertanto si potrà calcolare lo scarto quadratico medio dell intero carattere Y con l usuale formula σ = = 4, 088 4, 688 =,454 (i valori veri se fossero necessari per qualsiasi altra elaborazione dovrebbero evidentemente essere moltiplicati per 0, ovviamente il quadrato della media quadratica dovrebbe essere moltiplicato per 00). Otteniamo infine lo scarto delle medie riscrivendo la distribuzione delle medie con le rispettive frequenze

18 bruno delle donne Esercitazioni di Statistica - modulo base - a.a carattere X medie ( i ) freq. (n i ) x i *n i i i *n i ord-ovest 4, ,0 7, ,45 ord-est 4, ,0 7,83 308,89 Centro 4, ,0, ,0 Sud 5, ,0 9, ,63 Isole 5, ,0 3,06 565, totale === === 7838,7 Possiamo pertanto calcolare la media delle medie = 4,688 (3750/800) ovviamente uguale alla media dell intera distribuzione Y (la media di una popolazione divisia in gruppi è uguale alla media delle medie dei gruppi), il quadrato della media quadratica delle medie =,98 (7838,7/800) e quindi lo scarto quadratico medio delle medie σ =, 98 4, 688 = 0,570 (anche in questo caso i valori veri delle medie se fossero necessari per qualsiasi altra elaborazione dovrebbero evidentemente essere moltiplicati per 0 e per 00). Disponendo dei due scarti quadratici possiamo calcolare l Eta di Pearson, stabilendo che 0, 570 η = = 0,39, 454 x L'ultimo indice varia tra 0 ed e indica quindi una dipendenza delle medie di Y sul carattere X non eccessivamente elevata (il 39,%), sicuramente più significativa dell'interdipendenza.

Istituzioni di Statistica e Statistica Economica

Istituzioni di Statistica e Statistica Economica Istituzioni di Statistica e Statistica Economica Università degli Studi di Perugia Facoltà di Economia, Assisi, a.a. 2013/14 Esercitazione n. 1 A. I dati riportati nella seguente tabella si riferiscono

Dettagli

Esercitazioni di statistica

Esercitazioni di statistica Esercitazioni di statistica Misure di associazione: Indipendenza assoluta e in media Stefania Spina Universitá di Napoli Federico II stefania.spina@unina.it 22 ottobre 2014 Stefania Spina Esercitazioni

Dettagli

ESERCIZI STATISTICA DESCRITTIVA

ESERCIZI STATISTICA DESCRITTIVA ESERCIZI STATISTICA DESCRITTIVA Frequenze assolute e relative Titolo di studio Frequenze assolute Frequenze relative Proporzioni Percentuali Senza titolo 30 0,025 2,5 Lic. elementare 509 0,424 42,4 Licenza

Dettagli

REGRESSIONE E CORRELAZIONE

REGRESSIONE E CORRELAZIONE REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 41 Outline 1 2 3 4 5 () Statistica 2 / 41 Misura del legame Data una variabile doppia (X, Y ), la

Dettagli

Esercitazione di Statistica Indici di associazione

Esercitazione di Statistica Indici di associazione Esercitazione di Statistica Indici di associazione 28/10/2015 La relazione tra caratteri Indipendenza logica Quando si suppone che tra due caratteri non ci sia alcuna relazione di causa-effetto. Indipendenza

Dettagli

Statistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione

Statistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione Statistica Esercitazione alessandro polli facoltà di scienze politiche, sociologia, comunicazione Obiettivo Esercizio 1. Questo e alcuni degli esercizi che proporremo nei prossimi giorni si basano sul

Dettagli

Lezione 8. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 8. A. Iodice. Relazioni tra variabili

Lezione 8. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 8. A. Iodice. Relazioni tra variabili Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 26 Outline 1 2 3 4 () Statistica 2 / 26 Misura del legame Data una variabile doppia (X, Y ), la misura

Dettagli

Lezione 4 a - Misure di dispersione o di variabilità

Lezione 4 a - Misure di dispersione o di variabilità Lezione 4 a - Misure di dispersione o di variabilità Abbiamo visto che la media è una misura della localizzazione centrale della distribuzione (il centro di gravità). Popolazioni con la stessa media possono

Dettagli

La dipendenza. Antonello Maruotti

La dipendenza. Antonello Maruotti La dipendenza Antonello Maruotti Outline 1 Distribuzioni doppie 2 Medie e varianze condizionate 3 Indici di associazione Distribuzione doppia Definizione Una distribuzione doppia si ha quando su di uno

Dettagli

3) In una distribuzione di frequenza si può ottenere più di una moda Vero Falso

3) In una distribuzione di frequenza si può ottenere più di una moda Vero Falso CLM C Verifica in itinere statistica medica 13-01-2014 1) Indicate a quale categoria (Qualitativa, qualitativa ordinabile, quantitativa discreta, quantitativa continua) appartengono le seguenti variabili:

Dettagli

Statistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione

Statistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2011/2012 Statistica Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate.

Dettagli

Distribuzioni secondo due caratteri. Rappresentazioni e prime sintesi

Distribuzioni secondo due caratteri. Rappresentazioni e prime sintesi Distribuzioni secondo due caratteri Rappresentazioni e prime sintesi Rappresentazioni delle distribuzioni doppie Quando per ogni unità del collettivo rileviamo due caratteri otteniamo una Esempio. Ad alcuni

Dettagli

Esercitazioni. Es 1. Dato il seguente dataset

Esercitazioni. Es 1. Dato il seguente dataset Esercitazioni Es 1 Dato il seguente dataset N SESSO ETA' PESO ALTEZZA DIPLOMA COMPONENTI OCCHIALI FUMO 1 0 20,6 65 180 Ist.Tecnico 6 0 1 2 0 20,2 75 180 Liceo 4 0 0 3 0 20,3 60 173 Ist.Tecnico 4 1 0 4

Dettagli

STATISTICA: esercizi svolti sulla DIPENDENZA IN MEDIA

STATISTICA: esercizi svolti sulla DIPENDENZA IN MEDIA STATISTICA: esercizi svolti sulla DIPEDEZA I MEDIA 1 1 LA DIPEDEZA I MEDIA 2 1 LA DIPEDEZA I MEDIA 1. La popolazione in migliaia di unità occupata in Piemonte nel 1985 per reddito annuo Y (migliaia di

Dettagli

Lezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo

Lezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo UIVERSITA DEGLI STUDI DI BASILICATA FACOLTA DI ECOOMIA Corso di laurea in Economia Aziendale anno accademico 2012/2013 Lezioni di Statistica del 15 e 18 aprile 2013 Docente: Massimo Cristallo LA RELAZIOE

Dettagli

STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE

STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 2 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1.1

Dettagli

Esercitazioni di Statistica

Esercitazioni di Statistica Esercitazioni di Statistica Indici di posizione e di variabilità Prof. Livia De Giovanni lstatistica@dis.uniroma1.it Esercizio 1 Data la seguente distribuzione unitaria del carattere X: X : 4 2 4 2 6 4

Dettagli

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2010/2011 Statistica Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza

Dettagli

1/4 Capitolo 4 Statistica - Metodologie per le scienze economiche e sociali 2/ed Copyright 2008 The McGraw-Hill Companies srl

1/4 Capitolo 4 Statistica - Metodologie per le scienze economiche e sociali 2/ed Copyright 2008 The McGraw-Hill Companies srl 1/4 Capitolo 4 La variabilità di una distribuzione Intervalli di variabilità Box-plot Indici basati sullo scostamento dalla media Confronti di variabilità Standardizzazione Statistica - Metodologie per

Dettagli

Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale)

Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale) Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale) Esercizio 1: Un indagine su 10.000 famiglie ha dato luogo, fra le altre, alle osservazioni riportate nella

Dettagli

UNIVERSITÀ DEGLI STUDI DI ROMA LA SAPIENZA

UNIVERSITÀ DEGLI STUDI DI ROMA LA SAPIENZA UNIVERSITÀ DEGLI STUDI DI ROMA LA SAPIENZA - 9.Statistica - CTF Matematica - Seconda Parte Codice Compito: - Numero d Ordine D. 1 Un veicolo marcia per 50 km alla velocita v, e per altri 50 km alla velocita

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Misura dell associazione tra due caratteri Uno store manager è interessato a studiare la relazione

Dettagli

Questionario 1. Sono assegnati i seguenti dati

Questionario 1. Sono assegnati i seguenti dati Questionario 1. Sono assegnati i seguenti dati 30 30 10 30 50 30 60 60 30 20 20 20 30 20 30 30 20 10 10 40 20 30 10 10 10 30 40 30 20 20 40 40 40 dire se i dati illustrati sono unità statistiche valori

Dettagli

Esercitazioni di statistica

Esercitazioni di statistica Esercitazioni di statistica Gli indici statistici di sintesi: Gli indici di centralità Stefania Spina Universitá di Napoli Federico II stefania.spina@unina.it 7 Ottobre 2014 Stefania Spina Esercitazioni

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2 Dott.ssa Antonella Costanzo a.costanzo@unicas.it TIPI DI MEDIA: GEOMETRICA, QUADRATICA, ARMONICA Esercizio 1. Uno scommettitore puntando una somma iniziale

Dettagli

STATISTICA 1 ESERCITAZIONE 2

STATISTICA 1 ESERCITAZIONE 2 Frequenze STATISTICA 1 ESERCITAZIONE 2 Dott. Giuseppe Pandolfo 7 Ottobre 2013 RAPPRESENTAZIONE GRAFICA DEI DATI Le rappresentazioni grafiche dei dati consentono di cogliere la struttura e gli aspetti caratterizzanti

Dettagli

Esercitazione del

Esercitazione del Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36

Dettagli

Esercizi Svolti. 2. Costruire la distribuzione delle frequenze cumulate del tempo di attesa

Esercizi Svolti. 2. Costruire la distribuzione delle frequenze cumulate del tempo di attesa Esercizi Svolti Esercizio 1 Per una certa linea urbana di autobus sono state effettuate una serie di rilevazioni sui tempi di attesa ad una determinata fermata; la corrispondente distribuzione di frequenza

Dettagli

DISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a Prerequisiti Popolazione, unità, carattere Come nascono i dati:

DISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a Prerequisiti Popolazione, unità, carattere Come nascono i dati: DISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a. 2007-2008 Prerequisiti Popolazione, unità, carattere Come nascono i dati: osservazione e sperimentazione Popolazione: reale e virtuale Classificazione

Dettagli

ESERCIZI SVOLTI Giuliano Bonollo - Michele Bonollo

ESERCIZI SVOLTI Giuliano Bonollo - Michele Bonollo ESERCIZI SVOLTI Giuliano Bonollo - Michele Bonollo 1 La seguente tabella riporta le frequenze relative riguardanti gli studenti di un università e gli esiti dell esame da essi sostenuto. Qual è la percentuale

Dettagli

Statistica Un Esempio

Statistica Un Esempio Statistica Un Esempio Un indagine sul peso, su un campione di n = 100 studenti, ha prodotto il seguente risultato. I pesi p sono espressi in Kg e sono stati raggruppati in cinque classi di peso. classe

Dettagli

Gli indici di variabilità

Gli indici di variabilità Le misure della variabilità 4/5 ottobre 2011 Statistica sociale 1 Gli indici di variabilità In tutti gli esempi visti nell ultima lezione, abbiamo visto che le grandezze considerate - pur nelle diverse

Dettagli

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci La statistica Elaborazione e rappresentazione dei dati Gli indicatori statistici Introduzione La statistica raccoglie ed analizza gruppi di dati (su cose o persone) per trarne conclusioni e fare previsioni

Dettagli

Statistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione

Statistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione Statistica Esercitazione alessandro polli facoltà di scienze politiche, sociologia, comunicazione Obiettivo Questa esercitazione ha l obiettivo di consolidare ulteriormente gli strumenti di analisi bivariata

Dettagli

Esempi di confronti grafici

Esempi di confronti grafici Esempi di confronti grafici Esempi di confronti grafici 7/3 Capitolo 3 LE MEDIE La media aritmetica La media geometrica La trimmed mean La mediana La moda I percentili Statistica - Metodologie per

Dettagli

Indice. 1. Premessa Le relazioni tra coppie di caratteri L analisi della contingenza L analisi della correlazione...

Indice. 1. Premessa Le relazioni tra coppie di caratteri L analisi della contingenza L analisi della correlazione... INSEGNAMENTO DI STATISTICA DEL TURISMO LEZIONE IX LE RELAZIONI TRA CARATTERI PROF. GIOVANNI DI TRAPANI Indice 1. Premessa.... 3 2. Le relazioni tra coppie di caratteri.... 4 3. L analisi della contingenza....

Dettagli

x i. Δ x i

x i. Δ x i ITCS "R. LUXEMBURG" BO- AS 011-01 5CL MATEMATICA- COGOME: OME: VERIFICA UD 1.A : STATISTICA DESCRITTIVA (ORE ) DATA: 1] Data la serie del numero di componenti dei nuclei familiari rilevati in un gruppo

Dettagli

Capitolo 12. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 12.1: Suggerimento

Capitolo 12. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 12.1: Suggerimento Capitolo Suggerimenti agli esercizi a cura di Elena Siletti Esercizio.: Suggerimento Per verificare se due fenomeni sono dipendenti in media sarebbe necessario confrontare le medie condizionate, in questo

Dettagli

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17 C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica

Dettagli

Ringraziamenti dell Editore

Ringraziamenti dell Editore Indice Elenco dei simboli e delle abbreviazioni in ordine di apparizione Ringraziamenti dell Editore XI XVII 1 Introduzione FAQ e qualcos altro, da leggere prima 1 1.1 QuestoèunlibrodiStatistica....................

Dettagli

a.a Esercitazioni di Statistica Medica e Biometria Corsi di Laurea triennali Ostetricia / Infermieristica Pediatrica I anno

a.a Esercitazioni di Statistica Medica e Biometria Corsi di Laurea triennali Ostetricia / Infermieristica Pediatrica I anno a.a. 2007-2008 Esercitazioni di Statistica Medica e Biometria Corsi di Laurea triennali Ostetricia / Infermieristica Pediatrica I anno Dott.ssa Daniela Alessi daniela.alessi@med.unipmn.it 1 Argomenti:

Dettagli

Università degli Studi di Napoli Parthenope. Facoltà di Scienze Motorie a.a. 2010/2011 STATISTICA. Docente: Paolo Mazzocchi

Università degli Studi di Napoli Parthenope. Facoltà di Scienze Motorie a.a. 2010/2011 STATISTICA. Docente: Paolo Mazzocchi Università degli Studi di Napoli Parthenope Facoltà di Scienze Motorie a.a. 2010/2011 STATISTICA paolo.mazzocchi@uniparthenope.it Programma 1) Tabelle: distribuzioni di frequenze; classi di valori; tabelle

Dettagli

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Indici di posizione variabilità e forma per caratteri qualitativi Il seguente data set riporta la rilevazione

Dettagli

Elementi di Statistica

Elementi di Statistica Università degli Studi di Palermo Dipartimento di Ingegneria Informatica Informatica ed Elementi di Statistica 3 c.f.u. Anno Accademico 2010/2011 Docente: ing. Salvatore Sorce Elementi di Statistica Statistica

Dettagli

Indicatori di Posizione e di Variabilità. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica

Indicatori di Posizione e di Variabilità. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica Indicatori di Posizione e di Variabilità Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica Indici Sintetici Consentono il passaggio da una pluralità

Dettagli

Istituzioni di Statistica 1 Esercizi su tabelle di contingenza

Istituzioni di Statistica 1 Esercizi su tabelle di contingenza Istituzioni di Statistica 1 Esercizi su tabelle di contingenza Esercizio 1 Per stimare la percentuale di fumatori nella popolazione italiana adulta viene intervistato un campione di 60 donne e uno di 40

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative

Dettagli

Analisi congiunta di più fenomeni

Analisi congiunta di più fenomeni Analisi congiunta di più fenomeni Dati relativi al disastro del Titanic: Morti Sopravvissuti Classe Sesso Età 1 a Uomini Bambini 0 5 Adulti 118 57 Donne Bambini 0 1 Adulti 4 140 2 a Uomini Bambini 0 11

Dettagli

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva Fondamenti di Informatica Ester Zumpano Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva Lezione 5 Statistica descrittiva La statistica descrittiva mette a disposizione il calcolo di

Dettagli

Statistica descrittiva II

Statistica descrittiva II Probabilità e Statistica Esercitazioni a.a. 009/010 C.d.L.: Ingegneria Elettronica e delle Telecomunicazioni, Ingegneria Informatica Statistica descrittiva II Ines Campa Probabilità e Statistica - Esercitazioni

Dettagli

STATISTICHE DESCRITTIVE Parte II

STATISTICHE DESCRITTIVE Parte II STATISTICHE DESCRITTIVE Parte II INDICI DI DISPERSIONE Introduzione agli Indici di Dispersione Gamma Differenza Interquartilica Varianza Deviazione Standard Coefficiente di Variazione introduzione Una

Dettagli

Esercitazioni del corso: STATISTICA

Esercitazioni del corso: STATISTICA A. A. 0-0 Esercitazioni del corso: STATISTICA Sommario Esercitazione 4: Medie e varianze marginali Medie e varianze condizionate Scomposizione della varianza Indipendenza in media ESERCIZIO UNIVERSITÀ

Dettagli

STATISTICA (I modulo - Statistica Descrittiva) Soluzione Esercitazione I

STATISTICA (I modulo - Statistica Descrittiva) Soluzione Esercitazione I STATISTICA (I modulo - Statistica Descrittiva) Soluzione Esercitazione I 1. Il consumo di farmaci negli ultimi due giorni è un fenomeno di movimento. L'età è un carattere quantitativo continuo; nella tabella

Dettagli

STATISTICA (modulo I - Statistica Descrittiva) Soluzione Esercitazione I

STATISTICA (modulo I - Statistica Descrittiva) Soluzione Esercitazione I 2. e 3. STATISTICA (modulo I - Statistica Descrittiva) Soluzione Esercitazione I 1. Le unità statistiche sono costituite dai singoli ristoranti, mentre la popolazione è costituita da tutte le unità del

Dettagli

METODO DEI MINIMI QUADRATI

METODO DEI MINIMI QUADRATI METODO DEI MINIMI QUADRATI Torniamo al problema della crescita della radice di mais in funzione del contenuto di saccarosio nel terreno di coltura. Ripetendo varie volte l esperimento con diverse quantità

Dettagli

Stesso valore medio per distribuzioni diverse

Stesso valore medio per distribuzioni diverse Fonti e strumenti statistici per la comunicazione Prof.ssa Isabella Mingo A.A. 014-015 Stesso valore medio per distribuzioni diverse u i X 11 X 1 X 13 A 1 1 B 8 1 C 0 1 D 3 3 1 E 19 34 1 F 0 41 1 Un uguale

Dettagli

Premessa: la dipendenza in media

Premessa: la dipendenza in media Premessa: la dipendenza in media Supponiamo di avere K diversi livelli di un fattore che potrebbero influire su una determinata variabile. Per esempio supponiamo di domandarci se la diversificazione (intesa

Dettagli

PROVA SCRITTA DI STATISTICA. cod CLEA-CLAPI-CLEFIN-CLELI cod CLEA-CLAPI-CLEFIN-CLEMIT. 5 Novembre 2003 SOLUZIONI MOD.

PROVA SCRITTA DI STATISTICA. cod CLEA-CLAPI-CLEFIN-CLELI cod CLEA-CLAPI-CLEFIN-CLEMIT. 5 Novembre 2003 SOLUZIONI MOD. PROVA SCRITTA DI STATISTICA cod. 4038 CLEA-CLAPI-CLEFIN-CLELI cod. 5047 CLEA-CLAPI-CLEFIN-CLEMIT 5 Novembre 003 SOLUZIONI MOD. A In 8 facoltà di un ateneo italiano vengono rilevati i seguenti dati campionari

Dettagli

Esercizio 1 Questa tabella esprime i tempi di durata di 200 apparecchiature elettriche:

Esercizio 1 Questa tabella esprime i tempi di durata di 200 apparecchiature elettriche: Istituzioni di Statistica 1 Esercizi su indici di posizione e di variabilità Esercizio 1 Questa tabella esprime i tempi di durata di 200 apparecchiature elettriche: Durata (ore) Frequenza 0 100? 100 200

Dettagli

Le misure della tendenza

Le misure della tendenza Statistica descrittiva: le misure della tendenza centrale 4 ottobre 2011 Statistica sociale 1 Le misure della tendenza centrale Vediamo i passi che abbiamo fatto finora: 1) Abbiamo stabilito che cosa è

Dettagli

= elemento che compare nella seconda riga e quinta colonna = -4 In generale una matrice A di m righe e n colonne si denota con

= elemento che compare nella seconda riga e quinta colonna = -4 In generale una matrice A di m righe e n colonne si denota con Definizione di matrice Una matrice (di numeri reali) è una tabella di m x n numeri disposti su m righe e n colonne. I numeri che compaiono nella tabella si dicono elementi della matrice. La loro individuazione

Dettagli

http://www.biostatistica.unich.it 1 STATISTICA DESCRITTIVA Le misure di tendenza centrale 2 OBIETTIVO Individuare un indice che rappresenti significativamente un insieme di dati statistici. 3 Esempio Nella

Dettagli

STATISTICA esercizi svolti sulla VARIABILITA

STATISTICA esercizi svolti sulla VARIABILITA STATISTICA esercizi svolti sulla VARIABILITA 1 1 VARIABILITA 2 1 VARIABILITA 1.1 Esercizi 1. La seguente tabella riporta il tempo (in giorni) impiegato da sei individui per il consumo di una confezione

Dettagli

SCOPO DELL ANALISI DI CORRELAZIONE

SCOPO DELL ANALISI DI CORRELAZIONE CORRELAZIONE 1 SCOPO DELL ANALISI DI CORRELAZIONE STUDIARE LA RELAZIONE TRA DUE VARIABILI X E Y 2 diagrammi di dispersione un diagramma di dispersione (o grafico di dispersione) èuna rappresentazione grafica

Dettagli

Statistica. Matematica con Elementi di Statistica a.a. 2015/16

Statistica. Matematica con Elementi di Statistica a.a. 2015/16 Statistica La statistica è la scienza che organizza e analizza dati numerici per fini descrittivi o per permettere di prendere delle decisioni e fare previsioni. Statistica descrittiva: dalla mole di dati

Dettagli

Casa dello Studente. Casa dello Studente

Casa dello Studente. Casa dello Studente Esercitazione - 14 aprile 2016 ESERCIZIO 1 Di seguito si riporta il giudizio (punteggio da 0 a 5) espresso da un gruppo di studenti rispetto alle diverse residenze studentesche di un Ateneo: a) Si calcolino

Dettagli

Tema d esame del 15/02/12

Tema d esame del 15/02/12 Tema d esame del 15/0/1 Volendo aprire un nuovo locale, una catena di ristoranti chiede ad un consulente di valutare la posizione geografica ideale all interno di un centro abitato. A questo scopo, avvalendosi

Dettagli

Associazione tra caratteri quantitativi: gli indici di correlazione

Associazione tra caratteri quantitativi: gli indici di correlazione Associazione tra caratteri quantitativi: gli indici di correlazione Per correlazione si intende una relazione tra due variabili tale che a ciascun valore della prima variabile corrisponda con una certa

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Sintesi a cinque e misure di variabilità rispetto ad un centro Una catena di fast-food ha selezionato

Dettagli

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURA/TECNICA DI ANALISI DEI DATI SPECIFICAMENTE DESTINATA A STUDIARE LA RELAZIONE TRA UNA VARIABILE NOMINALE (ASSUNTA

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 4

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 4 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 4 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Differenze semplici medie, confronti in termini di mutua variabilità La distribuzione del prezzo

Dettagli

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 21/09/2011

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 21/09/2011 FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 1/9/11 ESERCIZIO 1 (+3++3) La seguente tabella riporta la distribuzione di frequenza dei valori di emoglobina nel sangue (espressi

Dettagli

Consideriamo un numero a e un numero naturale n positivo. Per dare una definizione corretta di radicale con indice n, o radice n-esima di a

Consideriamo un numero a e un numero naturale n positivo. Per dare una definizione corretta di radicale con indice n, o radice n-esima di a RADICALI E PROPRIETÀ DEI RADICALI I radicali in Matematica sono numeri definiti mediante radici con indice intero. I radicali possono essere espressi sotto forma di potenze con esponente fratto mediante

Dettagli

Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii

Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii Sommario Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii xv Parte I Statistica descrittiva 1 Capitolo 1 Introduzione 3 Perché studiare statistica? 4

Dettagli

Statistica4-29/09/2015

Statistica4-29/09/2015 Statistica4-29/09/2015 Raccogliere i dati con il maggior numero di cifre significative ed arrotondare eventualmente solo al momento dei calcoli (min. 3); nella grande maggioranza delle ricerche biologiche

Dettagli

Facoltà di Scienze Politiche Corso di laurea in Servizio sociale. Compito di Statistica del 7/1/2003

Facoltà di Scienze Politiche Corso di laurea in Servizio sociale. Compito di Statistica del 7/1/2003 Compito di Statistica del 7/1/2003 I giovani addetti all agricoltura in due diverse regioni sono stati classificati per età; la distribuzione di frequenze congiunta è data dalla tabella seguente Età in

Dettagli

Elementi di statistica

Elementi di statistica Scuola media G. Ungaretti Elementi di statistica Prof. Enrico Castello Ti insegnerò a conoscere i criteri organizzatori di una tabella di dati distinguere frequenze assolute e frequenze percentuali determinare

Dettagli

Teoria e tecniche dei test. Concetti di base

Teoria e tecniche dei test. Concetti di base Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi

Dettagli

Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill

Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill Es. Soluzione degli esercizi del capitolo 6 home - indice In base agli arrotondamenti effettuati nei calcoli,

Dettagli

Ulteriori applicazioni del test del Chi-quadrato (χ 2 )

Ulteriori applicazioni del test del Chi-quadrato (χ 2 ) Ulteriori applicazioni del test del Chi-quadrato (χ 2 ) Finora abbiamo confrontato con il χ 2 le numerosità osservate in diverse categorie in un campione con le numerosità previste da un certo modello

Dettagli

INDICATORI DI TENDENZA CENTRALE

INDICATORI DI TENDENZA CENTRALE INDICATORI DI TENDENZA CENTRALE INDICATORI DI TENDENZA CENTRALE Consentono di sintetizzare un insieme di misure tramite un unico valore rappresentativo indice che riassume o descrive i dati e dipende dalla

Dettagli

Statistiche e relazioni

Statistiche e relazioni tatistiche descrittive per frequenze e misure Frequenze e misure Per le frequenze e le misure, molte di queste statistiche perdono senso. In compenso, esistono indici appropriati, inutilizzabili per i

Dettagli

Sintesi dei dati in una tabella. Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6)

Sintesi dei dati in una tabella. Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6) Sintesi dei dati in una tabella Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6) Sintesi dei dati Spesso si vuole effettuare una sintesi dei dati per ottenere indici

Dettagli

ESEMPI DI DOMANDE PER TUTTE E DUE LE TIPOLOGIE DI PARTECIPANTI

ESEMPI DI DOMANDE PER TUTTE E DUE LE TIPOLOGIE DI PARTECIPANTI ESEMPI DI DOMANDE PER TUTTE E DUE LE TIPOLOGIE DI PARTECIPANTI Esercizio 1 L elevata densità di popolazione di un paese (rapporto tra numero di abitanti e superficie) indica che: a. l'ammontare della popolazione

Dettagli

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici) Statistica La statistica può essere vista come la scienza che organizza ed analizza dati numerici per fini descrittivi o per permettere di prendere delle decisioni e fare previsioni. Statistica descrittiva:

Dettagli

STATISTICHE DESCRITTIVE

STATISTICHE DESCRITTIVE STATISTICHE DESCRITTIVE ARGOMENTI DELLA LEZIONE concetti introduttivi indici di tendenza centrale indici di dispersione indici di posizione 2 concetti introduttivi Unità statistiche elementi che costituiscono

Dettagli

Applicazioni statistiche e utilizzo del package statistico Spss - 7

Applicazioni statistiche e utilizzo del package statistico Spss - 7 Applicazioni statistiche e utilizzo del package statistico Spss - 7 CISI 27 gennaio 2005 ricercapsicologica@tiscali.it Illustrare le principali statistiche mono e bivariate. Valutare quando è opportuno

Dettagli

Indici di variabilità ed eterogeneità

Indici di variabilità ed eterogeneità Indici di variabilità ed eterogeneità Corso di STATISTICA Prof. Roberta Siciliano Ordinario di Statistica, Università di apoli Federico II Professore supplente, Università della Basilicata a.a. 011/01

Dettagli

LE MISURE DI TENDENZA CENTRALE. Dott. Giuseppe Di Martino Scuola di Specializzazione in Igiene e Medicina Preventiva

LE MISURE DI TENDENZA CENTRALE. Dott. Giuseppe Di Martino Scuola di Specializzazione in Igiene e Medicina Preventiva LE MISURE DI TENDENZA CENTRALE Dott. Giuseppe Di Martino Scuola di Specializzazione in Igiene e Medicina Preventiva Individuare un indice che rappresenti significativamente un insieme di dati statistici

Dettagli

Esercitazioni di Statistica

Esercitazioni di Statistica Esercitazioni di Statistica Rappresentazioni grafiche Prof. Livia De Giovanni statistica@dis.uniroma1.it Esercizio 1 Si consideri la seguente distribuzione delle industrie tessili secondo il fatturato

Dettagli

Moltiplicazione. Divisione. Multipli e divisori

Moltiplicazione. Divisione. Multipli e divisori Addizione Sottrazione Potenze Moltiplicazione Divisione Multipli e divisori LE QUATTRO OPERAZIONI Una operazione aritmetica è quel procedimento che fa corrispondere ad una coppia ordinata di numeri (termini

Dettagli

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Strumenti statistici in Excell Pacchetto Analisi di dati Strumenti di analisi: Analisi varianza: ad un fattore Analisi

Dettagli

Esercitazione II Statistica e Calcolo delle Probabilità (con soluzioni)

Esercitazione II Statistica e Calcolo delle Probabilità (con soluzioni) Esercitazione II Statistica e Calcolo delle Probabilità (con soluzioni) Esercizio 1: Alla fine di una giornata di lavoro un intervistatore si accorge di aver perso i dati raccolti su un certo numero di

Dettagli

Esercitazioni di statistica

Esercitazioni di statistica Esercitazioni di statistica Gli indici di variabilità Stefania Spina Universitá di Napoli Federico II stefania.spina@unina.it 8 Ottobre 2014 Stefania Spina Esercitazioni di statistica 1/43 Introduzione

Dettagli

1 L estrazione di radice

1 L estrazione di radice 1 L estrazione di radice Consideriamo la potenza 3 2 = 9 di cui conosciamo: Esponente 3 2 = 9 Valore della potenza Base L operazione di radice quadrata consiste nel chiedersi qual è quel numero x che elevato

Dettagli

La Variabilità statistica

La Variabilità statistica La Variabilità statistica Una peculiarità dei caratteri rilevati nelle unità statistiche di un collettivo, è quella di presentare valori o attributi in tutto o in parte diversi. Si chiama variabilità (nel

Dettagli

STATISTICA: esercizi svolti su MODA, MEDIANA, QUARTILI, DECILI e CENTILI

STATISTICA: esercizi svolti su MODA, MEDIANA, QUARTILI, DECILI e CENTILI STATISTICA: esercizi svolti su MODA, MEDIANA, QUARTILI, DECILI e CENTILI 1 1 MODA, MEDIANA, QUARTILI, DECILI E CENTILI 2 1 MODA, MEDIANA, QUARTILI, DECILI E CENTILI 1. Viene rilevato il tempo X (in secondi)

Dettagli

Statistica Analisi bidimensionale La dipendenza in media. alessandro polli facoltà di scienze politiche, sociologia, comunicazione

Statistica Analisi bidimensionale La dipendenza in media. alessandro polli facoltà di scienze politiche, sociologia, comunicazione Statistica Analisi bidimensionale La dipendenza in media alessandro polli facoltà di scienze politiche, sociologia, comunicazione Obiettivo Nella sezione precedente abbiamo esaminato i principali metodi

Dettagli