Risultato di una rilevazione statistica effettuata su n unità statistiche con riferimento a p fenomeni (detti anche caratteri, variabili)

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Risultato di una rilevazione statistica effettuata su n unità statistiche con riferimento a p fenomeni (detti anche caratteri, variabili)"

Transcript

1 LA MATRICE DEI DATI Risultato di una rilevazione statistica effettuata su n unità statistiche con riferimento a p fenomeni (detti anche caratteri, variabili) Esempi di: unità variabili individui Reddito, sesso, titolo di studio imprese Fatturato, addetti, ragione sociale comuni Ampiezza dem., regione, presenza di stazione ferr..

2 Questionario - Indagine su reddito, consumo e fruizione dei quotidiani in Emilia Romagna Tipo di variabile I caratteri (variabili) possono essere o qualitativi (sconnessi o ordinali) o quantitativi (discreti o continui) Fenomeno indagato VARIABILI Possibili risposte MODALITA. sesso maschio femmina 2. età (in anni compiuti) Quantitativo 3. titolo di studio elementare media inferiore diploma laurea dottorato TIPO DI VARIABILE Qualitativo sconnesso (dicotomico) Qualitativo ordinabile (politomico) 4. reddito mensile (in euro) Quantitativo 5. consumo mensile (in euro) Quantitativo 6. acquista almeno un quotidiano al giorno? si no Qualitativo sconnesso (dicotomico) 2

3 Si possono codificare le modalità di variabili qualitative: Sesso M=0; F= Titolo di studio Elem.=, Media inf.=2, Media sup.=3, Laurea=4, Dottorato=5 Acquisto quotidiano SI=; NO=0 Matrice dei dati X= Dimensioni 0 x 6 N. B. : le variabili quantitative non sono espresse nella stessa unità di misura (anni, euro ) 3

4 MATRICE dei dati X, di dimensioni n x p ( n righe e p colonne) x xi xn x x x s is ns x p xip xnp Notiamo che i =,,n unità s=,,p variabili matrice X - unità x variabile Matrice composta da n vettori riga: ad ogni riga, x i, corrisponde una unità (elemento del campione o della popolazione studiata) e la riga i-esima fornisce le modalità osservate dei p caratteri per l unità statistica i-sima; p vettori colonna: ad ogni colonna corrisponde un carattere, una variabile, e la colonna s-esima X fornisce la distribuzione delle modalità della variabile s fra le n unità statistiche; s l elemento x is all interno della matrice rappresenta il valore del carattere s nella i-esima unità statistica. 4

5 Con riferimento alla matrice dei dati possiamo analizzare: un singolo fenomeno (analisi di tipo unidimensionale, riferita alla singola variabile) attraverso l'uso di medie, indici di variabilità, ecc.): Qual è l'età media con riferimento alle 0 unità in oggetto? E quale il consumo medio mensile? due fenomeni e la relazione che li lega (analisi di tipo bidimensionale): Che relazione c'è tra età e consumo? una pluralità di fenomeni (analisi multidimensionale o multivariata generalizzazione di quella bidim.) Ci occuperemo dell'analisi MULTIDIMENSIONALE DEI DATI i cui obiettivi si possono sintetizzare nei seguenti punti: sintesi delle relazioni tra le p variabili analisi della dipendenza lineare e non lineare di una variabile rispetto a p covariate misura della diversità/somiglianza tra le n unità statistiche, con riferimento ai p fenomeni indagati classificazione delle unità in gruppi omogenei ricerca di regole discriminanti tra due o più gruppi, sulla base di una pluralità di fenomeni 5

6 RAPPRESENTAZIONE GRAFICA DELLE UNITA' secondo le VARIABILI (quantitative) Supponiamo di aver osservato il reddito e il consumo di 3 unità statistiche (in euro): unità Reddito mens. Consumo mens X= x Media Possiamo rappresentare le 3 unità statistiche in R 2 : consumo reddito 6

7 Per p variabili: SPAZIO DELLE UNITA nella matrice unità x variabile, i vettori riga di dimensione p possono essere rappresentati in R p (spazio a p dimensioni, delle unità o degli individui) Due o più unità saranno tanto più simili, in relazione alle variabili considerate, quanto più sono vicine nello spazio delle unità. Possiamo individuare il vettore delle medie delle p variabili detto centroide (o baricentro): [ x,, ] x =, x s, x p nell'esempio: x = [ 07, 767] consumo reddito 7

8 LA MATRICE DEGLI SCOSTAMENTI (O SCARTI) DALLA MEDIA variabile X s, di tipo quantitativo, consideriamo gli scarti dalla media: ~ x = x x X = per i =,, n s=,, p ~ [ ] is is s Nell'esempio: unità Scarto riferito al Reddito mens. Scarto riferito al Consumo mens = = = = = = 33 x~ is Matrice X ~ degli scarti dalla media: L'impiego di X ~ equivale a considerare in R p un nuovo sistema di assi cartesiani, uguale a quello dei dati originari se non per l'origine che, in tale nuovo sistema, è nel centroide: la nuvola di punti presenta il medesimo aspetto, è l'origine degli assi che si sposta nel punto che ha come coordinate le medie delle p variabili 8

9 LA MATRICE DEGLI SCARTI STANDARDIZZATI Per ogni variabile, consideriamo gli scarti standardizzati, cioè gli scarti dalla media in rapporto allo scarto quadratico medio: z is x x σ is s is = = per i =,, n s ~ x σ s Matrice degli scarti standardizzati: [ ] Z = i=,, n s=,, p z is Caratteristiche delle p variabili considerate nella matrice Z (p scostamenti standardizzati), cioè dei vettori colonna z s: sono numeri puri, cioè non hanno unità di misura e non risentono dell'ordine medio di grandezza della variabile originaria hanno media pari a 0 e varianza pari ad 9

10 Perché consideriamo la matrice degli scarti standardizzati? Essa consente di analizzare congiuntamente variabili che hanno, in origine, diversa unità di misura e/o diverso ordine medio di grandezza/variabilità trasformandole in variabili che non hanno unità di misura e stesso ordine medio di grandezza/var.. sono confrontabili,5 Matrice Z riferita all'esempio precedente: scost. stand. consumo 0,5 0-0,5 - -,5 -,5 - -0,5 0 0,5,5 scost. stand. reddito 0

11 LA MATRICE DI COVARIANZA E LA MATRICE DI CORRELAZIONE Misura la relazione lineare tra due variabili di tipo quantitativo Consideriamo due generici vettori colonna della matrice X, x s ed x k (di dim. n x), che contengono i valori delle p variabili, con riferimento ad n unità. I dati sono rappresentati dalle coppie di valori is ik Si definiscono gli scarti dalle rispettive medie s is s ( x, x ) i =,, n ɶ xɶ k = xik xɶ k x = ( x x) ( ) Se a valori di x k maggiori (minori) della media corrispondono valori di x s maggiori (minori) della media, allora si dice che tra le due variabili esiste una relazione diretta la maggior parte degli scarti x~ k e x~ s ha lo stesso segno concordanza tra le var. Se a valori di x k maggiori (minori) della media corrispondono valori di x h minori (maggiori) della media, allora si dice che tra le due variabili esiste una relazione inversa la maggior parte degli scarti x~ k e x~ s ha segno opposto discordanza tra le var.

12 Una misura sintetica della relazione LINEARE tra le due variabili è la covarianza (media aritmetica dei prodotti degli scarti) s = cov( X, X ) = ( x x )( x x ) sk s k n n i= is s ik k (la troveremo indicata anche come σ sk ) Si noti che n s k = var( X ) = ( x x ) n (la troveremo indicata anche come σ k ) La COVARIANZA: k ik k i= è positiva se a valori crescenti di X s si associano valori crescenti di X k (analogamente se a valori decrescenti di X s si associano valori decrescenti di X k ). è negativa se a valori crescenti di X s si associano valori decrescenti di X k (e viceversa). cresce in valore assoluto quanto più è forte la relazione lineare tra le variabili. è tanto più piccola e vicina allo zero in assenza di una relazione lineare tra le due variabili. 2

13 Esempio di relazione non lineare non individuabile attraverso la Covarianza: (,3) (2,2) (3,) (4,) (5,2) (6,3) Cov(X s, X k )=0!!! Cov( X s, X k ) 0, non consente di stabilire l entità del legame (la covarianza non è un numero puro): per ottenere un indice normalizzato occorre rapportare la covarianza al suo massimo E noto che: cov 2 ( X, X ) s k var( X ) var( X cov( X, X ) var( X )var( X ) s k s k s k ) 3

14 quindi possiamo definire il coefficiente di correlazione (lineare) cov( X s, X k) corr( X s, X k) = corr( X s, X k) var( X s)var( X k) ssk r sk = r sk s s s k rsk r=- : i dati sono allineati su una retta con coefficiente angolare negativo (perfetta rel. lineare inversa) r sk = : i dati sono perfettamente allineati su una retta con coefficiente angolare positivo (perfetta rel. lineare diretta) r sk =0 : non c è associazione lineare tra le due variabili -< r sk <0 : esiste associazione (lineare) negativa tra le due variabili, cioè al crescere dell una decresce l altra; 0< r sk <: esiste associazione (lineare) positiva, cioè al crescere dell una cresce anche l altra; 4

15 Si noti che: Cov( Z, Z ) Corr ( X, X ) s k s k Correlazione spuria: può manifestarsi tra variabili per cui r 0 ma non vi è una effettiva relazione Con riferimento alla matrice X dei dati originari, consideriamo la covarianza tra tutte le possibili coppie di variabili (in numero pari a p x p): ( X s X k ) ssk Cov =, per s,k =,, p e il coefficiente di correlazione tra tutte le possibili coppie di variabili: ( X s X k ) rsk Corr =, per s, k =,, p 5

16 LA MATRICE DI COVARIANZA Possiamo riorganizzare le p x p covarianze nella matrice di covarianza: S X 2 s s2 s k s p 2 s2 s2 = 2 sk sk 2 sp sp è una matrice quadrata di dim. p x p s, k k, s, è una matrice simmetrica in quanto Cov( x x ) = Cov( x x ) s k sulla diagonale principale ha le varianze in quanto Cov( x x ) = Var( x ) s s, la matrice di covarianza può essere ottenuta in funzione della matrice degli scarti dalla media: ~ ~ S X = X X n s s 6

17 LA MATRICE DI CORRELAZIONE R r = r2 r k r p r2 = rs rss = rsk rp rpp = è una matrice quadrata di dim. p x p è una matrice simmetrica in quanto rsk = rks s, k sulla diagonale principale ha valori pari ad La matrice di correlazione può essere ottenuta in funzione della matrice degli scarti standardizzati: R = Z n Z 7

18 Strumento molto importante dell'analisi multidimensionale dei dati: pone in luce le relazioni lineari tra tutte le coppie di variabili. Più in dettaglio tale matrice ci indica: quali coppie di variabili forniscono all'incirca le medesime informazioni ( r sk ), in tal caso la considerazione di entrambe le variabili potrebbe portare ad una ridondanza di informazioni oppure una di queste due variabili potrebbe risultare utile per "prevedere" l'altra (analisi di regressione) quali coppie di variabili non sono correlate linearmente ( r sk 0) - caso in cui le due variabili portano informazioni diverse 8

19 Esempio Consideriamo i dati relativi alle variabili quantitative Età, Reddito e Consumo riferite all esempio precedente: Matrice dei dati (0 x 3) X= Matrice di Covarianza (3 x 3) Matrice di Correlazione (3 x 3) ,67-0,072 S = R= 0,67 0, ,072 0,596 9

20 ETÀ REDDITO CONSUMO 20

21 LA MATRICE DELLE DISTANZE/DISSOMIGLIANZE Consideriamo il concetto di prossimità/diversità tra unità statistiche prossimità = somiglianza = similarità (tuttavia, quest'ultimo termine ha un significato ben preciso ) diversità = dissomiglianza = dissimilarità La prossimità viene definita tra coppie di individui matrice di dim. n x n Indici di prossimità: distanze per variabili quantitative similarità per variabili qualitative 2

22 distanza La distanza tra due generiche unità statistiche i e j sarà, in generale, calcolata con riferimento a due vettori riga della matrice X, x i e x j : d ( x, x ) = d per i, j = n i j ij,, MATRICE DELLE DISTANZE di dim. n x n: D = d = d 2 di dn 0 d 2 0 d j d ij d n 0 ma non abbiamo ancora definito d ij.. 22

23 Alcuni tipi di distanza LA DISTANZA EUCLIDEA Consideriamo il reddito ed il consumo mensile con riferimento ai primi 2 individui (esempio ): (050, 800) (000, 900) ( x js, x jk ) ( x is, xik ) Xk consumo xik xjk xis xjs Xs reddito 23

24 Distanza euclidea tra i due individui, con riferimento a due variabili, reddito e consumo: ( ) 2 + ( ) 2 =,8 2 2dij = ( xis x js ) + ( xik x jk ) 2 Con riferimento a p variabili: p 2d = ( x ij s= is x js ) 2 Con riferimento alle variabili Età, Reddito e Consumo (Esempio ): Matrice delle distanze Distanza euclidea Questa è una matrice di dissimilarità Attenzione!!! Questa matrice presenta un problema: le variabili non sono espresse nella stessa unità di misura le distanze calcolate risentono di tale problema. 24

25 LA DISTANZA DI MINKOWSKI Definizione più generale, distanza di ordine q: q d ij p = xis x s= js q q q Attenzione: le somme considerate, e, quindi, le relative distanze, hanno senso solo se tutte le variabili sono espresse nella stessa unità di misura Anche in tal caso, tuttavia, le distanze considerate non sono del tutto appropriate per misurare la diversità tra le unità in quanto esse risultano influenzate dai caratteri con più elevato ordine di grandezza e maggiore variabilità (che presentano differenze preponderanti rispetto alle altre) Ad esempio X = ( ) X2 = ( ) d 2 2 =((45-43)2 +( ) 2 ) /2 =5000 il peso di X sul calcolo di d è trascurabile! Come superare tale problema? 25

26 Ad esempio, calcolando le distanze con riferimento agli scarti standardizzati Z: Cas o Matrice delle distanze ,44 2,8 2,77 2,54 4,5,93 2,72 2,59,5,44 2,58 2,73 2,69 3,95,65 2,64 2,27,95 2,8 2,58 3,27 2,43,45,94 2,08,75,78 2,77 2,73 3,27 2,56 3,8 2,58,44 3,2 3,03 2,54 2,69 2,43 2,56 3,05 2,34,65 2,87 2,37 4,5 3,95,45 3,8 3,05 3,30 2,48,97 3,20,93,65,94 2,58 2,34 3,30 2,9,67,52 2,72 2,64 2,08,44,65 2,48 2,9 2,28 2,46 2,59 2,27,75 3,2 2,87,97,67 2,28,57,5,95,78 3,03 2,37 3,20,52 2,46,57 Questa è una matrice di dissimilarità Distanza euclidea anche se la standardizzazione attenua le differenze 26

27 Distanza di Mahalanobis Consente di eliminare la correlazione tra le variabili: M d ij = [( ) ( )] x x S x x 2 i j i j coincide con la dist. euclidea su var. stand. incorrelate Le distanze ponderate Nel caso in cui si voglia attribuire diversa importanza ad ogni variabile (anche se la determinazione dei pesi lascia ampi margini alla soggettività). Distanza di MINKOWSKI PONDERATA Definizione più generale, distanza di ordine q: q q = p q q d ij xis x js ws in cui w s è il peso attribuito alla variabile s-sima s= 27

28 RELAZIONE TRA ) DISTANZA EUCLIDEA CALCOLATA TRA LE SINGOLE OSSERVAZIONI ED IL PUNTO MEDIO E 2) DEVIANZA (NUMERATORE DELLA VARIANZA) Con riferimento alle p variabili (s=,,p) consideriamo i valori medi x s (vettore dei valori medi): x = ( x x,, ), 2,, x s x p centroide M(X 2 ) M(X ) 28

29 Somma delle Devianze riferite alle p variabili = somma delle distanze euclidee al quadrato tra le singole osservazioni ed il centroide x: p n s= i= n p ( x x ) = ( x x ) = d ( i,x ) is s i= s = is s n 2 i= INDICI DI SIMILARITA' S ij Per fenomeni dicotomici (.=presenza, 0=assenza ) Supponiamo di considerare p caratteri dicotomici. La misura della similarità tra due unità statistiche i e j si basa sulla seguente tabella i \ j 0 tot a = n. di fenomeni presenti contemp. nelle 2 unità (co-presenze) a b a+b d = numero di fenomeni assenti in entrambe le unità (co-assenze) 0 c d c+d b = numero di fenomeni presenti in i ma non in j tot a+c b+d p c = numero di fenomeni presenti in j ma non in i a e d segnalano similarità (anche se a concorre maggiormente a definire la similarità) b e c segnalano dissimilarità 29

30 Esempio Con riferimento a due città osserviamo la presenza dell'aeroporto (AP), della stazione ferroviaria (SF), dell'ingresso in autostrada (IA), del porto (P) -- Si noti che sono possibili più risposte.(simile a più variabili di tipo dicotomico) AP SF IA P Città 0 0 Città 2 0 c b a c Città \ città 2 0 tot tot 3 4 alcuni indici a Indice di similarità di Russel e Rao: S ij = = / 4 p 30

31 a Indice di similarità di Jaccard 2 S ij = = / 4 a + b + c (usato se le co-assenze sono ritenute poco significative) PER FENOMENI POLITOMICI (AD ES.: TITOLO DI STUDIO) E' necessario innanzitutto passare ad una codifica di tipo disgiuntivo di ognuna delle variabili qualitative. In questo caso le co-assenze non hanno nessun significato e quindi gli indici da impiegare sono quelli che valutano la similarità sono in funzione delle co-presenze (I. di Jaccard) Ci sono alcuni indici che valutano la somiglianza con riferimento a variabili quantitative e qualitative considerate congiuntamente 3

Analisi delle corrispondenze

Analisi delle corrispondenze Capitolo 11 Analisi delle corrispondenze L obiettivo dell analisi delle corrispondenze, i cui primi sviluppi risalgono alla metà degli anni 60 in Francia ad opera di JP Benzécri e la sua equipe, è quello

Dettagli

REGRESSIONE E CORRELAZIONE

REGRESSIONE E CORRELAZIONE REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.

Dettagli

Associazione tra caratteri quantitativi: gli indici di correlazione

Associazione tra caratteri quantitativi: gli indici di correlazione Associazione tra caratteri quantitativi: gli indici di correlazione Per correlazione si intende una relazione tra due variabili tale che a ciascun valore della prima variabile corrisponda con una certa

Dettagli

Lezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo

Lezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo UIVERSITA DEGLI STUDI DI BASILICATA FACOLTA DI ECOOMIA Corso di laurea in Economia Aziendale anno accademico 2012/2013 Lezioni di Statistica del 15 e 18 aprile 2013 Docente: Massimo Cristallo LA RELAZIOE

Dettagli

Indice. 1. Premessa Le relazioni tra coppie di caratteri L analisi della contingenza L analisi della correlazione...

Indice. 1. Premessa Le relazioni tra coppie di caratteri L analisi della contingenza L analisi della correlazione... INSEGNAMENTO DI STATISTICA DEL TURISMO LEZIONE IX LE RELAZIONI TRA CARATTERI PROF. GIOVANNI DI TRAPANI Indice 1. Premessa.... 3 2. Le relazioni tra coppie di caratteri.... 4 3. L analisi della contingenza....

Dettagli

Distribuzioni secondo due caratteri. Rappresentazioni e prime sintesi

Distribuzioni secondo due caratteri. Rappresentazioni e prime sintesi Distribuzioni secondo due caratteri Rappresentazioni e prime sintesi Rappresentazioni delle distribuzioni doppie Quando per ogni unità del collettivo rileviamo due caratteri otteniamo una Esempio. Ad alcuni

Dettagli

Misure di diversità tra unità statistiche. Loredana Cerbara

Misure di diversità tra unità statistiche. Loredana Cerbara Misure di diversità tra unità statistiche Loredana Cerbara LA DISTANZA IN STATISTICA In statistica la distanza ha un significato diverso da quello che si può intuire in altre discipline, dove, peraltro,

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Misura dell associazione tra due caratteri Uno store manager è interessato a studiare la relazione

Dettagli

Esercitazioni di statistica

Esercitazioni di statistica Esercitazioni di statistica Misure di associazione: Indipendenza assoluta e in media Stefania Spina Universitá di Napoli Federico II stefania.spina@unina.it 22 ottobre 2014 Stefania Spina Esercitazioni

Dettagli

Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria

Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata Prof. Massimo Aria aria@unina.it Il concetto di interpolazione In matematica, e in particolare in

Dettagli

Esercitazione di Statistica Indici di associazione

Esercitazione di Statistica Indici di associazione Esercitazione di Statistica Indici di associazione 28/10/2015 La relazione tra caratteri Indipendenza logica Quando si suppone che tra due caratteri non ci sia alcuna relazione di causa-effetto. Indipendenza

Dettagli

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci La statistica Elaborazione e rappresentazione dei dati Gli indicatori statistici Introduzione La statistica raccoglie ed analizza gruppi di dati (su cose o persone) per trarne conclusioni e fare previsioni

Dettagli

DISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a Prerequisiti Popolazione, unità, carattere Come nascono i dati:

DISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a Prerequisiti Popolazione, unità, carattere Come nascono i dati: DISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a. 2007-2008 Prerequisiti Popolazione, unità, carattere Come nascono i dati: osservazione e sperimentazione Popolazione: reale e virtuale Classificazione

Dettagli

STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE

STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 2 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1.1

Dettagli

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva Fondamenti di Informatica Ester Zumpano Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva Lezione 5 Statistica descrittiva La statistica descrittiva mette a disposizione il calcolo di

Dettagli

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURA/TECNICA DI ANALISI DEI DATI SPECIFICAMENTE DESTINATA A STUDIARE LA RELAZIONE TRA UNA VARIABILE NOMINALE (ASSUNTA

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri

Dettagli

1/4 Capitolo 4 Statistica - Metodologie per le scienze economiche e sociali 2/ed Copyright 2008 The McGraw-Hill Companies srl

1/4 Capitolo 4 Statistica - Metodologie per le scienze economiche e sociali 2/ed Copyright 2008 The McGraw-Hill Companies srl 1/4 Capitolo 4 La variabilità di una distribuzione Intervalli di variabilità Box-plot Indici basati sullo scostamento dalla media Confronti di variabilità Standardizzazione Statistica - Metodologie per

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative

Dettagli

Indicatori di Posizione e di Variabilità. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica

Indicatori di Posizione e di Variabilità. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica Indicatori di Posizione e di Variabilità Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica Indici Sintetici Consentono il passaggio da una pluralità

Dettagli

Istituzioni di Statistica e Statistica Economica

Istituzioni di Statistica e Statistica Economica Istituzioni di Statistica e Statistica Economica Università degli Studi di Perugia Facoltà di Economia, Assisi, a.a. 2013/14 Esercitazione n. 1 A. I dati riportati nella seguente tabella si riferiscono

Dettagli

Facoltà di Scienze Politiche Corso di laurea in Servizio sociale. Compito di Statistica del 7/1/2003

Facoltà di Scienze Politiche Corso di laurea in Servizio sociale. Compito di Statistica del 7/1/2003 Compito di Statistica del 7/1/2003 I giovani addetti all agricoltura in due diverse regioni sono stati classificati per età; la distribuzione di frequenze congiunta è data dalla tabella seguente Età in

Dettagli

ANALISI DEI DATI PER IL MARKETING 2014

ANALISI DEI DATI PER IL MARKETING 2014 ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it MISURE DI DISTANZA E SIMILARITA 1 SCOPI DEL CALCOLO Problema: misurare la diversità (ovvero la rassomiglianza) tra

Dettagli

Esempio sulla media geometrica

Esempio sulla media geometrica Media geometrica La media geometrica di un insieme di n valori positivi x, x 2,, x n di un carattere quantitativo X è pari alla radice n-esima del prodotto dei singoli valori: x g n x x2 K x n Esempio

Dettagli

ANALISI MULTIDIMENSIONALE DEI DATI (AMD)

ANALISI MULTIDIMENSIONALE DEI DATI (AMD) ANALISI MULTIDIMENSIONALE DEI DATI (AMD) L Analisi Multidimensionale dei Dati (AMD) è una famiglia di tecniche il cui obiettivo principale è la visualizzazione, la classificazione e l interpretazione della

Dettagli

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17 C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica

Dettagli

INDICATORI DI TENDENZA CENTRALE

INDICATORI DI TENDENZA CENTRALE INDICATORI DI TENDENZA CENTRALE INDICATORI DI TENDENZA CENTRALE Consentono di sintetizzare un insieme di misure tramite un unico valore rappresentativo indice che riassume o descrive i dati e dipende dalla

Dettagli

Stesso valore medio per distribuzioni diverse

Stesso valore medio per distribuzioni diverse Fonti e strumenti statistici per la comunicazione Prof.ssa Isabella Mingo A.A. 014-015 Stesso valore medio per distribuzioni diverse u i X 11 X 1 X 13 A 1 1 B 8 1 C 0 1 D 3 3 1 E 19 34 1 F 0 41 1 Un uguale

Dettagli

Capitolo 3 Sintesi e descrizione dei dati quantitativi

Capitolo 3 Sintesi e descrizione dei dati quantitativi Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 3 Sintesi e descrizione dei dati quantitativi Insegnamento: Statistica Applicata Corso di Laurea in "Scienze e tecnologie Alimentari" Unità

Dettagli

Teoria e tecniche dei test. Concetti di base

Teoria e tecniche dei test. Concetti di base Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi

Dettagli

Questionario 1. Sono assegnati i seguenti dati

Questionario 1. Sono assegnati i seguenti dati Questionario 1. Sono assegnati i seguenti dati 30 30 10 30 50 30 60 60 30 20 20 20 30 20 30 30 20 10 10 40 20 30 10 10 10 30 40 30 20 20 40 40 40 dire se i dati illustrati sono unità statistiche valori

Dettagli

La matrice delle correlazioni è la seguente:

La matrice delle correlazioni è la seguente: Calcolo delle componenti principali tramite un esempio numerico Questo esempio numerico puó essere utile per chiarire il calcolo delle componenti principali e per introdurre il programma SPAD. IL PROBLEMA

Dettagli

INDICATORI DI TENDENZA CENTRALE

INDICATORI DI TENDENZA CENTRALE INDICATORI DI TENDENZA CENTRALE INDICATORI DI TENDENZA CENTRALE Consentono di sintetizzare un insieme di misure tramite un unico valore rappresentativo è indice che riassume o descrive i dati e dipende

Dettagli

Esercizi Svolti. 2. Costruire la distribuzione delle frequenze cumulate del tempo di attesa

Esercizi Svolti. 2. Costruire la distribuzione delle frequenze cumulate del tempo di attesa Esercizi Svolti Esercizio 1 Per una certa linea urbana di autobus sono state effettuate una serie di rilevazioni sui tempi di attesa ad una determinata fermata; la corrispondente distribuzione di frequenza

Dettagli

Elementi di Statistica

Elementi di Statistica Università degli Studi di Palermo Dipartimento di Ingegneria Informatica Informatica ed Elementi di Statistica 3 c.f.u. Anno Accademico 2010/2011 Docente: ing. Salvatore Sorce Elementi di Statistica Statistica

Dettagli

Statistica di base per l analisi socio-economica

Statistica di base per l analisi socio-economica Laurea Magistrale in Management e comunicazione d impresa Statistica di base per l analisi socio-economica Giovanni Di Bartolomeo gdibartolomeo@unite.it Definizioni di base Una popolazione è l insieme

Dettagli

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2010/2011 Statistica Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza

Dettagli

STATISTICHE DESCRITTIVE Parte II

STATISTICHE DESCRITTIVE Parte II STATISTICHE DESCRITTIVE Parte II INDICI DI DISPERSIONE Introduzione agli Indici di Dispersione Gamma Differenza Interquartilica Varianza Deviazione Standard Coefficiente di Variazione introduzione Una

Dettagli

I principali tipi di grafici

I principali tipi di grafici I principali tipi di grafici Esiste una grande varietà di rappresentazioni grafiche. I grafici più semplici e nello stesso tempo più efficaci e comunemente utilizzati sono: I GRAFICI A BARRE I GRAFICI

Dettagli

La dipendenza. Antonello Maruotti

La dipendenza. Antonello Maruotti La dipendenza Antonello Maruotti Outline 1 Distribuzioni doppie 2 Medie e varianze condizionate 3 Indici di associazione Distribuzione doppia Definizione Una distribuzione doppia si ha quando su di uno

Dettagli

x i. Δ x i

x i. Δ x i ITCS "R. LUXEMBURG" BO- AS 011-01 5CL MATEMATICA- COGOME: OME: VERIFICA UD 1.A : STATISTICA DESCRITTIVA (ORE ) DATA: 1] Data la serie del numero di componenti dei nuclei familiari rilevati in un gruppo

Dettagli

ANALISI DEI DATI PER IL MARKETING 2014

ANALISI DEI DATI PER IL MARKETING 2014 ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it ANALISI DELLE CORRISPONDENZE (cap. VII) Problema della riduzione delle dimensioni L ANALISI DELLE COMPONENTI PRINCIPALI

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Sintesi a cinque e misure di variabilità rispetto ad un centro Una catena di fast-food ha selezionato

Dettagli

Statistiche e relazioni

Statistiche e relazioni tatistiche descrittive per frequenze e misure Frequenze e misure Per le frequenze e le misure, molte di queste statistiche perdono senso. In compenso, esistono indici appropriati, inutilizzabili per i

Dettagli

le scale di misura scala nominale scala ordinale DIAGNOSTICA PSICOLOGICA lezione si basano su tre elementi:

le scale di misura scala nominale scala ordinale DIAGNOSTICA PSICOLOGICA lezione si basano su tre elementi: DIAGNOSTICA PSICOLOGICA lezione! Paola Magnano paola.magnano@unikore.it si basano su tre elementi: le scale di misura sistema empirico: un insieme di entità non numeriche (es. insieme di persone; insieme

Dettagli

Metodi e tecniche di analisi dei dati nella ricerca psico-educativa Parte III

Metodi e tecniche di analisi dei dati nella ricerca psico-educativa Parte III Laboratorio Metodi e tecniche di analisi dei dati nella ricerca psico-educativa Parte III Laura Palmerio Università Tor Vergata A.A. 2005/2006 MISURAZIONE Misurare le variabili Assegnazione di valori numerici

Dettagli

Fonte: Esempio a fini didattici

Fonte: Esempio a fini didattici I principali tipi di grafici Esiste una grande varietà di rappresentazioni grafiche. I grafici più semplici e nello stesso tempo più efficaci e comunemente utilizzati sono: i grafici a barre i grafici

Dettagli

DIPENDENZA E ASSOCIAZIONE DISTRIBUZIONE CONGIUNTA DI DUE VARIABILI. Ci limiteremo a considerare il caso di due variabili.

DIPENDENZA E ASSOCIAZIONE DISTRIBUZIONE CONGIUNTA DI DUE VARIABILI. Ci limiteremo a considerare il caso di due variabili. DIPENDENZA E ASSOCIAZIONE DISTRIBUZIONE CONGIUNTA DI DUE VARIABILI Sinora abbiamo considerato l analisi di un unica variabile per volta Tuttavia, le rilevazioni su un unità statistica sono in generale

Dettagli

Esercitazione del

Esercitazione del Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36

Dettagli

Statistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione

Statistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2011/2012 Statistica Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate.

Dettagli

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici) Statistica La statistica può essere vista come la scienza che organizza ed analizza dati numerici per fini descrittivi o per permettere di prendere delle decisioni e fare previsioni. Statistica descrittiva:

Dettagli

SCOPO DELL ANALISI DI CORRELAZIONE

SCOPO DELL ANALISI DI CORRELAZIONE CORRELAZIONE 1 SCOPO DELL ANALISI DI CORRELAZIONE STUDIARE LA RELAZIONE TRA DUE VARIABILI X E Y 2 diagrammi di dispersione un diagramma di dispersione (o grafico di dispersione) èuna rappresentazione grafica

Dettagli

Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale)

Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale) Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale) Esercizio 1: Un indagine su 10.000 famiglie ha dato luogo, fra le altre, alle osservazioni riportate nella

Dettagli

Statistica Sociale Prof.ssa Cristina Davino. Esercitazione sulla sintesi degli indicatori sociali

Statistica Sociale Prof.ssa Cristina Davino. Esercitazione sulla sintesi degli indicatori sociali Esercitazione sulla sintesi degli indicatori sociali Aprire Excel Aprire il file indicatori xlstat.xls, foglio dati Ribaltare gli indicatori x1, x2, x5, x8, x9, x14 affinché abbiano un verso positivo:

Dettagli

Statistica. Campione

Statistica. Campione 1 STATISTICA DESCRITTIVA Temi considerati 1) 2) Distribuzioni statistiche 3) Rappresentazioni grafiche 4) Misure di tendenza centrale 5) Medie ferme o basali 6) Medie lasche o di posizione 7) Dispersione

Dettagli

E la rappresentazione grafica, in questo caso, è la dispersione x,y, cioè una nuvola di punti nel piano cartesiano

E la rappresentazione grafica, in questo caso, è la dispersione x,y, cioè una nuvola di punti nel piano cartesiano Capitolo uno STATISTICA DESCRITTIVA BIVARIATA La statistica bidimensionale o bivariata si occupa dello studio del grado di dipendenza di due caratteri distinti della stessa unità statistica. E possibile,

Dettagli

STATISTICA (modulo I - Statistica Descrittiva) Soluzione Esercitazione I

STATISTICA (modulo I - Statistica Descrittiva) Soluzione Esercitazione I 2. e 3. STATISTICA (modulo I - Statistica Descrittiva) Soluzione Esercitazione I 1. Le unità statistiche sono costituite dai singoli ristoranti, mentre la popolazione è costituita da tutte le unità del

Dettagli

Capitolo 12. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 12.1: Suggerimento

Capitolo 12. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 12.1: Suggerimento Capitolo Suggerimenti agli esercizi a cura di Elena Siletti Esercizio.: Suggerimento Per verificare se due fenomeni sono dipendenti in media sarebbe necessario confrontare le medie condizionate, in questo

Dettagli

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura INDICE GENERALE Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura XI XIV XV XVII XVIII 1 LA RILEVAZIONE DEI FENOMENI

Dettagli

Il modello lineare misto

Il modello lineare misto Il modello lineare misto (capitolo 9) A M D Marcello Gallucci Univerisità Milano-Bicocca Lezione: 15 GLM Modello Lineare Generale vantaggi Consente di stimare le relazioni fra due o più variabili Si applica

Dettagli

Elementi di statistica

Elementi di statistica Scuola media G. Ungaretti Elementi di statistica Prof. Enrico Castello Ti insegnerò a conoscere i criteri organizzatori di una tabella di dati distinguere frequenze assolute e frequenze percentuali determinare

Dettagli

ESERCIZI STATISTICA DESCRITTIVA

ESERCIZI STATISTICA DESCRITTIVA ESERCIZI STATISTICA DESCRITTIVA Frequenze assolute e relative Titolo di studio Frequenze assolute Frequenze relative Proporzioni Percentuali Senza titolo 30 0,025 2,5 Lic. elementare 509 0,424 42,4 Licenza

Dettagli

Statistica Descrittiva III

Statistica Descrittiva III Serie Bi-variate Statistica Descrittiva III Definizioni Serie statistiche bi-variate Rappresentazioni tabellari e grafiche Indici di posizione e di variabilità Dipendenza lineare: retta di regressione

Dettagli

Statistica descrittiva

Statistica descrittiva Statistica descrittiva Caso di 1 variabile: i dati si presentano in una tabella: Nome soggetto Alabama Dato 11.6.. Per riassumere i dati si costruisce una distribuzione delle frequenze. 1 Si determina

Dettagli

Test per la correlazione lineare

Test per la correlazione lineare 10 Test per la correlazione lineare Istituzioni di Matematica e Statistica 2015/16 E. Priola 1 Introduzione alla correlazione lineare Problema: In base ai dati che abbiamo possiamo dire che c è una qualche

Dettagli

Statistica. Matematica con Elementi di Statistica a.a. 2015/16

Statistica. Matematica con Elementi di Statistica a.a. 2015/16 Statistica La statistica è la scienza che organizza e analizza dati numerici per fini descrittivi o per permettere di prendere delle decisioni e fare previsioni. Statistica descrittiva: dalla mole di dati

Dettagli

Covarianza, correlazione e retta di regressione. Paola Lecca, CIBIO UNITN Corso di Matematica e Statistica 2

Covarianza, correlazione e retta di regressione. Paola Lecca, CIBIO UNITN Corso di Matematica e Statistica 2 Covarianza, correlazione e retta di regressione Paola Lecca, CIBIO UNITN Corso di Matematica e Statistica 2 Questa presentazione è stata preparata attingendo dai seguenti testi S. M. Iacus, Statistica,

Dettagli

Capitolo uno STATISTICA DESCRITTIVA BIVARIATA

Capitolo uno STATISTICA DESCRITTIVA BIVARIATA Capitolo uno STATISTICA DESCRITTIVA BIVARIATA La statistica unidimensionale si occupa di studiare una sola variabile statistica. La statistica bidimensionale o bivariata si occupa dello studio congiunto

Dettagli

Indice della lezione. Incertezza e rischio: sinonimi? Le Ipotesi della Capital Market Theory UNIVERSITA DEGLI STUDI DI PARMA FACOLTA DI ECONOMIA

Indice della lezione. Incertezza e rischio: sinonimi? Le Ipotesi della Capital Market Theory UNIVERSITA DEGLI STUDI DI PARMA FACOLTA DI ECONOMIA UNIVERSIT DEGLI STUDI DI PRM FCOLT DI ECONOMI Indice della lezione Corso di Pianificazione Finanziaria Introduzione al rischio Rischio e rendimento per titoli singoli La Teoria di Portafoglio di Markowitz

Dettagli

Ringraziamenti dell Editore

Ringraziamenti dell Editore Indice Elenco dei simboli e delle abbreviazioni in ordine di apparizione Ringraziamenti dell Editore XI XVII 1 Introduzione FAQ e qualcos altro, da leggere prima 1 1.1 QuestoèunlibrodiStatistica....................

Dettagli

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel: UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA Prof.ssa Donatella Siepi donatella.siepi@unipg.it tel: 075 5853525 2 LEZIONE Statistica descrittiva STATISTICA DESCRITTIVA Rilevazione dei dati Rappresentazione

Dettagli

http://www.biostatistica.unich.it 1 STATISTICA DESCRITTIVA Le misure di tendenza centrale 2 OBIETTIVO Individuare un indice che rappresenti significativamente un insieme di dati statistici. 3 Esempio Nella

Dettagli

La retta di regressione

La retta di regressione La retta di regressione Michele Impedovo Uno dei temi nuovi e centrali per il rinnovamento dei programmi di matematica, che si impone in modo naturale quando si abbia a disposizione un qualunque strumento

Dettagli

STATISTICA A-K (2014) Soluzione esercizi da svolgere prima settimana

STATISTICA A-K (2014) Soluzione esercizi da svolgere prima settimana STATISTICA A-K (2014) Soluzione esercizi da svolgere prima settimana Classificazione di 80 aziende in base a: X = numero di dipendenti Y = fatturato (in milioni di euro) X \ Y 0,5 1 1 2 2 4 4 20 Totale

Dettagli

PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE

PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE 1. Distribuzione congiunta Ci sono situazioni in cui un esperimento casuale non si può modellare con una sola variabile casuale,

Dettagli

Correlazione. Daniela Valenti, Treccani Scuola 1

Correlazione. Daniela Valenti, Treccani Scuola 1 Correlazione 1 I dati di un indagine per riflettere Cominciamo con i dati di un indagine svolta in una quinta classe di scuola superiore. Dopo l Esame di Stato 12 studenti si sono iscritti a corsi di laurea

Dettagli

Esempi di confronti grafici

Esempi di confronti grafici Esempi di confronti grafici Esempi di confronti grafici 7/3 Capitolo 3 LE MEDIE La media aritmetica La media geometrica La trimmed mean La mediana La moda I percentili Statistica - Metodologie per

Dettagli

Le graduatorie basate su una molteplicità di indicatori. I pericoli della sintesi di variabili disomogenee.

Le graduatorie basate su una molteplicità di indicatori. I pericoli della sintesi di variabili disomogenee. Le graduatorie basate su una molteplicità di indicatori. I pericoli della sintesi di variabili disomogenee. Sovente è necessario stabilire delle graduatorie tra unità statistiche. In azienda il problema

Dettagli

Analisi dei dati per la comunicazione. La costruzione di misure relative semplici e complesse. Prof.ssa Isabella Mingo

Analisi dei dati per la comunicazione. La costruzione di misure relative semplici e complesse. Prof.ssa Isabella Mingo Analisi dei dati per la comunicazione La costruzione di misure relative semplici e complesse Prof.ssa Isabella Mingo A.A. 2015-2016 I Rapporti medi Ammontare globale di un fenomeno X Dimensione spaziale

Dettagli

STATISTICA NOZIONI DI BASE

STATISTICA NOZIONI DI BASE STATISTICA NOZIONI DI BASE Italo Nofroni Statistica medica - Sapienza - Roma Si definisce statistica la scienza cha ha per oggetto la raccolta, l analisi e l interpretazione dei dati (intensità e/o frequenze)

Dettagli

Lezione 4 a - Misure di dispersione o di variabilità

Lezione 4 a - Misure di dispersione o di variabilità Lezione 4 a - Misure di dispersione o di variabilità Abbiamo visto che la media è una misura della localizzazione centrale della distribuzione (il centro di gravità). Popolazioni con la stessa media possono

Dettagli

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di dispersione

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di dispersione Consentono di descrivere la variabilità all interno della distribuzione di requenza tramite un unico valore che ne sintetizza le caratteristiche CAMPO DI VARIAZIONE DIFFERENZA INTERQUARTILE SCOSTAMENTO

Dettagli

TOPOGRAFIA 2013/2014. Prof. Francesco-Gaspare Caputo

TOPOGRAFIA 2013/2014. Prof. Francesco-Gaspare Caputo TOPOGRAFIA 2013/2014 L operazione di misura di una grandezza produce un numero reale che esprime il rapporto della grandezza stessa rispetto a un altra, a essa omogenea, assunta come unità di misura. L

Dettagli

La statistica descrittiva per le variabili quantitative

La statistica descrittiva per le variabili quantitative La statistica descrittiva per le variabili quantitative E la sintesi dei dati Gli indici di posizione/tendenza centrale OBIETTIVO Individuare un indice che rappresenti significativamente un insieme di

Dettagli

Sintesi numerica di distribuzioni statistiche

Sintesi numerica di distribuzioni statistiche Sintesi numerica di distribuzioni statistiche La sintesi numerica di una distribuzione statistica è basata sulla costruzione di particolari indici numerici che delineano alcuni aspetti essenziali della

Dettagli

0 altimenti 1 soggetto trova lavoroentro 6 mesi}

0 altimenti 1 soggetto trova lavoroentro 6 mesi} Lezione n. 16 (a cura di Peluso Filomena Francesca) Oltre alle normali variabili risposta che presentano una continuità almeno all'interno di un certo intervallo di valori, esistono variabili risposta

Dettagli

Σ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica

Σ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica 13. Regressione lineare parametrica Esistono numerose occasioni nelle quali quello che interessa è ricostruire la relazione di funzione che lega due variabili, la variabile y (variabile dipendente, in

Dettagli

3. Vettori, Spazi Vettoriali e Matrici

3. Vettori, Spazi Vettoriali e Matrici 3. Vettori, Spazi Vettoriali e Matrici Vettori e Spazi Vettoriali Operazioni tra vettori Basi Trasformazioni ed Operatori Operazioni tra Matrici Autovalori ed autovettori Forme quadratiche, quadriche e

Dettagli

STATISTICA: esercizi svolti sulla MEDIA ARITMETICA

STATISTICA: esercizi svolti sulla MEDIA ARITMETICA STATISTICA: esercizi svolti sulla MEDIA ARITMETICA 1 1 MEDIA ARITMETICA 2 1 MEDIA ARITMETICA 1. La seguente tabella riporta il numero di persone divise per sesso che si sono presentate durante l anno 1997

Dettagli

Università degli Studi di Verona

Università degli Studi di Verona Università degli Studi di Verona CdL in Economia e Commercio a.a. 2010/2011 STATISTICA Esercitazioni: Annamaria Guolo Rappresentazioni grafiche e distribuzioni di frequenza: SOLUZIONI Esercizio 2 a) I

Dettagli

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill Statistica - metodologie per le scienze economiche e sociali /e S Borra, A Di Ciaccio - McGraw Hill Es 6 Soluzione degli esercizi del capitolo 6 In base agli arrotondamenti effettuati nei calcoli, si possono

Dettagli

Premessa: la dipendenza in media

Premessa: la dipendenza in media Premessa: la dipendenza in media Supponiamo di avere K diversi livelli di un fattore che potrebbero influire su una determinata variabile. Per esempio supponiamo di domandarci se la diversificazione (intesa

Dettagli

STATISTICA 1 ESERCITAZIONE 2

STATISTICA 1 ESERCITAZIONE 2 Frequenze STATISTICA 1 ESERCITAZIONE 2 Dott. Giuseppe Pandolfo 7 Ottobre 2013 RAPPRESENTAZIONE GRAFICA DEI DATI Le rappresentazioni grafiche dei dati consentono di cogliere la struttura e gli aspetti caratterizzanti

Dettagli

Obiettivi Strumenti Cosa ci faremo? Probabilità, distribuzioni campionarie. Stimatori. Indici: media, varianza,

Obiettivi Strumenti Cosa ci faremo? Probabilità, distribuzioni campionarie. Stimatori. Indici: media, varianza, Obiettivi Strumenti Cosa ci faremo? inferenza Probabilità, distribuzioni campionarie uso stima Stimatori significato teorico descrizione Indici: media, varianza, calcolo Misure di posizione e di tendenza

Dettagli

Anno scolastico 2015/2016 PROGRAMMA SVOLTO. Docente: Catini Romina. Materie: Matematica. Classe : 4 L Indirizzo Scientifico Scienze Applicate

Anno scolastico 2015/2016 PROGRAMMA SVOLTO. Docente: Catini Romina. Materie: Matematica. Classe : 4 L Indirizzo Scientifico Scienze Applicate Anno scolastico 2015/2016 PROGRAMMA SVOLTO Docente: Catini Romina Materie: Matematica Classe : 4 L Indirizzo Scientifico Scienze Applicate UNITA DIDATTICA FORMATIVA 1: Statistica Rilevazione dei dati Rappresentazioni

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 41 Outline 1 2 3 4 5 () Statistica 2 / 41 Misura del legame Data una variabile doppia (X, Y ), la

Dettagli

LE DISTRIBUZIONI CAMPIONARIE

LE DISTRIBUZIONI CAMPIONARIE LE DISTRIBUZIONI CAMPIONARIE Argomenti Principi e metodi dell inferenza statistica Metodi di campionamento Campioni casuali Le distribuzioni campionarie notevoli: La distribuzione della media campionaria

Dettagli

La lunghezza dei vettori e legata alle operazioni sui vettori nel modo seguente: Consideriamo due vettori v, w e il vettore v + w loro somma.

La lunghezza dei vettori e legata alle operazioni sui vettori nel modo seguente: Consideriamo due vettori v, w e il vettore v + w loro somma. Matematica II, 20.2.. Lunghezza di un vettore nel piano Consideriamo il piano vettoriale geometrico P O. Scelto un segmento come unita, possiamo parlare di lunghezza di un vettore v P O rispetto a tale

Dettagli

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli. Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:

Dettagli

STATISTICA DESCRITTIVA BIVARIATA

STATISTICA DESCRITTIVA BIVARIATA STATISTICA DESCRITTIVA BIVARIATA Si parla di Analisi Multivariata quando su ogni unità statistica, appartenente ad una determinata popolazione, si rileva un certo numero s di caratteri X, X 2,,X s. Si

Dettagli