SDE Marco Riani

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "SDE Marco Riani"

Transcript

1 SDE 2018 Marco Riani

2 MISURE DI DISTANZA E SIMILARITA

3 SCOPI DEL CALCOLO Problema: misurare la diversità (ovvero la rassomiglianza) tra due unità statistiche di cui si conoscono i valori di p variabili Esempio: differenze tra le caratteristiche di due prodotti (marche) Date n unità statistiche posso individuare le coppie tra loro più simili e quelle maggiormente diverse E la premessa per la successiva individuazione di gruppi omogenei (segmenti del mercato)

4 Distanza tra due punti nel piano Uj Ui

5 DEFINIZIONE DI DISTANZA Dati due vettori p-dimensionali x, y, si dice distanza una funzione che gode delle seguenti proprietà: 1. Non negatività: d( x, y) 0 2. Identità: d( x, x) = 0 3. Simmetria: d( x, y) = d( y, x) 4. Disuguaglianza triangolare: d( x, y) d( x, z) + d( y, z)

6 DISTANZA EUCLIDEA Si considerino due unità statistiche: u i = [x i1, x i2,..., x ip ] u j = [x j1, x j2,..., x jp ] d ij = p s= 1 ( x is x js 2 )

7 DISTANZA DELLA CITTA A BLOCCHI d ij = p s= 1 x is x corrisponde ai due cateti js in R 2, agli spigoli del parallelepipedo in R 3

8 Distanza di Minkowski di ordine k Espressione generale di distanza, funzione del parametro k Per k = 1, city-block; per k =2, euclidea d ij lim( d k = p s= 1 ij ) = x is max x js x is k 1/ k x js, per k 1, distanza lagrangiana

9 Proprietà delle distanze di Minkowski Funzione decrescente dell indice k Invariante per traslazione delle variabili (somma algebrica d una costante) Non invariante se si moltiplicano i valori delle variabili per una costante Invariante per rotazione degli assi

10 NUMERO ORDINI E AMMONTARE (4 clienti) N. IMPORTO A 3 20 B C 8 30 D 2 12 Distanza euclidea d AB = (3 10) 2 + (20 42) 2 = 23,087

11 Anteprima output Matrice delle distanze Distanza euclidea 1:A 2:B 3:C 4:D 1:A,000 23,087 11,180 8,062 2:B 23,087,000 12,166 31,048 3:C 11,180 12,166,000 18,974 4:D 8,062 31,048 18,974,000 Questa è una matrice di dissimilarità Matrice delle distanze Distanza City Block 1:A 2:B 3:C 4:D 1:A,000 29,000 15,000 9,000 2:B 29,000,000 14,000 38,000 3:C 15,000 14,000,000 24,000 4:D 9,000 38,000 24,000,000 Questa è una matrice di dissimilarità

12 ESEMPIO DISTANZE Matrice delle distanze Distanza euclidea 1:A 2:B 3:C 4:D 1:A,000 23,087 11,180 8,062 2:B 23,087,000 12,166 31,048 3:C 11,180 12,166,000 18,974 4:D 8,062 31,048 18,974,000 Questa è una matrice di dissimilarità Matrice delle distanze Distanza City Block 1:A 2:B 3:C 4:D 1:A,000 29,000 15,000 9,000 2:B 29,000,000 14,000 38,000 3:C 15,000 14,000,000 24,000 4:D 9,000 38,000 24,000,000 Questa è una matrice di dissimilarità

13 CONFRONTI TRA DISTANZA EUCLIDEA E CITY-BLOCK Distanza city-block dist. euclidea Distanza city-block risente in misura minore degli outliers Tra i due tipi di distanza non esiste sempre una relazione monotona (cioè gli ordinamenti o graduatorie possono essere diversi) Se le variabili sono espresse in unità di misura diverse occorre calcolarle sugli scostamenti standardizzati

14 CONFRONTI (continua) PRIMO CASO Unità X 1 X d City-B = 4; d E = 8 SECONDO CASO d City-B = 4; d E = 10

15 Z ordini e Z ammontare A ,71 -,46 B ,10 1,23 C 8 30,58,31 D ,97-1,08 Statistiche descrittive N. ORDINI AMMONTARE Validi (listwise) N Deviazione Media std. 4 5,75 3, ,00 12,961 4

16 ESEMPIO DISTANZE STANDARDIZZATE (4 clienti) Distanza euclidea standardizzata 1:A 2:B 3:C 4:D 1:A,000 2,483 1,507,669 2:B 2,483,000 1,061 3,106 3:C 1,507 1,061,000 2,084 4:D,669 3,106 2,084,000 Questa è una matrice di dissimilarità Distanza City Block standardizzata 1:A 2:B 3:C 4:D 1:A,000 3,510 2,066,876 2:B 3,510,000 1,444 4,386 3:C 2,066 1,444,000 2,942 4:D,876 4,386 2,942,000 Questa è una matrice di dissimilarità

17 GRADUATORIE DISTANZE STANDARDIZZATE (In questo caso vi è una relazione monotona, ma non in generale) Distanza euclidea standardizzata 1:A 2:B 3:C 4:D 1:A,000 5,000 3,000 1,00 2:B,000 2,000 6,000 3:C 4:D,000 4,00,000 Questa è una matrice di dissimilarità Distanza City Block standardizzata 1:A 2:B 3:C 4:D 1:A,000 5,000 3,000 1,000 2:B,000 2,000 6,000 3:C 4:D,000 4,000,000 Questa è una matrice di dissimilarità

18 INDICI DI DISTANZA Il quadrato della distanza euclidea non soddisfa la proprietà di disuguaglianza triangolare (vedi esempio pag.318): è un indice di distanza Il quadrato della distanza euclidea soddisfa però la proprietà di additività: se le variabili sono suddivise in gruppi, l indice di distanza calcolato su tutte le variabili è uguale alla somma degli indici calcolati sui vari gruppi Esempio: variabili economiche, demografiche, sociali

19 Quadrato della distanza euclidea (4 clienti, dati originari) La distanza tra A e B è maggiore della somma delle distanze A-C e B-C 1:A 2:B 3:C 4:D Matrice delle distanze Distanza euclidea quadratica 1:A 2:B 3:C 4:D, , ,000 65, ,000, , , , ,000, ,000 65, , ,000,000 Questa è una matrice di dissimilarità

20 ESERCIZIO In un indagine sulla qualità della vita il quotidiano Italia Oggi ha fornito, tra l altro, i seguenti dati sulla situazione ambientale in alcune province emiliane: ZTL= zone a traffico limitato (mq per abitante); VERDE = verde pubblico (mq per abitante); DIFF = raccolta differenziata rifiuti (in percentuale della raccolta totale). Si calcoli la corrispondente matrice degli scostamenti standardizzati; si calcoli la matrice delle distanze della città a blocchi dapprima sui dati originari e quindi sugli scostamenti standardizzati e se ne commenti il significato.

21 DATI PROVINCE ZTL VERDE DIFF PIACENZA PARMA REGGIO E MODENA

22 MATRICE DEGLI SCOST. STAND. M = [3.24; 14.45; 25.12] σ= [1.62; 2.31; 10.68] PROVINCE ZTL VERDE RACC. PIACENZA,57 -,37,61 PARMA,53 -,63 -,98 REGGIO E -1,50 -,50 1,08 MODENA,40 1,49 -,71

23 Distanze non stand. e stand. Matrice delle distanze Distanza City Block 1:PIACENZA 2:PARMA 3:REGGIO E 4:MODENA 1:PIACENZA,000 17,570 8,750 18,670 2:PARMA 17,570,000 25,580 7,900 3:REGGIO E 8,750 25,580,000 26,880 4:MODENA 18,670 7,900 26,880,000 Questa è una matrice di dissimilarità Matrice delle distanze standardizzate Distanza City Block 1:PIACENZA 2:PARMA 3:REGGIO E 4:MODENA 1:PIACENZA,000 1,884 2,672 3,345 2:PARMA 1,884,000 4,210 2,504 3:REGGIO E 2,672 4,210,000 5,684 4:MODENA 3,345 2,504 5,684,000 Questa è una matrice di dissimilarità

24 Interpretazione delle distanze Ordinale Su scala d intervalli Valutazione oggettiva (Teorema p. 332) DEFINIZIONE :Dati tre vettori x, y, z: Se xs ys xs zs per s = 1,2,..., p si dice che x è OGGETTIVAMENTE meno distante da y che da z

25 TEOREMA Enunciato: Se una coppia di vettori x e y è oggettivamente meno distante di x da z allora si conserva il verso della disuguaglianza per qualunque distanza appartenente alla classe di Minkowski, per k finito. Dimostrazione: p.333

26 Distanza Euclidea e distanza di Mahalanobis

27 Distanza euclidea Invariante per trasformazioni ortogonali

28 Distanza di Mahalanobis Tiene conto della correlazione tra le diverse variabili Invariante per trasformazioni lineari assume lo stesso valore se viene applicata ai dati originari oppure alle variabili standardizzate.

29 Richiami del biplot

30 Distanza Eucidea e di Mahalanobis (da un centroide)

31 INDICI DI SIMILARITA

32 SCOPI DEL CALCOLO Problema: misurare la rassomiglianza tra due unità statistiche di cui si conoscono i valori di p variabili qualitative binarie (o politomiche): INDICI DI SIMILARITA Esempio: somiglianza tra le caratteristiche di due modelli di automobili in base alla presenza assenza di p accessori (oppure: non possibile, a pagamento, di serie) Date n modelli posso individuare le coppie tra loro più simili Dissimilarità = 1 indice di similarità = analogo qualitativo della distanza

33 Similarità e market basket analysis Con la market basket analysis si studiano le relazioni tra coppie di prodotti acquistati insieme (presenti contemporaneamente in n carrelli) Con gli indici di similarità si studia la somiglianza tra coppie di clienti (numero di prodotti, rispetto al totale p, presenti contemporaneamente in due carrelli)

34 Esempio 1: indagine sull utilizzo di Internet Campione di studenti Records di due studenti del dataset con riferimento a 6 items (variabili binarie: usi di Internet sì no): Posta Studio Ricerche Svago Chat. Altro C è similarità negli utilizzi dei due studenti? Possiamo formare gruppi di studenti che danno giudizi simili?

35 Esempio 2: sequenze di visita ad un sito web Similarità nel comportamento dei due visitatori? Pagine viste non viste. Altri esempi: segmentazione di prodotti in base a presenza/assenza di caratteristiche tecniche. comportamenti di acquisto similarità tra carrelli della spesa Possesso di p beni durevoli Presenza-assenza di p servizi in due comuni

36 Indici di similarità Nel caso di variabili binarie (v. Esempio 1) l aspetto più rilevante della similarità è il numero di co-presenze (positive matches) frequenza di items presenti contemporaneamente nelle due unità I diversi indici di similarità differiscono principalmente per come trattano gli items assenti in una od entrambe le unità qualificano in modo diverso la similarità, a seconda dell applicazione. Esempio 1: p accessori di due modelli di auto Esempio 2: p marche di profumi acquistate/non acquistate da due clienti

37 SIMBOLOGIA Notazione: u i, u j due unità (studenti, visitatori del sito, modelli di auto, clienti ) di cui si misura la similarità p = numero di items (nell Es. 1: p = 6)

38 La similarità tra u i e u j può essere valutata attraverso una Tabella 2 2 classificazione dei p items per le due unità: u i \ u j Presente (1) Assente (0) Tot. Presente (1) a b a + b Assente (0) c d c + d Tot. a + c b + d p a = numero di co-presenze d = numero di co-assenze a + b = numero di items presenti nell unità u i a + c = numero di items presenti nell unità u j Attenzione: p è il numero di variabili binarie

39 Indici di similarità più utilizzati Indice di Russel Rao: S ij = a / p Indice di Jaccard esclude le co-assenze: S ij = a / (a + b + c) Indice di corrispondenza semplice di Sokal- Michener (simple matching) numero co-presenze + numero co-assenze sul totale degli items: S ij = (a + d) / p Dipende dal numero di items elencati Altri indici di similarità: pp ; SPSS

40 Esempio 1 (p = 6) similarità tra i due studenti con riferimento agli utilizzi di Internet u 1 \ u 2 Presente Assente Tot. (1) (0) Presente (1) Assente (0) Tot Posta Studio Ricerche Svago Chat. Altro Russel Rao S ij = a / p = 2/6 = Jaccard: S ij = a / (a + b + c) =2/(2+0+1) = 2/(6-3) = Sokal-Michener S ij = (a + d) / p: (2+3)/6 = 0.833

41 Russel Rao S ij = a / p : = 2/6 = Jaccard: S ij = a / (a + b + c) =2/(2+0+1) = 2/(6-3) = Sokal-Michener S ij = (a + d) / p (simple matching): (2+3)/6 = La disuguaglianza che esiste tra gli indici sopra riportati vale in generale La scelta dell indice dipende dall importanza data alle co-assenze qualificano la similarità?

42 Alcune proprietà di tutti gli indici di similarità Non negatività S ij 0 Normalizzazione S ii = 1 Simmetria S ij = S ji Relazione tra similarità e dissimilarità D ij = 1 S ij

43 SPSS per il calcolo delle matrici di similarità Percorso: Analizza Correlazione distanze similarità Scelta delle variabili binarie (codificate però come numeriche) da analizzare Consente di calcolare la matrice degli indici di similarità con la formula prescelta IN ALTERNATIVA: CALCOLO NELL AMBITO DEL METODO GERARCHICO DI CLUSTER ANALYSIS

44 ESPRESSIONE GENERALE DEGLI INDICI DI SIMILARITA (formula di Zani, p. 350) Z S ij = aw 3 aw1 + dw JACCARD : w dw2 + ( b + RUSSEL RAO : w = w c) w = 1;... w SOKAL MICHENER : pesi = = = w w 3 5 = 5 w 4 = w 2 5 = = 1;... w w 4 = 0 2 = 0 Altri...

45 Distanze con variabili binarie Esempio 1: indagine sugli utilizzi di Internet Posta Studio Ricerche Svago Chat Altro Dissimilarità basata sull indice simple matching: D ij = 1 S ij = 1 5/6 = 1/6 S ij = (a + d) / p Il complemento a 1 dell indice di corrispondenza semplice è uguale alla distanza media (cioè rapportata al numero dei caratteri p) calcolata con la metrica della città a blocchi o con il quadrato della distanza euclidea.

46 Similarità per fenomeni qualitativi politomici, con più di due modalità che si escludono a vicenda Codificazione disgiuntiva: date k>2 modalità si considerano k variabili binarie Esempio: Forma giuridica SPA SNC SAS ALTRA U U Per ogni variabile un solo 1 per riga se le modalità si escludono a vicenda

47 SIMILARITA PER CODIFICA DISGIUNTIVA Tabella p. 356: le coppie 0-0 sono prive di significato Indice formalmente analogo a Jaccard (8.46) e formula (8.47), indice di DICE α A S ij = α + β + γ α α B S ij = α + 0.5( β + γ ) = p

48 STRATEGIE PER CARATTERI QUALITATIVI E QUANTITATIVI p. 358 e seg. ESEMPI: home theatre p. 8 ; navigatori in SPSS 1) Cluster analysis partendo dalla matrice delle distanze e dalla matrice delle similarità; poi confronto. 2) Trasformazione dei dati e riduzione ad un unica scala; problemi: Difficoltà di quantificazione nel passaggio da ordinali a quantitativi (possibilità di soluzioni diverse); Perdita d informazioni nella trasformazione di caratteri quantitativi in ordinali o dicotomici 3) Definizione di indici ad hoc

49 INDICE DI GOWER S ij ove : w = ijs = p s= 1 p w z s= 1 ijs w w ijs ijs = 1se è possibile il confronto tra le unità i e 0 altrimenti ijs j IL CONFRONTO NON E' POSSIBILE : SE VI E' UN DATO MANCANTE IN ALMENO UNA DELLE DUE UNITA' OPPURE QUANDOSI MANIFESTA UNA COASSENZA (0-0)

50 SIGNIFICATO DI Z ijs Caratteri dicotomici : z ijs =1 se le unità i e j mostrano una copresenza per il carattere s; z ijs = 0 altrimenti. Caratteri politomici: z ijs =1 se le unità i e j mostrano la stessa modalità per il carattere s; z ijs = 0 altrimenti. Variabili quantitative o gradi ordinali: S p s= 1 ij = p z s= 1 ijs w w ijs ijs z ijs =1 x is K x s js

51 Valori dell indice di Gower = 1 se le unità i e j presentano modalità uguali per ciascuno dei caratteri qualitativi e valori uguali per ciascuna delle variabili quantitative (PERFETTA SIMILARITA ) = 0 se le unità i e j presentano modalità diverse per ciascuno dei caratteri qualitativi e per ciascuna delle variabili quantitative un unità presenta il massimo e l altra il minimo (MASSIMA DIVERSITA ) Nel caso di sole variabili binarie coincide con l indice di Jaccard

52 ESEMPIO: 3 FRIGORIFERI Marca capacità prezzo allarme dispenser display S p s= 1 ij = p z s= 1 ijs w w ijs ijs z ijs =1 x is K x s js AEG BOSCH IGNIS K=range AEG-BOSCH: GOWER = [(1-120/190)+ (1-1100/1320)+1+0+0] / 5= 0.307

53 ESEMPIO: 3 FRIGORIFERI Marca capacità prezzo allarme dispenser display S p s= 1 ij = p z s= 1 ijs w w ijs ijs z ijs =1 x is K x s js AEG BOSCH IGNIS K=range AEG-IGNIS: GOWER = [(1-70/190) + (1-220/1320) + 0] /3 = vi sono due co-assenze

54 ESEMPIO: 3 FRIGORIFERI Marca capacità prezzo allarme dispenser display S p s= 1 ij = p z s= 1 ijs w w ijs ijs z ijs =1 x is K x s js AEG BOSCH IGNIS K=range BOSCH-IGNIS: GOWER = 0

55 ESERCIZIO Si è confrontata la presenza (1) oppure l assenza (0) di 15 accessori su due modelli A e B di MP3, ottenendo la tabella riportata di seguito. Si calcolino i diversi indici di similarità e se ne commenti il significato. Assumendo i totali marginali della tabella come prefissati, si scrivano le frequenze di casella corrispondenti all ipotesi di maggiore similarità possibile tra i due modelli, calcolando anche il valore che presenterebbero in tal caso i vari indici di similarità. A \ B

56 SOLUZIONE Russel-Rao: 9/15 =0.6 Jaccard: 9/12 = 0.75 Sokal-Michener: 12/15 =0.8 A\B 1 0 Tot Tot

57 ESERCIZIO Si sono rilevate le categorie di beni alimentari acquistati da 3 clienti (1 = acquistato; 0 = non acquistato): CLIENTE pane pasta acqua birra vino carni pesce salumi latte caffè olio burro A B C Si calcolino le matrici dei diversi indici di similarità fra i 3 clienti. Si dica se esiste una relazione monotona tra gli indici che compaiono nelle differenti matrici.

58 RISOLUZIONE SIMILARITA A - B A / B 1 0 TOT TOT R-R=3/12 J =3/11 S-M=4/12

59 RISOLUZIONE Le matrici degli indici di similarità fra i tre clienti, indicati con A, B, C, sono le seguenti: Russel Rao A B C A B C 1 Jaccard A B C A B C 1 Sokal Michener A B C A B C 1 La relazione monotona esiste tra le matrici degli indici di Russel Rao e di Jaccard, ma non con la matrice degli indici di Sokal Michener (vi è una inversione dei gradi nella prima riga).

ANALISI DEI DATI PER IL MARKETING 2014

ANALISI DEI DATI PER IL MARKETING 2014 ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it MISURE DI DISTANZA E SIMILARITA 1 SCOPI DEL CALCOLO Problema: misurare la diversità (ovvero la rassomiglianza) tra

Dettagli

1.8 Matrici di distanze

1.8 Matrici di distanze come punti in uno spazio -dimensionale che chiameremo spazio degli oggetti. Per esempio la matrice di correlazione ha una naturale interpretazione nello spazio degli oggetti della matrice centrata H. La

Dettagli

Distanze Analisi Esplorativa

Distanze Analisi Esplorativa Distanze Analisi Esplorativa Aldo Solari 1 / 57 1 Distanze 2 Distanza di Mahalanobis 3 Distanze e trasformazioni lineari 4 Indici di similarità 2 / 57 Raggruppamento di unità statistiche L analisi di raggruppamento

Dettagli

Misure di diversità tra unità statistiche. Loredana Cerbara

Misure di diversità tra unità statistiche. Loredana Cerbara Misure di diversità tra unità statistiche Loredana Cerbara LA DISTANZA IN STATISTICA In statistica la distanza ha un significato diverso da quello che si può intuire in altre discipline, dove, peraltro,

Dettagli

ANALISI DEI DATI PER IL MARKETING 2014

ANALISI DEI DATI PER IL MARKETING 2014 ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it ANALISI DELLE CORRISPONDENZE (cap. VII) Problema della riduzione delle dimensioni L ANALISI DELLE COMPONENTI PRINCIPALI

Dettagli

Risultato di una rilevazione statistica effettuata su n unità statistiche con riferimento a p fenomeni (detti anche caratteri, variabili)

Risultato di una rilevazione statistica effettuata su n unità statistiche con riferimento a p fenomeni (detti anche caratteri, variabili) LA MATRICE DEI DATI Risultato di una rilevazione statistica effettuata su n unità statistiche con riferimento a p fenomeni (detti anche caratteri, variabili) Esempi di: unità variabili individui Reddito,

Dettagli

SDE Marco Riani

SDE Marco Riani SDE 2017 Marco Riani mriani@unipr.it http://www.riani.it LA CLASSIFICAZIONE Problema generale della scienza (Linneo, ) Analisi discriminante Cluster Analysis (analisi dei gruppi) ANALISI DISCRIMINANTE

Dettagli

Cluster Analysis Distanze ed estrazioni Marco Perugini Milano-Bicocca

Cluster Analysis Distanze ed estrazioni Marco Perugini Milano-Bicocca Cluster Analysis Distanze ed estrazioni M Q Marco Perugini Milano-Bicocca 1 Scopi Lo scopo dell analisi dei Clusters è di raggruppare casi od oggetti sulla base delle loro similarità in una serie di caratteristiche

Dettagli

Analisi Multivariata Prova finale del 3 giugno 2010

Analisi Multivariata Prova finale del 3 giugno 2010 Analisi Multivariata Prova finale del 3 giugno 2010 Esercizi da svolgere con carta e penna Esercizio A A1 Descrivere brevemente qual è l obiettivo principale dell analisi fattoriale. A2 Scrivere il modello

Dettagli

COGNOME E NOME MATR. ANALISI DEI DATI PER IL MARKETING novembre 2008.

COGNOME E NOME MATR. ANALISI DEI DATI PER IL MARKETING novembre 2008. COGNOME E NOME MATR. ANALISI DEI DATI PER IL MARKETING novembre 2008. ESERCIZIO I Si è applicata l analisi delle componenti principali a 97 modelli di fotocamere digitali, considerando 7 variabili ed ottenendo

Dettagli

ANALISI DEI DATI PER IL MARKETING 2016

ANALISI DEI DATI PER IL MARKETING 2016 ANALISI DEI DATI PER IL MARKETING 2016 Marco Riani mriani@unipr.it http://www.riani.it INFORMAZIONI SUL CORSO Orario MER 9.00-11.00 (frontale) MER 14.00-16.00 (frontale) VEN 9.00-11.00 (laboratorio) Ricevimento

Dettagli

I metodi di Classificazione automatica

I metodi di Classificazione automatica L Analisi Multidimensionale dei Dati Una Statistica da vedere I metodi di Classificazione automatica Matrici e metodi Strategia di AMD Anal Discrimin Segmentazione SI Per riga SI Matrice strutturata NO

Dettagli

STATISTICA PER LA DIGITAL ECONOMY Marco Riani

STATISTICA PER LA DIGITAL ECONOMY Marco Riani STATISTICA PER LA DIGITAL ECONOMY 2018 Marco Riani mriani@unipr.it http://www.riani.it Ponderazione delle unità Unità statistiche: con la stessa importanza con importanza diversa: ponderazione Vettore

Dettagli

Prova finale del 6 giugno 2011

Prova finale del 6 giugno 2011 Prova finale del 6 giugno 2011 Esercizio A, da svolgere con carta e penna Si consideri la seguente matrice dei dati relativa a 3 unità statistiche e 3 variabili, X 1 e X 2 quantitative, X 3 dicotomica.

Dettagli

Analisi delle corrispondenze

Analisi delle corrispondenze Capitolo 11 Analisi delle corrispondenze L obiettivo dell analisi delle corrispondenze, i cui primi sviluppi risalgono alla metà degli anni 60 in Francia ad opera di JP Benzécri e la sua equipe, è quello

Dettagli

Statistica per l Impresa

Statistica per l Impresa Statistica per l Impresa a.a. 2017/2018 Tecniche di Analisi Multidimensionale Analisi dei Gruppi 23 aprile 2018 Indice 1. Analisi dei Gruppi: Introduzione 2. Misure di distanza e indici di similarità 3.

Dettagli

Indicatori compositi. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

Indicatori compositi. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Indicatori [1/4] Gli indicatori: sintetizzano le caratteristiche di un fenomeno colgono aspetti e problemi del fenomeno che non hanno una immediata

Dettagli

Analisi delle corrispondenze

Analisi delle corrispondenze Analisi delle corrispondenze Obiettivo: analisi delle relazioni tra le modalità di due (o più) caratteri qualitativi Individuazione della struttura dell associazione interna a una tabella di contingenza

Dettagli

ANALISI DEI CLUSTER. In questo documento presentiamo alcune opzioni analitiche della procedura di analisi de cluster di

ANALISI DEI CLUSTER. In questo documento presentiamo alcune opzioni analitiche della procedura di analisi de cluster di ANALISI DEI CLUSTER In questo documento presentiamo alcune opzioni analitiche della procedura di analisi de cluster di SPSS che non sono state incluse nel testo pubblicato. Si tratta di opzioni che, pur

Dettagli

Statistica per l Impresa

Statistica per l Impresa Statistica per l Impresa a.a. 2017/2018 Tecniche di Analisi Multidimensionale Analisi dei Gruppi 9 maggio 2018 Indice Analisi dei Gruppi: Introduzione Misure di distanza e indici di similarità Metodi gerarchici

Dettagli

Dispense Associazione PRELIMINARY DRAFT

Dispense Associazione PRELIMINARY DRAFT Dispense Associazione PRELIMINARY DRAFT Cristina Mollica & Jan Martin Rossi January 3, 2019 1 Esercizio 3 - Prova scritta 12-01-2018 Esercizio 3. Si consideri la distribuzione doppia di un campione di

Dettagli

SDE Marco Riani

SDE Marco Riani SDE 208 Marco Riani mriani@unipr.it http://www.riani.it RIDUZIONE DELLE DIMENSIONI (con riferimento alle variabili Analisi dei fattori Analisi delle componenti principali OBIETTIVI Date p variabili (correlate

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2017-2018 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

STATISTICA PER LA DIGITAL ECONOMY 2017

STATISTICA PER LA DIGITAL ECONOMY 2017 STATISTICA PER LA DIGITAL ECONOMY 2017 Marco Riani mriani@unipr.it http://www.riani.it INFORMAZIONI SUL CORSO Orario MER 11.00-13.00 (frontale) GIO 9.00-11.00 (frontale) VEN 11.00-13.00 (laboratorio) Ricevimento

Dettagli

Esercizi del 10 maggio 2012 da riconsegnare il 17 maggio 2012

Esercizi del 10 maggio 2012 da riconsegnare il 17 maggio 2012 Analisi Multivariata Esercizi del 10 maggio 2012 da riconsegnare il 17 maggio 2012 La Tabella 1 contiene la classificazione in base alla qualifica e all abitudine al fumo di 193 dirigenti e impiegati di

Dettagli

Indicatori di Posizione e di Variabilità. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica

Indicatori di Posizione e di Variabilità. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica Indicatori di Posizione e di Variabilità Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica Indici Sintetici Consentono il passaggio da una pluralità

Dettagli

Analisi dei dati per la comunicazione

Analisi dei dati per la comunicazione Analisi dei dati per la comunicazione La costruzione e l uso di misure relative semplici e complesse Prof.ssa Isabella Mingo A.A. 2014-2015 La costruzione di indici complessi: fasi In definitiva, la costruzione

Dettagli

Prova scritta di ASM - Modulo Analisi Esplorativa del

Prova scritta di ASM - Modulo Analisi Esplorativa del Cognome:... Nome:... Matricola:......... Prova scritta di ASM - Modulo Analisi Esplorativa del 14.02.2017 La durata della prova è di 90 minuti. Si svolgano gli esercizi A e B riportando il risultato dove

Dettagli

Variabilità. ..senza variabilità non ci sarebbe la statistica

Variabilità. ..senza variabilità non ci sarebbe la statistica Variabilità..senza variabilità non ci sarebbe la statistica Se tutti votassimo lo stesso partito alle elezioni (=moda), non ci sarebbero i sondaggi, nè le previsioni elettorali il voto politico sarebbe

Dettagli

Corso di Laurea: Diritto per le Imprese e le istituzioni a.a Statistica. Statistica Descrittiva 3. Esercizi: 5, 6. Docente: Alessandra Durio

Corso di Laurea: Diritto per le Imprese e le istituzioni a.a Statistica. Statistica Descrittiva 3. Esercizi: 5, 6. Docente: Alessandra Durio Corso di Laurea: Diritto per le Imprese e le istituzioni a.a. 2016-17 Statistica Statistica Descrittiva 3 Esercizi: 5, 6 Docente: Alessandra Durio 1 Contenuti I quantili nel caso dei dati raccolti in classi

Dettagli

La variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

La variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Introduzione [1/2] Gli indici di variabilità consentono di riassumere le principali caratteristiche di una distribuzione (assieme alle medie) Le

Dettagli

Metodi Probabilistici e Statistici per l Analisi dei Dati. Prof. V. Simoncini. Testi di Riferimento

Metodi Probabilistici e Statistici per l Analisi dei Dati. Prof. V. Simoncini. Testi di Riferimento Metodi Probabilistici e Statistici per l Analisi dei Dati Prof. V. Simoncini e-mail: valeria@dm.unibo.it, valeria@ambra.unibo.it Testi di Riferimento Lucidi di Lezione (http://www.dm.unibo.it/ ~simoncin/datiii.html)

Dettagli

ANALISI DEI DATI PER IL MARKETING 2017

ANALISI DEI DATI PER IL MARKETING 2017 ANALISI DEI DATI PER IL MARKETING 2017 Marco Riani mriani@unipr.it http://www.riani.it TRATTAMENTI PRELIMINARI DEI DATI Pulizia dei dati (data cleaning) = processo capace di garantire, con una certa soglia

Dettagli

Esercizi di statistica

Esercizi di statistica Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..

Dettagli

Matematica Lezione 22

Matematica Lezione 22 Università di Cagliari Corso di Laurea in Farmacia Matematica Lezione 22 Sonia Cannas 14/12/2018 Indici di posizione Indici di posizione Gli indici di posizione, detti anche misure di tendenza centrale,

Dettagli

SDE Marco Riani

SDE Marco Riani SDE 2018 Marco Riani mriani@unipr.it http://www.riani.it RAPPRESENTAZIONI GRAFICHE Nella comunicazione una figura vale più di cento numeri e di mille parole! SCOPI DELLE RAPPRESENTAZIONI GRAFICHE NELLE

Dettagli

A.A. 2014/2015 Corso di Algebra Lineare

A.A. 2014/2015 Corso di Algebra Lineare A.A. 2014/2015 Corso di Algebra Lineare Stampato integrale delle lezioni Massimo Gobbino Indice Lezione 01: Vettori geometrici nel piano cartesiano. Operazioni tra vettori: somma, prodotto per un numero,

Dettagli

APPUNTI DI CLUSTER ANALYSIS (Paola Vicard)

APPUNTI DI CLUSTER ANALYSIS (Paola Vicard) APPUNTI DI CLUSTER ANALYSIS (Paola Vicard) Obiettivi della cluster analysis La cluster analysis è una delle principali tecniche di analisi statistica multivariata per raggruppare le unità osservate in

Dettagli

decisioni multiattributo lezione 10

decisioni multiattributo lezione 10 decisioni multiattributo lezione 10 richiamo- tabella multiattributo Attributi X1 X2 Xn Alternative A 1 V 11 V 12 V 1n A 2 V 21 V 22 V 2n A m V m1 V m2 V mn obiettivi o attributi? obiettivi := ragioni

Dettagli

1. variabili dicotomiche: 2 sole categorie A e B

1. variabili dicotomiche: 2 sole categorie A e B Variabile X su scala qualitativa (due categorie) modello di regressione: variabili quantitative misurate almeno su scala intervallo (meglio se Y è di questo tipo e preferibilmente anche le X i ) variabili

Dettagli

SDE Marco Riani

SDE Marco Riani SDE 018 Marco Riani mriani@uniprit http://wwwrianiit ANALISI DELLE CORRISPONDENZE Problema della riduzione delle dimensioni L ANALISI DELLE COMPONENTI PRINCIPALI per una matrice di dati quantitativi L

Dettagli

Esercizi Svolti. 2. Costruire la distribuzione delle frequenze cumulate del tempo di attesa

Esercizi Svolti. 2. Costruire la distribuzione delle frequenze cumulate del tempo di attesa Esercizi Svolti Esercizio 1 Per una certa linea urbana di autobus sono state effettuate una serie di rilevazioni sui tempi di attesa ad una determinata fermata; la corrispondente distribuzione di frequenza

Dettagli

ANALISI DEI DATI PER IL MARKETING 2014

ANALISI DEI DATI PER IL MARKETING 2014 ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it LA CLASSIFICAZIONE CAP IX, pp.367-457 Problema generale della scienza (Linneo, ) Analisi discriminante Cluster Analysis

Dettagli

PreCorso di Matematica - PCM Corso M-Z

PreCorso di Matematica - PCM Corso M-Z PreCorso di Matematica - PCM Corso M-Z DOCENTE: M. Auteri Outline Docente: Auteri PreCorso di Matematica 2016 2 Definizione di matrice Una matrice (di numeri reali) è una tabella di m x n numeri disposti

Dettagli

Teoria e tecniche dei test. Concetti di base

Teoria e tecniche dei test. Concetti di base Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi

Dettagli

misura. Adesso, ad un arbitrario punto P dello spazio associamo una terna di numeri reali x

misura. Adesso, ad un arbitrario punto P dello spazio associamo una terna di numeri reali x 4. Geometria di R 3. Questo paragrafo è molto simile al paragrafo : tratta infatti delle proprietà geometriche elementari dello spazio R 3. Per assegnare delle coordinate nello spazio, fissiamo innanzitutto

Dettagli

misura. Adesso, ad un arbitrario punto P dello spazio associamo una terna di numeri reali x

misura. Adesso, ad un arbitrario punto P dello spazio associamo una terna di numeri reali x 4. Geometria di R 3. Questo paragrafo è molto simile al paragrafo : tratta infatti delle proprietà geometriche elementari dello spazio R 3. Per assegnare delle coordinate nello spazio, fissiamo innanzitutto

Dettagli

Analisi esplorativa di dati multidimensionali

Analisi esplorativa di dati multidimensionali io e Luigi Fabbris Analisi esplorativa di dati multidimensionali 'CENTRO " G. ASTENGO» cleup editore INVENTARIO 2B6 c., INDICE DEI CONTENUTI -~ Cap. 1 L'analisi dei dati nella ricerca sociale pag. I 1.1.

Dettagli

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici) Statistica La statistica può essere vista come la scienza che organizza ed analizza dati numerici per fini descrittivi o per permettere di prendere delle decisioni e fare previsioni. Statistica descrittiva:

Dettagli

Liceo delle Scienze Umane Fabrizio De André Dipartimento di Matematica e Fisica Programma di Matematica per il Biennio: a.s.

Liceo delle Scienze Umane Fabrizio De André Dipartimento di Matematica e Fisica Programma di Matematica per il Biennio: a.s. Liceo delle Scienze Umane Fabrizio De André Dipartimento di Matematica e Fisica Programma di Matematica per il Biennio: a.s. 2016-2017 Utilizzare le tecniche e le procedure del calcolo aritmetico e algebrico

Dettagli

Descrittiva. V Scuola Estiva AISV La statistica come strumento di analisi nelle scienze umanistiche e comportamentali

Descrittiva. V Scuola Estiva AISV La statistica come strumento di analisi nelle scienze umanistiche e comportamentali Elementi di Statistica Descrittiva La Variabilità V Scuola Estiva AISV La statistica come strumento di analisi nelle scienze umanistiche e comportamentali Soriano nel Cimino (VT), 5 Ottobre 2009 Pier Francesco

Dettagli

Statistica Descrittiva Soluzioni 6. Indici di variabilità, asimmetria e curtosi

Statistica Descrittiva Soluzioni 6. Indici di variabilità, asimmetria e curtosi ISTITUZIONI DI STATISTICA A A 2007/2008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona

Dettagli

ESTRAZIONE DI DATI 3D DA IMMAGINI DIGITALI. (Visione 3D)

ESTRAZIONE DI DATI 3D DA IMMAGINI DIGITALI. (Visione 3D) ESTRAZIONE DI DATI 3D DA IMMAGINI DIGITALI () Structure From Motion Date m immagini di n punti 3D (fissi) Stimare le m matrici di proiezione P i e gli n vettori X j date le mn corrispondenze x ij SFM

Dettagli

Alfonso Iodice D Enza

Alfonso Iodice D Enza Strumenti quantitativi per l economia e la finanza I Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino e del Lazio Meridionale () Statistica 1 / 58 Outline 1 2 3 4 5 () Statistica

Dettagli

Statistica Elementare

Statistica Elementare Statistica Elementare 1. Frequenza assoluta Per popolazione si intende l insieme degli elementi che sono oggetto di una indagine statistica, ovvero l insieme delle unità, dette unità statistiche o individui

Dettagli

Unità Carattere Modalità

Unità Carattere Modalità Unità Carattere Modalità Unità statistica: unità elementare del collettivo oggetto di studio Carattere: è ogni aspetto del fenomeno oggetto di studio osservabile su un insieme di unità statistiche Modalità:

Dettagli

PROGRAMMAZIONE MATEMATICA classe seconda economico/turistico:

PROGRAMMAZIONE MATEMATICA classe seconda economico/turistico: PROGRAMMAZIONE MATEMATICA classe seconda economico/turistico: UDA n. 0 Statistica descrittiva (ripasso da attuare in un qualsiasi momento dell a.s.) Prerequisiti Padronanza del calcolo nei vari insiemi

Dettagli

Nuovi scenari per la matematica Salerno 29/08/2012.

Nuovi scenari per la matematica Salerno 29/08/2012. Nuovi scenari per la matematica Salerno 29/08/2012 rprosp@alice.it, albertaschettino@gmail.com 2 Due livelli di azione Medie Disuguaglianza Concetto centrale della statistica Confronto media aritmetica

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 3

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 3 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 3 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. La variabile casuale normale Da un analisi di bilancio è emerso che, durante i giorni feriali

Dettagli

S 2 p n X. + S2 p. n Y

S 2 p n X. + S2 p. n Y ESERCIZIO 1 Attraverso un indagine effettuata su un campione di 83 pellicole cinematografiche, si verifichi, a livello 0.01, se vi sono differenze, in media, tra i budget dei film di produzione americana

Dettagli

La gestione dei risultati della valutazione. Claudio Mantovani

La gestione dei risultati della valutazione. Claudio Mantovani La gestione dei risultati della valutazione Claudio Mantovani L obiettivo di questo intervento Descrivere alcune tecniche di analisi di dati dalle più semplici alle più complesse Dare suggerimenti pratici

Dettagli

Una approssimazione allo spazio della fisica classica. Spazi affini euclidei.

Una approssimazione allo spazio della fisica classica. Spazi affini euclidei. Una approssimazione allo spazio della fisica classica. Spazi affini euclidei. Federico Lastaria. Analisi e Geometria 1. Una introduzione allo spazio della fisica classica. 1/20 Lo spazio E 3 (il piano

Dettagli

Errata corrige. p. 10 riga 5 del secondo paragrafo: misurare

Errata corrige. p. 10 riga 5 del secondo paragrafo: misurare Errata corrige p. 9 esercizio 5. Modificare testo dell esercizio come segue: Dati una retta r e un punto P, esistono infiniti piani per P paralleli a r: si tratta dei piani che contengono la retta s per

Dettagli

Casa dello Studente. Casa dello Studente

Casa dello Studente. Casa dello Studente Esercitazione - 14 aprile 2016 ESERCIZIO 1 Di seguito si riporta il giudizio (punteggio da 0 a 5) espresso da un gruppo di studenti rispetto alle diverse residenze studentesche di un Ateneo: a) Si calcolino

Dettagli

Spazi vettoriali euclidei.

Spazi vettoriali euclidei. Spazi vettoriali euclidei Prodotto scalare, lunghezza e ortogonalità in R n Consideriamo lo spazio vettoriale R n = { =,,, n R}, n con la somma fra vettori e il prodotto di un vettore per uno scalare definiti

Dettagli

INDICATORI DI TENDENZA CENTRALE

INDICATORI DI TENDENZA CENTRALE INDICATORI DI TENDENZA CENTRALE INDICATORI DI TENDENZA CENTRALE Consentono di sintetizzare un insieme di misure tramite un unico valore rappresentativo indice che riassume o descrive i dati e dipende dalla

Dettagli

Analisi multivariata per osservazioni appaiate. Analisi multivariata per osservazioni appaiate

Analisi multivariata per osservazioni appaiate. Analisi multivariata per osservazioni appaiate Introduzione Notazione Modello additivo Verifica d ipotesi Sia X una variabile q-dimensionale, a valori reali, non degenere, osservata in k tempi diversi (τ 1, τ 2,..., τ k ), sulle stesse n unità statistiche

Dettagli

Analisi delle componenti principali

Analisi delle componenti principali Analisi delle componenti principali Serve a rappresentare un fenomeno k-dimensionale tramite un numero inferiore o uguale a k di variabili incorrelate, ottenute trasformando le variabili osservate Consiste

Dettagli

Argomenti della lezione:

Argomenti della lezione: Lezione 6 La lineare Argomenti della lezione: Variabili a livello degli intervalli Variabili dicotomiche e ordinali Relazione tra variabili Studio dei legami che intercorrono tra più variabili rilevate

Dettagli

COGNOME.NOME...MATR..

COGNOME.NOME...MATR.. STATISTICA 29.01.15 - PROVA GENERALE (CHALLENGE) Modalità A (A) ai fini della valutazione verranno considerate solo le risposte riportate dallo studente negli appositi riquadri bianchi: in caso di necessità

Dettagli

Le matrici. Sia K un campo con elemento neutro dell addizione 0 ed elemento neutro della moltiplicazione 1.

Le matrici. Sia K un campo con elemento neutro dell addizione 0 ed elemento neutro della moltiplicazione 1. Le matrici Sia K un campo con elemento neutro dell addizione 0 ed elemento neutro della moltiplicazione 1. Siano m, n N\{0}. Una matrice m n a coefficienti in K è una tabella di m n elementi di K disposti

Dettagli

Introduzione alla Matematica per le Scienze Sociali - parte II

Introduzione alla Matematica per le Scienze Sociali - parte II Introduzione alla Matematica per le Scienze Sociali - parte II Lucrezia Fanti Istituto Nazionale per l Analisi delle Politiche Pubbliche (INAPP) lucrezia.fanti@uniroma1.it Lucrezia Fanti Intro Matematica

Dettagli

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel: UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA Prof.ssa Donatella Siepi donatella.siepi@unipg.it tel: 075 5853525 2 LEZIONE Statistica descrittiva STATISTICA DESCRITTIVA Rilevazione dei dati Rappresentazione

Dettagli

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli Dipartimento di Sociologia e Ricerca Sociale Corso di Laurea in Sociologia Insegnamento di Statistica (a.a. 018-019) dott.ssa Gaia Bertarelli Esercitazione n. 3 1. I giorni impiegati da sei individui per

Dettagli

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di tendenza centrale

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di tendenza centrale INDICATORI DI TENDENZA CENTRALE Consentono di sintetizzare un insieme di misure tramite un unico valore rappresentativo indice che riassume o descrive i dati e dipende dalla scala di misura dei dati in

Dettagli

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi) CHEMIOMETRIA Applicazione di metodi matematici e statistici per estrarre (massima) informazione chimica (affidabile) da dati chimici INCERTEZZA DI MISURA (intervallo di confidenza/fiducia) CONFRONTO CON

Dettagli

Esempi di confronti grafici

Esempi di confronti grafici Esempi di confronti grafici Esempi di confronti grafici 7/3 Capitolo 3 LE MEDIE La media aritmetica La media geometrica La trimmed mean La mediana La moda I percentili Statistica - Metodologie per

Dettagli

ESERCIZI DI STATISTICA SOCIALE

ESERCIZI DI STATISTICA SOCIALE ESERCIZI DI STATISTICA SOCIALE FREQUENZA ASSOLUTA Data una distribuzione semplice di dati, ovvero una serie di microdati, si chiama frequenza assoluta di ogni modalità del carattere studiato il numero

Dettagli

Variabilità e Concentrazione Esercitazione n 02

Variabilità e Concentrazione Esercitazione n 02 Variabilità e Concentrazione Esercitazione n 02 ESERCIZIO 1 Nella tabella di seguito sono riportati i dati relativi al tempo necessario a 8 studenti per svolgere un test di valutazione (in ore): Tempo

Dettagli

MATRICI E SISTEMI LINEARI

MATRICI E SISTEMI LINEARI 1 Rappresentazione di dati strutturati MATRICI E SISTEMI LINEARI Gli elementi di una matrice, detti coefficienti, possono essere qualsiasi e non devono necessariamente essere omogenei tra loro; di solito

Dettagli

25 - Funzioni di più Variabili Introduzione

25 - Funzioni di più Variabili Introduzione Università degli Studi di Palermo Facoltà di Economia CdS Statistica per l Analisi dei Dati Appunti del corso di Matematica 25 - Funzioni di più Variabili Introduzione Anno Accademico 2013/2014 M. Tumminello

Dettagli

Elementi di Statistica

Elementi di Statistica Università degli Studi di Palermo Dipartimento di Ingegneria Informatica Informatica ed Elementi di Statistica 3 c.f.u. Anno Accademico 2010/2011 Docente: ing. Salvatore Sorce Elementi di Statistica Statistica

Dettagli

Daniela Lera A.A

Daniela Lera A.A Daniela Lera Università degli Studi di Cagliari Dipartimento di Matematica e Informatica A.A. 2016-2017 Richiami Algebra Lineare Spazio normato Uno spazio lineare X si dice normato se esiste una funzione

Dettagli

STATISTICA PER LA DIGITAL ECONOMY Marco Riani

STATISTICA PER LA DIGITAL ECONOMY Marco Riani STATISTICA PER LA DIGITAL ECONOMY 2018 Marco Riani mriani@unipr.it http://www.riani.it INFORMAZIONI SUL CORSO Orario MER 11.15-12.45 (frontale) GIO 9.15-10.45 (frontale) VEN 11.00-13.00 (laboratorio) Ricevimento

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative

Dettagli

Distribuzione di frequenza relativa e percentuale: esempio

Distribuzione di frequenza relativa e percentuale: esempio Distribuzione di frequenza relativa e percentuale: esempio Sesso Freq. assol. F 3 M Totale 5 Sesso % F 60 M 40 Totale 100 Sesso Freq. assol. F 180 M 10 Totale 300 Sesso % F 60 M 40 Totale 100 Attenzione:

Dettagli

PROGRAMMAZIONE DEL GRUPPO DISCIPLINARE A.S. 2016/17 INDIRIZZO SCOLASTICO: LICEO SCIENZE UMANE

PROGRAMMAZIONE DEL GRUPPO DISCIPLINARE A.S. 2016/17 INDIRIZZO SCOLASTICO: LICEO SCIENZE UMANE ISTITUTO D ISTRUZIONE SUPERIORE Enrico Mattei ISTITUTO TECNICO COMMERCIALE LICEO SCIENTIFICO LICEO dellescienze UMANE LICEO ECONOMICO SOCIALE Via delle Rimembranze, 26 40068 San Lazzaro di Savena BO Tel.

Dettagli

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI VERIFICA DI IPOTESI SUL LEGAME TRA VARIABILI QUALITATIVE Profssa G Serio, Prof P Trerotoli, Cattedra di Statistica Medica, Università di Bari 1/1 IL

Dettagli

Obiettivo: assegnazione di osservazioni a gruppi di unità statistiche non definiti a priori e tali che:

Obiettivo: assegnazione di osservazioni a gruppi di unità statistiche non definiti a priori e tali che: Cluster Analysis Obiettivo: assegnazione di osservazioni a gruppi di unità statistiche non definiti a priori e tali che: le unità appartenenti ad uno di essi sono il più possibile omogenee i gruppi sono

Dettagli

Didattica della Matematica per il triennio Geometria sintetica e geometria analitica

Didattica della Matematica per il triennio Geometria sintetica e geometria analitica Didattica della Matematica per il triennio Geometria sintetica e geometria analitica anno acc. 2012/2013 Univ. degli Studi di Milano Cristina Turrini (Univ. degli Studi di Milano) Didattica della Matematica

Dettagli

Statistica. Lezioni: 7, 8. Statistica Descrittiva Univariata 3

Statistica. Lezioni: 7, 8. Statistica Descrittiva Univariata 3 Corsi di Laurea: a.a. 2017-18 Diritto per le Imprese e le istituzioni Scienze dell Amministrazione e Consulenza del Lavoro sienze Internazionali dello Sviluppo e della Cooperazione Statistica Statistica

Dettagli

Mugno Eugenio Matematica 2F

Mugno Eugenio Matematica 2F Docente Materia Classe Mugno Eugenio Matematica 2F Programmazione Preventiva Anno Scolastico 2012/2013 Data 25/11/2012 Obiettivi Cognitivi OBIETTIVI MINIMI U.D.1: FRAZIONI ALGEBRICHE conoscere la definizione

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza La per Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 1 Outline 1 La La per () Statistica 2 / 1 Outline La per 1 La 2 per () Statistica 2 / 1 Outline

Dettagli

PIANO DI LAVORO ANNUALE LICASTRO MARIA SAVERIA MATEMATICA CON INFORMATICA CLASSE: 1^ G. a. s Obiettivi cognitivi.

PIANO DI LAVORO ANNUALE LICASTRO MARIA SAVERIA MATEMATICA CON INFORMATICA CLASSE: 1^ G. a. s Obiettivi cognitivi. ISTITUTO D ISTRUZIONE SUPERIORE MAJORANA Via Ada Negri, 14 10024 MONCALIERI (TO) Codice fiscale 84511990016 Sezione Liceale E.Majorana Scientifico - Linguistico Via Ada Negri, 14 10024 MONCALIERI Tel.

Dettagli

INDICATORI DI TENDENZA CENTRALE

INDICATORI DI TENDENZA CENTRALE INDICATORI DI TENDENZA CENTRALE INDICATORI DI TENDENZA CENTRALE Consentono di sintetizzare un insieme di misure tramite un unico valore rappresentativo è indice che riassume o descrive i dati e dipende

Dettagli

Elementi di Psicometria (con laboratorio software 1)

Elementi di Psicometria (con laboratorio software 1) Elementi di Psicometria (con laboratorio software 1) 02-Tendenza centrale e variabilità (v. 1.0, 22 marzo 2019) versione per stampa Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia,

Dettagli

le scale di misura scala nominale scala ordinale DIAGNOSTICA PSICOLOGICA lezione si basano su tre elementi:

le scale di misura scala nominale scala ordinale DIAGNOSTICA PSICOLOGICA lezione si basano su tre elementi: DIAGNOSTICA PSICOLOGICA lezione! Paola Magnano paola.magnano@unikore.it si basano su tre elementi: le scale di misura sistema empirico: un insieme di entità non numeriche (es. insieme di persone; insieme

Dettagli

Maria Brigida Ferraro + Luca Tardella

Maria Brigida Ferraro + Luca Tardella Cluster Maria Brigida Ferraro + Luca Tardella e-mail: mariabrigida.ferraro@uniroma1.it, ferraromb@gmail.com Lezione #3: Cluster Obiettivi del modulo Cluster 1 Introduzione ai problemi di classificazione

Dettagli

Indici di tendenza centrale Media, mediana e moda.

Indici di tendenza centrale Media, mediana e moda. Indici di tendenza centrale Media, mediana e moda. Indici di tendenza centrale Gli indici di tendenza centrale individuano gli aspetti tipici, ovvero i valori più rappresentativi della distribuzione Questi

Dettagli