Corso di formazione per Mathesis

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Corso di formazione per Mathesis"

Transcript

1 Statistica descrittiva II (Distribuzioni doppie e relazione tra variabili) 8 Marzo 2017 :: Secondo incontro

2 Formazione Docenti :: Programma Incontro preliminare Statistica e Probabilità a Scuola :: le attività del Dipartimento di Scienze Statistiche (Sapienza Università di Roma) Prima parte :: Statistica descrittiva Classificazione, organizzazione e rappresentazione dei dati Sintesi numeriche dei dati (tendenza centrale e dispersione) Distribuzioni doppie e relazione tra variabili qualitative (Tabelle di contingenza e Chi quadrato) Relazione tra variabili quantitative (Correlazione e Regressione)

3 Breve riassunto della lezione precedente Classificazione, organizzazione, rappresentazione e sintesi numeriche dei dati Cosa è la Statistica descrittiva Un po di terminologia (rilevazione, popolazione, unità, variabile) Classificazione delle variabili (qualitative, quantitative...) Organizzazione dei dati (distribuzioni per unità, di frequenza, in classi) Rappresentazioni grafiche (diagramma a barre, diagramma a torta, istogramma) Misure di tendenza centrale: moda, mediana e quantili, media Misure di dispersione: range, range interquartilico, varianza, deviazione standard e coefficiente di variazione Valutazione (grafica) della forma della distribuzione Strumenti informatici (es. Google Drive)

4 Relazione tra due variabili È interessante analizzare il legame di dipendenza esistente tra due (o più) variabili. In base alla natura delle variabili, possono esistere modi differenti per studiare la dipendenza... X e Y entrambe qualitative X e Y entrambe quantitative X e Y una qualitativa una quantitativa

5 Relazione tra due variabili È interessante analizzare il legame di dipendenza esistente tra due (o più) variabili. In base alla natura delle variabili, possono esistere modi differenti per studiare la dipendenza... X e Y entrambe qualitative X e Y entrambe quantitative X e Y una qualitativa una quantitativa

6 Distribuzioni doppie Dalla distribuzione doppia per unità alla distribuzione doppia di frequenza variabili unità X Y 1 x 1 y 1 2 x 2 y 2 i x i y i n x n y n Y X y1 yj yt Totale x1 n 11 n 1j n 1t n 1 xi n i1 n ij n it n i xs n s1 n sj n st n s Totale n 1 n j n t n

7 Tabella di contingenza Notazione Y X y1 yj yt Totale x1 n 11 n 1j n 1t n 1 xi n i1 n ij n it n i xs n s1 n sj n st n s Totale n 1 n j n t n n ij : frequenza congiunta della coppia di modalità (x i, y j ) n i = t j=1 n ij: frequenza marginale della riga i-ma n j = s n = s i=1 i=1 n ij: frequenza marginale della colonna j-ma t j=1 n ij = s i=1 n i = t j=1 n j: numerosità totale

8 Tabella di contingenza Esempio (1) X: scuola superiore Y: social network Y X FB Twitter Totale IT LC LS Totale Esiste un legame tra le due variabili?

9 Distribuzioni marginali X x1 n 1 x i n i xs n s Y y1 n 1 y j n j yt n t

10 Distribuzioni condizionate X (Y=y x 1 j ) n 1j x i n ij xs n sj per j = 1,, t Y (X=x y 1 i ) n i1 y j n ij yt n it per i = 1,, s

11 Distribuzioni condizionate relative X (Y=yj ) x1 n 1j /n j xi n ij /n j xs n sj /n j per j = 1,, t Y (X=xi ) y1 n i1 /n i yj n ij /n i yt n it /n i per i = 1,, s

12 Distribuzioni condizionate relative Esempio (1) X (Y=FB) IT 85/224 = 0.38 LC 69/224 = LS 70/224 = Y (X=IT) FB 85/113 = 0.75 Twitter 28/113 = X (Y=Twitter) IT 28/150 = 0.18 LC 79/150 = 0.53 LS 43/150 = Y (X=LC) FB 69/148 = 0.47 Twitter 79/148 = Y (X=LS) FB 70/113 = 0.62 Twitter 43/113 =

13 Diagramma a barre affiancate Una rappresentazione grafica utile per il confronto IT LS LC FB Twitter FB Twitter IT LC LS Social Network Scuola superiore

14 Diagramma a barre ripartite Una rappresentazione grafica utile per il confronto IT LS LC FB Twitter FB Twitter IT LC LS Social Network Scuola superiore

15 Distribuzioni condizionate relative Caso estremo: Indipendenza = Assenza di connessione X è indipendente da Y se tutte le distribuzioni condizionate di frequenze relative di X data Y sono uguali tra loro (e uguali alla distribuzione marginale relativa di X). In simboli: E simmetricamente: n ij = n i n j n i = 1,, s n ij = n j n i n j = 1,, t ovvero Y è indipendente da X se tutte le distribuzioni condizionate di frequenze relative di Y data X sono uguali tra loro (e uguali alla distribuzione marginale relativa di Y ).

16 Distribuzioni condizionate relative Caso estremo: Indipendenza = Assenza di connessione X e Y sono indipendenti se è verificata la seguente condizione: n ij = n i n j f ij = f i f j n Altrimenti, ci sarà una certa dipendenza o associazione o connessione...

17 Tabella di indipendenza Esempio (1) Y X FB Twitter Totale IT LC LS n 1 n 1 n = = n 2 n 1 n = = n 3 n 1 n = = n 1 n 2 n = = n 1 = 113 n 2 n 2 n = = n 2 = 148 n 3 n 3 n = = n 3 = 113 Totale n 1 = 224 n 2 = 150 n = 374

18 Misurare la connessione Indice Chi quadrato di Pearson Idea: quantificare la connessione introducendo una misura di distanza tra la situazione realmente osservata (le frequenze congiunte all interno della tabella di contingenza) e la situazione ideale di indipendenza ˆn ij = n i n j n χ 2 = s i=1 j=1 t (n ij ˆn ij ) 2 ˆn ij

19 Misurare la connessione con il Chi quadrato Esempio (1) Tabella osservata Y X FB Twitter Totale IT LC LS Totale Tabella di indipendenza Y X FB Twitter Totale IT LC LS Totale χ 2 = + ( )2 ( ) ( )2 ( ) ( ) = ( )

20 Misurare la connessione con il Chi quadrato Esempio (1): interpretazione Se ci fossimo trovati nel caso di indipendenza, avremmo ottenuto χ 2 = 0 Il valore ottenuto χ 2 = indica una certa associazione, ma è difficilmente interpretabile perché il Chi quadrato è un indice assoluto Per costruzione χ 2 è anche una quantità quadratica Infine, un grande difetto di questo indice è che dipende dalla numerosità del collettivo n conviene quindi introdurre un indice relativo, ovvero un indice che varia tra 0 e 1

21 Misurare la connessione Indice V di Cramer Per ottenere un indice relativo I rel occorre trasformare l indice assoluto I ass come segue: I rel = I ass Iass min I max I min Si dimostra che 0 χ 2 n min{s 1, t 1} ass Prendendo la radice quadrata si ottiene l indice V di Cramer: ass χ 2 V = n min{s 1, t 1}

22 Misurare la connessione con V di Cramer Esempio (1) V = 374 min{3 1, 2 1} = 0.24 Il valore ottenuto V = 0.24 indica una leggera associazione tra le due variabili perché è piuttosto vicino allo 0.

23 Il voto in Matematica dipende dal sesso? Esempio (2) Voto Sesso + Totale F M Totale voto < 6 + voto 6

24 Distribuzioni Marginali Esempio (2) della X (Sesso) della Y (Voto) Sesso Totale F n 1 = 23 M n 2 = 31 Totale n = 54 Voto + Totale Totale n 1 = 23 n 2 = 31 n = 54

25 Distribuzioni Condizionate relative Esempio (2) della X rispetto alla Y = y j Voto Sesso + F n 11 /n 1 = 0.43 n 12 /n 2 = 0.42 M n 21 /n 1 = 0.57 n 22 /n 2 = della Y rispetto alle X = xi Voto Sesso + Totale F n 11 /n 1 = 0.43 n 12 /n 1 = M n 21 /n 2 = 0.42 n 22 /n 2 =

26 Diagramma a barre affiancate Una rappresentazione grafica utile per il confronto F M F M Voto in Matematica Sesso

27 Diagramma a barre ripartite Una rappresentazione grafica utile per il confronto F M F M Voto in Matematica Sesso

28 Il voto in Matematica dipende dal sesso? Interpretazione delle distribuzioni condizionate Un voto 6 (+) è stato preso nel 42% dei casi da femmine e nel 58% dei casi da maschi. Girando il punto di vista, circa il 43% delle femmine ha preso un voto < 6 (-) mentre il restante 57 % un voto 6 (+). Per quanto riguarda i maschi, circa il 42% ha preso un voto < 6 (-) e il 58% un voto 6 (+). La percentuale dei maschi con la sufficienza in Matematica è maggiore della percentuale delle femmine.

29 Il Paradosso di Simpson Stratifichiamo per classe di appartenenza Classe C Voto Sesso + Totale F M Totale Classe D Voto Sesso + Totale F M Totale

30 Il Paradosso di Simpson Distribuzioni condizionate relative Classe C Voto (Sesso = F) Voto (Sesso = M) Classe D Voto (Sesso = F) Voto (Sesso = M)

31 Il Paradosso di Simpson Rappresentazione grafica Classe C Classe D F M F M Sesso Sesso

32 Il voto in Matematica dipende dal sesso? Come è cambiata l interpretazione La relazione tra sesso e voto in Matematica nelle due classi ha caratteristiche diverse. Nella prima classe sono più numerose le femmine. A differenza della situazione aggregata, la percentuale dei maschi con la sufficienza è minore della percentuale delle femmine in entrambi le classi. In particolare il 53% e il 67% delle femmine ha la sufficienza in Matematica in entrambe le classi contro il 50% e il 63% dei maschi.

33 Formazione Docenti :: Programma Incontro preliminare Statistica e Probabilità a Scuola :: le attività del Dipartimento di Scienze Statistiche (Sapienza Università di Roma) Prima parte :: Statistica descrittiva Classificazione, organizzazione e rappresentazione dei dati Sintesi numeriche dei dati (tendenza centrale e dispersione) Distribuzioni doppie e relazione tra variabili qualitative (Tabelle di contingenza e Chi quadrato) Relazione tra variabili quantitative (Correlazione e Regressione)

34 Relazione tra due variabili È interessante analizzare il legame di dipendenza esistente tra due (o più) variabili. In base alla natura delle variabili, possono esistere modi differenti per studiare la dipendenza... X e Y entrambe qualitative X e Y entrambe quantitative X e Y una qualitativa una quantitativa

35 Distribuzioni doppie variabili unità X Y 1 x 1 y 1 2 x 2 y 2 i x i y i n x n y n X quantitativa Y quantitativa

36 Distribuzioni doppie Esempio (1) X: QI madre Y: QI figlia QI madre QI figlia Esiste un legame tra le due variabili?

37 Diagramma a dispersione Quando i caratteri della distribuzione doppia sono quantitativi, possiamo rappresentare la distribuzione mediante un diagramma a dispersione Nel diagramma a dispersione, le coppie di modalità di 2 caratteri quantitativi (x i, y i ) vengono rappresentate come punti di un piano cartesiano i cui assi ortogonali corrispondono a 2 caratteri (X e Y ).

38 Diagramma a dispersione Esempio (1) QI figlie QI madri

39 Associazioni positive e negative Due variabili sono associate positivamente quando i valori sopra la media di una tendono ad associarsi con i valori sopra la media dell altra e allo stesso modo si comportano i valori sotto la media. Due variabili sono associate negativamente quando i valori sopra la media di una tendono ad associarsi con i valori sotto la media dell altra e viceversa.

40 Misurare l associazione lineare Tramite un diagramma a dispersione possiamo osservare la forma, la direzione e la forza della relazione fra due variabili quantitative. Le relazioni lineari, ovvero le relazioni la cui forma è rappresentabile tramite una linea retta, sono abbastanza comuni. È possibile affermare che una relazione lineare è forte se i punti si trovano vicini ad una linea retta. La relazione è invece debole se i punti si trovano molto lontani da una retta.

41 Attenzione :: ad occhio non è possibile giudicare quanto una relazione lineare sia forte. Due grafici a dispersione degli stessi dati. Il modello lineare nella distribuzione a destra appare più forte a causa dello spazio bianco circostante.

42 Attenzione :: ad occhio non è possibile giudicare quanto una relazione lineare sia forte. Due grafici a dispersione degli stessi dati. Il modello lineare nella distribuzione a destra appare più forte a causa dello spazio bianco circostante.

43 Misurare l associazione lineare È necessario utilizzare un indice numerico per supportare l informazione data da un grafico. La correlazione è la misura che utilizzeremo in questo caso. Il coefficiente di correlazione, che indichiamo con r, misura la direzione e la forza della relazione lineare fra due variabili quantitative.

44 Misurare l associazione lineare :: la covarianza Un indice simmetrico che misura la concordanza o la discordanza tra 2 caratteri quantitativi è la covarianza s XY definita come s XY = 1 n (y i y n n )(x i x n ) i=1 Se due caratteri sono statisticamente indipendenti, s XY = 0 (ma non è vero il viceversa ossia s XY = 0 non implica X e Y indipendenti) Infatti, la covarianza si può annullare quando due caratteri sono dipendenti ma non linearmente! Assume valori nel range s X s Y s XY s X s Y Difetto: s XY dipende dall unità di misura delle osservazioni! Quindi non possiamo usarla per i confronti

45 Misurare l associazione lineare :: coefficiente di correlazione lineare di Bravais-Pearson r XY = s XY s X s Y 1 r 1 r = 1 se tra X e Y sussiste un perfetto legame lineare e i 2 caratteri sono concordi r = 1 se tra X e Y sussiste un perfetto legame lineare e i 2 caratteri sono discordi r = 0 se X e Y sono indipendenti oppure se la loro relazione non è di tipo lineare I valori estremi r = 1 e r = 1 si ottengono soltanto in caso di una relazione lineare perfetta, quando i punti si trovano esattamente lungo una linea retta.

46 Misurare la correlazione lineare con r Esempio (1) x n = = y n = = i x i y i tot

47 Misurare la correlazione lineare con r Esempio (1) i x i y i (x i x n ) (y i y n ) tot

48 Misurare la correlazione lineare con r Esempio (1) i x i y i (x i x n ) 2 (y i y n ) 2 (x i x n )(y i x n ) tot

49 Diagramma a dispersione Esempio (1) QI figlie QI madri

50 Misurare la correlazione lineare con r Esempio (1) Cosa ci aspettiamo? s XY = s X = s Y = r = = Sembra esserci una forte relazione lineare tra il QI delle madri e il QI delle figlie. Il coefficiente di correlazione è vicino al suo valore massimo 1. Il QI delle figlie aumenta all aumentare del QI delle madri.

51 Misurare la correlazione lineare con r Esempio (1) Cosa ci aspettiamo? s XY = s X = s Y = r = = Sembra esserci una forte relazione lineare tra il QI delle madri e il QI delle figlie. Il coefficiente di correlazione è vicino al suo valore massimo 1. Il QI delle figlie aumenta all aumentare del QI delle madri.

52 Aspetti della correlazione Nel calcolare la correlazione non fa differenza quale variabile sia X o Y. La correlazione richiede che entrambe le variabili siano quantitative. Dato che r utilizza i valori standardizzati delle osservazioni, r non cambia quando si cambiano le unità di misura di X, di Y o di entrambe. Il coefficiente di correlazione r non ha unità di misura: è un numero puro.

53 Attenzione! Relazioni non-lineari Il coefficiente di correlazione r misura solamente la forza di una relazione lineare fra due variabili. Non descrive relazioni curvilinee fra le variabili, anche in caso di relazioni molto forti.

54 Attenzione! Outlier Così come la media e la deviazione standard, anche la correlazione non è una misura robusta: r è fortemente influenzato dalla presenza di pochi outlier. Bisogna utilizzare r con attenzione quando sono evidenti degli outlier nel diagramma a dispersione.

55 Attenzione! Correlazione spuria I dolcificanti causano un aumento di peso? Le persone che utilizzano dolcificanti al posto dello zucchero tendono ad essere piú grasse rispetto a quelle che usano lo zucchero. Esiste una spiegazione plausibile per questa associazione? È un esempio di correlazione spuria: non esiste un legame causale tra il peso e l uso di dolcificante, ma esiste una variabile nascosta influente sia sul peso che sull uso di dolcificante, che induce un alta correlazione tra di esse. È lecito, infatti, pensare che il consumo di dolcificante sia suggerito a persone sovrappeso o che seguono una dieta alimentare.

56 Attenzione! Correlazione spuria I dolcificanti causano un aumento di peso? Le persone che utilizzano dolcificanti al posto dello zucchero tendono ad essere piú grasse rispetto a quelle che usano lo zucchero. Esiste una spiegazione plausibile per questa associazione? È un esempio di correlazione spuria: non esiste un legame causale tra il peso e l uso di dolcificante, ma esiste una variabile nascosta influente sia sul peso che sull uso di dolcificante, che induce un alta correlazione tra di esse. È lecito, infatti, pensare che il consumo di dolcificante sia suggerito a persone sovrappeso o che seguono una dieta alimentare.

57 Attenzione! Correlazione spuria Un recente studio ha rilevato una forte correlazione positiva tra il livello di colesterolo dei giovani adulti e il tempo speso a guardare la televisione. Ti saresti aspettato questo risultato? Ritieni che guardare la tv causi un aumento del livello di colesterolo? Il risultato può essere giustificato alla luce del fatto che chi spende molto tempo a guardare la televisione tende a non fare molta attività fisica con un conseguente incremento della massa grassa corporea e del colesterolo. L affermazione non è esatta in quanto la correlazione non dimostra causalità.

58 Attenzione! Correlazione spuria Un recente studio ha rilevato una forte correlazione positiva tra il livello di colesterolo dei giovani adulti e il tempo speso a guardare la televisione. Ti saresti aspettato questo risultato? Ritieni che guardare la tv causi un aumento del livello di colesterolo? Il risultato può essere giustificato alla luce del fatto che chi spende molto tempo a guardare la televisione tende a non fare molta attività fisica con un conseguente incremento della massa grassa corporea e del colesterolo. L affermazione non è esatta in quanto la correlazione non dimostra causalità.

59 Relazione lineare Le relazioni lineari fra due variabili quantitative sono facilmente riconoscibili e piuttosto comuni. La correlazione misura la direzione e la forza di queste relazioni. Quando un diagramma a dispersione indica una relazione lineare, potremmo riassumerne l andamento generale tracciando una linea sul grafico.

60 Retta di regressione Una retta di regressione sintetizza la relazione fra due variabili, ma soltanto in ambiti specifici: ovvero se una delle due aiuta a spiegare o a prevedere l altra. La regressione descrive una relazione fra una variabile esplicativa e una variabile risposta. Una retta di regressione descrive come cambia una variabile risposta Y quando cambia la variabile esplicativa X. Spesso usiamo una retta di regressione per prevedere il valore di Y per un dato valore di X.

61 Diagramma a dispersione Esempio (1) QI figlie QI madri

62 Retta di regressione come strumento di previsione Esempio (1) QI figlie QI della figlia previsto per un QI della madre pari a 100 La retta di regressione descrive l andamento generale della relazione QI madri

63 Retta di regressione dei minimi quadrati Esistono infinite rette del piano che passano attraverso la nuvola dei punti. È necessario trovare la retta che meglio si adatti alla nostra nuvola di punti. La linea viene tracciata per prevedere Y in base a X, quindi gli errori di previsione sono errori sulla direzione verticale del grafico.

64 Retta di regressione dei minimi quadrati Esempio (1) QI figlie La risposta osservata per x=104 La risposta prevista per x=104 Una buona retta di regressione rende queste distanze minime QI madri

65 Retta di regressione dei minimi quadrati ŷ = b 0 + b 1 x La retta di regressione di Y su X trovata con il metodo dei minimi quadrati è la linea retta che rende minima la somma dei quadrati delle distanze verticali tra i punti osservati e la retta stessa: n n (y i ŷ i ) 2 = (y i b 0 b 1 x i ) 2 i=1 i=1

66 Retta di regressione dei minimi quadrati La retta di regressione dei minimi quadrati è la linea con coefficiente angolare ŷ = b 0 + b 1 x b 1 = s XY s 2 X e intercetta b 0 = y n b 1 x n

67 Retta di regressione dei minimi quadrati b 1 è molto importante per l interpretazione dei dati. Indica la variazione media che subisce Y quando X aumenta di una unità. b 0 è il valore di ŷ quando x = 0. Sebbene si abbia bisogno del valore dell intercetta per tracciare la linea, esso ha, in termini statistici, importanza soltanto quando la variabile x assume effettivamente valori vicini allo zero. La retta di regressione passa per il baricentro della distribuzione doppia, cioè il punto di coordinate (x n, y n ).

68 Retta di regressione dei minimi quadrati Esempio (1) b 1 = = b 0 = = ŷ = x Quando il QI della madre aumenta di una unità il QI della figlia subisce una variazione media pari a

69 Attenzione! La distinzione fra variabili esplicative e di risposta è fondamentale nella regressione. La regressione dei minimi quadrati prende in considerazione le distanze dei punti dalla retta solo nella direzione delle y. Invertendo le due variabili, si ottiene una retta di regressione dei minimi quadrati differente.

70 Retta di regressione come strumento di previsione Esempio (1) QI figlie y=106 (la risposta osservata per x=104) y^ = x (la risposta prevista per x=104) QI madri

71 Adattamento della retta di regressione ai dati È possibile scindere la variabilità totale dei valori osservati in Y in due parti: una misura gli spostamenti di Y lungo la retta di regressione, conseguenti a variazioni di X; l altra misura la variabilità dei punti rispetto alla retta.

72 Adattamento della retta di regressione ai dati QI figlie y y^ y y y^ y QI madri

73 Scomposizione della devianza di Y n n n D y = (y i y n ) 2 = (ŷ i y n ) 2 + (y i ŷ i ) 2 i=1 i=1 i=1 n (ŷ i y n ) 2 è la parte di devianza spiegata dalla retta di i=1 regressione n (y i ŷ i ) 2 è la devianza residua i=1 Il residuo è la differenza fra un valore osservato della variabile risposta e il valore previsto dalla retta di regressione: residuo = y i ŷ i

74 Misurare la bontà di adattamento Indice di determinazione oppure n (ŷ i y n ) 2 R 2 i=1 = n (y i y n ) 2 i=1 n (y i ŷ i ) 2 R 2 i=1 = 1 n (y i y n ) 2 i=1 R 2 = r 2 (quadrato del coefficiente di correlazione lineare)

75 Indice di determinazione Proprietà Assume valori nell intervallo [0, 1]. Assume il minimo, 0, se e solo se la retta di regressione è parallela all asse delle ascisse. Assume il massimo, 1, se e solo se i punti osservati giacciono su una retta.

76 Indice di determinazione Esempio (1) i x i y i ŷ i (ŷ i y n ) 2 (y i y n ) tot

77 Indice di determinazione Esempio (1) R 2 = = Circa il 74% della variabilità del QI delle figlie è spiegato tramite la relazione lineare dal QI delle madri. Il restante 26% è la variabilità non spiegata da tale relazione.

78 Outlier e osservazioni influenti nella regressione Un outlier è un osservazione che non segue il modello generale assunto dalla maggior parte delle osservazioni. I punti che, guardando un diagramma a dispersione, possiamo considerare outlier in direzione di Y, hanno residui elevati. Un osservazione è influente se, eliminandola, cambierebbe profondamente il risultato. I punti che, in un diagramma a dispersione, possiamo considerare outlier in direzione della X sono spesso punti influenti nella determinazione della retta di regressione dei minimi quadrati.

79 Outlier QI figlie Outlier QI madri

80 Osservazione Influente QI figlie Osservazione Influente QI madri

Rappresentazioni grafiche di distribuzioni doppie

Rappresentazioni grafiche di distribuzioni doppie Rappresentazioni grafiche di distribuzioni doppie Distribuzione doppia di frequenze Tabella di contingenza Tabella di correlazione Stereogramma Distribuzione unitaria doppia di 2 caratteri quantitativi

Dettagli

Corso in Statistica Medica

Corso in Statistica Medica Corso in Statistica Medica Introduzione alle tecniche statistiche di elaborazione dati Regressione e correlazione Dott. Angelo Menna Università degli Studi di Chieti G. d Annunziod Annunzio Anno Accademico

Dettagli

Regressione & Correlazione

Regressione & Correlazione Regressione & Correlazione Monia Ranalli Ranalli M. Dipendenza Settimana # 4 1 / 20 Sommario Regressione Modello di regressione lineare senplice Stima dei parametri Adattamento del modello ai dati Correlazione

Dettagli

Matematica Lezione 22

Matematica Lezione 22 Università di Cagliari Corso di Laurea in Farmacia Matematica Lezione 22 Sonia Cannas 14/12/2018 Indici di posizione Indici di posizione Gli indici di posizione, detti anche misure di tendenza centrale,

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Associazione, correlazione e dipendenza tra caratteri In un collettivo di 11 famiglie è stata

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative

Dettagli

x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y )

x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y ) Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 0/03 lezioni di statistica del 5 e 8 aprile 03 - di Massimo Cristallo - A. Le relazioni tra i fenomeni

Dettagli

Lezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo

Lezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo UIVERSITA DEGLI STUDI DI BASILICATA FACOLTA DI ECOOMIA Corso di laurea in Economia Aziendale anno accademico 2012/2013 Lezioni di Statistica del 15 e 18 aprile 2013 Docente: Massimo Cristallo LA RELAZIOE

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri

Dettagli

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli Dipartimento di Sociologia e Ricerca Sociale Corso di Laurea in Sociologia Insegnamento di Statistica (a.a. 2018-2019) dott.ssa Gaia Bertarelli Esercitazione n. 4 1. La seguente tabella riporta la distribuzione

Dettagli

Capitolo 12 La regressione lineare semplice

Capitolo 12 La regressione lineare semplice Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università

Dettagli

DISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a Prerequisiti Popolazione, unità, carattere Come nascono i dati:

DISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a Prerequisiti Popolazione, unità, carattere Come nascono i dati: DISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a. 2007-2008 Prerequisiti Popolazione, unità, carattere Come nascono i dati: osservazione e sperimentazione Popolazione: reale e virtuale Classificazione

Dettagli

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17 C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica

Dettagli

Statistica descrittiva in due variabili

Statistica descrittiva in due variabili Statistica descrittiva in due variabili 1 / 65 Statistica descrittiva in due variabili 1 / 65 Supponiamo di misurare su un campione statistico due diverse variabili X e Y. Indichiamo come al solito con

Dettagli

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Quesito: Posso stimare il numero di ore passate a studiare statistica sul voto conseguito all esame? Potrei calcolare il coefficiente di correlazione.

Dettagli

Relazioni Statistiche

Relazioni Statistiche Relazioni Statistiche L analisi congiunta di due o più caratteri è utile per studiare le relazioni tra di essi. Analisi dell associazione Indipendenza Interdipendenza Dipendenza Tipi di relazioni tra caratteri

Dettagli

Indipendenza, Dipendenza e interdipendenza

Indipendenza, Dipendenza e interdipendenza Indipendenza, Dipendenza e interdipendenza In analisi bivariata la tabella di contingenza consente di esaminare congiuntamente due variabili consente di rilevare le relazioni esistenti tra le variabili

Dettagli

Teoria e tecniche dei test. Concetti di base

Teoria e tecniche dei test. Concetti di base Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi

Dettagli

Analisi bivariata. Il caso di caratteri quantitativi

Analisi bivariata. Il caso di caratteri quantitativi Analisi bivariata Il caso di caratteri quantitativi Pagina 382 Rappresentazioni grafiche di distribuzioni doppie Distribuzione doppia di frequenze Tabella di contingenza Tabella di correlazione Stereogramma

Dettagli

Esercitazione III Soluzione

Esercitazione III Soluzione Esercitazione III Soluzione Esercizio 1 a) Frequenze congiunte assolute: n ij Reddito mensile Titolo di studio 1000-000 000-5000 5000-8000 Totale Laurea triennale 4 1 0 5 Laurea magistrale 1 4 7 Dottorato

Dettagli

Regressione Lineare Semplice e Correlazione

Regressione Lineare Semplice e Correlazione Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)

Dettagli

Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale)

Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale) Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale) Esercizio 1: Un indagine su 10.000 famiglie ha dato luogo, fra le altre, alle osservazioni riportate nella

Dettagli

Capitolo 12. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 12.1: Suggerimento

Capitolo 12. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 12.1: Suggerimento Capitolo Suggerimenti agli esercizi a cura di Elena Siletti Esercizio.: Suggerimento Per verificare se due fenomeni sono dipendenti in media sarebbe necessario confrontare le medie condizionate, in questo

Dettagli

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 4 Analisi Bivariata I Parte

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 4 Analisi Bivariata I Parte Metodi Quantitativi per Economia, Finanza e Management Lezione n 4 Analisi Bivariata I Parte Statistica descrittiva bivariata Indaga la relazione tra due variabili misurate. Si distingue rispetto alla

Dettagli

Analisi dell associazione tra due caratteri

Analisi dell associazione tra due caratteri Analisi dell associazione tra due caratteri Non ci accontentiamo di analizzare il singolo fenomeno, considerato indipendentemente da altri fenomeni Ci interessano le relazioni che possono esistere tra

Dettagli

1.1 Obiettivi della statistica Struttura del testo 2

1.1 Obiettivi della statistica Struttura del testo 2 Prefazione XV 1 Introduzione 1.1 Obiettivi della statistica 1 1.2 Struttura del testo 2 2 Distribuzioni di frequenza 2.1 Informazione statistica e rilevazione dei dati 5 2.2 Distribuzioni di frequenza

Dettagli

Statistica Descrittiva Soluzioni 7. Interpolazione: minimi quadrati

Statistica Descrittiva Soluzioni 7. Interpolazione: minimi quadrati ISTITUZIONI DI STATISTICA A. A. 2007/2008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona

Dettagli

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2010/2011 Statistica Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza

Dettagli

Associazione tra caratteri quantitativi: gli indici di correlazione

Associazione tra caratteri quantitativi: gli indici di correlazione Associazione tra caratteri quantitativi: gli indici di correlazione Per correlazione si intende una relazione tra due variabili tale che a ciascun valore della prima variabile corrisponda con una certa

Dettagli

Statistiche e relazioni

Statistiche e relazioni tatistiche descrittive per frequenze e misure Frequenze e misure Per le frequenze e le misure, molte di queste statistiche perdono senso. In compenso, esistono indici appropriati, inutilizzabili per i

Dettagli

Distribuzioni secondo due caratteri. Rappresentazioni e prime sintesi

Distribuzioni secondo due caratteri. Rappresentazioni e prime sintesi Distribuzioni secondo due caratteri Rappresentazioni e prime sintesi Rappresentazioni delle distribuzioni doppie Quando per ogni unità del collettivo rileviamo due caratteri otteniamo una Esempio. Ad alcuni

Dettagli

Statistica descrittiva in due variabili

Statistica descrittiva in due variabili Statistica descrittiva in due variabili Dott Nicola Pintus AA 2018-2019 Indichiamo con U la popolazione statistica e con u i le unità statistiche Ad ogni unità statistica associamo i caratteri osservati

Dettagli

Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010.

Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010. Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010 Statistica Esercitazione 4 12 maggio 2010 Dipendenza in media. Covarianza e

Dettagli

REGRESSIONE E CORRELAZIONE

REGRESSIONE E CORRELAZIONE REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.

Dettagli

Esercitazione del

Esercitazione del Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36

Dettagli

Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria

Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata Prof. Massimo Aria aria@unina.it Il concetto di interpolazione In matematica, e in particolare in

Dettagli

Consideriamo due variabili quantitative Y e X, e supponiamo di essere interessati a comprendere come la Y

Consideriamo due variabili quantitative Y e X, e supponiamo di essere interessati a comprendere come la Y 1 Analisi della interdipendenza lineare Quando si analizzano due o più caratteri quantitativi si può cercare di individuare una funzione che descriva in modo dettagliato la relazione che emerge dai dati,

Dettagli

Regressione lineare semplice

Regressione lineare semplice Regressione lineare semplice Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Statistica con due variabili var. nominale, var. nominale: gruppo sanguigno - cancro

Dettagli

Indice di contingenza quadratica media (phi quadro) χ n

Indice di contingenza quadratica media (phi quadro) χ n Indice di contingenza quadratica media (phi quadro) Φ χ n Proprietà L influenza del numero di unità n è eliminata Assume valore 0 se X e Y sono perfettamente indipendenti Pagina Indice di Cramer V min

Dettagli

Esercitazione di Statistica Indici di associazione

Esercitazione di Statistica Indici di associazione Esercitazione di Statistica Indici di associazione 28/10/2015 La relazione tra caratteri Indipendenza logica Quando si suppone che tra due caratteri non ci sia alcuna relazione di causa-effetto. Indipendenza

Dettagli

STATISTICA 1 ESERCITAZIONE 6

STATISTICA 1 ESERCITAZIONE 6 STATISTICA 1 ESERCITAZIONE 6 Dott. Giuseppe Pandolfo 5 Novembre 013 CONCENTRAZIONE Osservando l ammontare di un carattere quantitativo trasferibile su un collettivo statistico può essere interessante sapere

Dettagli

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Regressione Lineare e Correlazione Argomenti della lezione Determinismo e variabilità Correlazione Regressione Lineare

Dettagli

Dipartimento di Fisica a.a. 2003/2004 Fisica Medica 2 Indici statistici 22/4/2005

Dipartimento di Fisica a.a. 2003/2004 Fisica Medica 2 Indici statistici 22/4/2005 Dipartimento di Fisica a.a. 23/24 Fisica Medica 2 Indici statistici 22/4/25 Ricerca statistica La ricerca può essere deduttiva (data una legge teorica nota cerco verifica tramite più misure) ovvero induttiva

Dettagli

Statistica descrittiva in due variabili

Statistica descrittiva in due variabili 1 / 69 Statistica descrittiva in due variabili Supponiamo di misurare su un campione statistico due diverse variabili X e Y. Indichiamo come al solito con X = (x 1,...,x N ) Y = (y 1,...,y N ) i valori

Dettagli

Statistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione

Statistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2011/2012 Statistica Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate.

Dettagli

L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale

L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile Corso di Metodologia della ricerca sociale L analisi della varianza (ANOVA) La tecnica con cui si esplorano le relazioni

Dettagli

Esercitazioni di statistica

Esercitazioni di statistica Esercitazioni di statistica Misure di associazione: Indipendenza assoluta e in media Stefania Spina Universitá di Napoli Federico II stefania.spina@unina.it 22 ottobre 2014 Stefania Spina Esercitazioni

Dettagli

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci La statistica Elaborazione e rappresentazione dei dati Gli indicatori statistici Introduzione La statistica raccoglie ed analizza gruppi di dati (su cose o persone) per trarne conclusioni e fare previsioni

Dettagli

La dipendenza. Antonello Maruotti

La dipendenza. Antonello Maruotti La dipendenza Antonello Maruotti Outline 1 Distribuzioni doppie 2 Medie e varianze condizionate 3 Indici di associazione Distribuzione doppia Definizione Una distribuzione doppia si ha quando su di uno

Dettagli

Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica. Antonio Azzollini

Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica. Antonio Azzollini Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica Antonio Azzollini antonio.azzollini@unibas.it Anno accademico 2017/2018 Distribuzione condizionata Un grafico a mosaico è una rappresentazione

Dettagli

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza XIII Presentazione del volume XV L Editore ringrazia 3 1. Introduzione alla Statistica 5 1.1 Definizione di Statistica 6 1.2 I Rami della Statistica Statistica Descrittiva, 6 Statistica Inferenziale, 6

Dettagli

STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE

STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 2 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1.1

Dettagli

Prova d esame di Statistica - II canale - nuovo ordinamento Dott.ssa C. Conigliani 19/06/2003

Prova d esame di Statistica - II canale - nuovo ordinamento Dott.ssa C. Conigliani 19/06/2003 19/06/2003 Compito A Esercizio 1. [14 punti] Data la seguente distribuzione doppia secondo i caratteri reddito familiare mensile () e spesa alimentare mensile (): 0 300 300 600 600 e più tot 0 1000 25

Dettagli

Regressione lineare. Lo studio della relazione lineare tra due variabili. X e Y caratteri entrambi quantitativi. variabile dipendente

Regressione lineare. Lo studio della relazione lineare tra due variabili. X e Y caratteri entrambi quantitativi. variabile dipendente Regressione lineare Se la correlazione misura l intensità e il segno del legame lineare tra due variabili, l obiettivo delle tecniche di regressione è, invece, quello di individuare il tipo di relazione

Dettagli

STATISTICA. Regressione-4 ovvero Macron!

STATISTICA. Regressione-4 ovvero Macron! STATISTICA Regressione-4 ovvero Macron! Eravamo partiti da qui Stipendio medio orario 2013 Voto per Le Pen Stipendio medio orario (2013) [11,12) [12,13) [13,14) [14,15) [15,23] Eravamo partiti da qui Stipendio

Dettagli

Sommario. 2 I grafici Il sistema di coordinate cartesiane Gli istogrammi I diagrammi a torta...51

Sommario. 2 I grafici Il sistema di coordinate cartesiane Gli istogrammi I diagrammi a torta...51 Sommario 1 I dati...15 1.1 Classificazione delle rilevazioni...17 1.1.1 Esperimenti ripetibili (controllabili)...17 1.1.2 Rilevazioni su fenomeni non ripetibili...18 1.1.3 Censimenti...19 1.1.4 Campioni...19

Dettagli

La regressione lineare. Rappresentazione analitica delle distribuzioni

La regressione lineare. Rappresentazione analitica delle distribuzioni La regressione lineare Rappresentazione analitica delle distribuzioni Richiamiamo il concetto di dipendenza tra le distribuzioni di due caratteri X e Y. Ricordiamo che abbiamo definito dipendenza perfetta

Dettagli

ANALISI STATISTICHE BIVARIATE. Tabelle di contingenza

ANALISI STATISTICHE BIVARIATE. Tabelle di contingenza ANALISI STATISTICHE BIVARIATE Tabelle di contingenza 1 Analisi Statistica Bivariata Generalmente, lo studio quantitativo di un fenomeno di interesse si svolge rilevando contemporaneamente più caratteri

Dettagli

Istituzioni di Statistica

Istituzioni di Statistica Istituzioni di Statistica CORSO DI LAUREA IN ECONOMIA DEL COMMERCIO INTERNAZIONALE CORSO DI LAUREA IN ECONOMIA E AMMINISTRAZIONE DELLE IMPRESE A.A. 2007/2008 DOCENTE: Marco Minozzo PROGRAMMA - STATISTICA

Dettagli

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione

Dettagli

Argomenti della lezione:

Argomenti della lezione: Lezione 7 Argomenti della lezione: La regressione semplice Il modello teorico Il calcolo dei parametri Regressione lineare Esamina la relazione lineare tra una o più variabili esplicative (o indipendenti,

Dettagli

8. RELAZIONE TRA CARATTERI

8. RELAZIONE TRA CARATTERI UNIVERSITA DEGLI STUDI DI PERUGIA DIPARTIMENTO DI FILOSOFIA SCIENZE SOCIALI UMANE E DELLA FORMAZIONE Corso di Laurea in Scienze per l'investigazione e la Sicurezza 8. RELAZIONE TRA CARATTERI REGRESSIONE

Dettagli

STATISTICA (I modulo - Statistica Descrittiva) Soluzione Esercitazione I ( )

STATISTICA (I modulo - Statistica Descrittiva) Soluzione Esercitazione I ( ) STATISTICA (I modulo - Statistica Descrittiva) Soluzione Esercitazione I (09.10.2003) Esercizio A. a) L unità statistica è lo studente che ha sostenuto l esame conclusivo nell ultima sessione. Il collettivo

Dettagli

Statistica descrittiva

Statistica descrittiva Luigi Vajani Statistica descrittiva r,,, I o -:i f e l ~ 1 (f"i I - / I I - ETASLIBRI Indice XIII Presentazione Parte prima - Introduzione 3 Capitolo 1 - Concetti generali 1.1 - Introduzione; l.2 - La

Dettagli

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione

Dettagli

Statistica di base per l analisi socio-economica

Statistica di base per l analisi socio-economica Laurea Magistrale in Management e comunicazione d impresa Statistica di base per l analisi socio-economica Giovanni Di Bartolomeo gdibartolomeo@unite.it Definizioni di base Una popolazione è l insieme

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unina.it Università degli studi di Cassino () Statistica 1 / 24 Outline 1 () Statistica 2 / 24 Outline 1 2 () Statistica 2 / 24 Outline 1 2 3 () Statistica 2 /

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unina.it Università degli studi di Cassino () Statistica 1 / 1 Outline 1 () Statistica 2 / 1 Outline 1 2 () Statistica 2 / 1 Outline 1 2 3 () Statistica 2 / 1

Dettagli

Old Faithful, Yellowstone Park. Statistica e biometria. D. Bertacchi. Dati congiunti. Tabella. Scatterplot. Covarianza. Correlazione.

Old Faithful, Yellowstone Park. Statistica e biometria. D. Bertacchi. Dati congiunti. Tabella. Scatterplot. Covarianza. Correlazione. Coppie o vettori di dati Spesso i dati osservati sono di tipo vettoriale. Ad esempio studiamo 222 osservazioni relative alle eruzioni del geyser Old Faithful. Old Faithful, Yellowstone Park. Old Faithful

Dettagli

Capitolo uno STATISTICA DESCRITTIVA BIVARIATA

Capitolo uno STATISTICA DESCRITTIVA BIVARIATA Capitolo uno STATISTICA DESCRITTIVA BIVARIATA La statistica unidimensionale si occupa di studiare una sola variabile statistica. La statistica bidimensionale o bivariata si occupa dello studio congiunto

Dettagli

Corso di Laurea in Amministrazione Aziendale Complex Learning. Statistica per l azienda (T) SECS-S/01 a. a. 2017/2018

Corso di Laurea in Amministrazione Aziendale Complex Learning. Statistica per l azienda (T) SECS-S/01 a. a. 2017/2018 Corso di Laurea in Amministrazione Aziendale Complex Learning Statistica l azienda (T) SECS-S/01 a. a. 2017/2018 DOCENTI TITOLARI : Prof. Nicoletta Melis ORE DI LEZIONE ON LINE : 18 ore : 6 3 TIPOLOGIE

Dettagli

La statistica descrittiva prima parte. a cura della prof.ssa Anna Rita Valente

La statistica descrittiva prima parte. a cura della prof.ssa Anna Rita Valente La statistica descrittiva prima parte a cura della prof.ssa Anna Rita Valente INTRODUZIONE La statistica è una disciplina all ordine del giorno basta sfogliare un giornale per trovare dati statistici sui

Dettagli

Casa dello Studente. Casa dello Studente

Casa dello Studente. Casa dello Studente Esercitazione - 14 aprile 2016 ESERCIZIO 1 Di seguito si riporta il giudizio (punteggio da 0 a 5) espresso da un gruppo di studenti rispetto alle diverse residenze studentesche di un Ateneo: a) Si calcolino

Dettagli

Statistica multivariata Donata Rodi 17/10/2016

Statistica multivariata Donata Rodi 17/10/2016 Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare

Dettagli

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25 Sommario Presentazione dell edizione italiana Prefazione xv xiii Capitolo 1 I dati e la statistica 1 Statistica in pratica: BusinessWeek 1 1.1 Le applicazioni in ambito aziendale ed economico 3 Contabilità

Dettagli

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è

Dettagli

REGISTRO DELLE LEZIONI*

REGISTRO DELLE LEZIONI* UNIVERSITÀ DEGLI STUDI DI GENOVA Dipartimento di Matematica Corso di laurea in Statistica matematica e trattamento informatico dei dati REGISTRO DELLE LEZIONI* dell' INSEGNAMENTO o MODULO UFFICIALE Nome:

Dettagli

Sperimentazioni di Fisica I mod. A Statistica - Lezione 2

Sperimentazioni di Fisica I mod. A Statistica - Lezione 2 Sperimentazioni di Fisica I mod. A Statistica - Lezione 2 A. Garfagnini M. Mazzocco C. Sada Dipartimento di Fisica G. Galilei, Università di Padova AA 2014/2015 Elementi di Statistica Lezione 2: 1. Istogrammi

Dettagli

LA RAPPRESENTAZIONE E LA SINTESI DEI DATI

LA RAPPRESENTAZIONE E LA SINTESI DEI DATI Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria Civile A.A. 2009-10 Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain 1 LA RAPPRESENTAZIONE E LA SINTESI

Dettagli

Ringraziamenti dell Editore

Ringraziamenti dell Editore Indice Elenco dei simboli e delle abbreviazioni in ordine di apparizione Ringraziamenti dell Editore XI XVII 1 Introduzione FAQ e qualcos altro, da leggere prima 1 1.1 QuestoèunlibrodiStatistica....................

Dettagli

Dispensa di Statistica

Dispensa di Statistica Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 41 Outline 1 2 3 4 5 () Statistica 2 / 41 Misura del legame Data una variabile doppia (X, Y ), la

Dettagli

Statistica descrittiva: analisi di regressione

Statistica descrittiva: analisi di regressione Statistica descrittiva: analisi di regressione L analisi di regressione permette di esplorare le relazioni tra due insiemi di valori (p.e. i valori di due attributi di un campione) alla ricerca di associazioni.

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2018-2019 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

materiale didattico II incontro

materiale didattico II incontro Piano Nazionale Lauree Scientifiche (PLS 016-017) Statistica Laboratorio di Statistica Le relazioni tra variabili. L indipendenza prof.ssa Angela Maria D'Uggento angelamaria.duggento@uniba.it materiale

Dettagli

Compiti tematici dai capitoli 2,3,4

Compiti tematici dai capitoli 2,3,4 Compiti tematici dai capitoli 2,3,4 a cura di Giovanni M. Marchetti 2016 ver. 0.8 1. In un indagine recente, i rispondenti sono stati classificati rispetto al sesso, lo stato civile e l area geografica

Dettagli

Distribuzioni Doppie e Relazioni tra Variabili Esercitazione n 03

Distribuzioni Doppie e Relazioni tra Variabili Esercitazione n 03 Distribuzioni Doppie e Relazioni tra Variabili Esercitazione n 03 ESERCIZIO 1 Tra le famiglie del Comune di Vigata sono stati rilevati congiuntamente la PROFESSIONE DEL CA- POFAMIGLIA () e l AMMONTARE

Dettagli

7. STATISTICA DESCRITTIVA

7. STATISTICA DESCRITTIVA 7. STATISTICA DESCRITTIVA Quando si effettua un indagine statistica si ha a che fare con un numeroso insieme di oggetti, detto popolazione del quale si intende esaminare una o più caratteristiche (matricole

Dettagli

ESERCITAZIONE IV - Soluzioni

ESERCITAZIONE IV - Soluzioni umero di omicidi ESERCITAZIOE IV - Soluzioni Esercizio I. a),00 12,00 10,00 8,00 6,00 4,00 2,00 0,00 0 5 10 15 20 25 Popolazione povera (%) b) Poiché i due caratteri in analisi sono quantitativi per calcolare

Dettagli

La media e la mediana sono indicatori di centralità, che indicano un centro dei dati.

La media e la mediana sono indicatori di centralità, che indicano un centro dei dati. La media e la mediana sono indicatori di centralità, che indicano un centro dei dati. Un indicatore che sintetizza in un unico numero tutti i dati, nascondendo quindi la molteplicità dei dati. Per esempio,

Dettagli

Copyright Esselibri S.p.A.

Copyright Esselibri S.p.A. 70 3000 500 000 1500 1000 500 A B C D (a) Capitolo Terzo A B C D 500 1000 1500 000 5003000 3500 Fig. 1 - Ortogramma a colonne (a) e ortogramma a nastri (b) 4. MISURE DI ASSOCIAZIONE E DI COGRADUAZIONE

Dettagli

Lezione 5 Corso di Statistica. Francesco Lagona

Lezione 5 Corso di Statistica. Francesco Lagona Lezione 5 Corso di Statistica Francesco Lagona Università Roma Tre F. Lagona (francesco.lagona@uniroma3.it) 1 / 23 obiettivi della lezione familiarizzare con le distribuzioni bivariate, le distribuzioni

Dettagli

Statistica e informatica

Statistica e informatica Statistica e informatica Statistica descrittiva:variabili doppie Francesco Pauli & Nicola Torelli A.A. 2016/2017 Solo una variabile... Finora abbiamo trattato di come rappresentare graficamente, sintetizzare

Dettagli

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 5 Analisi Bivariata I Parte

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 5 Analisi Bivariata I Parte Metodi Quantitativi per Economia, Finanza e Management Lezione n 5 Analisi Bivariata I Parte Statistica descrittiva bivariata Indaga la relazione tra due variabili misurate. Si distingue rispetto alla

Dettagli

SCOPO DELL ANALISI DI CORRELAZIONE

SCOPO DELL ANALISI DI CORRELAZIONE CORRELAZIONE 1 SCOPO DELL ANALISI DI CORRELAZIONE STUDIARE LA RELAZIONE TRA DUE VARIABILI X E Y 2 diagrammi di dispersione un diagramma di dispersione (o grafico di dispersione) èuna rappresentazione grafica

Dettagli

ESEMPI DI DOMANDE PER LA PROVA SCRITTA DI STATISTICA SOCIALE

ESEMPI DI DOMANDE PER LA PROVA SCRITTA DI STATISTICA SOCIALE ESERCITAZIONE DI FINE CORSO ESEMPI DI DOMANDE PER LA PROVA SCRITTA DI STATISTICA SOCIALE 1. Si prenda in esame la seguente tabella che riporta la suddivisione di una popolazione femminile per titolo di

Dettagli

Indice. 1. Premessa Le relazioni tra coppie di caratteri L analisi della contingenza L analisi della correlazione...

Indice. 1. Premessa Le relazioni tra coppie di caratteri L analisi della contingenza L analisi della correlazione... INSEGNAMENTO DI STATISTICA DEL TURISMO LEZIONE IX LE RELAZIONI TRA CARATTERI PROF. GIOVANNI DI TRAPANI Indice 1. Premessa.... 3 2. Le relazioni tra coppie di caratteri.... 4 3. L analisi della contingenza....

Dettagli