Laboratorio di Probabilità e Statistica

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Laboratorio di Probabilità e Statistica"

Transcript

1 Laboratorio di Probabilità e Statistica lezione 8 Massimo Guerriero Ettore Benedetti

2 Consegna 1. Implementare delle funzioni che, accettando opportuni parametri in ingresso, risolvano le formule viste in questa lezione. Soluzioni: Verifica di ipotesi sulle proporzioni Z = p p 0 p0(1 p0) n N(0,1) Verifica di ipotesi per due proporzioni Z = p 1 p 2 p 1 p 1 n1 + 1 n2 dove p = n 1 p 1 +n 2 p 2 n 1 +n 2

3 Soluzione: Come possiamo notare leggendo il testo, p = 0.75 mentre p 0 = 0.80 e dobbiamo rigettare l ipotesi nulla se z < -z 0.95 ovvero se z < -qnorm(0.95) z < Rigettiamo H 0, gli studenti di Verona sono sproporzionatamente inferiori alla realtà nazionale Consegna 2. Da uno studio statistico è risultato che l 80% degli studenti delle scuole superiori italiane ha buoni risultati nelle materie scientifiche. Una scuola di 1500 studenti di Verona, ha provato a ripetere il test nazionale in privato e ha visto che solo il 75% degli studenti ha ottenuto buoni risultati. Verificare, al livello α = 0.05, se gli studenti di Verona possono ritenersi sproporzionatamente inferiori nelle materie scientifiche rispetto alla realtà nazionale.

4 P-Value z= z= Accettazione 0.75 > 0.80 (di molto inferiore a 0.05)

5 Consegna 3. Alcuni anni fa venne condotto uno studio epidemiologico per studiare gli effetti positivi dell uso di aspirina sulla prevenzione degli attacchi cardiaci. Di seguito si riportano i risultati: Verificare se la proporzione di persone colpite da infarto che hanno assunto Aspirina, è statisticamente inferiore rispetto alle persone colpite da infarto che hanno assunto un farmaco placebo senza principi attivi.

6 Soluzione: Come possiamo notare leggendo il testo e la tabella, p 1 = 239/11034 = mentre p 2 = 139/11037= Nell esercizio non viene specificato un alfa. Scegliamo quindi ad esempio α = Dobbiamo rigettare l ipotesi nulla se z < -z 0.99 ovvero se z < -qnorm(0.99) z < Accettiamo H0: la proporzione di persone colpite da infarto che hanno assunto Aspirina è statisticamente inferiore rispetto alle persone colpite da infarto che hanno assunto un farmaco placebo z= Accettazione > z= 5.2

7 Indice Lezione Prerequisiti dalla lezione scorsa Analisi di regressione: I grafici di dispersione e la covarianza La retta di regressione Previsioni Bontà di adattamento Effetto degli outlier sulla retta di regressione

8 Prerequisiti dalla lezione scorsa Intervallo di confidenza per le proporzioni Verifica d ipotesi sulle proporzioni Test a una o due code (dx e sx) Verifica di ipotesi per due proporzioni

9 I grafici di dispersione e la covarianza 1/5 Analisi di regressione Effettuare un analisi di regressione significa analizzare congiuntamente due fenomeni di tipo quantitativo. Supponiamo di avere due fenomeni X e Y di tipo quantitativo e di aver raccolto su n individui le coppie di valori (x i, y i ). Un grafico di dispersione consiste nella rappresentazione di queste coppie di punti nel piano euclideo, scegliendo arbitrariamente gli assi dove collocare le variabili. Es.

10 I grafici di dispersione e la covarianza 2/5 Il grafico di dispersione serve per verificare graficamente se le coppie di punti (fenomeni statistici) presentano qualche forma di regolarità, e in particolare, per vedere come i punti si disperdono attorno a un particolare punto chiamato baricentro di coordinate (x n, y n ). La covarianza è un indice che misura la dispersione dei punti dal proprio centro, offre una valutazione analitica del grafico. σ xy = Cov(X,Y) = 1 n i=1 n (x i x n )(y i y n ) In R: cov(x,y) viene utilizzata la formula con (n-1)

11 I grafici di dispersione e la covarianza 3/5 Al contrario della varianza, di cui è un estensione, la covarianza si occupa anche di misurare l eventuale direzione del legame, ovvero se i due fenomeni si muovono nella stessa direzione (segno +) o in direzioni opposte (segno -). Cov = 0 Cov > 0 Cov < 0

12 I grafici di dispersione e la covarianza 4/5 Il coefficiente di correlazione si ottiene in questo modo: ρ xy = σ xy σ x σ y ρ xy = 0, solo se X e Y sono incorrelate 1, solo se X e Y sono legate da una relazione lineare diretta -1, solo se X e Y sono legate da una relazione lineare inversa L indice ρ è quindi in grado di misurare se vi è una relazione lineare tra X e Y, ovvero se le coppie di valori (x i, y i ) sono più o meno allineate lungo una retta del tipo: y i = a + b x i In R ρ viene calcolato con il comando: cor(x,y)

13 I grafici di dispersione e la covarianza 5/5 Se il coefficiente di correlazione è uguale a 0, ciò non implica che non vi sia un altro tipo di relazione (non lineare). Es. ma calcolando il X 2 e normalizzandolo come visto nella lezione 3: infatti, in questo caso: y = x 2

14 Consegna 1. Scrivere una funzione che restituisca la covarianza e un altra per il coefficiente di correlazione 2. Verificare se esiste una relazione lineare tra ore passate in internet dal lunedì al venerdì (hinternet_lv) e soldi spesi mensilmente per la rete (spesa_mese). Utilizzare l opzione: use="na.or.complete" per eliminare i punti con i valori mancanti.

15 Indice Lezione Prerequisiti dalla lezione scorsa Analisi di regressione: I grafici di dispersione e la covarianza La retta di regressione Previsioni Bontà di adattamento Effetto degli outlier sulla retta di regressione

16 La retta di regressione 1/2 Siamo ora interessati a ricercare una relazione lineare (retta) che modelli l andamento del grafico di dispersione dei punti: Vogliamo quindi trovare la retta y i = a + b x i, di cui abbiamo parlato nelle slide precedenti, che risulta essere la più vicina alle coppie di punti (x i, y i ). Dalla teoria sappiamo che i coefficienti a e b di questa retta si ricavano dalle seguenti formule: b = σ xy σ x 2 a = y b x In R esiste la funzione: lm(y~x)

17 La retta di regressione 2/2 x<-c(11,8,28,17,9,4,28,5,12,23,6,24,18,21,6,22, 27,17,27,6,29,9,3,12,9,23,5,27,20,13) y<-c(28,21,63,42,28,2,80,19,33,60,14,58,54,67, 18,64,65,68,77,17,95,12,1,30,34,67,20,75,59,55) plot(x,y) cor(x,y) [1] model<-lm(y~x) Model Call: lm(formula = y ~ x) Coefficients: (Intercept) x abline(model,col="red",lwd=2) a b

18 Previsioni Se riteniamo attendibile il modello trovato, sappiamo calcolare quali valori assume Y in corrispondenza di ogni valore di X, cioè siamo in grado di fare previsioni o ricostruire i valori mancanti per Y. In R si utilizza il comando: predict(model, data.frame(x=valori)) Es. (riprendendo il codice della slide precedente)

19 residui residui Bontà di adattamento 1/3 Ora che abbiamo costruito il nostro modello è buona cosa farne una valutazione. Come strumento interpretativo utilizziamo i residui ovvero gli scarti: e i = y i y i * Situazioni in cui i residui si concentrano tutti in una zona, oppure si ripetono in modo sistematico, sono indicatori di una distorsione indotta da modello 0 0 Index Index

20 Bontà di adattamento 2/3 Questa analisi dei residui è sempre consigliabile in prima battuta, ma occorre quantificarla con un indice: L indice R 2 valuta gli scarti e si ottiene facilmente elevando al quadrato il coefficiente di correlazione: R 2 = ρ 2 Tanto più R 2 si avvicina a 1, tanto più il nostro modello si adatta bene ai dati.

21 Bontà di adattamento 3/3 Valutiamo il modello dei dati delle slide precedenti: Gli errori si distribuiscono abbastanza casualmente e R 2 è vicino a 1: Il modello spiega molto bene i dati!

22 Effetto degli outlier sulla retta di regressione Consideriamo il seguente esempio: x<-c(1,1,2,2) y<-c(4,3,3,2) plot(x,y, xlim=c(0,10),ylim=c(0,10)) cor(x,y) [1] model<-lm(y~x) abline(model,col="red",lwd=2) Introduciamo un singolo punto (8, 8): x<-c(1,1,2,2,8) y<-c(4,3,3,2,8) plot(x,y, xlim=c(0,10),ylim=c(0,10)) cor(x,y) [1] model<-lm(y~x) abline(model,col="red",lwd=2) E sempre meglio visualizzare prima i dati tramite il grafico di dispersione, per poter valutare l opportunità di effettuare successivamente un analisi di regressione

23 Consegna 1. Sulla base dell esercizio 2 dell ultima consegna, costruire la retta di regressione e il grafico degli scarti per valutare la bontà di adattamento 2. Verificare se esiste una relazione lineare tra ore passate in internet sul pc (h_pc) e ore passate in internet sul cellullare (h_cell). Costruire la retta di regressione, il grafico degli scarti e valutare di quando si migliora il modello provando ad escludere qualche outlier a scelta. 3. Ripetere tutto lo studio precedente confrontando le variabili h_cell con h_tab ed h_tab con h_pc. Provare a trarre dagli studi qualche conclusione.

Laboratorio di Probabilità e Statistica

Laboratorio di Probabilità e Statistica Laboratorio di Probabilità e Statistica lezione 7 Massimo Guerriero Ettore Benedetti Indice Lezione Prerequisiti dalla lezione scorsa Intervallo di confidenza per le proporzioni Verifica di ipotesi sulle

Dettagli

Laboratorio di Probabilità e Statistica

Laboratorio di Probabilità e Statistica Laboratorio di Probabilità e Statistica lezione 9 Massimo Guerriero Ettore Benedetti Indice Lezione Prerequisiti dalla lezione scorsa Analisi di regressione: Cambiamenti di scala Schema generale sull analisi

Dettagli

Covarianza, correlazione e retta di regressione. Paola Lecca, CIBIO UNITN Corso di Matematica e Statistica 2

Covarianza, correlazione e retta di regressione. Paola Lecca, CIBIO UNITN Corso di Matematica e Statistica 2 Covarianza, correlazione e retta di regressione Paola Lecca, CIBIO UNITN Corso di Matematica e Statistica 2 Questa presentazione è stata preparata attingendo dai seguenti testi S. M. Iacus, Statistica,

Dettagli

La media e la mediana sono indicatori di centralità, che indicano un centro dei dati.

La media e la mediana sono indicatori di centralità, che indicano un centro dei dati. La media e la mediana sono indicatori di centralità, che indicano un centro dei dati. Un indicatore che sintetizza in un unico numero tutti i dati, nascondendo quindi la molteplicità dei dati. Per esempio,

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri

Dettagli

Regressione & Correlazione

Regressione & Correlazione Regressione & Correlazione Monia Ranalli Ranalli M. Dipendenza Settimana # 4 1 / 20 Sommario Regressione Modello di regressione lineare senplice Stima dei parametri Adattamento del modello ai dati Correlazione

Dettagli

STATISTICA. Esercitazione 5

STATISTICA. Esercitazione 5 STATISTICA Esercitazione 5 Esercizio 1 Ad un esame universitario sono stati assegnati in modo casuale due compiti diversi con i seguenti risultati: Compito A Compito B Numero studenti 102 105 Media dei

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unina.it Università degli studi di Cassino () Statistica 1 / 1 Outline 1 () Statistica 2 / 1 Outline 1 2 () Statistica 2 / 1 Outline 1 2 3 () Statistica 2 / 1

Dettagli

STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE

STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 2 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1.1

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative

Dettagli

Capitolo 12 La regressione lineare semplice

Capitolo 12 La regressione lineare semplice Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università

Dettagli

Esercitazione del

Esercitazione del Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Associazione, correlazione e dipendenza tra caratteri In un collettivo di 11 famiglie è stata

Dettagli

Regressione Lineare Semplice e Correlazione

Regressione Lineare Semplice e Correlazione Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)

Dettagli

Laboratorio di Probabilità e Statistica

Laboratorio di Probabilità e Statistica Laboratorio di Probabilità e Statistica lezione 6 Massimo Guerriero Ettore Benedetti Indice Lezione Prerequisiti dalla lezione scorsa Intervallo di confidenza per la media Verifica d ipotesi sulla media

Dettagli

Lezione 6 Corso di Statistica. Francesco Lagona

Lezione 6 Corso di Statistica. Francesco Lagona Lezione 6 Corso di Statistica Francesco Lagona Università Roma Tre F. Lagona (francesco.lagona@uniroma3.it) 1 / 19 obiettivi della lezione familiarizzare con le ditribuzioni bivariate delle variabili quantitative

Dettagli

Correlazione lineare e regressione

Correlazione lineare e regressione 7c e regressione Se i due caratteri sono entrambi quantitativi, X e Y, possiamo studiare la loro correlazione lineare. Prima di tutto cerchiamo di capire di cosa si tratta. Se elenchiamo le N osservazioni

Dettagli

Matematica Lezione 22

Matematica Lezione 22 Università di Cagliari Corso di Laurea in Farmacia Matematica Lezione 22 Sonia Cannas 14/12/2018 Indici di posizione Indici di posizione Gli indici di posizione, detti anche misure di tendenza centrale,

Dettagli

La media e la mediana sono indicatori di centralità, che indicano un centro dei dati.

La media e la mediana sono indicatori di centralità, che indicano un centro dei dati. La media e la mediana sono indicatori di centralità, che indicano un centro dei dati. Un indicatore che sintetizza in un unico numero tutti i dati, nascondendo quindi la molteplicità dei dati. Per esempio,

Dettagli

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Quesito: Posso stimare il numero di ore passate a studiare statistica sul voto conseguito all esame? Potrei calcolare il coefficiente di correlazione.

Dettagli

Indipendenza, Dipendenza e interdipendenza

Indipendenza, Dipendenza e interdipendenza Indipendenza, Dipendenza e interdipendenza In analisi bivariata la tabella di contingenza consente di esaminare congiuntamente due variabili consente di rilevare le relazioni esistenti tra le variabili

Dettagli

Old Faithful, Yellowstone Park. Statistica e biometria. D. Bertacchi. Dati congiunti. Tabella. Scatterplot. Covarianza. Correlazione.

Old Faithful, Yellowstone Park. Statistica e biometria. D. Bertacchi. Dati congiunti. Tabella. Scatterplot. Covarianza. Correlazione. Coppie o vettori di dati Spesso i dati osservati sono di tipo vettoriale. Ad esempio studiamo 222 osservazioni relative alle eruzioni del geyser Old Faithful. Old Faithful, Yellowstone Park. Old Faithful

Dettagli

Corso di Statistica. Distribuzioni doppie Relazioni tra due variabili. Prof.ssa T. Laureti a.a

Corso di Statistica. Distribuzioni doppie Relazioni tra due variabili. Prof.ssa T. Laureti a.a Corso di Statistica Distribuzioni doppie Relazioni tra due variabili Prof.ssa T. Laureti a.a. 2013-2014 1 Distribuzione doppia di frequenza Addet ti Genere respons 6 M 6 M 10 F 10 F 7 M 3 M 3 M 6 F 4 F

Dettagli

LABORATORIO DI PROBABILITA E STATISTICA

LABORATORIO DI PROBABILITA E STATISTICA UNIVERSITA DEGLI STUDI DI VERONA LABORATORIO DI PROBABILITA E STATISTICA Docente: Bruno Gobbi 6 ESERCIZI RIEPILOGATIVI PRIME 3 LEZIONI REGRESSIONE LINEARE: SPORT - COLESTEROLO ESERCIZIO 8: La tabella seguente

Dettagli

STATISTICA. Regressione-3 L inferenza per il modello lineare semplice

STATISTICA. Regressione-3 L inferenza per il modello lineare semplice STATISTICA Regressione-3 L inferenza per il modello lineare semplice Regressione lineare: GRAFICO DI DISPERSIONE & & analisi residui A. Valutazione preliminare se una retta possa essere una buona approssimazione

Dettagli

Esercizi su Regressione e Connessione

Esercizi su Regressione e Connessione Esercizi su Regressione e Connessione Stefano Cabras 31 marzo 2009 Sommario Questa serie di esercizi è principalmente incentrata sulla regressione e la connessione, tuttavia in alcuni esercizi le soluzioni

Dettagli

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre R - Esercitazione 6 Andrea Fasulo fasulo.andrea@yahoo.it Università Roma Tre Venerdì 22 Dicembre 2017 Il modello di regressione lineare semplice (I) Esempi tratti da: Stock, Watson Introduzione all econometria

Dettagli

STATISTICA MULTIVARIATA SSD MAT/06

STATISTICA MULTIVARIATA SSD MAT/06 Università degli studi di Ferrara Dipartimento di Matematica A.A. 2018/2019 I semestre STATISTICA MULTIVARIATA SSD MAT/06 LEZIONE 4 - Questioni di analisi e applicazione della regressione lineare Pratica

Dettagli

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è

Dettagli

Esercizio 2: voto e ore dedicate allo studio

Esercizio 2: voto e ore dedicate allo studio La seguente tabella riporta il voto riportato da 10 studenti all esame di Statistica Sociale e il numero di ore di lezione non seguite dallo studente (il corso prevede 30 ore di lezione). Ci si chiede

Dettagli

Dispensa di Statistica

Dispensa di Statistica Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza

Dettagli

STATISTICA A K (60 ore)

STATISTICA A K (60 ore) STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta

Dettagli

Laboratorio di Probabilità e Statistica

Laboratorio di Probabilità e Statistica Laboratorio di Probabilità e Statistica lezione 5 Massimo Guerriero Ettore Benedetti Indice Lezione Prerequisiti dalla lezione scorsa Media e varianza campionaria Legge dei grandi numeri Teorema del limite

Dettagli

REGRESSIONE E CORRELAZIONE

REGRESSIONE E CORRELAZIONE REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.

Dettagli

STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7:

STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7: esercitazione 7 p. 1/13 STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7: 20-05-2004 Luca Monno Università degli studi di Pavia luca.monno@unipv.it http://www.lucamonno.it

Dettagli

Statistica descrittiva in due variabili

Statistica descrittiva in due variabili Statistica descrittiva in due variabili Dott Nicola Pintus AA 2018-2019 Indichiamo con U la popolazione statistica e con u i le unità statistiche Ad ogni unità statistica associamo i caratteri osservati

Dettagli

Corso in Statistica Medica

Corso in Statistica Medica Corso in Statistica Medica Introduzione alle tecniche statistiche di elaborazione dati Regressione e correlazione Dott. Angelo Menna Università degli Studi di Chieti G. d Annunziod Annunzio Anno Accademico

Dettagli

La statistica è la scienza che permette di conoscere il mondo intorno a noi attraverso i dati.

La statistica è la scienza che permette di conoscere il mondo intorno a noi attraverso i dati. RICHIAMI DI STATISTICA La statistica è la scienza che permette di conoscere il mondo intorno a noi attraverso i dati. Quale è la media della distribuzione del reddito dei neolaureati? Per rispondere dovremmo

Dettagli

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Un breve richiamo sul test t-student Siano A exp (a 1, a 2.a n ) e B exp (b 1, b 2.b m ) due set di dati i cui

Dettagli

Esercizi di statistica

Esercizi di statistica Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..

Dettagli

x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y )

x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y ) Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 0/03 lezioni di statistica del 5 e 8 aprile 03 - di Massimo Cristallo - A. Le relazioni tra i fenomeni

Dettagli

La regressione lineare. Rappresentazione analitica delle distribuzioni

La regressione lineare. Rappresentazione analitica delle distribuzioni La regressione lineare Rappresentazione analitica delle distribuzioni Richiamiamo il concetto di dipendenza tra le distribuzioni di due caratteri X e Y. Ricordiamo che abbiamo definito dipendenza perfetta

Dettagli

La verifica delle ipotesi

La verifica delle ipotesi La verifica delle ipotesi Se abbiamo un idea di quale possa essere il valore di un parametro incognito possiamo sottoporlo ad una verifica, che sulla base di un risultato campionario, ci permetta di decidere

Dettagli

Comprendere i fenomeni vuol dire studiare le relazioni tra 2 o più variabili. Esiste un legame tra le variabili?

Comprendere i fenomeni vuol dire studiare le relazioni tra 2 o più variabili. Esiste un legame tra le variabili? Comprendere i fenomeni vuol dire studiare le relazioni tra 2 o più variabili. Esiste un legame tra le variabili? Quale tipo di legame? Quanto forte? Siamo sicuri che non sia dovuto al caso? Tutti i modelli

Dettagli

ECONOMETRIA: Laboratorio I

ECONOMETRIA: Laboratorio I ECONOMETRIA: Laboratorio I Luca De Angelis CLASS - Università di Bologna Programma Laboratorio I Valori attesi e varianze Test di ipotesi Stima di un modello lineare attraverso OLS Valore atteso Data una

Dettagli

STATISTICA DESCRITTIVA I

STATISTICA DESCRITTIVA I - 1 - APPUNTI DI STATISTICA DESCRITTIVA I Corso di Laurea in Informatica voto Numero studenti 18 6 1 8 4 3 10 5 11 6 8 9 9 1 30 9 σ k 1 = ( xi x) ni = n i = 1 k 1 = xi ni n i = 1 ( x ) - - Elementi di

Dettagli

Vogliamo determinare una funzione lineare che meglio approssima i nostri dati sperimentali e poter decidere sulla bontà di questa approssimazione.

Vogliamo determinare una funzione lineare che meglio approssima i nostri dati sperimentali e poter decidere sulla bontà di questa approssimazione. S.S.I.S. TOSCANA F.I.M. II anno FUNZIONI DI REGRESSIONE E METODO DEI MINIMI QUADRATI Supponiamo di star conducendo uno studio sulla crescita della radice di mais in funzione del contenuto di saccarosio

Dettagli

Corso di Laurea in Economia Aziendale. Docente: Marta Nai Ruscone. Statistica

Corso di Laurea in Economia Aziendale. Docente: Marta Nai Ruscone. Statistica Corso di Laurea in Economia Aziendale Docente: Marta Nai Ruscone Statistica a.a. 2015/2016 1 Lezione 3 1) Grafico a dispersione 2) La correlazione lineare -la covarianza funzione di excel: covarianza()

Dettagli

Lezione 6 Corso di Statistica. Domenico Cucina

Lezione 6 Corso di Statistica. Domenico Cucina Lezione 6 Corso di Statistica Domenico Cucina Università Roma Tre D. Cucina (domenico.cucina@uniroma3.it) 1 / 17 obiettivi della lezione familiarizzare con le ditribuzioni bivariate delle variabili quantitative

Dettagli

Esercizi vari sulle schede di statistica

Esercizi vari sulle schede di statistica Esercizi vari sulle schede di statistica December 4, 2008 1 Introduzione Nelle prove scritte ci sarà un esercizio relativo alla parte di statistica e la sua implementazione con R. Tale parte dello scritto

Dettagli

Esercizio 1. Trovare un intervallo della distribuzione di COR che contenga il 95% dell'area.

Esercizio 1. Trovare un intervallo della distribuzione di COR che contenga il 95% dell'area. Esercizio 1. Trovare un intervallo della distribuzione di COR che contenga il 95% dell'area. Soluzione. Ricordiamo che i comandi per ottenere (a livello simulativo) la distribuzione di COR sono (ad es.

Dettagli

Rappresentazioni grafiche di distribuzioni doppie

Rappresentazioni grafiche di distribuzioni doppie Rappresentazioni grafiche di distribuzioni doppie Distribuzione doppia di frequenze Tabella di contingenza Tabella di correlazione Stereogramma Distribuzione unitaria doppia di 2 caratteri quantitativi

Dettagli

Introduzione al rischio, rendimento e costo opportunità del capitale

Introduzione al rischio, rendimento e costo opportunità del capitale Introduzione al rischio, rendimento e costo opportunità del capitale Nozione di Costo Opportunità del Capitale Il rendimento che i finanziatori otterrebbero impiegando i propri fondi in attività alternative,

Dettagli

Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico )

Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico ) Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico 05-6) REGRESSIONE LINEARE SEMPLICE OPEN STATISTICA 8.44 Per 8 settimanali, appartenenti alla medesima fascia di prezzo e presenti in edicola

Dettagli

lezione 7 AA Paolo Brunori

lezione 7 AA Paolo Brunori AA 2016-2017 Paolo Brunori dove siamo arrivati? - se siamo interessati a studiare l andamento congiunto di due fenomeni economici - possiamo provare a misurare i due fenomeni e poi usare la lineare semplice

Dettagli

Nuovo Ordinamento Esame di Statistica 20 Giugno 2003 docente: P. Vicard Nome

Nuovo Ordinamento Esame di Statistica 20 Giugno 2003 docente: P. Vicard Nome Nuovo Ordinamento Esame di Statistica 20 Giugno 2003 Cognome docente: P. Vicard Nome Al termine di ogni esercizio è lasciato lo spazio per scrivere la soluzione (corredata degli opportuni passaggi). La

Dettagli

Analisi di regressione: approccio matriciale. Abbiamo rilevato i seguenti caratteri su n = 25

Analisi di regressione: approccio matriciale. Abbiamo rilevato i seguenti caratteri su n = 25 Analisi di regressione: approccio matriciale Abbiamo rilevato i seguenti caratteri su n = 25 unità Y X 1 X 2 X 3 10.98 35.3 20 4 11.13 29.7 20 5 12.51 30.8 23 4 8.40 58.8 20 4 9.27 61.4 21 5 8.73 71.3

Dettagli

Statistica Descrittiva Soluzioni 7. Interpolazione: minimi quadrati

Statistica Descrittiva Soluzioni 7. Interpolazione: minimi quadrati ISTITUZIONI DI STATISTICA A. A. 2007/2008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona

Dettagli

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza XIII Presentazione del volume XV L Editore ringrazia 3 1. Introduzione alla Statistica 5 1.1 Definizione di Statistica 6 1.2 I Rami della Statistica Statistica Descrittiva, 6 Statistica Inferenziale, 6

Dettagli

Facoltà di Psicologia Università di Padova Anno Accademico Corso di Psicometria - Modulo B

Facoltà di Psicologia Università di Padova Anno Accademico Corso di Psicometria - Modulo B Facoltà di Psicologia Università di Padova Anno Accademico 2010-2011 Corso di Psicometria - Modulo B Dott. Marco Vicentini marco.vicentini@unipd.it Rev. 27/12/2010 Regressione lineare Modello geometrico

Dettagli

Statistica descrittiva in due variabili

Statistica descrittiva in due variabili Statistica descrittiva in due variabili 1 / 65 Statistica descrittiva in due variabili 1 / 65 Supponiamo di misurare su un campione statistico due diverse variabili X e Y. Indichiamo come al solito con

Dettagli

ESERCITAZIONE REGRESSIONE MULTIPLA

ESERCITAZIONE REGRESSIONE MULTIPLA ESERCITAZIONE REGRESSIONE MULTIPLA Dati delle Nazioni Unite del 2005 riferiti, per diverse nazioni, al tasso di feconditá (bambini per donna) (variabile Fert), alla percentuale di donne che usa contraccettivi

Dettagli

Statistica. Esercizi: 7. Statistica Descrittiva Bivariata 3 Probabilità 1

Statistica. Esercizi: 7. Statistica Descrittiva Bivariata 3 Probabilità 1 Corsi di Laurea: a.a. 2018-19 Diritto per le Imprese e le istituzioni Scienze Internazionali dello Sviluppo e della Cooperazione Statistica Statistica Descrittiva Bivariata 3 Probabilità 1 Esercizi: 7

Dettagli

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli Dipartimento di Sociologia e Ricerca Sociale Corso di Laurea in Sociologia Insegnamento di Statistica (a.a. 2018-2019) dott.ssa Gaia Bertarelli Esercitazione n. 6 1. Si consideri un campione di 69 persone

Dettagli

Consideriamo due variabili quantitative Y e X, e supponiamo di essere interessati a comprendere come la Y

Consideriamo due variabili quantitative Y e X, e supponiamo di essere interessati a comprendere come la Y 1 Analisi della interdipendenza lineare Quando si analizzano due o più caratteri quantitativi si può cercare di individuare una funzione che descriva in modo dettagliato la relazione che emerge dai dati,

Dettagli

7. STATISTICA DESCRITTIVA

7. STATISTICA DESCRITTIVA 7. STATISTICA DESCRITTIVA Quando si effettua un indagine statistica si ha a che fare con un numeroso insieme di oggetti, detto popolazione del quale si intende esaminare una o più caratteristiche (matricole

Dettagli

STATISTICA. Regressione-4 ovvero Macron!

STATISTICA. Regressione-4 ovvero Macron! STATISTICA Regressione-4 ovvero Macron! Eravamo partiti da qui Stipendio medio orario 2013 Voto per Le Pen Stipendio medio orario (2013) [11,12) [12,13) [13,14) [14,15) [15,23] Eravamo partiti da qui Stipendio

Dettagli

Università degli Studi di Padova Facoltà di Scienze Statistiche, CL. in Astronomia

Università degli Studi di Padova Facoltà di Scienze Statistiche, CL. in Astronomia Università degli Studi di Padova Facoltà di Scienze Statistiche, CL. in Astronomia Esame di Statistica Descrittiva mod. B, Appello del 4/7/2007 CORREZIONE 1) Un azienda produce bulloni di diametro pari

Dettagli

Regressione. Monica Marabelli. 15 Gennaio 2016

Regressione. Monica Marabelli. 15 Gennaio 2016 Regressione Monica Marabelli 15 Gennaio 2016 La regressione L analisi di regressione é una tecnica statistica che serve a studiare la relazione tra variabili. In particolare, nel modello di regressione

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 3

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 3 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 3 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. La variabile casuale normale Da un analisi di bilancio è emerso che, durante i giorni feriali

Dettagli

per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione

per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione Rapporti statistici di composizione la parte rispetto al tutto percentuali di derivazione per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione di frequenza (tassi) rapporti

Dettagli

Analisi di Regressione Multipla

Analisi di Regressione Multipla Analisi di Regressione Multipla Stima OLS della relazione Test Score/STR : TestScore! = 698.9.8 STR, R =.05, SER = 18.6 (10.4) (0.5) E una stima credibile dell effetto causale sul rendimento nei test di

Dettagli

1. ISTOGRAMMI E GRAFICI DI ALCUNE DENSITA (COMPLEMENTO ALLA LEZIONE PRECEDENTE)

1. ISTOGRAMMI E GRAFICI DI ALCUNE DENSITA (COMPLEMENTO ALLA LEZIONE PRECEDENTE) 1. ISTOGRAMMI E GRAFICI DI ALCUNE DENSITA (COMPLEMENTO ALLA LEZIONE PRECEDENTE) Riprendiamo l esempio X = seq(-5,5,0.01) Y= dnorm(x) plot(x,y) Si poteva automatizzare la scelta delle X ponendo: X=rnorm(1000)

Dettagli

SCOPO DELL ANALISI DI CORRELAZIONE

SCOPO DELL ANALISI DI CORRELAZIONE CORRELAZIONE 1 SCOPO DELL ANALISI DI CORRELAZIONE STUDIARE LA RELAZIONE TRA DUE VARIABILI X E Y 2 diagrammi di dispersione un diagramma di dispersione (o grafico di dispersione) èuna rappresentazione grafica

Dettagli

Metodo dei Minimi Quadrati. Dott. Claudio Verona

Metodo dei Minimi Quadrati. Dott. Claudio Verona Metodo dei Minimi Quadrati Dott. Claudio Verona E in generale interessante studiare l andamento di una variabile in funzione di un altra e capire se c è una funzione matematica che le lega. Viceversa è

Dettagli

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione

Dettagli

ˆp(1 ˆp) n 1 +n 2 totale di successi considerando i due gruppi come fossero uno solo e si costruisce z come segue ˆp 1 ˆp 2. n 1

ˆp(1 ˆp) n 1 +n 2 totale di successi considerando i due gruppi come fossero uno solo e si costruisce z come segue ˆp 1 ˆp 2. n 1 . Verifica di ipotesi: parte seconda.. Verifica di ipotesi per due campioni. Quando abbiamo due insiemi di dati possiamo chiederci, a seconda della loro natura, se i campioni sono simili oppure no. Ci

Dettagli

LM 88 SOCIOLOGIA E RICERCA SOCIALE. Metodi Statistici per la Ricerca Sociale. Regressione lineare e correlazione

LM 88 SOCIOLOGIA E RICERCA SOCIALE. Metodi Statistici per la Ricerca Sociale. Regressione lineare e correlazione LM 88 SOCIOLOGIA E RICERCA SOCIALE Metodi Statistici per la Ricerca Sociale Regressione lineare e correlazione 1. Su un campione di individui sono rilevati i caratteri X (peso in Kg) e Y (altezza in cm),

Dettagli

ESERCITAZIONE IV - Soluzioni

ESERCITAZIONE IV - Soluzioni umero di omicidi ESERCITAZIOE IV - Soluzioni Esercizio I. a),00 12,00 10,00 8,00 6,00 4,00 2,00 0,00 0 5 10 15 20 25 Popolazione povera (%) b) Poiché i due caratteri in analisi sono quantitativi per calcolare

Dettagli

Fondamenti e metodi analisi empirica nelle scienze sociali

Fondamenti e metodi analisi empirica nelle scienze sociali CORSO DI FONDAMENTI E METODI PER L'ANALISI EMPIRICA NELLE SCIENZE SOCIALI Distribuzioni statistiche multiple AA 2017/2018 1. Introduzione: il processo di rilevazione e le distribuzioni statistiche. 2.

Dettagli

lezione 4 AA Paolo Brunori

lezione 4 AA Paolo Brunori AA 2016-2017 Paolo Brunori dove eravamo arrivati - abbiamo individuato la regressione lineare semplice (OLS) come modo immediato per sintetizzare una relazione fra una variabile dipendente (Y) e una indipendente

Dettagli

Esercitazioni di Statistica Dott.ssa Cristina Mollica

Esercitazioni di Statistica Dott.ssa Cristina Mollica Esercitazioni di Statistica Dott.ssa Cristina Mollica cristina.mollica@uniroma.it Regressione Esercizio. Siano dati i seguenti valori per le due variabili X ed Y: 4 5 3 5 3 3 Con riferimento al modello

Dettagli

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1 lezione n. 6 (a cura di Gaia Montanucci) METODO MASSIMA VEROSIMIGLIANZA PER STIMARE β 0 E β 1 Distribuzione sui termini di errore ε i ε i ~ N (0, σ 2 ) ne consegue : ogni y i ha ancora distribuzione normale,

Dettagli

Associazione tra caratteri quantitativi: gli indici di correlazione

Associazione tra caratteri quantitativi: gli indici di correlazione Associazione tra caratteri quantitativi: gli indici di correlazione Per correlazione si intende una relazione tra due variabili tale che a ciascun valore della prima variabile corrisponda con una certa

Dettagli

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Regressione Lineare e Correlazione Argomenti della lezione Determinismo e variabilità Correlazione Regressione Lineare

Dettagli

Corso di Psicometria Progredito

Corso di Psicometria Progredito Corso di Psicometria Progredito 5. La correlazione lineare Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014 Sommario 1 Tipi di relazione

Dettagli

STATISTICA. Regressione-2

STATISTICA. Regressione-2 STATISTICA Regressione-2 Esempio Su un campione di =5unità sono state osservate due variabili, ed : x i 1 2 3 4 5 y i 1.5 2.5 3 2.5 3.5 1. Rappresentare l andamento congiunto di in funzione di mediante

Dettagli

Statistica di base per l analisi socio-economica

Statistica di base per l analisi socio-economica Laurea Magistrale in Management e comunicazione d impresa Statistica di base per l analisi socio-economica Giovanni Di Bartolomeo gdibartolomeo@unite.it Definizioni di base Una popolazione è l insieme

Dettagli

Lezione 7 Corso di Statistica. Domenico Cucina

Lezione 7 Corso di Statistica. Domenico Cucina Lezione 7 Corso di Statistica Domenico Cucina Università Roma Tre D. Cucina (domenico.cucina@uniroma3.it) 1 / 12 obiettivi della lezione comprendere la retta di regressione e le sue proprietà D. Cucina

Dettagli

Esercitazione

Esercitazione Esercitazione 3 29.5.2014 REGRESSIONE E CORRELAZIONE Accedere alle macchine con LOGIN: esame PASSWORD: didattica Regressione Ci chiediamo quanto i dati osservati differiscano da quelli teorici, usando

Dettagli

Elementi di Psicometria (con laboratorio software 1)

Elementi di Psicometria (con laboratorio software 1) Elementi di Psicometria (con laboratorio software 1) 05-La verifica delle ipotesi con le medie dei campioni (v. 1.0, 15 aprile 2019) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia,

Dettagli

Corso di Statistica - Prof. Fabio Zucca V Appello - 19 febbraio 2015

Corso di Statistica - Prof. Fabio Zucca V Appello - 19 febbraio 2015 Corso di Statistica - Prof. Fabio Zucca V Appello - 19 febbraio 215 Nome e cognome: Matricola: c I diritti d autore sono riservati. Ogni sfruttamento commerciale non autorizzato sarà perseguito. 8994 Esercizio

Dettagli

STATISTICA. Esercitazione 6

STATISTICA. Esercitazione 6 STATISTICA Esercitazione 6 Esercizio 1 Ad un esame universitario sono stati assegnati in modo casuale tre compiti diversi con i seguenti risultati: Compito A Compito B Compito C Numero studenti 41 39 43

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 28-Intervalli di confidenza vers. 1.1 (21 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

Lezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo

Lezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo UIVERSITA DEGLI STUDI DI BASILICATA FACOLTA DI ECOOMIA Corso di laurea in Economia Aziendale anno accademico 2012/2013 Lezioni di Statistica del 15 e 18 aprile 2013 Docente: Massimo Cristallo LA RELAZIOE

Dettagli

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1 Statistica Capitolo 1 Regressione Lineare Semplice Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Spiegare il significato del coefficiente di correlazione lineare

Dettagli

Scheda n. 13: modelli lineari

Scheda n. 13: modelli lineari Scheda n. 13: modelli lineari December 4, 2008 1 Combinazioni affini di variabili aleatorie La teoria che stiamo per esporre vuole descrivere relazioni matematiche tra variabili aleatorie: in tali relazioni

Dettagli

UNIVERSITÀ di ROMA TOR VERGATA

UNIVERSITÀ di ROMA TOR VERGATA UNIVERSITÀ di ROMA TOR VERGATA Corso di Statistica, anno 2010-11 P.Baldi Lista di esercizi 3. Corso di Laurea in Biotecnologie Esercizio 1 Una v.a. X segue una legge N(2, ). Calcolare a1) P(X 1) a2) P(2

Dettagli