Esercizi su Regressione e Connessione
|
|
- Leona Isabella Guidi
- 5 anni fa
- Visualizzazioni
Transcript
1 Esercizi su Regressione e Connessione Stefano Cabras 31 marzo 2009 Sommario Questa serie di esercizi è principalmente incentrata sulla regressione e la connessione, tuttavia in alcuni esercizi le soluzioni proposte fanno riferimento ad argomenti del corso che saranno impartiti nelle sezioni dedicate alla probabilità e all inferenza. 1 Esercizio La relazione di dipendenza tra il consumo di carburante x (in litri) e lo spazio percorso Y (espresso in Km) per un automobile è del tipo Y = a+bx. L utilizzo dell automobile è tale per cui non rimane mai ferma con il motore acceso; inoltre sappiamo che non è stata mai spinta; non vi sono perdite di carburante dal serbatoio e quindi il carburante viene utilizzato solo per muovere il veicolo. In alcune prove la distanza media percorsa è 20 Km, mentre il corrispondente consumo medio è stato di un litro con uno scarto pari a un Km per lo spazio percorso. 1.1 Determinare il valore di b. Dal testo sappiamo che se x = 0 allora Y = 0 e ciò avviene solo se la retta passa per l origine degli assi. Dunque a = 0. La stima di a è cioè 0 = a = ȳ b x, b = σ xy 2, 0 = ȳ σ xy 2 x, dove ȳ = 20, x = 1, σ 2 x = 1, mentre σ xy è incognita. Quindi da cui 0 = 20 σ xy, σ xy = b = 20. Senza effettuare i calcoli, ma semplicemente interpretando il significato del coefficiente b: numero di Km percorsi con 1 litro si poteva affermare b = 20 Km. 1
2 1.2 Esiste una relazione causale tra Y e x? Evidentemente si, perchè il consumo di carburante è dovuto esclusivamente allo spazio percorso dall automobile. In questo caso la correlazione è anche un indicatore della relazione causa (spazio percorso) ed effetto (consumo di carburante). 2 Esercizio Per verificare l indipendenza tra il contatto con una sostanza tossica (C=Contatto, NC=Non Contatto) e una certa malattia (S=Sano, M=Malato) è stato effettuato uno studio su 100 persone. La metà degli individui è venuta a contatto con la sostanza. Tra gli individui che sono venuti a contatto con la sostanza, il 40% è risultato sano, mentre tra coloro che non sono venuti a contatto con la sostanza la metà risulta malata. 2.1 Supponendo che la popolazione di riferimento sia composta da tutti gli intervistato si dica se la probabilità di ammalarsi aumenta con il contatto con la sostanza tossica. La tebella completa è la seguente: Dobbiamo calcolare il rapporto Sano Malato Contatto Non Contatto k = quindi la probabilità aumenta del 20%. Pr(M C) Pr(M NC) = = 1.2, 2.2 Verificare l ipotesi di indipendenza ai livelli di significatività del 5% e 1% tra il contatto con la sostanza e la malattia. Le frequenze teoriche n ij sono Sano Malato Contatto Non Contatto Quindi 2 2 χ 2 (n ij n ij obs = )2 i=1 j=1 n ij
3 Il χ 2 assuma valori tra (0, n min{(i 1), (J 1)}) (0, 100) e quindi dividendolo per il suo massimo si ottiene un indice che varia tra 0 e 1 chiamato indice di Cramér 3 Esercizio ψ = χ 2 obs n min{(i 1), (J 1)} = Per le variabili statistiche z e h sono noti i momenti primi m h = 0.33, m z = 0.01 e i momenti secondi, m h = 0.233, m z = non centrati ottenuti su una popolazione di 10 individui. Infine è nota la funzione di regressione di z h: z = h. 3.1 Si determini la percentuale di varianza spiegata dalla retta di regressione. Dal testo sappiamo: s h = 10 i=1 h i = 3.3, s z = 10 i=1 z i = 0.1, s h 2 = 10 i=1 h2 i = 2.33, s z 2 = 10 i=1 z2 i = Usando le formule di decomposizione della varianza si ha ( ) σ h = n s h 2 n s h = = ( ) σ z = n s z 2 n s z = = Il coefficiente di correlazione è ρ hz = bσ h 1 σ z = = 0.99, quindi la varianza spiegata dalla retta è il circa il 99%. 3.2 Si determini la derivata prima della retta di regressione di h z. La derivata prima della retta h z non è altro che il suo coefficiente: 4 Esercizio b h z = b z h σ 2 h σ 2 z = = I dati relativi alla distribuzione empirica della coppia di variabili statistiche (X, Y ) sono andati persi. Tuttavia, per le 20 coppie osservate sono note le seguenti statistiche: 3
4 la retta di regressione X y : x = y le varianze campionarie non corrette sono S 2 x = 529, S 2 y = ; l inverso delle medie x 1 = , ȳ 1 = ; la retta di regressione Y x : y = x 4.1 Determinare le varianze campionarie corrette. La varianzia non corretta è S x 2 = 1 n n i=1 (x i x) 2, mentre quella corretta è Sx 2 = 1 n n 1 i=1 (x i x) 2, dunque Analogamente S 2 x = S 2 y = n n 1 S 2 x = n n 1 S 2 y = Si determini la proporzione di varianza non spiegata dalla retta di regressione Y x ottenuta con il metodo dei minimi quadrati. La proporzione di varianza spiegata dal modello è data da R 2 = ( ) 2 ( b S x S y = ) 2 = Quella non spiegata è quindi = circa il 90%. 5 Esercizio Analizzando la relazione tra il peso Y (in gr) e la lunghezza massima x (in mm) è stata ipotizzata una funzione del tipo Y = a + bx. Sappiamo che la funzione, stimata con il metodo dei minimi quadrati, è stata forzata a passare per l origine del sistema di coordinate (Y, x). Le medie osservate sono x = 10, ȳ = 20, la varianza per l altezza è 10, mentre la varianza del peso è σ 2 y = Valutare la bontà di adattamento della retta di regressione. Per valutare la retta di regressione dobbiamo determinare R 2 = ρ 2 = ( y σ x σ y quindi occorre calcolare σ xy. Dal testo sappiamo che se x = 0 allora Y = 0 e ciò avviene solo se la retta passa per l origine degli assi. Dunque a = 0. La stima di a è 0 = a = ȳ b x, b = σ xy 2, ) 2 4
5 occorre quindi risolvere l equazione in σ xy : Quindi ȳ σ xy 2 x = 0 σ xy = σ2 xȳ = = 20 x 100 R 2 = ρ 2 = ( y σ x σ y ) 2 = ( ) 2 20 = 0.04, è l adattamento della retta di regressione è decisamente debole, infatti siamo in grado di spiegare solo il 4% della variabilità del peso. 5.2 Determinare l errore di previsione su un nuovo insetto che è lungo 0,02 metri e pesa 10gr. Occorre calcolare il valore stimato Ŷ per x = 20, dunque Ŷ = b 20 = = L errore di previsione è una sottostima di 6 gr. 6 Esercizio Per verificare l associazione tra rendimento scolastico e un certo libro di testo è stato effettuato uno studio su 100 scolari i cui risultati sono in parte riportati nella seguente tabella: Mediocre Buono Testo adottato Testo non adottato Supponendo che l insieme di tutti gli scolari sia esattamente composto dai 100 scolari intervistati e utilizzando la nozione frequentista di probabilità, si dica se diminuisce la frequenza di un rendimento buono quando il testo è adottato. La tebella completa è la seguente: Mediocre Buono Testo adottato Testo non adottato Indichiamo con E l evento il testo è adottato e con M lo scolaro ha un rendimento buono. Dobbiamo calcolare il rapporto k = quindi la probabilità aumenta del 20%. Pr(M E) 30 = Pr(M Ē) 25 = 1.2, 5
6 6.2 Verificare l ipotesi di indipendenza tra rendimento e adozione del libro. Le frequenze teoriche n ij sono Mediocre Buono Testo adottato Testo non adottato Quindi 2 2 χ 2 (n ij n ij obs = )2 i=1 j=1 n ij Esercizio Nello studio di una retta di regressione Y = a + bx si sa solamente che la pendenza della retta è negativa e che tramite x si spiega il 90% della variabilità di Y 7.1 Determinare il coefficiente di correlazione lineare tra Y e x. Dal testo il valore R 2 = 0.9. Il coefficiente di correlazione a meno del segno è ρ = R 2 = 0.9 = Siccome b < 0 allora deve essere ρ = Sapendo che le varianze osservate sono pari a 9 e 4 rispettivamente per Y e x, determinare la covarianza tra x e Y. Possiamo utilizzare la relazione ρ = cov(x,y) σ xσ y = 8 Esercizio cov(x, y) 3 2 dunque cov(x, y) = = Un produttore di computer vuole capire se la diffusione di due virus (A,B) è associato a un sistema operativo (W,M,L). A tal proposito raccoglie i dati relativi a 355 computer infettati W M L A B
7 8.1 Sulla base della risposta alla domanda del produttore si può dire che il sistema operativo W causa la diffusione di un virus? L associazione tra due variabili non implica un nesso causale. Infatti vi possono essere variabili confondenti come ad esempio l operatore al computer, per cui può risultare che il sistema operativo sia associato al virus, mentre la causa di diffusione è una particolare azione dell operatore. 8.2 Determinare se esiste associazione tra tipo di virus e sistema operativo. Si tratta di effettuare un test χ 2 sull indipendenza. La statistica χ 2 osservata vale 7.26, da confrontare con il valore teorico al 95% χ 2 ν=2,α=0.05 = 5.99, pertanto al 95% l ipotesi di indipendenza tra sistema operativo e virus è rifiutata. Lo stessa ipotesi però non può essere rifiutata al 99%, infatti χ 2 ν=2,α=0.05 = 9.21 > Esercizio Su 10 unità statistiche sono stati rilevati i valori delle variabili X e Y che le caratterizzano, ottenendo le seguenti statistiche: s x = 10 i=1 x i = 3.3, s y = 10 i=1 y i = 0.1, s x 2 = 10 i=1 x2 i = 2.33, s y 2 = 10 i=1 y2 i = La retta di regressione di Y x ha la seguente equazione Y = x 9.1 Si determini il coefficiente di correlazione lineare tra X e Y. Usando le formule di decomposizione della varianza si ha ( ) σ x = n s x 2 n s x = = ( ) σ y = n s y 2 n s y = = Il coefficiente di correlazione è ρ xy = bσ x 1 σ y = =
8 9.2 Si determini la retta di regressione di X y. Il coefficiente della retta X y è mentre b X y = b Y x σ 2 x σ 2 y = = 0.317, a X y = x ȳb X y = = Quindi la retta cercata è X = y. 10 Esercizio Della variabile doppia (X, Y ) sono state osservate su 20 individui: le medie x = 8.5, x = 53; gli scarti campionari non corretti S x = 23, S y = 10.8; la retta di regressione Y x : y = x la retta di regressione X y : x = y 10.1 Determinare le varianze campionarie corrette. S x 1 n = n i=1 (x i x) 2, mentre la varianza campionaria corretta è Sx 2 = 1 n n 1 i=1 (x i x) 2, dunque Sx 2 = n n 1 (S x) 2 = Analogamente S 2 y = n n 1 (S y) 2 = Si determini la varianza residua della retta Y x. La proporzione di varianza spiegata dal modello è data da ( ) 2 ( R 2 = b S x S y = ) 2 = Sappiamo inoltre che R 2 = 1 V R (S y) 2 V R = (S y) 2 (1 R 2 ) = ( ) = Esercizio Nello studio sulla resistenza elastica di un cavo di sezione unitaria, la relazione tra l allungamento Y (in mm) e la forza applicata x (in [N]) è Y = a+bx. I dati originali sono andati persi, però sappiamo che la retta stimata con il metodo dei minimi quadrati ci informa che se non applichiamo forze il cavo non si allunga e che le medie osservate sono x = 10, ȳ = 20, la varianza è σ 2 x = 100, mentre la varianza dell allungamento è σ 2 y =
9 11.1 Valutare la bontà di adattamento della retta di regressione. Per valutare la retta di regressione dobbiamo determinare R 2 = ρ 2 = ( y σ x σ y quindi occorre calcolare σ xy. Dal testo sappiamo che se x = 0 allora Y = 0 e ciò avviene solo se la retta passa per l origine degli assi. Dunque a = 0. La stima di a è 0 = a = ȳ b x, b = σ xy 2, occorre quindi risolvere l equazione in σ xy : Quindi ) 2 ȳ σ xy 2 x = 0 σ xy = σ2 xȳ = = 20 x 100 R 2 = ρ 2 = ( y σ x σ y ) 2 = ( ) 2 20 = 0.04, è l adattamento della retta di regressione è decisamente debole, infatti usando la sola forza applicata, siamo in grado di spiegare solo il 4% della variabilità del numero di pezzi rotti In una prova successiva sono stati applicati 20 [N] e la barra si è allungata di 10mm. Qual è l errore di previsione del modello per questa prova? Occorre calcolare il valore stimato Ŷ per x = 20, dunque Ŷ = b 20 = = L errore di previsione è una sottostima di 6 mm. 9
Matricola: Corso: 1. (4 Punti) Stimare la variazione del reddito quando il prezzo del prodotto finale raddoppia.
Facoltà di Economia Statistica Esame 3-12/04/2010: A Cognome, Nome: Matricola: Corso: Problema 1. Per 5 imprese imprese è stato rilevato il reddito quinquennale medio (in milioni di euro), y, e il corrispondente
DettagliSTATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE
STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 2 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1.1
DettagliCorrelazione lineare e regressione
7c e regressione Se i due caratteri sono entrambi quantitativi, X e Y, possiamo studiare la loro correlazione lineare. Prima di tutto cerchiamo di capire di cosa si tratta. Se elenchiamo le N osservazioni
DettagliCorso in Statistica Medica
Corso in Statistica Medica Introduzione alle tecniche statistiche di elaborazione dati Regressione e correlazione Dott. Angelo Menna Università degli Studi di Chieti G. d Annunziod Annunzio Anno Accademico
DettagliCORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Associazione, correlazione e dipendenza tra caratteri In un collettivo di 11 famiglie è stata
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri
DettagliLM 88 SOCIOLOGIA E RICERCA SOCIALE. Metodi Statistici per la Ricerca Sociale. Regressione lineare e correlazione
LM 88 SOCIOLOGIA E RICERCA SOCIALE Metodi Statistici per la Ricerca Sociale Regressione lineare e correlazione 1. Su un campione di individui sono rilevati i caratteri X (peso in Kg) e Y (altezza in cm),
DettagliDipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli
Dipartimento di Sociologia e Ricerca Sociale Corso di Laurea in Sociologia Insegnamento di Statistica (a.a. 2018-2019) dott.ssa Gaia Bertarelli Esercitazione n. 6 1. Si consideri un campione di 69 persone
DettagliEsercitazione del
Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36
DettagliCorso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010.
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010 Statistica Esercitazione 4 12 maggio 2010 Dipendenza in media. Covarianza e
DettagliRegressione Lineare Semplice e Correlazione
Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)
DettagliL'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale
L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile Corso di Metodologia della ricerca sociale L analisi della varianza (ANOVA) La tecnica con cui si esplorano le relazioni
DettagliStatistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2010/2011 Statistica Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza
DettagliEsercizi sull Inferenza
Esercizi sull Inferenza Stefano Cabras 17 giugno 2009 Sommario Alcuni esercizi sono volutamente ripetuti nella soluzione ma non nell enunciato. 1 Esercizio Per valutare l efficacia di un contenitore di
DettagliREGRESSIONE E CORRELAZIONE
REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative
DettagliRegressione & Correlazione
Regressione & Correlazione Monia Ranalli Ranalli M. Dipendenza Settimana # 4 1 / 20 Sommario Regressione Modello di regressione lineare senplice Stima dei parametri Adattamento del modello ai dati Correlazione
DettagliUNIVERSITÀ di ROMA TOR VERGATA
UNIVERSITÀ di ROMA TOR VERGATA Corso di Statistica, anno 2010-11 P.Baldi Lista di esercizi 3. Corso di Laurea in Biotecnologie Esercizio 1 Una v.a. X segue una legge N(2, ). Calcolare a1) P(X 1) a2) P(2
DettagliStatistica di base per l analisi socio-economica
Laurea Magistrale in Management e comunicazione d impresa Statistica di base per l analisi socio-economica Giovanni Di Bartolomeo gdibartolomeo@unite.it Definizioni di base Una popolazione è l insieme
DettagliSTATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo
STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)
DettagliMatematica Lezione 22
Università di Cagliari Corso di Laurea in Farmacia Matematica Lezione 22 Sonia Cannas 14/12/2018 Indici di posizione Indici di posizione Gli indici di posizione, detti anche misure di tendenza centrale,
DettagliOld Faithful, Yellowstone Park. Statistica e biometria. D. Bertacchi. Dati congiunti. Tabella. Scatterplot. Covarianza. Correlazione.
Coppie o vettori di dati Spesso i dati osservati sono di tipo vettoriale. Ad esempio studiamo 222 osservazioni relative alle eruzioni del geyser Old Faithful. Old Faithful, Yellowstone Park. Old Faithful
DettagliFacoltà di Psicologia Università di Padova Anno Accademico Corso di Psicometria - Modulo B
Facoltà di Psicologia Università di Padova Anno Accademico 2010-2011 Corso di Psicometria - Modulo B Dott. Marco Vicentini marco.vicentini@unipd.it Rev. 27/12/2010 Regressione lineare Modello geometrico
DettagliTema d esame del 15/02/12
Tema d esame del 15/0/1 Volendo aprire un nuovo locale, una catena di ristoranti chiede ad un consulente di valutare la posizione geografica ideale all interno di un centro abitato. A questo scopo, avvalendosi
DettagliMetodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo
Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è
DettagliESERCITAZIONI N. 3 corso di statistica
ESERCITAZIONI N. 3corso di statistica p. 1/18 ESERCITAZIONI N. 3 corso di statistica Marco Picone Università Roma Tre ESERCITAZIONI N. 3corso di statistica p. 2/18 Introduzione Media e Varianza Covarianza
DettagliSommario. 2 I grafici Il sistema di coordinate cartesiane Gli istogrammi I diagrammi a torta...51
Sommario 1 I dati...15 1.1 Classificazione delle rilevazioni...17 1.1.1 Esperimenti ripetibili (controllabili)...17 1.1.2 Rilevazioni su fenomeni non ripetibili...18 1.1.3 Censimenti...19 1.1.4 Campioni...19
DettagliStatistica descrittiva in due variabili
Statistica descrittiva in due variabili Dott Nicola Pintus AA 2018-2019 Indichiamo con U la popolazione statistica e con u i le unità statistiche Ad ogni unità statistica associamo i caratteri osservati
DettagliProva d esame di Statistica - II canale - nuovo ordinamento Dott.ssa C. Conigliani 19/06/2003
19/06/2003 Compito A Esercizio 1. [14 punti] Data la seguente distribuzione doppia secondo i caratteri reddito familiare mensile () e spesa alimentare mensile (): 0 300 300 600 600 e più tot 0 1000 25
DettagliEsercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale)
Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale) Esercizio 1: Un indagine su 10.000 famiglie ha dato luogo, fra le altre, alle osservazioni riportate nella
DettagliStatistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill
Statistica - metodologie per le scienze economiche e sociali /e S Borra, A Di Ciaccio - McGraw Hill Es 6 Soluzione degli esercizi del capitolo 6 In base agli arrotondamenti effettuati nei calcoli, si possono
DettagliEsercizi di statistica
Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@unina.it Università degli studi di Cassino () Statistica 1 / 1 Outline 1 () Statistica 2 / 1 Outline 1 2 () Statistica 2 / 1 Outline 1 2 3 () Statistica 2 / 1
Dettaglix, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y )
Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 0/03 lezioni di statistica del 5 e 8 aprile 03 - di Massimo Cristallo - A. Le relazioni tra i fenomeni
DettagliEsercitazione III Soluzione
Esercitazione III Soluzione Esercizio 1 a) Frequenze congiunte assolute: n ij Reddito mensile Titolo di studio 1000-000 000-5000 5000-8000 Totale Laurea triennale 4 1 0 5 Laurea magistrale 1 4 7 Dottorato
DettagliStatistica multivariata Donata Rodi 17/10/2016
Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare
DettagliNel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0.
Regressione [] el modello di regressione lineare si assume una relazione di tipo lineare tra il valore medio della variabile dipendente Y e quello della variabile indipendente X per cui Il modello si scrive
Dettagli1 Fit di dati sperimentali: il χ 2. Il metodo dei minimi quadrati.
1 Fit di dati sperimentali: il χ 2. Il metodo dei minimi quadrati. Per comprendere dei fenomeni fisici, non basta raccogliere buoni dati sperimentali, occorre anche interpretarli. Molto spesso lo scopo
DettagliCapitolo 12 La regressione lineare semplice
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università
DettagliESERCITAZIONI N. 3 corso di statistica
ESERCITAZIONI N 3corso di statistica p 1/18 ESERCITAZIONI N 3 corso di statistica Marco Picone Università Roma Tre ESERCITAZIONI N 3corso di statistica p 2/18 Introduzione Decomposizione della devianza
DettagliR - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre
R - Esercitazione 6 Andrea Fasulo fasulo.andrea@yahoo.it Università Roma Tre Venerdì 22 Dicembre 2017 Il modello di regressione lineare semplice (I) Esempi tratti da: Stock, Watson Introduzione all econometria
DettagliIndipendenza, Dipendenza e interdipendenza
Indipendenza, Dipendenza e interdipendenza In analisi bivariata la tabella di contingenza consente di esaminare congiuntamente due variabili consente di rilevare le relazioni esistenti tra le variabili
DettagliStatistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1
Statistica Capitolo 1 Regressione Lineare Semplice Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Spiegare il significato del coefficiente di correlazione lineare
DettagliVogliamo determinare una funzione lineare che meglio approssima i nostri dati sperimentali e poter decidere sulla bontà di questa approssimazione.
S.S.I.S. TOSCANA F.I.M. II anno FUNZIONI DI REGRESSIONE E METODO DEI MINIMI QUADRATI Supponiamo di star conducendo uno studio sulla crescita della radice di mais in funzione del contenuto di saccarosio
DettagliUniversità del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare
Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione
DettagliIl metodo dei minimi quadrati. Molto spesso due grandezze fisiche x e y, misurabili direttamente, sono legate tra loro da una legge del tipo:
Il metodo dei minimi quadrati Molto spesso due grandezze fisiche x e y, misurabili direttamente, sono legate tra loro da una legge del tipo: Dove A e B sono costanti y = A + Bx (ad esempio in un moto uniformemente
DettagliEsercizio 1. Durante un inchiesta su 500 studenti frequentanti i corsi di Algebra (A), Fisica (F) e Statistica è stato rilevato che:
Esercizio 1 Durante un inchiesta su 500 studenti frequentanti i corsi di Algebra (A), Fisica (F) e Statistica è stato rilevato che: A 329 F 186 S 295 AS 217 AF 83 FS 63 AFS 53 Determinare la partizione
DettagliRappresentazioni grafiche di distribuzioni doppie
Rappresentazioni grafiche di distribuzioni doppie Distribuzione doppia di frequenze Tabella di contingenza Tabella di correlazione Stereogramma Distribuzione unitaria doppia di 2 caratteri quantitativi
DettagliLa media e la mediana sono indicatori di centralità, che indicano un centro dei dati.
La media e la mediana sono indicatori di centralità, che indicano un centro dei dati. Un indicatore che sintetizza in un unico numero tutti i dati, nascondendo quindi la molteplicità dei dati. Per esempio,
DettagliStatistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2011/2012 Statistica Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate.
DettagliLa regressione lineare. Rappresentazione analitica delle distribuzioni
La regressione lineare Rappresentazione analitica delle distribuzioni Richiamiamo il concetto di dipendenza tra le distribuzioni di due caratteri X e Y. Ricordiamo che abbiamo definito dipendenza perfetta
DettagliMETODO DEI MINIMI QUADRATI
METODO DEI MINIMI QUADRATI Torniamo al problema della crescita della radice di mais in funzione del contenuto di saccarosio nel terreno di coltura. Ripetendo varie volte l esperimento con diverse quantità
DettagliMETODI STATISTICI PER LA BIOLOGIA. Paolo Dai Pra e Francesco Caravenna
METODI STATISTICI PER LA BIOLOGIA. Paolo Dai Pra e Francesco Caravenna 18 marzo 2008 NOME 1. Parte A 1.1. Sono stati raccolti 7 dati relativi ad una variabile x. Si sa che 3 dati hanno valore 5; 2 dati
DettagliI appello di calcolo delle probabilità e statistica
I appello di calcolo delle probabilità e statistica A.Barchielli, L. Ladelli, G. Posta 8 Febbraio 13 Nome: Cognome: Matricola: Docente: I diritti d autore sono riservati. Ogni sfruttamento commerciale
DettagliLezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo
UIVERSITA DEGLI STUDI DI BASILICATA FACOLTA DI ECOOMIA Corso di laurea in Economia Aziendale anno accademico 2012/2013 Lezioni di Statistica del 15 e 18 aprile 2013 Docente: Massimo Cristallo LA RELAZIOE
DettagliLezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria
Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata Prof. Massimo Aria aria@unina.it Il concetto di interpolazione In matematica, e in particolare in
DettagliSTATISTICA ESERCITAZIONE 13
STATISTICA ESERCITAZIONE 13 Dott. Giuseppe Pandolfo 9 Marzo 2015 Errore di I tipo: si commette se l'ipotesi nulla H 0 viene rifiutata quando essa è vera Errore di II tipo: si commette se l'ipotesi nulla
DettagliCOGNOME.NOME...MATR..
STATISTICA 29.01.15 - PROVA GENERALE (CHALLENGE) Modalità A (A) ai fini della valutazione verranno considerate solo le risposte riportate dallo studente negli appositi riquadri bianchi: in caso di necessità
DettagliCapitolo 12. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 12.1: Suggerimento
Capitolo Suggerimenti agli esercizi a cura di Elena Siletti Esercizio.: Suggerimento Per verificare se due fenomeni sono dipendenti in media sarebbe necessario confrontare le medie condizionate, in questo
DettagliRegressione lineare semplice
Regressione lineare semplice Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Statistica con due variabili var. nominale, var. nominale: gruppo sanguigno - cancro
DettagliCorrelazione e regressione
Correlazione e regressione Correlazione 1 Come posso determinare il legame tra due o più variabili? Correlazione COEFFICIENTE DI CORRELAZIONE (r di Pearson) massimo consumo di ossigeno e prestazione nelle
DettagliCognome e Nome:... Corso di laurea:...
Statistica - corso base Prof. B. Liseo Prova di esame dell 8 gennaio 201 Cognome e Nome:................................................................... Corso di laurea:.......................................................................
DettagliUniversità del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare
Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione
DettagliDispensa di Statistica
Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza
DettagliUniversità del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica
Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Regressione Lineare e Correlazione Argomenti della lezione Determinismo e variabilità Correlazione Regressione Lineare
DettagliCOME SI STUDIANO MOLTISSIME MISURE?
COME SI STUDIANO MOLTISSIME MISURE? Pb1 In una indagine sanitaria si riscontrano i seguenti dati, relativamente ad un certo tipo di infezione batterica: Area immuni a rischio infetti Nord 46 12 25 Centro
DettagliPolitecnico di Milano - Scuola di Ingegneria Industriale. II Prova in Itinere di Statistica per Ingegneria Energetica 7 Luglio 2011
Politecnico di Milano - Scuola di Ingegneria Industriale II Prova in Itinere di Statistica per Ingegneria Energetica 7 Luglio 2011 c I diritti d autore sono riservati. Ogni sfruttamento commerciale non
DettagliCorso di Laurea in MQEGA
Corso di Laurea in MQEGA Insegnamento di Statistica (Prof. P.F. Perri) Esercizi di riepilogo sulle distribuzioni bivariate Esercizio 1 La rilevazione congiunta dei caratteri e Y su 100 unità statistiche
Dettagli1.4. Siano X B(1, 1/2) e Y B(1, 1/2) variabili aleatorie indipendenti. Quale delle seguenti affermazioni é falsa? E(X + Y ) = 1 V ar(x + Y ) = 1/2
Statistica N. Crediti: Cognome: Laurea Triennale in Biologia Nome: 4 settembre 2012 Matricola: 1. Parte A 1.1. Siano x 1, x 2,..., x 10 i dati relativi al peso di 10 neonati espressi in chilogrammi e y
DettagliStatistica (parte II) Esercitazione 4
Statistica (parte II) Esercitazione 4 Davide Passaretti 03/03/016 Test sulla differenza tra medie (varianze note) Un negozio di scarpe è interessato a capire se le misure delle scarpe acquistate da adulti
DettagliCognome e Nome:... Matricola e corso di laurea:...
Statistica - corso base Prof. B. Liseo Prova di esame dell 8 gennaio 2014 Cognome e Nome:................................................................... Matricola e corso di laurea:...................................................
DettagliLaboratorio di Probabilità e Statistica
Laboratorio di Probabilità e Statistica lezione 8 Massimo Guerriero Ettore Benedetti Consegna 1. Implementare delle funzioni che, accettando opportuni parametri in ingresso, risolvano le formule viste
DettagliEsercitazione 8 maggio 2014
Esercitazione 8 maggio 2014 Esercizio 2 dal tema d esame del 13.01.2014 (parte II). L età media di n gruppo di 10 studenti che hanno appena conseguito la laurea triennale è di 22 anni. a) Costruire un
DettagliSommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25
Sommario Presentazione dell edizione italiana Prefazione xv xiii Capitolo 1 I dati e la statistica 1 Statistica in pratica: BusinessWeek 1 1.1 Le applicazioni in ambito aziendale ed economico 3 Contabilità
DettagliSTATISTICA. Regressione-4 ovvero Macron!
STATISTICA Regressione-4 ovvero Macron! Eravamo partiti da qui Stipendio medio orario 2013 Voto per Le Pen Stipendio medio orario (2013) [11,12) [12,13) [13,14) [14,15) [15,23] Eravamo partiti da qui Stipendio
DettagliStima dei Parametri. Capitolo 8
Capitolo 8 Stima dei Parametri Lo scopo dello studio dei fenomeni fisici è quello di scoprire le leggi che legano le grandezze oggetto di indagine e di misurare il valore delle costanti che compaiono della
Dettagli3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17
C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica
DettagliSTATISTICA. Regressione-2
STATISTICA Regressione-2 Esempio Su un campione di =5unità sono state osservate due variabili, ed : x i 1 2 3 4 5 y i 1.5 2.5 3 2.5 3.5 1. Rappresentare l andamento congiunto di in funzione di mediante
DettagliFondamenti e metodi analisi empirica nelle scienze sociali
CORSO DI FONDAMENTI E METODI PER L'ANALISI EMPIRICA NELLE SCIENZE SOCIALI Distribuzioni statistiche multiple AA 2017/2018 1. Introduzione: il processo di rilevazione e le distribuzioni statistiche. 2.
DettagliDistribuzione Normale
Distribuzione Normale istogramma delle frequenze di un insieme di misure di una grandezza che può variare con continuità popolazione molto numerosa, costituita da una quantità praticamente illimitata di
DettagliEsame di Statistica (10 o 12 CFU) CLEF 11 febbraio 2016
Esame di Statistica 0 o CFU) CLEF febbraio 06 Esercizio Si considerino i seguenti dati, relativi a 00 clienti di una banca a cui è stato concesso un prestito, classificati per età e per esito dell operazione
Dettaglilezione 7 AA Paolo Brunori
AA 2016-2017 Paolo Brunori dove siamo arrivati? - se siamo interessati a studiare l andamento congiunto di due fenomeni economici - possiamo provare a misurare i due fenomeni e poi usare la lineare semplice
DettagliProva d'esame di Statistica I - Corso Prof.ssa S. Terzi
Prova d'esame di Statistica I - Corso Prof.ssa S. Terzi Esercizio 1 Data la variabile casuale X con funzione di densità f(x) = 2x, per 0 x 1; f(x) = 0 per x [0, 1], determinare: a) P( - 0,5 < X< 0,7) b)
DettagliAssociazione tra caratteri quantitativi: gli indici di correlazione
Associazione tra caratteri quantitativi: gli indici di correlazione Per correlazione si intende una relazione tra due variabili tale che a ciascun valore della prima variabile corrisponda con una certa
DettagliSTATISTICA (modulo I - Statistica Descrittiva) Soluzione Esercitazione I
2. e 3. STATISTICA (modulo I - Statistica Descrittiva) Soluzione Esercitazione I 1. Le unità statistiche sono costituite dai singoli ristoranti, mentre la popolazione è costituita da tutte le unità del
DettagliCognome e nome Tempo disponibile: 75 minuti
Corso di Laurea in Biotecnologia Statistica medica. A.A. 2010-2011 21 giugno 2011 Cognome e nome Tempo disponibile: 75 minuti 1. Immaginate di condurre uno studio sperimentale in cui si confronta l effetto
DettagliDISTRIBUZIONE NORMALE (1)
DISTRIBUZIONE NORMALE (1) Nella popolazione generale molte variabili presentano una distribuzione a forma di campana, bene caratterizzata da un punto di vista matematico, chiamata distribuzione normale
DettagliCorso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII
Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Un breve richiamo sul test t-student Siano A exp (a 1, a 2.a n ) e B exp (b 1, b 2.b m ) due set di dati i cui
DettagliINTRODUZIONE ALLA STATISTICA (parte 3)
1 / 1 INTRODUZIONE ALLA STATISTICA (parte 3) A.A.2017/2018 Calcolare le misure di variabilità 2 / 1 In sette città in Canada il 14 gennaio 2006 sono state registrate le seguenti temperature. 12 5 2 2 0
DettagliProblema 1. Cognome, Nome: Facoltà di Economia Statistica Esame 1-20/01/2010: A. Matricola: Corso:
Facoltà di Economia Statistica Esame 1-20/01/2010: A Cognome, Nome: Matricola: Corso: Problema 1. Su 10 imprese è stato rilevato l utile netto dell ultimo triennio espresso in milioni di euro. Il risultato
DettagliStatistica descrittiva in due variabili
1 / 69 Statistica descrittiva in due variabili Supponiamo di misurare su un campione statistico due diverse variabili X e Y. Indichiamo come al solito con X = (x 1,...,x N ) Y = (y 1,...,y N ) i valori
DettagliProblema 1. Cognome, Nome: Facoltà di Economia Statistica Esame 5-19/11/2009: A. Matricola: Corso:
Facoltà di Economia Statistica Esame 5-19/11/2009: A Cognome, Nome: Matricola: Corso: Problema 1. In un indagine di mercato tre tipologie di consumatori, A, B e C hanno espresso un giudizio di gradimento,
DettagliStatistica descrittiva in due variabili
Statistica descrittiva in due variabili 1 / 65 Statistica descrittiva in due variabili 1 / 65 Supponiamo di misurare su un campione statistico due diverse variabili X e Y. Indichiamo come al solito con
DettagliProva scritta di Statistica (10 CREDITI) II canale (Dott.ssa Conigliani) 16/06/2009
Prova scritta di Statistica (10 CREDITI) II canale (Dott.ssa Conigliani) 16/06/2009 COGNOME:......................................................... NOME:...............................................................
Dettagli1.1 Obiettivi della statistica Struttura del testo 2
Prefazione XV 1 Introduzione 1.1 Obiettivi della statistica 1 1.2 Struttura del testo 2 2 Distribuzioni di frequenza 2.1 Informazione statistica e rilevazione dei dati 5 2.2 Distribuzioni di frequenza
DettagliLa regressione lineare semplice
La regressione lineare semplice Il modello di regressione lineare semplice - 1 y = β 0 + βx + ε 10 8 Una retta nel piano Variabile Y 6 4 2 0 0 1 2 3 4 Variabile X 1 Il modello di regressione lineare semplice
DettagliStatistica Corso Base (Serale) Dott.ssa Cristina Mollica
Statistica Corso Base Serale Dott.ssa Cristina Mollica cristina.mollica@uniroma1.it Campionamento Esercizio 1. Da una ricerca si è osservato che il peso del prodotto A varia tra i e i 530 grammi. 1 Ipotizzando
DettagliMetodi statistici per la ricerca sociale Capitolo 7. Confronto tra Due Gruppi Esercitazione
Metodi statistici per la ricerca sociale Capitolo 7. Confronto tra Due Gruppi Esercitazione Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università degli Studi di Firenze
Dettagli