ESERCIZI 1) A fianco sono riportati i risultati di due rilevazioni quantitative su 10 elementi. Per questi dati si ha: 10
|
|
- Modesto Ruggiero
- 6 anni fa
- Visualizzazioni
Transcript
1 ESERCIZI 1) A fianco sono riportati i risultati di due rilevazioni quantitative su elementi. Per questi dati si ha: x i = 1 y i = 1 x y i = 1 i = 6514 i i = 1 i = 1 i = x y 2 i 2 i = = i = 1 a) Disegnare il grafico della distribuzione congiunta. b) Calcolare media di e di, la varianza di e Cov(,). c) Calcolare la retta di regressione di rispetto a e disegnarla sul sistema di assi dove è stata disegnata la distribuzione congiunta. a) Scatterplot of vs Scatterplot of vs b) Descriptive Statistics: Variable Mean Variance,0 5,878 Variable Mean 651,4 Covariances: ; 5, , ,0 Quindi Cov(,) = 97,0667 c)
2 Scatterplot of vs Qui sotto sono riportati i risultati della regressione effettuata con il software Minitab da cui sono stati cancellati (e indicati con xxx) alcuni valori. Predictor Coef SE Coef T P Constant xxx xxx xxx S = R-Sq = xxx% R-Sq(adj) = 72.7% Analysis of Variance Source DF SS MS F P Regression Residual Error Total Obs C1 C4 Fit SE Fit Residual St Resid xxx 8.15 xxx d) Calcolare l indice R 2 Regression Analysis: C4 versus C1 The regression equation is C4 = ,5 C1 Predictor Coef SE Coef T P Constant -60,4 1,5-0, 0,683 C1 16,514 3,302 5,00 0,001 S = 24,01 R-Sq = 75,8% R-Sq(adj) = 72,7% Analysis of Variance Source DF SS MS F P Regression ,02 0,001 Residual Error Total e) Calcolare il valore di approssimato e il residuo per la seconda unità sperimentale. Osservaz. C1 C4 Fit Residui 1,00,00 654,00 699,24 -,24 2,00,00 672,00 666,22 5,78 3,00,00 613,00,16 12,84
3 4,00,00 630,00 616,67 13,33 5,00,00 679,00 682,73-3,73 6,00,00 577,00,16-23,16 7,00,00 718,00 682,73 35,27 8,00,00 6,00 649,70-7,70 9,00,00 612,00 616,67-4,67,00,00 717,00 699,24 17,76 La precedente tabella è stata calcolata inserendo nella colonna Fit i valori della variabile risposta (C4) ottenuti con la formula della retta di regressione, ossia = -60,4 +16,514*B2 Ove B2 è il valore contenuto nella cella B2, ossia,00. Copiando tale formula si ottiene, per ogni valore di (contenuti nella colonna C1) io valore calcolato secondo il modello di regressione di. Nella colonna dei residui si è semplicemente eseguita la sottrazione tra il valore di reale (colonna C4) e il valore di y calcolato (colonna Fit). Il valore di calcolato e il residuo per la seconda unità sperimentale, ossia per,0 sono, rispettivamente, 666,22 e 5,78. f) Disegnare il grafico dei residui e valutare la bontà del modello. Con excel, basta riportare in ascisse il fitted value (ossia i valori calcolati con il modello) e in ordinate i residui, ottenendo:,00 30,00 20,00,00 0,00 -,00 550,00,00 650,00,00 750,00-20,00-30,00 -,00-50,00 Serie1 C è una certa simmetria e quindi il modello può essere considerato, a una prima analisi buono. Con Minitab ho fratto uno scatterplot dei residui verso Fit, ottenendo la stessa cosa.
4 Scatterplot of Residui vs Fit Residui Fit 2) Si considerano, per due specie di pesci, il peso, la lunghezza, la larghezza e l'altezza e si vuole stabilire se il peso è esprimibile come funzione lineare delle altre variabili. Qui sotto sono riportati i grafici dei residui della regressione lineare per le due specie. Commentare i due grafici e stabilire - tramite essi - se il peso delle due specie di pesci è esprimibile come funzione lineare della lunghezza, larghezza e altezza. Nel primo caso sembra che le cose non funzionino. Il grafico dei residui è ben lontano d presentare una simmetria accettabile rispetto all asse delle x. Nel secondo caso le cose sembrano funzionare un po meglio. Quindi la risposta che suggerisce un esame grafico dei dati (del grafico dei residui) è che il peso sia esprimibile come funzione lineare delle altre variabili solo per la seconda specie di pesci e non certo per la prima. 3) Si vuole studiare se una variabile, indicata con, possa avere una dipendenza lineare da 3 variabili esplicative, indicate con 1, 2 e 3. Si effettua una regressione lineare su 0 osservazioni campionarie considerando un modello con costante e con variabili esplicative 1, 2 e 3 ; i risultati sono i seguenti:
5 The regression equation is = Predictor Coef SE Coef T P Constant S = R-Sq = 98.9% R-Sq(adj) = 98.9% Residual Residuals Versus the Fitted Values (response is ) Fitted Value Sulla base di tutte le informazioni precedenti si può dedurre che il modello scelto è buono? Perché? Il grafico dei residui, non certo simmetrico rispetto all asse x, suggerisce che tale modello non sia un buon modello. Il valore di R 2 vicino a 1 potrebbe far pensare a una buona correlazione lineare, ma il grafico dei residui suggerisce che non sia così. Inserisco qui di seguito le risposte date da 5 studenti con le mie eventuali osservazioni in rosso Esercizi della scheda 5 Matteo Peluffo Esercizio numero 1 A Il grafico della distribuzione congiunta delle variabili x e y è il seguente: Scatterplot of vs
6 B La media di è,0, quella di 651,4,mentre la varianza di è 5,878 e la covarianza fra e 97,0667. C La retta di regressione ha equazione = ,5 Scatterplot of vs D L indice R 2 ha valore 75,8%. E Il valore di y, calcolato con l equazione dell esercizio C è e il residuo è 5,. F Il grafico dei residui è il seguente. Il modello è abbastanza buono, visto anche R 2 è quasi 75 % e che la distribuzione è abbastanza omogenea a parte una coppia di dati che appare un po fuori dalla nuvola delle altre coppie. Residuals Versus the Fitted Values (response is ) Residual Fitted Value Esercizio numero 2 Nel grafico dei residui a sinistra la dipendenza fra le variabili non appare certamente lineare perché la nuvola dai dati è disposta in modo da assomigliare molto più a una parabola e a una distribuzione omogenea (volevi dire e non a una distribuzione omogenea?); in quello a destra invece la dipendenza fra le variabili può essere di tipo lineare perché la nuvola dei dati è abbastanza omogenea e i residui abbastanza vicini allo 0, anche se non vicinissimi; per questo non escludo che esista fra le variabili una altro tipo di relazione, diversa da quella lineare, che meglio approssimi i dati.
7 Esercizio numero 3 A mio avviso le informazioni sono contraddittorie perché viene dato un valore di R 2 molto alto (98,9%), il che farebbe pensare a una reale dipendenza lineare (come ipotizzato nella consegna dell esercizio), visto che nella scheda vi è scritto se R 2 è alto i residui sono bassi (pagina 3 della scheda 5) e dunque a una effettiva correttezza del modello (il grafico dei residui mi aspetterei che fosse una nuvola omogenea con i dati vicini a 0); invece nel grafico dei residui si nota una fortissima dipendenza quadratica fra le variabili, il che presupporrebbe un valore di R 2 piuttosto basso, visto che è stata fatta l ipotesi di un modello lineare. Esercizi scheda 5 (Regressione lineare) Luigi Mandraccio 1) Il diagramma di dispersione bidimensionale, o scatterplot, è il seguente Scatterplot of vs La funzione di regressione è = ,5 come da output di Minitab. La media di è,1 e la sua varianza vale 5,878; mentre la media di è 651,4 (varianza=2115,6). Cov(,)=97,0667. Il grafico dei residui
8 Residuals Versus the Fitted Values (response is ) Residual Fitted Value Residuals Versus the Order of the Data (response is ) Residual Observation Order Il modello usato è lineare, e in genere questo viene considerato il peggiore dei modelli possibili, ma in questo caso non c'è da sfoderare grande fantasia, la retta sembra approssimare bene i dati in nostro possesso come evidenzia anche il grafico dei residui. Certamente è migliore rispetto a un modello quadratico (attento, perché stai contraddicendo quanto detto prima: se davvero il modello lineare dovesse essere sempre considerato il modello peggiore, e sono d accordo con l uso delle virgolette, allora un
9 qualunque altro modello, per esempio quello quadratico, dovrebbe essere meno peggio!). Probabilmente una funzione complessa potrebbe avvicinarsi ancora maggiormente, ma forse si perderebbe la comprensione; inoltre, in mancanza di maggiori informazioni sui dati, non possiamo nemmeno determinare a priori un modello teorico adattabile. Accontentiamoci di una bella (e semplice) retta. Mancano le risposte alle domande d) e) f). Vedi quelle di Matteo e le mie. 2) In questo caso, senza dati, la valutazione non è immediata. Nel grafico di sinistra possiamo osservare che i punti, rappresentanti dei vari dati, non sono posizionati in modo simmetrico rispetto alla linea orizzontale in 0; a dire il vero non accadrà mai, o quasi, di trovare dai completamente simmetrici, ma noi sappiamo che più lo sono e maggiore è la bontà del modello. È per questo che nel primo caso direi che non ci può essere una correlazione tra le variabili espresse dal testo. Passando al caso di destra, una funzione lineare che leghi peso, lunghezza, larghezza e altezza è già più fattibile, perché sono rispettate, seppur a grandi linee, le condizioni di cui sopra; gli stacchi dei dati sono pochissime, ne conto due o al massimo tre. 3) Non sono affatto sicuro della mia valutazione, e vorrei parlarne un attimo a voce per alcune precisazioni. A parte questo, i rilevamenti R-Sq=98,9% e R-Sq(adj)=98,9% e la forma del grafico dei residui, meglio la posizione dei pallini, mi portano a dire che il modello scelto sembra funzionare. Guarda la risposta di Matteo e la mia; poi ne possiamo parlare anche a voce. Esercizi scheda 5 Marco Lentini PRIMO (C1=, C2=) a) Scatterplot of C1 vs C2 C1 C2 b) : Mean Variance : Covariances: ;
10 c) 47 Scatterplot of C1 vs C2 C1 39 C2 d)mancano le risposte a d), e) f). Vedi quelle di Matteo e le mie. e) f) SECONDO Etrambi i grafici mi sembrano non omogenei : nel primo si può vedere come la nuvola di punti e concentrata tra 0 e -0 ; nel secondo invece vi e una situazione più omogenea rispetto al primo ma non uniforme (sempre rispetto a Res=0). A mio avviso nel primo e possibile stabilire una funzione lineare mentre nel secondo grafico no. O ti sei confuso, oppure non hai capito le informazioni che offrono i residui. Ti consiglio di leggere le risposte di Matteo e le mie e di riguardare la parte della scheda 5 relativa ai residui. TERZO Il modello scelto sembra corretto per ciò che riguarda il grafico dei residui. Si può notare una concentrazione di dati nell intervallo , Questa risposta sembra confermare che tu non abbia capito la parte della scheda 5 relativa alle informazioni fornite dal grafico dei residui. Scheda 5 Luca Nucifora Es. 1 Distribuzione congiunta di y e x
11 Scatterplot of y vs x y x Mean of x =,1 Mean of y = 651,4 Variance = 5,878 Covariance = 97,0667 Fitted Line Plot y = - 60,4 + 16,51 x S 24,01 R-Sq 75,8% R-Sq(adj) 72,7% y x x y y approx residui ,06 -, ,04 5,96 613,00 13, ,51 13,49
12 ,55-3,55 577,00-23, ,55 35, 6 649,53-7, ,51-4, ,06 17,94 Residuals Versus the Fitted Values (response is y) Residual Fitted Value Es. 2 In nessuno dei due: nel primo l approssimazione possibile è di secondo grado nella seconda il comportamento non può avere nessuna approssimazione Ne sei così sicuro? Guarda la mia rispsta, quella di Matteo e la parte della scheda 5 relativa alle informazioni che offrono i residui. Es. 3 Sì Perché il coefficiente R-sq è vicino al 0% Ne sei così sicuro? Guarda la mia rispsta, quella di Matteo e la parte della scheda 5 relativa alle informazioni che offrono i residui. 1) IVD SCHEDA 5 Andrea Martinelli
13 Scatterplot of y vs x y x a) b) 1 n 1 1 Si ricorda che x = xi, perciò avremo che: x = (1) =,1 e y = ( 6514) = 651, 4. n i = 1 Poiché la varianza può anche essere espressa come differenza fra la media dei dati al quadrato e la n media al quadrato, avremo: σ = xi x 1857,61 5,29 n = =. i= 1 Allo stesso modo è possibile scrivere la covarianza come la differenza fra la media del prodotto dei n dati ed il prodotto delle medie: Cov (, ) = xiyi xy ( 651, 4,1) 87,36 n = = i = 1 c) Retta di regressione di y rispetto a x. Poiché Cov(, ) 87,36 = 2 ( x) + y = ( x,1) + 651, 4 = 16.51x σ x 5, 29 d)
14 Scatterplot of y vs x y x d-e-f) Regression Analysis: y versus x The regression equation is y = ,5 x Predictor Coef SE Coef T P Constant -60,4 1,5-0, 0,683 x 16,514 3,302 5,00 0,001 S = 24,01 R-Sq = 75,8% R-Sq(adj) = 72,7% Analysis of Variance Source DF SS MS F P Regression ,02 0,001 Residual Error Total Obs x y Fit SE Fit Residual St Resid 1,0 654,00 699,29 12,22 -,29-2,19R 2,0 672,00 666,26 8,15 5,74 0,25 3,0 613,00,21 12,75 12,79 0,63 4,0 630,00 616,72,28 13,28 0,61 5,0 679,00 682,78 9,85-3,78-0,17 6,0 577,00,21 12,75-23,21-1,14 7,0 718,00 682,78 9,85 35,22 1,61 8,0 6,00 649,75 7,60-7,75-0,34 9,0 612,00 616,72,28-4,72-0,22,0 717,00 699,29 12,22 17,71 0,86 R denotes an observation with a large standardized residual.
15 NB: Per calcolare il valore di R 2 manualmente avrei potuto calcolare il quadrato del 2 Cov(, y) 2 coefficiente di correlazione, cioè: = R. σσ x y Per determinare invece il residuo sarebbe stato sufficiente fare: (16.51* () )- 672=residuo dove e 672 è la coppia di valori in questione. Residuals Versus the Fitted Values (response is y) Residual Fitted Value Il grafico dei residui è piuttosto omogeneo: la regressione lineare è quindi un buon modello per lo studio di queste due variabili. 2) Dai grafici dei residui si evince chiaramente che solo per la seconda specie di pesci (quella rappresentata nel grafico di destra) la regressione lineare è un modello utile allo studio del peso in funzione delle altre variabili: infatti il grafico dei residui della regressione lineare è più omogeneo. 3) Secondo me il modello proposto è buono perché, pur non avendo un grafico dei residui omogeneo, il coefficiente R 2 è molto prossimo al 0% (e quindi a 1). Infatti, più il coefficiente R 2 è prossimo a 1 migliore è l approssimazione del modello lineare. A mio avviso bisogna fare attenzione: potrei pensare a una funzione sulla quale stanno tutti i dati non lineare e nemmeno polinomiale tale che R 2 sia molto, molto vicino a 1, ma il grafico dei residui risulti piuttosto disomogeneo. Ciò dovrebbe far dubitare della bontà del modello. Magari chiediamo lumi anche agli esperti che ci seguono.
16
STATISTICA DESCRITTIVA SCHEDA N. 5: REGRESSIONE LINEARE
STATISTICA DESCRITTIVA SCHEDA N. : REGRESSIONE LINEARE Nella Scheda precedente abbiamo visto che il coefficiente di correlazione fra due variabili quantitative X e Y fornisce informazioni sull esistenza
DettagliMETODO DEI MINIMI QUADRATI
METODO DEI MINIMI QUADRATI Torniamo al problema della crescita della radice di mais in funzione del contenuto di saccarosio nel terreno di coltura. Ripetendo varie volte l esperimento con diverse quantità
DettagliEsercitazione del
Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36
DettagliMETODO DEI MINIMI QUADRATI
Vogliamo determinare una funzione lineare che meglio approssima i nostri dati sperimentali e poter decidere sulla bontà di questa approssimazione. Sia f(x) = mx + q, la coppia di dati (x i, y i ) appartiene
DettagliData Mining. Prova parziale del 20 aprile 2017: SOLUZIONE
Università degli Studi di Padova Corso di Laurea Magistrale in Informatica a.a. 2016/2017 Data Mining Docente: Annamaria Guolo Prova parziale del 20 aprile 2017: SOLUZIONE ISTRUZIONI: La durata della prova
DettagliStima dei parametri di modelli lineari
Stima dei parametri di modelli lineari Indice Introduzione................................ 1 Il caso studio................................ 2 Stima dei parametri............................ 3 Bontà delle
DettagliESERCIZI. Regressione lineare semplice CAPITOLO 12 Levine, Krehbiel, Berenson, Statistica II ed., 2006 Apogeo
Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università di Padova Docenti: Prof. L. Salmaso, Dott. L. Corain ESERCIZI Regressione lineare semplice
Dettagli0.1 Percorrenza e Cilindrata
0.1 Percorrenza e Cilindrata Iniziamo ora un analisi leggermente più complessa basata sempre sui concetti appena introdotti. Innanzi tutto possiamo osservare, dal grafico ottenuto con il comando pairs,
DettagliREGRESSIONE E CORRELAZIONE
REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.
DettagliLezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo
UIVERSITA DEGLI STUDI DI BASILICATA FACOLTA DI ECOOMIA Corso di laurea in Economia Aziendale anno accademico 2012/2013 Lezioni di Statistica del 15 e 18 aprile 2013 Docente: Massimo Cristallo LA RELAZIOE
DettagliIl modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)
Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Quesito: Posso stimare il numero di ore passate a studiare statistica sul voto conseguito all esame? Potrei calcolare il coefficiente di correlazione.
DettagliStatistica descrittiva in due variabili
Statistica descrittiva in due variabili 1 / 65 Statistica descrittiva in due variabili 1 / 65 Supponiamo di misurare su un campione statistico due diverse variabili X e Y. Indichiamo come al solito con
DettagliEsercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale)
Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale) Esercizio 1: Un indagine su 10.000 famiglie ha dato luogo, fra le altre, alle osservazioni riportate nella
DettagliLa regressione lineare. Rappresentazione analitica delle distribuzioni
La regressione lineare Rappresentazione analitica delle distribuzioni Richiamiamo il concetto di dipendenza tra le distribuzioni di due caratteri X e Y. Ricordiamo che abbiamo definito dipendenza perfetta
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative
DettagliDispensa di Statistica
Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza
DettagliEsercizi di statistica
Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri
DettagliSTATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE
STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 2 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1.1
DettagliLa media e la mediana sono indicatori di centralità, che indicano un centro dei dati.
La media e la mediana sono indicatori di centralità, che indicano un centro dei dati. Un indicatore che sintetizza in un unico numero tutti i dati, nascondendo quindi la molteplicità dei dati. Per esempio,
DettagliLezione 6 Richiami di Geometria Analitica
1 Piano cartesiano Lezione 6 Richiami di Geometria Analitica Consideriamo nel piano due rette perpendicolari che si intersecano in un punto O Consideriamo ciascuna di queste rette come retta orientata
DettagliAssociazione tra caratteri quantitativi: gli indici di correlazione
Associazione tra caratteri quantitativi: gli indici di correlazione Per correlazione si intende una relazione tra due variabili tale che a ciascun valore della prima variabile corrisponda con una certa
DettagliStatistica a lungo termine: calcolo dell onda di progetto
Esercitazione Statistica a lungo termine: calcolo dell onda di progetto Sulla base delle misure ondametriche effettuate dalla boa di Ponza si calcoli, utilizzando la distribuzione di probabilità di Gumbel,
DettagliRICHIAMI DI STATISTICA DESCRITTIVA E DI INFERENZA: LA VERIFICA DI IPOTESI: TEST BASATI SU UN CAMPIONE
RICHIAMI DI STATISTICA DESCRITTIVA E DI INFERENZA: LA VERIFICA DI IPOTESI: TEST BASATI SU UN CAMPIONE 1 La verifica di ipotesi Finora abbiamo visto come si utilizza una statistica campionaria per stimare
DettagliEsercizi Svolti. 2. Costruire la distribuzione delle frequenze cumulate del tempo di attesa
Esercizi Svolti Esercizio 1 Per una certa linea urbana di autobus sono state effettuate una serie di rilevazioni sui tempi di attesa ad una determinata fermata; la corrispondente distribuzione di frequenza
DettagliCORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Misura dell associazione tra due caratteri Uno store manager è interessato a studiare la relazione
DettagliCORSO DI MATEMATICA E LABORATORIO ESERCIZI ASSEGNATI NELL A.A. 2016/17
CORSO DI MATEMATICA E LABORATORIO ESERCIZI ASSEGNATI NELL A.A. 26/7 GABRIELE BIANCHI Gli esercizi che seguono sono quelli che assegnerò durante il corso 26/7. Tutti gli esercizi presenti in un compito
DettagliStatistica Applicata all edilizia: il modello di regressione
Statistica Applicata all edilizia: il modello di regressione E-mail: orietta.nicolis@unibg.it 27 aprile 2009 Indice Il modello di Regressione Lineare 1 Il modello di Regressione Lineare Analisi di regressione
DettagliRegressione e Correlazione (cap. 11) Importazione dati da file di testo
Regressione e Correlazione (cap. 11) Importazione dati da file di testo Introduzione Nella statistica applicata si osserva la relazione (dipendenza) tra due o più grandezze. Esigenza: determinare una funzione
DettagliΣ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica
13. Regressione lineare parametrica Esistono numerose occasioni nelle quali quello che interessa è ricostruire la relazione di funzione che lega due variabili, la variabile y (variabile dipendente, in
DettagliSTATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo
STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)
DettagliApplicazioni sulle caratteristiche bidimensionali
Applicazioni sulle caratteristiche bidimensionali 89 Applicazioni sulle caratteristiche bidimensionali 5.1 Richiamo di alcune operazioni di analisi statistica in MINITAB In questo paragrafo sono riportati
Dettaglitabelle grafici misure di
Statistica Descrittiva descrivere e riassumere un insieme di dati in maniera ordinata tabelle grafici misure di posizione dispersione associazione Misure di posizione Forniscono indicazioni sull ordine
DettagliE la rappresentazione grafica, in questo caso, è la dispersione x,y, cioè una nuvola di punti nel piano cartesiano
Capitolo uno STATISTICA DESCRITTIVA BIVARIATA La statistica bidimensionale o bivariata si occupa dello studio del grado di dipendenza di due caratteri distinti della stessa unità statistica. E possibile,
DettagliUNITÀ DIDATTICA 5 LA RETTA
UNITÀ DIDATTICA 5 LA RETTA 5.1 - La retta Equazione generica della retta Dalle considerazioni emerse nel precedente capitolo abbiamo compreso come una funzione possa essere rappresentata da un insieme
DettagliINTERPOLAZIONE. Introduzione
Introduzione INTERPOLAZIONE Quando ci si propone di indagare sperimentalmente la legge di un fenomeno, nel quale intervengono due grandezze x, y simultaneamente variabili, e una dipendente dall altra,
Dettaglilezione 7 AA Paolo Brunori
AA 2016-2017 Paolo Brunori dove siamo arrivati? - se siamo interessati a studiare l andamento congiunto di due fenomeni economici - possiamo provare a misurare i due fenomeni e poi usare la lineare semplice
DettagliR - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre
R - Esercitazione 6 Andrea Fasulo fasulo.andrea@yahoo.it Università Roma Tre Venerdì 22 Dicembre 2017 Il modello di regressione lineare semplice (I) Esempi tratti da: Stock, Watson Introduzione all econometria
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@unina.it Università degli studi di Cassino () Statistica 1 / 1 Outline 1 () Statistica 2 / 1 Outline 1 2 () Statistica 2 / 1 Outline 1 2 3 () Statistica 2 / 1
DettagliUniversità di Padova
Università di Padova Dipartimento di Tecnica e Gestione dei sistemi industriali Corso di Laurea Specialistica in Ingegneria Civile Elaborato di analisi statistica a.a. 5-6 Prof. L. Salmaso Dott. L. Corain
DettagliLa variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali
Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Introduzione [1/2] Gli indici di variabilità consentono di riassumere le principali caratteristiche di una distribuzione (assieme alle medie) Le
DettagliCapitolo 12. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 12.1: Suggerimento
Capitolo Suggerimenti agli esercizi a cura di Elena Siletti Esercizio.: Suggerimento Per verificare se due fenomeni sono dipendenti in media sarebbe necessario confrontare le medie condizionate, in questo
DettagliL A B C di R. Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010
L A B C di R 0 20 40 60 80 100 2 3 4 5 6 7 8 Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010 La scelta del test statistico giusto La scelta della analisi
DettagliLO STUDIO DI FUNZIONE ESERCIZI CON SOLUZIONI
Autore: Enrico Manfucci - 6/05/0 LO STUDIO DI FUNZIONE ESERCIZI CON SOLUZIONI PREMESSA Per Studio di funzione si intende disegnare il grafico di una funzione data la sua espressione analitica. Questo significa
DettagliUniversità del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica
Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Regressione Lineare e Correlazione Argomenti della lezione Determinismo e variabilità Correlazione Regressione Lineare
DettagliSTATISTICA (modulo I - Statistica Descrittiva) Soluzione Esercitazione I
2. e 3. STATISTICA (modulo I - Statistica Descrittiva) Soluzione Esercitazione I 1. Le unità statistiche sono costituite dai singoli ristoranti, mentre la popolazione è costituita da tutte le unità del
DettagliESAME. 9 Gennaio 2017 COMPITO B
ESAME 9 Gennaio 2017 COMPITO B Cognome Nome Numero di matricola 1) Approssimare tutti i calcoli alla quarta cifra decimale. 2) Ai fini della valutazione si terrà conto solo ed esclusivamente di quanto
DettagliSCHEDA DIDATTICA N 7
FACOLTA DI INGEGNERIA CORSO DI LAUREA IN INGEGNERIA CIVILE CORSO DI IDROLOGIA PROF. PASQUALE VERSACE SCHEDA DIDATTICA N 7 LA DISTRIBUZIONE NORMALE A.A. 01-13 La distribuzione NORMALE Uno dei più importanti
DettagliLab. 2 - Excel. Prof. De Michele e Farina
Lab. 2 - Excel Prof. De Michele e Farina 1 Utilizzo avanzato di un foglio elettronico: - Utilizzo di funzioni Regressioni lineari Istogrammi 2 La funzione somma restituisce la somma dei valori dei propri
DettagliRegressione Lineare Semplice e Correlazione
Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)
DettagliUNIVERSITÀ DEGLI STUDI DI ROMA LA SAPIENZA
UNIVERSITÀ DEGLI STUDI DI ROMA LA SAPIENZA - 9.Statistica - CTF Matematica - Seconda Parte Codice Compito: - Numero d Ordine D. 1 Un veicolo marcia per 50 km alla velocita v, e per altri 50 km alla velocita
DettagliStatistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill
Statistica - metodologie per le scienze economiche e sociali /e S Borra, A Di Ciaccio - McGraw Hill Es 6 Soluzione degli esercizi del capitolo 6 In base agli arrotondamenti effettuati nei calcoli, si possono
DettagliDistribuzione normale
Distribuzione normale istogramma delle frequenze di un insieme di misure relative a una grandezza che varia con continuità popolazione molto numerosa, costituita da una quantità praticamente illimitata
DettagliStatistica Descrittiva Soluzioni 7. Interpolazione: minimi quadrati
ISTITUZIONI DI STATISTICA A. A. 2007/2008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona
DettagliIntervallo di fiducia del coefficiente angolare e dell intercetta L intervallo di fiducia del coefficiente angolare (b 1 ) è dato da:
Analisi chimica strumentale Intervallo di fiducia del coefficiente angolare e dell intercetta L intervallo di fiducia del coefficiente angolare (b 1 ) è dato da: (31.4) dove s y è la varianza dei valori
DettagliStatistica descrittiva: misure di associazione
Statistica descrittiva: misure di associazione L analisi di regressione permette di esplorare le relazioni tra due insiemi di valori (p.e. i valori di due attributi di un campione) alla ricerca di associazioni.
DettagliEsercizi di Ricapitolazione
Esercizio 1. Sono dati 150g di una soluzione S 1 concentrata al 12%. (a) Determinare quanti grammi di soluto occorre aggiungere a S 1 per ottenere una nuova soluzione S 2 concentrata al 20%. (b) Determinare
Dettagli1 4 Esempio 2. Si determini la distribuzione di probabilità della variabile casuale X = punteggio ottenuto lanciando un dado. Si ha immediatamente:
CAPITOLO TERZO VARIABILI CASUALI. Le variabili casuali e la loro distribuzione di probabilità In molte situazioni, dato uno spazio di probabilità S, si è interessati non tanto agli eventi elementari (o
DettagliBLAND-ALTMAN PLOT. + X 2i 2 la differenza ( d ) tra le due misure per ognuno degli n campioni; d i. X i. = X 1i. X 2i
BLAND-ALTMAN PLOT Il metodo di J. M. Bland e D. G. Altman è finalizzato alla verifica se due tecniche di misura sono comparabili. Resta da comprendere cosa si intenda con il termine metodi comparabili
DettagliCognome e Nome:... Corso di laurea:...
Statistica - corso base Prof. B. Liseo Prova di esame dell 8 gennaio 201 Cognome e Nome:................................................................... Corso di laurea:.......................................................................
DettagliSCOPO DELL ANALISI DI CORRELAZIONE
CORRELAZIONE 1 SCOPO DELL ANALISI DI CORRELAZIONE STUDIARE LA RELAZIONE TRA DUE VARIABILI X E Y 2 diagrammi di dispersione un diagramma di dispersione (o grafico di dispersione) èuna rappresentazione grafica
DettagliFacoltà di ECONOMIA Università di Pavia 20 Aprile 2004 Prova scritta di Analisi dei dati MODALITÀ A
MODALITÀ A Riportare sul foglio nome, cognome, numero di matricola e modalità del testo d esame. Problema 1 (8 PUNTI) Su un collettivo di 10 clienti iscritti al programma frequent flyer di una nota compagnia
Dettagli12) Metodo dei minimi quadrati e linea di tendenza
12) Metodo dei minimi quadrati e linea di tendenza 43 Si supponga di avere una tabella di dati {y exp i} i=1,,n in funzione di altri dati {x i } i=1,,n che siano il risultato di una qualche misura sperimentale.
DettagliRegressione lineare semplice
Regressione lineare semplice Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Statistica con due variabili var. nominale, var. nominale: gruppo sanguigno - cancro
DettagliCovarianza, correlazione e retta di regressione. Paola Lecca, CIBIO UNITN Corso di Matematica e Statistica 2
Covarianza, correlazione e retta di regressione Paola Lecca, CIBIO UNITN Corso di Matematica e Statistica 2 Questa presentazione è stata preparata attingendo dai seguenti testi S. M. Iacus, Statistica,
DettagliIl metodo dei minimi quadrati. Molto spesso due grandezze fisiche x e y, misurabili direttamente, sono legate tra loro da una legge del tipo:
Il metodo dei minimi quadrati Molto spesso due grandezze fisiche x e y, misurabili direttamente, sono legate tra loro da una legge del tipo: Dove A e B sono costanti y = A + Bx (ad esempio in un moto uniformemente
DettagliSTATISTICA DESCRITTIVA (variabili quantitative)
STATISTICA DESCRITTIVA (variabili quantitative) PRIMO ESEMPIO: Concentrazione di un elemento chimico in una roccia. File di lavoro di STATVIEW Cliccando sul tasto del pane control si ottiene il cosiddetto
DettagliStatistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1
Statistica Capitolo 1 Regressione Lineare Semplice Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Spiegare il significato del coefficiente di correlazione lineare
DettagliQuaderno per il recupero del debito MATEMATICA ANNO SCOLASTICO 2016/2017 Prof.ssa Migliaccio Gabriella CLASSE III
Quaderno per il recupero del debito MATEMATICA ANNO SCOLASTICO 016/017 Prof.ssa Migliaccio Gabriella CLASSE III Gli esercizi vanno svolti e consegnati, anche su un quaderno, il giorno dell esame per il
DettagliLaboratorio di Statistica 1 con R Esercizi per la Relazione. I testi e/o i dati degli esercizi contassegnati da sono tratti dai libri consigliati
Laboratorio di Statistica 1 con R Esercizi per la Relazione I testi e/o i dati degli esercizi contassegnati da sono tratti dai libri consigliati nel corso. Esercizio 1. 1. Facendo uso dei comandi
DettagliCorso di Laurea in Economia Aziendale. Docente: Marta Nai Ruscone. Statistica
Corso di Laurea in Economia Aziendale Docente: Marta Nai Ruscone Statistica a.a. 2015/2016 1 Lezione 3 1) Grafico a dispersione 2) La correlazione lineare -la covarianza funzione di excel: covarianza()
DettagliSTATISTICA 1 ESERCITAZIONE 6
STATISTICA 1 ESERCITAZIONE 6 Dott. Giuseppe Pandolfo 5 Novembre 013 CONCENTRAZIONE Osservando l ammontare di un carattere quantitativo trasferibile su un collettivo statistico può essere interessante sapere
DettagliMATEMATICA CORSO A II COMPITINO (Tema 1) 5 Aprile 2013
MATEMATICA CORSO A II COMPITINO (Tema 1) 5 Aprile 2013 Soluzioni 1. Due sperimentatori hanno rilevato rispettivamente 25 e 5 misure di una certa grandezza lineare e calcolato le medie che sono risultate
DettagliIl processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni
La statistica inferenziale Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni E necessario però anche aggiungere con
DettagliCAPITOLO 5 Introduzione ai piani fattoriali
Douglas C. Montgomery Progettazione e analisi degli esperimenti 2006 McGraw-Hill CAPITOLO 5 Introduzione ai piani fattoriali Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria
DettagliPIANO CARTESIANO e RETTE classi 2 A/D 2009/2010
PIANO CARTESIANO e RETTE classi 2 A/D 2009/2010 1) PIANO CARTESIANO serve per indicare, identificare, chiamare... ogni PUNTO del piano (ente geometrico) con una coppia di valori numerici (detti COORDINATE).
DettagliAnalisi grafica residui in R. Da output grafico analisi regressionelm1.csv Vedi dispensa. peso-statura
Analisi grafica residui in R Da output grafico analisi regressionelm1.csv Vedi dispensa peso-statura 1) Il plot in alto a sinistra mostra gli errori residui contro i loro valori stimati. I residui devono
DettagliCorso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010.
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010 Statistica Esercitazione 4 12 maggio 2010 Dipendenza in media. Covarianza e
DettagliESERCITAZIONE IV - Soluzioni
umero di omicidi ESERCITAZIOE IV - Soluzioni Esercizio I. a),00 12,00 10,00 8,00 6,00 4,00 2,00 0,00 0 5 10 15 20 25 Popolazione povera (%) b) Poiché i due caratteri in analisi sono quantitativi per calcolare
DettagliL errore percentuale di una misura è l errore relativo moltiplicato per 100 ed espresso in percentuale. Si indica con e p e risulta: e ( e 100)%
UNITÀ L ELBORZIONE DEI DTI IN FISIC 1. Gli errori di misura.. Errori di sensibilità, errori casuali, errori sistematici. 3. La stima dell errore. 4. La media, la semidispersione e lo scarto quadratico
DettagliDefinizioni basilari di funzione.
Definizioni basilari di funzione. Una funzione per definizione e' una legge che ad ogni elemento di un insieme ( detto dominio ed indicato con D) associa un unico elemento di un secondo insieme (il codominio)
DettagliEsercitazioni di statistica
Esercitazioni di statistica Misure di associazione: Indipendenza assoluta e in media Stefania Spina Universitá di Napoli Federico II stefania.spina@unina.it 22 ottobre 2014 Stefania Spina Esercitazioni
Dettagli1 Polinomio di Taylor 1. 2 Formula di Taylor 2. 3 Alcuni sviluppi notevoli 2. 4 Uso della formula di Taylor nel calcolo dei limiti 4
1 POLINOMIO DI TAYLOR 1 Formula di Taylor Indice 1 Polinomio di Taylor 1 Formula di Taylor 3 Alcuni sviluppi notevoli 4 Uso della formula di Taylor nel calcolo dei iti 4 5 Soluzioni degli esercizi 6 La
DettagliSIMULAZIONE - 29 APRILE QUESITI
www.matefilia.it SIMULAZIONE - 29 APRILE 206 - QUESITI Q Determinare il volume del solido generato dalla rotazione attorno alla retta di equazione y= della regione di piano delimitata dalla curva di equazione
DettagliTest per la correlazione lineare
10 Test per la correlazione lineare Istituzioni di Matematica e Statistica 2015/16 E. Priola 1 Introduzione alla correlazione lineare Problema: In base ai dati che abbiamo possiamo dire che c è una qualche
Dettagli3) Vengono di nuovo ripetute le misure del punto 2 e i risultati sono s, s, s, s, s, s, s, 96.
Problema A Un pendolo e costituito da una massa di dimensioni trascurabili appesa a un filo considerato in estensibile, di massa trascurabile, lunghezza L, e fissato a un estremo. L Il periodo di oscillazione
DettagliArgomento 7. Studio di funzione
Argomento 7 Studio di funzione Studiare una funzione significa ottenere, mediante strumenti analitici (iti, derivate, ecc.) informazioni utili a disegnare un grafico qualitativo della funzione data. I
DettagliLezione n. 1 (a cura di Irene Tibidò)
Lezione n. 1 (a cura di Irene Tibidò) Richiami di statistica Variabile aleatoria (casuale) Dato uno spazio campionario Ω che contiene tutti i possibili esiti di un esperimento casuale, la variabile aleatoria
DettagliAnalisi della regressione multipla
Analisi della regressione multipla y = β 0 + β 1 x 1 + β 2 x 2 +... β k x k + u 2. Inferenza Assunzione del Modello Classico di Regressione Lineare (CLM) Sappiamo che, date le assunzioni Gauss- Markov,
Dettagli3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17
C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica
DettagliLA DISTRIBUZIONE NORMALE (Vittorio Colagrande)
LA DISTRIBUZIONE NORMALE (Vittorio Colagrande) Allo scopo di interpolare un istogramma di un carattere statistico X con una funzione continua (di densità), si può far ricorso nell analisi statistica alla
DettagliCapitolo 6. La distribuzione normale
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 6 La distribuzione normale Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università
DettagliDISTRIBUZIONE NORMALE (1)
DISTRIBUZIONE NORMALE (1) Nella popolazione generale molte variabili presentano una distribuzione a forma di campana, bene caratterizzata da un punto di vista matematico, chiamata distribuzione normale
DettagliStatistica di base per l analisi socio-economica
Laurea Magistrale in Management e comunicazione d impresa Statistica di base per l analisi socio-economica Giovanni Di Bartolomeo gdibartolomeo@unite.it Definizioni di base Una popolazione è l insieme
DettagliPiano cartesiano e Retta
Piano cartesiano e Retta 1 Piano cartesiano e Retta 1. Richiami sul piano cartesiano 2. Richiami sulla distanza tra due punti 3. Richiami punto medio di un segmento 4. La Retta (funzione lineare) 5. L
DettagliCapitolo 6 La distribuzione normale
Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 6 La distribuzione normale Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università
DettagliEsercizio 2: voto e ore dedicate allo studio
La seguente tabella riporta il voto riportato da 10 studenti all esame di Statistica Sociale e il numero di ore di lezione non seguite dallo studente (il corso prevede 30 ore di lezione). Ci si chiede
DettagliUNIVERSITÀ di ROMA TOR VERGATA
UNIVERSITÀ di ROMA TOR VERGATA Corso di Statistica, anno 2010-11 P.Baldi Lista di esercizi 3. Corso di Laurea in Biotecnologie Esercizio 1 Una v.a. X segue una legge N(2, ). Calcolare a1) P(X 1) a2) P(2
Dettagli05. Errore campionario e numerosità campionaria
Statistica per le ricerche di mercato A.A. 01/13 05. Errore campionario e numerosità campionaria Gli schemi di campionamento condividono lo stesso principio di fondo: rappresentare il più fedelmente possibile,
DettagliCapitolo 12 La regressione lineare semplice
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara
Dettagli