Data Mining. Prova parziale del 20 aprile 2017: SOLUZIONE
|
|
|
- Adelmo Renzi
- 8 anni fa
- Просмотров:
Транскрипт
1 Università degli Studi di Padova Corso di Laurea Magistrale in Informatica a.a. 2016/2017 Data Mining Docente: Annamaria Guolo Prova parziale del 20 aprile 2017: SOLUZIONE ISTRUZIONI: La durata della prova è di 1 ora. La prova va svolta su questi fogli. Eventuali fogli di brutta copia possono essere richiesti, ma non verranno corretti. Non scrivere in matita. In caso di errore, barrare la parte errata, non utilizzare un correttore (bianchetto). Nome: Cognome: Matricola: Domande a risposta multipla Solo una delle risposte è corretta. Segnare con una crocetta la risposta corretta. Le risposte sbagliate o non date valgono zero punti. 1) Nel modello di regressione lineare stimato ai minimi quadrati l indice R 2 è pari a (a) devianza spiegata devianza totale (b) La risposta corretta è la (a). devianza totale devianza residua (c) devianza residua devianza spiegata (d) devianza residua devianza totale 2) La verifica d ipotesi per il confronto tra due modelli lineari annidati condotta tramite la statistica F rifiuta l ipotesi nulla di passaggio dal modello più grande al modello più piccolo al livello di significatività α (a) per valori alti e bassi di F (b) per valori bassi di F (c) per valori alti di F (d) per valori di F minori di α = 0.05 La risposta corretta è la (c). 3) In un modello di regressione lineare, il problema della multicollinearità deriva da (a) bassa correlazione tra gli errori ε e la risposta (b) bassa correlazione tra tutte le esplicative (c) alta correlazione tra almeno due esplicative (d) bassa correlazione tra almeno un errore ε e le esplicative La risposta corretta è la (c). 4) Nel modello di regressione lineare Y = β 0 + β 1 X + ε, il livello di significatività osservato (p-value) pari a 0.83 per il test H 0 : β 1 = 0 contro H 1 : β 1 0 suggerisce (a) di eliminare X dal modello (c) di eliminare β 0 dal modello La risposta corretta è la (a). (b) di mantenere X nel modello (d) che vi sono osservazioni anomale 1
2 5) Il residual standard error (RSE) per un modello Y = β 0 + β 1 X + ε con errori che si assumono N(0, σ 2 ) e che viene stimato ai minimi quadrati è (a) la stima di β 1 (b) la stima della media degli errori (c) la stima di σ (d) il p-value associato al test di bontà di adattamento del modello La risposta corretta è la (c). 2
3 Esercizio Rispondere su questi fogli in modo conciso e chiaro. Per i calcoli, riportare tutti i passaggi, non solo il risultato finale. Si considerino le informazioni su 145 auto usate e relative a prezzo (in centinaia di euro) chilometri percorsi (in migliaia) cavalli potenza: la variabile assume valore TRUE se i cavalli sono maggiori di 100 e FALSE se i cavalli sono minori o uguali a 100 anni: la variabile assume valore A se l età è minore o uguale a 3 anni, B se l età è tra 4 e 5 anni (estremi inclusi), C se l età è maggiore o uguale a 6 anni a) Viene stimato un modello di regressione lineare per spiegare il prezzo dell auto usata in funzione dei chilometri percorsi e della potenza del motore. Di seguito l output fornito da R a.1) Scrivere l espressione del modello stimato. Precisare come viene gestita la variabile qualitativa cavalli e quale livello (vale a dire quale potenza del motore) viene considerato di base. Il modello stimato è prezzo = chilometri I cavalli=true dove I cavalli=true è la variabile indicatrice che assume valore 1 se cavalli=true e valore 0 se cavalli=false. Questo perchè la variabile cavalli è una variabile qualitativa con due livelli, TRUE e FALSE, dei quali il livello FALSE è considerato come livello base da R, dato l ordinamento alfabetico dei livelli. La variabile qualitativa con due livelli viene tradotta in una variabile numerica (quantitativa) che assume valori 0 e 1 come specificato sopra. Di conseguenza, il coefficiente indica l aumento di prezzo per un auto con oltre 100 cavalli rispetto ad un auto con meno (o con esattamente) di 100 cavalli. a.2) Commentare l output evidenziando la significatività dei coefficienti e la possibilità di semplificazione del modello, interpretando i segni e i valori dei coefficienti stimati (vale a dire l associazione delle esplicative con la risposta), valutando l adattamento del modello tramite R 2. L output del modello indica che entrambi i coefficienti associati alle variabili esplicative sono significativamente diversi da 0, dato che il p-value (livello di significatività osservato) associato al test di verifica dipotesi per luguaglianza a zero dei coefficienti è basso. Di conseguenza il modello non è semplificabile. Se invece del classico livello di riferimento 0.05 con cui confrontare il p-value si considerasse il livello 0.01, allora il coefficiente associato a cavallitrue 3
4 sarebbe considerato pari a 0 e la corrispondente variabile si potrebbe eliminare dal modello. I risultati indicano che al crescere dei chilometri percorsi il costo dell auto diminuisce: in particolare, un aumento di 1000 chilometri percorsi diminuisce il prezzo di centinaia di euro ( euro). Inoltre, se la potenza del motore supera i 100 cavalli allora il prezzo dell auto aumenta di centinaia di euro rispetto a quello di un auto con meno (o al più) di 100 cavalli. Il valore basso dell indice R 2 suggerisce che il modello non presenta un buon adattamento alle osservazioni: potrebbe essere migliorabile tramite l inserimento di nuove variabili, l inserimento di eventuali interazioni tra le variabili o di termini polinomiali per le variabili esplicative quantitative. a.3) A quale verifica d ipotesi si riferiscono i valori della statistica F e del suo p-value riportati nell ultima riga dell output? Come si interpretano i risultati? Il valore si riferisce alla statistica che valuta l uguaglianza a zero dei coefficienti associati alle esplicative, vale a dire H 0 : β 1 = β 2 = 0 (dove β 1 è il coefficiente associato a chilometri e β 2 il coefficiente associato a cavallitrue) contro l alternativa H 1 che almeno uno dei due coefficienti sia non nullo. La statistica si scrive come F = R R 2 2 ed ha distribuzione F 2,142 sotto l ipotesi nulla. Il valore del p-value molto basso indica che non è giustificabile il passaggio dal modello con due variabili esplicative al modello senza variabili esplicative. a.4) Proporre un intervallo di confidenza di livello 0.90 per il parametro associato alla variabile chilometri, spiegando le eventuali assunzioni fatte. Indicando con β 1 il coefficiente associato a chilometri, con ˆβ 1 la sua stima e con SE( ˆβ 1 ) lo standard error, si ha che ˆβ 1 β 1 SE( ˆβ 1 ) t n 3 e quindi l intervallo richiesto è ˆβ 1 t 0.95,n 3 SE( ˆβ 1 ) β 1 ˆβ 1 + t 0.95,n 3 SE( ˆβ 1 ) Poichè n 3 = 142 è un valore molto elevato, la distribuzione t di Student si può approssimare con la distribuzione N(0, 1) (normale standard): l intervallo allora si può approssimare con il seguente intervallo che utilizza i quantili di N(0, 1) vale a dire ˆβ 1 z 0.95 SE( ˆβ 1 ) β 1 ˆβ 1 + z 0.95,n 3 SE( ˆβ 1 ) β da cui si ricava β a.5) Il seguente grafico riporta l output di default di R riferito all analisi dei residui del modello Il modello presenta un buon adattamento? Presenta dei problemi? Se si, quali sono delle possibili soluzioni? 4
5 Fitted values Residuals Residuals vs Fitted Theoretical Quantiles Standardized residuals Normal Q Q Fitted values Standardized residuals Scale Location Leverage Standardized residuals Cook's distance 0.5 Residuals vs Leverage Il grafico dei residui indica che il modello non presenta un buon adattamento. Infatti, il primo grafico (grafico di dispersione dei residui) mostra un andamento deterministico che non dovrebbe in realtà esserci. Inoltre, la media dei residui non sembra pari a 0 e la varianza dei residui non appare costante, come dovrebbe essere sulla base delle ipotesi che il modello di regressione pone sugli errori ε. Inoltre, nemmeno la normalità dei residui è soddisfatta, come evidenziato nel secondo grafico: i quantili empirici, infatti, si discostano da quelli teorici di una normal standard. Possibili soluzioni prevedono l inserimento di nuove variabili esplicative, eventualmente con interazioni e/o l inserimento di termini polinomiali associati alle variabili quantitative. Per completare l analisi dei residui, non sembrano essere presenti valori anomali: sebbene R evidenzi delle osservazioni, queste non rappresentano osservazioni anomale dato che la distanza di Cook non è elevata. b) L estensione del modello con l inclusione della variabile anni risulta (si veda pagina successiva) b.1) Come si interpretano i valori dei coefficienti associati ai livelli della variabile anni? Sono valori ragionevoli? I coefficienti indicano che il prezzo dell auto diminuisce al crescere dell età del veicolo, il che è in linea con quanto ci si attende nella realtà. In particolare, per un auto di 4-5 anni il prezzo diminuisce di centinaia di euro rispetto ad un auto di 3 anni al massimo, mentre per un auto di 6 o più anni il prezzo diminuisce di centinaia di euro rispetto ad un auto di 3 anni al massimo. b.2) Confrontare i due modelli fin qui stimati calcolando la statistica F, spiegando la verifica d ipotesi condotta e commentando il risultato. Considerare il livello di significatività Consideriamo la verifica d ipotesi H 0 : β 2 = β 3 = 0 contro H 1 che considera almeno uno dei due coefficienti non nullo: in questo modo, sotto H 1 consideriamo che la variable anni sia inserita nel modello (basta che almeno uno dei coefficienti associati ai livelli sia significativo). 5
6 Il fatto che i modelli siano annidati permette di fare riferimento alla statistica F = RSS 0 RSS RSS n p 1, q dove q = 2, n p 1 = = 140, RSS 0 è la somma dei quadrati dei residui nel modello con meno variabili e RSS è la somma dei quadrati dei residui nel modello con più variabili. Considerando che RSS 0 = RSE 2 (n p 1) = = e che RSS = = il valore osservato sui dati di F è = Confrontiamo questo valore con il quantile 0.95 di una F 2,140, che vale Poichè il valore osservato è maggiore, si rifiuta l ipotesi nulla al livello 0.05: la variabile anni va mantenuta nel modello, vale a dire che non è giustificabile il passaggio al modello più semplice. b.3) Usando il secondo modello stimato, prevedere il costo di un auto di 2 anni, con 120 cavalli potenza e con chilometri percorsi (attenzione alla scala di misura delle variabili). Come cambia il costo per un auto con le stesse caratteristiche ma con 7 anni di età? Il risultato è ragionevole? Auto di 2 anni con le caratteristiche indicate: prezzo = = centinaia di euro Auto di 7 anni con le caratteristiche indicate: prezzo = = centinaia di euro È ragionevole che il prezzo dell auto diminuisca al crescere dell età del veicolo. c) Il seguente grafico di dispersione tra chilometri e prezzo distingue le osservazioni riferite alle auto delle tre classi di età (si veda la pagina successiva) c.1) Sulla base del grafico, si può ipotizzare che un modello lineare che spieghi il prezzo dell auto in funzione dei chilometri, degli anni e della loro interazione abbia senso? Se si, perchè? 6
7 A B C prezzo chilometri Si, ha senso un modello che includa le due variabili ed anche la loro interazione. Osservando il grafico si nota che che i punti associati ai tre livelli della variabile anni seguono dispersioni diverse: livelli più alti di prezzo si hanno tendenzialmente per il gruppo A, livelli medi per il gruppo B e livelli bassi per il gruppo C. In tutte e tre i casi al crescere dei chilometri diminuisce il prezzo del veicolo, con una precisazione: supponendo di stimare 3 rette di regressione che leghino il prezzo ai chilometri, una per ciascun livello di anni, si nota che le rette si intersecherebbero, vale a dire che la loro inclinazione, seppur decrescente data la relazione con chilometri, sarebbe diversa per ciascun gruppo. Ci si attende quindi che il termine di interazione sia significativo. Informazioni utili Quantili di una N(0, 1) z 0.01 = 2.33 z = 1.96 z 0.05 = 1.64 z 0.95 = 1.64 z = 1.96 z 0.99 = 2.33 Quantili di una F F 0.025;2,140 = F 0.025;140,2 = F 0.975;2,140 = F 0.975;140,2 = F 0.05;2,140 = F 0.05;140,2 = F 0.95;2,140 = F 0.95;140,2 =
Statistica Applicata all edilizia: il modello di regressione
Statistica Applicata all edilizia: il modello di regressione E-mail: [email protected] 27 aprile 2009 Indice Il modello di Regressione Lineare 1 Il modello di Regressione Lineare Analisi di regressione
Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo
Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è
Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.
Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:
Il modello di regressione lineare multipla. Il modello di regressione lineare multipla
Introduzione E la generalizzazione del modello di regressione lineare semplice: per spiegare il fenomeno d interesse Y vengono introdotte p, con p > 1, variabili esplicative. Tale generalizzazione diventa
lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1
lezione n. 6 (a cura di Gaia Montanucci) METODO MASSIMA VEROSIMIGLIANZA PER STIMARE β 0 E β 1 Distribuzione sui termini di errore ε i ε i ~ N (0, σ 2 ) ne consegue : ogni y i ha ancora distribuzione normale,
Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)
Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Quesito: Posso stimare il numero di ore passate a studiare statistica sul voto conseguito all esame? Potrei calcolare il coefficiente di correlazione.
Statistica Descrittiva Soluzioni 7. Interpolazione: minimi quadrati
ISTITUZIONI DI STATISTICA A. A. 2007/2008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona
R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre
R - Esercitazione 6 Andrea Fasulo [email protected] Università Roma Tre Venerdì 22 Dicembre 2017 Il modello di regressione lineare semplice (I) Esempi tratti da: Stock, Watson Introduzione all econometria
Esercitazione del
Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36
Prova Scritta di METODI STATISTICI PER L AMMINISTRAZIONE DELLE IMPRESE (Milano, )
Università degli Studi di Milano Bicocca Scuola di Economia e Statistica Corso di Laurea in Economia e Amministrazione delle Imprese (ECOAMM) Prova Scritta di METODI STATISTICI PER L AMMINISTRAZIONE DELLE
Regressione Lineare Semplice e Correlazione
Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)
Test F per la significatività del modello
Test F per la significatività del modello Per verificare la significatività dell intero modello si utilizza il test F Si vuole verificare l ipotesi H 0 : β 1 = 0,, β k = 0 contro l alternativa che almeno
Statistica multivariata Donata Rodi 17/10/2016
Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare
Cognome e Nome:... Corso di laurea:...
Statistica - corso base Prof. B. Liseo Prova di esame dell 8 gennaio 201 Cognome e Nome:................................................................... Corso di laurea:.......................................................................
Politecnico di Milano - Scuola di Ingegneria Industriale. II Prova in Itinere di Statistica per Ingegneria Energetica 25 luglio 2011
Politecnico di Milano - Scuola di Ingegneria Industriale II Prova in Itinere di Statistica per Ingegneria Energetica 25 luglio 2011 c I diritti d autore sono riservati. Ogni sfruttamento commerciale non
ESAME. 9 Gennaio 2017 COMPITO B
ESAME 9 Gennaio 2017 COMPITO B Cognome Nome Numero di matricola 1) Approssimare tutti i calcoli alla quarta cifra decimale. 2) Ai fini della valutazione si terrà conto solo ed esclusivamente di quanto
Regressione lineare semplice
Regressione lineare semplice Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Statistica con due variabili var. nominale, var. nominale: gruppo sanguigno - cancro
Esercizi di statistica
Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..
Statistica 1 A.A. 2015/2016
Corso di Laurea in Economia e Finanza Statistica 1 A.A. 2015/2016 (8 CFU, corrispondenti a 48 ore di lezione frontale e 24 ore di esercitazione) Prof. Luigi Augugliaro 1 / 35 Il modello di regressione
STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7:
esercitazione 7 p. 1/13 STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7: 20-05-2004 Luca Monno Università degli studi di Pavia [email protected] http://www.lucamonno.it
Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1
Statistica Capitolo 1 Regressione Lineare Semplice Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Spiegare il significato del coefficiente di correlazione lineare
Laboratorio di Statistica Aziendale Modello di regressione lineare semplice
Laboratorio di Statistica Aziendale Modello di regressione lineare semplice Dott.ssa Michela Pasetto [email protected] Caricamento del dataset Il dataset SalesData si trova nella cartella condivisa
Analisi grafica residui in R. Da output grafico analisi regressionelm1.csv Vedi dispensa. peso-statura
Analisi grafica residui in R Da output grafico analisi regressionelm1.csv Vedi dispensa peso-statura 1) Il plot in alto a sinistra mostra gli errori residui contro i loro valori stimati. I residui devono
STATISTICA A K (60 ore)
STATISTICA A K (60 ore) Marco Riani [email protected] http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta
le scale di misura scala nominale scala ordinale DIAGNOSTICA PSICOLOGICA lezione si basano su tre elementi:
DIAGNOSTICA PSICOLOGICA lezione! Paola Magnano [email protected] si basano su tre elementi: le scale di misura sistema empirico: un insieme di entità non numeriche (es. insieme di persone; insieme
Esame di Statistica del 19 settembre 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova).
Esame di Statistica del 19 settembre 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola Es. 1 Es. 2 Es. 3 Es. 4 Somma Voto finale Attenzione: si
Statistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri
Analisi della regressione multipla
Analisi della regressione multipla y = β 0 + β 1 x 1 + β 2 x 2 +... β k x k + u 2. Inferenza Assunzione del Modello Classico di Regressione Lineare (CLM) Sappiamo che, date le assunzioni Gauss- Markov,
Università degli Studi di Padova Facoltà di Scienze Politiche
Università degli Studi di Padova Facoltà di Scienze Politiche STATISTICA Nuovo ordinamento Scienze Sociologiche Prof.ssa A. Dalla Valle Vecchio ordinamento Prova del 27/6/2007 (A) Cognome e nome: N. matricola:
Esame di Statistica A-Di Prof. M. Romanazzi
1 Università di Venezia Esame di Statistica A-Di Prof. M. Romanazzi 25 Maggio 2015 Cognome e Nome..................................... N. Matricola.......... Valutazione Il punteggio massimo teorico di
LEZIONE N. 11 ( a cura di MADDALENA BEI)
LEZIONE N. 11 ( a cura di MADDALENA BEI) F- test Assumiamo l ipotesi nulla H 0 :β 1,...,Β k =0 E diverso dal verificare che H 0 :B J =0 In realtà F - test è più generale H 0 :Aβ=0 H 1 :Aβ 0 A è una matrice
Esercitazione 9 del corso di Statistica (parte seconda)
Esercitazione 9 del corso di Statistica (parte seconda) Dott.ssa Paola Costantini 17 Marzo 9 Esercizio 1 Esercizio Un economista del Ministero degli Esteri desidera verificare se gli accordi di negoziazione
Lezione 18. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 18. A. Iodice
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 45 Outline 1 2 3 4 5 () Statistica 2 / 45 Modello di In molte applicazioni il ruolo delle variabili
Metodi statistici per la ricerca sociale Capitolo 7. Confronto tra Due Gruppi Esercitazione
Metodi statistici per la ricerca sociale Capitolo 7. Confronto tra Due Gruppi Esercitazione Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università degli Studi di Firenze
CAPITOLO 11 ANALISI DI REGRESSIONE
VERO FALSO CAPITOLO 11 ANALISI DI REGRESSIONE 1. V F Se c è una relazione deterministica tra due variabili,x e y, ogni valore dato di x,determinerà un unico valore di y. 2. V F Quando si cerca di scoprire
LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell
LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Strumenti statistici in Excell Pacchetto Analisi di dati Strumenti di analisi: Analisi varianza: ad un fattore Analisi
Statistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative
Fac-simile prova di esame
UNIVERSITÀ CA FOSCARI DI VENEZIA FACOLTÀ DI ECONOMIA Statistica Computazionale I Prof. Stefano Tonellato COGNOME.................................... NOME.................................... MATRICOLA....................................
Dispensa di Statistica
Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza
Laboratorio di Statistica 1 con R Esercizi per la Relazione. I testi e/o i dati degli esercizi contassegnati da sono tratti dai libri consigliati
Laboratorio di Statistica 1 con R Esercizi per la Relazione I testi e/o i dati degli esercizi contassegnati da sono tratti dai libri consigliati nel corso. Esercizio 1. 1. Facendo uso dei comandi
Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2010/2011 Statistica Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza
Regressione Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007
Regressione Esempio Un azienda manifatturiera vuole analizzare il legame che intercorre tra il costo mensile Y di produzione e il corrispondente volume produttivo X per uno dei propri stabilimenti. Volume
STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo
STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)
Esercitazione 5 - Statistica (parte II) Davide Passaretti 9/3/2017
Esercitazione 5 - Statistica (parte II) Davide Passaretti 9/3/2017 Contents 1 Inferenza sulla regressione semplice 1 1.1 Test sulla pendenza della retta................................... 1 1.2 Test sull
Statistica per le ricerche di mercato. 11. La regressione lineare multipla
Statistica per le ricerche di mercato A.A. 2012/13 Dr. L.Secondi 11. La regressione lineare multipla 1 Modello di regressione lineare multipla Il modello di regressione multipla estende il modello di regressione
Regressione Semplice. Correlazioni. sconto leverage. sconto Correlazione di Pearson 1,275. Sign. (a due code),141
Regressione Semplice Analisi Per avere una prima idea della struttura di dipendenza fra le variabili in esame, possiamo cominciare col costruire la matrice di correlazione delle variabili presenti nel
REGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori
REGRESSIONE lineare e CORRELAZIONE Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori Y X La NATURA e la FORZA della relazione tra variabili si studiano con la REGRESSIONE
Statistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 1 Outline 1 () Statistica 2 / 1 Outline 1 2 () Statistica 2 / 1 Outline 1 2 3 () Statistica 2 / 1
La regressione lineare. Rappresentazione analitica delle distribuzioni
La regressione lineare Rappresentazione analitica delle distribuzioni Richiamiamo il concetto di dipendenza tra le distribuzioni di due caratteri X e Y. Ricordiamo che abbiamo definito dipendenza perfetta
i dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente
TEST DI AUTOVALUTAZIONE - SETTIMANA 6 I diritti d autore sono riservati. Ogni sfruttamento commerciale non autorizzato sarà perseguito. Metodi statistici per la biologia Parte A. La retta di regressione.2
Contenuti: Capitolo 14 del libro di testo
Test d Ipotesi / TIPICI PROBLEMI DI VERIFICA DI IPOTESI SONO Test per la media Test per una proporzione Test per la varianza Test per due campioni indipendenti Test di indipendenza Contenuti Capitolo 4
Regressione Lineare Multipla
Regressione Lineare Multipla Fabio Ruini Abstract La regressione ha come scopo principale la previsione: si mira, cioè, alla costruzione di un modello attraverso cui prevedere i valori di una variabile
STATISTICA ESERCITAZIONE 13
STATISTICA ESERCITAZIONE 13 Dott. Giuseppe Pandolfo 9 Marzo 2015 Errore di I tipo: si commette se l'ipotesi nulla H 0 viene rifiutata quando essa è vera Errore di II tipo: si commette se l'ipotesi nulla
Esercitazione 5 Sta/s/ca Aziendale
Esercitazione 5 Sta/s/ca Aziendale David Aristei 12 maggio 2015 Si è interessa/ ad analizzare le determinan/ a livello aziendale della produ>vità del lavoro (PL, in migliaia di euro per dipendente) di
Analisi della varianza
Università degli Studi di Padova Facoltà di Medicina e Chirurgia Facoltà di Medicina e Chirurgia - A.A. 2009-10 Scuole di specializzazione Lezioni comuni Disciplina: Statistica Docente: dott.ssa Egle PERISSINOTTO
La multicollinearità sorge quando c è un elevata correlazione tra due o più variabili esplicative.
Lezione 14 (a cura di Ludovica Peccia) MULTICOLLINEARITA La multicollinearità sorge quando c è un elevata correlazione tra due o più variabili esplicative. In un modello di regressione Y= X 1, X 2, X 3
MODELLO DI REGRESSIONE LINEARE. le ipotesi del modello di regressione classico, stima con i metodi dei minimi quadrati e di massima verosimiglianza,
MODELLO DI REGRESSIONE LINEARE le ipotesi del modello di regressione classico, stima con i metodi dei minimi quadrati e di massima verosimiglianza, teorema di Gauss-Markov, verifica di ipotesi e test di
Statistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2011/2012 Statistica Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate.
Criteri di Valutazione della scheda (solo a carattere indicativo)
Criteri di Valutazione della scheda (solo a carattere indicativo) Previsioni - A Sono state fatte le previsioni e discussi i valori attesi insieme al ragionamento con cui sono stati calcolati? E stata
Esercitazione 8 maggio 2014
Esercitazione 8 maggio 2014 Esercizio 2 dal tema d esame del 13.01.2014 (parte II). L età media di n gruppo di 10 studenti che hanno appena conseguito la laurea triennale è di 22 anni. a) Costruire un
b) Calcolare la devianza tra i gruppi (devianza esterna), la devianza entro i gruppi (devianza interna) e la devianza totale
ESERCIZIO 1 La tendenza recente del mercato dell auto vede i veicoli SUV ed i fuoristrada sempre di più soppiantare le macchine tradizionali. Il loro utilizzo, soprattutto nei centri cittadini, viene criticato
Statistica Descrittiva Soluzioni 6. Indici di variabilità, asimmetria e curtosi
ISTITUZIONI DI STATISTICA A A 2007/2008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona
0 altimenti 1 soggetto trova lavoroentro 6 mesi}
Lezione n. 16 (a cura di Peluso Filomena Francesca) Oltre alle normali variabili risposta che presentano una continuità almeno all'interno di un certo intervallo di valori, esistono variabili risposta
Statistica. Esercitazione 16. Alfonso Iodice D Enza [email protected]. Università degli studi di Cassino. Statistica. A. Iodice
Esercitazione 16 Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () 1 / 24 Studio della relazione tra due variabili Commonly Asked Questions Qual è la relazione tra la spesa
Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII
Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Un breve richiamo sul test t-student Siano A exp (a 1, a 2.a n ) e B exp (b 1, b 2.b m ) due set di dati i cui
Intervallo di fiducia del coefficiente angolare e dell intercetta L intervallo di fiducia del coefficiente angolare (b 1 ) è dato da:
Analisi chimica strumentale Intervallo di fiducia del coefficiente angolare e dell intercetta L intervallo di fiducia del coefficiente angolare (b 1 ) è dato da: (31.4) dove s y è la varianza dei valori
Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale
DIPARTIMENTO DI SCIENZE AGRARIE E AMBIENTALI PRODUZIONE, TERRITORIO, AGROENERGIA Marco Acutis [email protected] www.acutis.it CdS Scienze della Produzione e Protezione delle Piante (g59) CdS Biotecnologie
ESERCIZI. Regressione lineare semplice CAPITOLO 12 Levine, Krehbiel, Berenson, Statistica II ed., 2006 Apogeo
Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università di Padova Docenti: Prof. L. Salmaso, Dott. L. Corain ESERCIZI Regressione lineare semplice
Analisi descrittiva: calcolando medie campionarie, varianze campionarie e deviazioni standard campionarie otteniamo i dati:
Obiettivi: Esplicitare la correlazione esistente tra l altezza di un individuo adulto e la lunghezza del suo piede e del suo avambraccio. Idea del progetto: Il progetto nasce dall idea di acquistare scarpe
11.2. Introduzione alla statistica 2/ed. Marilyn K. Pelosi, Theresa M. Sandifer, Paola Cerchiello, Paolo Giudici
CAPITOLO 11 L ANALISI DI REGRESSIONE SOLUZIONI 11.1 a) una relazione lineare potrebbe essere appropriata b)l equazione di regressione è y cappello=0,96+0,00006 x c)olanda: y cappello=0,96+0,00006 (53560)=4,57
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010.
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010 Statistica Esercitazione 4 12 maggio 2010 Dipendenza in media. Covarianza e
La regressione lineare multipla
13 La regressione lineare multipla Introduzione 2 13.1 Il modello di regressione multipla 2 13.2 L analisi dei residui nel modello di regressione multipla 9 13.3 Il test per la verifica della significatività
Indici di variabilità ed eterogeneità
Indici di variabilità ed eterogeneità Corso di STATISTICA Prof. Roberta Siciliano Ordinario di Statistica, Università di apoli Federico II Professore supplente, Università della Basilicata a.a. 011/01
Analisi della varianza
Analisi della varianza Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona ANALISI DELLA VARIANZA - 1 Abbiamo k gruppi, con un numero variabile di unità statistiche.
CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)
CHEMIOMETRIA Applicazione di metodi matematici e statistici per estrarre (massima) informazione chimica (affidabile) da dati chimici INCERTEZZA DI MISURA (intervallo di confidenza/fiducia) CONFRONTO CON
Esame di Istituzioni di Matematica II del 18 gennaio 2001 (Corso di Laurea in Biotecnologie, Universitá degli Studi di Padova). Cognome Nome Matricola
Esame di Istituzioni di Matematica II del 8 gennaio 00 (Corso di Laurea in Biotecnologie, Universitá degli Studi di Padova). Cognome Nome Matricola Es. Es. Es. 3 Es. 4 Somma Voto finale Attenzione: si
