DIAGNOSTICA DEI RESIDUI
|
|
|
- Armando Fabbri
- 8 anni fa
- Visualizzazioni
Transcript
1 DIAGNOSTICA DEI RESIDUI Per valutare la bontà dei residui in un modello di regressione lineare esistono diverse possibilità, alcune di tipo esplorativo basate sulla costruzione di opportuni grafici ed altri affidati all uso di particolari misure o test statistici. Si consideri un modello di regressione multivariata in cui il tasso di risparmio di 50 paesi è messo in relazione con alcune variabili demografiche e con il pil. Il dataset a cui si fa riferimento appartiene al pacchetto faraway. Lo si carichi e se ne esplori la struttura attraverso l help: data(savings) help(savings) Si costruisce quindi un modello di regressione in cui il tasso di risparmio, (la variabile sr) è messo in relazione con tutte le altre 4 variabili: g<-lm(sr~pop15+pop75+dpi+ddpi,savings) Si può a questo punto fare un grafico dove in ascissa si mettono i valori teorici e in ordinata i residui di questa regressione. Eventuali strutture o trend presenti nel grafico indicano che i residui non sono casuali e quindi che i regressori non hanno colto tutta la variabilità della variabile risposta: plot(fitted(g),residuals(g),xlab= valori teorici,ylab= residui ) residui valori teorici In questo caso non si osservano particolari problemi poichè i residui sembrano disperdersi in maniera casuale sopra e sotto la loro media (lo zero). 17
2 Verifica della normalità distributiva La normalità distributiva dei residui si può esplorare innanzitutto in maniera grafica attraverso le funzioni Q-Q plot. Il comando qqnorm applicato ai residui del modello costruisce un grafico in cui riporta in ordinata il valore osservato di ciascun residuo (i quantili campionari) mentre in ascissa rappresenta i valori teorici (i quantili di popolazione) che delimitano la stessa frazione percentuale nella distribuzione normale avente ugual media (nulla) e varianza di quella campionaria. qqnorm(g$res) Se la normalità distributiva è valida i punti tendono ad allinearsi lungo la bisettrice di questo grafico. Per visualizzarne la bisettrice si digita il comando: qqline(g$res) Normal Q-Q Plot Sample Quantiles Theoretical Quantiles Alternativamente si può effettuare un test, noto come il test di Shapiro-Wilk, che saggia l ipotesi nulla di normalità distributiva di un insieme di dati: shapiro.test(residuals(g)) Shapiro-Wilk normality test data: residuals(g) W = 0.987, p-value = Il p-value indica che l ipotesi nulla non si rifiuta e dunque i residui sono normalmente distribuiti. Se si costruisce un istogramma si osserva infatti la classica forma campanulare: 18
3 hist(residuals(g),15) Histogram of residuals(g) Frequency residuals(g) (si provi a cambiare il valore 15 per vedere cosa succede al grafico). Misure diagnostiche Nella libreria faraway sono contenuti alcuni comandi che producono i leverages, i residui studentizzati e la distanza di cook. Il comando influence si applica all output di un modello di regressione e produce una lista al cui interno (sotto il nome di hat) sono contenuti i valori di leverages: ginf<-influence(g) ginf$hat Australia Austria Belgium Bolivia Brazil Canada Chile China Colombia Costa Rica Denmark Ecuador Finland France Germany Greece Guatamala Honduras Iceland India Ireland Italy Japan Korea Luxembourg Malta Norway Netherlands New Zealand Nicaragua Panama Paraguay Peru Philippines Portugal South Africa South Rhodesia Spain Sweden Switzerland
4 Turkey Tunisia United Kingdom United States Venezuela Zambia Jamaica Uruguay Libya Malaysia Questi due comandi producono un grafico dei Leverages in cui si mostrano le etichette dei paesi con i 5 leverages più alti: contries<-row.names(savings) halfnorm(lm.influence(g)$hat,5,labs=contries,ylab="leverages") Si provi ancora una volta a modificare il valore 5 per valutarne gli effetti. Per calcolare i residui studentizzati internamente si usa la loro formula definitoria basata sui valori di leverages appena stimati: gs<-summary(g) # mette in gs il summary di g gs$sig # è la radice quadrata della varianza stimata stud.int<-residuals(g)/(gs$sig*sqrt(1-ginf$hat)) # formula per il calcolo Invece per ottenere i residui studentizzati esternamente si può utilizzare direttamente la formula: stud.est<-rstudent(g) Infine per calcolare la distanza di Cook si utilizza il comando: cook<-cooks.distance(g) halfnorm(cook,3,labs=countries,ylab= Cook s distances ) # fa il grafico Un esercizio Il dataset star (libreria farway) contiene di dati sulla luminosità e sulla temperatura di alcune stelle del sistema solare. Si vuole valutare se stelle molto luminose corrispondono a stelle con temperature elevate e viceversa. data(star) plot(star$temp,star$light,xlab= Temperatura,ylab= Luminosità ) g<-lm(light~temp,star) abline(g) 20
5 Luminosità Temperatura in cui si osserva purtroppo un andamento decrescente dovuto molto probabilmente alla presenza di quattro punti anomali, che corrispondono a quattro stelle aventi una temperatura inferiore a 3.6. Se si calcolano i leverages infatti si ha che quelli maggiori di 2(m+1)/n sono proprio quei 4 punti: cbind(influence(g)$hat,star$temp) [,1] [,2]
6 Dunque si può ristimare un modello di regressione escludendo le stelle con temperatura inferiori a 3.6: g2<-lm(light~temp,star,subset=(temp>3.6)) abline(g2) da cui si ottiene una relazione crescente fra le due variabili: Luminosità Temperatura 22
Le novità sui materiali specifici a rischio
IZSTO Istituto Zooprofilattico Sperimentale del Piemonte, Liguria e Valle d Aosta Le novità sui materiali specifici a rischio Daniela Meloni Centro di riferimento Nazionale Encefalopatie Animali [email protected]
ANALISI DELLA VARIANZA
ANALISI DELLA VARIANZA Il data set coagulation contenuto nella libreria faraway contiene i tempi di coagulazione del sangue (misurato in secondi) di 24 animali sottoposti casualmente a quattro tipi di
Analfabetismo finanziario ed inclusione previdenziale nella società che invecchia
Analfabetismo finanziario ed inclusione previdenziale nella società che invecchia Mario Padula Presidente della Commissione di Vigilanza sui Fondi Pensione JOB & Orienta 26 o Mostra Convegno Nazionale
Progetti di Outplacement per l Azienda
Progetti di Outplacement per l Azienda TRASFORMIAMO IL CAMBIAMENTO IN OPPORTUNITÀ CHI SIAMO PERCHÈ SCEGLIERE OP SOLUTION Supportiamo le Aziende che devono affrontare il percorso di uscita dei loro dipendenti,
Una Malattia dei Bronchi e dei Polmoni Cronica Ostruttiva SCUOLA BPCO 2012 A.C.O. S. FILIPPO NERI ROMA
Una Malattia dei Bronchi e dei Polmoni Cronica Ostruttiva SCUOLA BPCO 2012 A.C.O. S. FILIPPO NERI ROMA 1 DEFINIZIONE 2011 La BPCO, malattia frequente, prevenibile e trattabile, è caratterizzata da una
IL MINISTRO DEL LAVORO, DELLA SALUTE E DELLE POLITICHE SOCIALI. di concerto con IL MINISTRO DELL'ECONOMIA E DELLE FINANZE
D.M. 28 gennaio 2009 Attuazione disposizioni di cui al comma 9, dell'art. 38, della legge n. 289/2002, concernente la determinazione del livello di reddito equivalente per ciascun Paese straniero, al reddito
KRESTON GV Italy Audit Srl The new brand, the new vision
KRESTON GV Italy Audit Srl The new brand, the new vision Chi siamo Kreston GV Italy Audit Srl è il membro italiano di Kreston International, network internazionale di servizi di revisione, di corporate
KIT DI PRECARICA tipo PC 11.1 I 01-12
KIT DI PRECARICA tipo PC 11.1 I 01-12 11.1.1 DATI TECNICI PRESSIONE MASSIMA DI ESERCIZIO (PS): 600 BAR PRESSIONE DI COLLAUDO (PT): 1.43 PS FONDO SCALA MANOMETRO: 4-10 - 16-25 - 60-100 - 250 (std.) - 400-600
Welfare state. Un confronto tra paesi europei
Welfare state Un confronto tra paesi europei 1 Dimensione dei sistemi di welfare (1) Spesa pubblica sociale lorda Tre gruppi di paesi nel 1996: a) Nordici (1/3 PIL) b) Continentali (29%) c) Meridionali
obbligazioni corporate e semi-government (tenute presso il corrispondente estero) emesse prima del 01/01/1999;
SPAGNA: guida operativa di assistenza fiscale su strumenti finanziari obbligazionari corporate e semi-government (sub depositati presso il depositario del corrispondente estero) di diritto spagnolo non
Sezione Regionale Abruzzo e Molise
Sezione Regionale Abruzzo e Molise www.sitiabruzzomolise.it Riepilogo mensile Anno Gen Feb Mar Apr Mag Giu Lug Ago Set Ott Nov Dic Mese Visitatori diversi Numero di visite Pagine Accessi Banda usata Gen
Il Sistema Bus KNX. Standard mondiale ISO/IEC Milano, 14 dicembre Renato Ricci Diego Pastore
Il Sistema Bus KNX Standard mondiale ISO/IEC 14543-3 Renato Ricci Diego Pastore Milano, 14 dicembre 2012 KNX: I pilastri Certificazione la Certificazione KNX garantisce un alto livello di qualità ai prodotti
Distribuzione digitale
Distribuzione digitale Amazon Kindle Store La più grande libreria on line al mondo, con il Kindle ha fatto esplodere le vendite di ebook in America. Il Kinde Store è presente in Italia dal Novembre 2011.
LA RICETTA DELLA SMART FACTORY M. CECCHINATO 27/09/2017
LA RICETTA DELLA SMART FACTORY M. CECCHINATO 27/09/2017 Page: 1 La ricetta della Smart Factory INDICE: SWISSLOG@AGLANCE CASE HISTORY PIZZOLI: UNA RICETTA VINCENTE ESISTE LA RICETTA PERFETTA PER UN PROGETTO
Descrizione del sistema
CT-Bolt Descrizione del sistema Doppia funzione di bullone e chiodo da roccia Per impieghi provvisori e permanenti Immediato bloccaggio mediante testa ad espansione Doppia protezione anticorrosione mediante
Corruzione, l Italia migliora ma è comunque terzultima in Europa
Corruzione, l Italia migliora ma è comunque terzultima in Europa - Il Sole... 1 TRANSPARENCY INTERNATIONAL Corruzione, l Italia migliora ma è comunque terzultima in Europa di Serena Uccello 25 gennaio
Avv. Franco Toffoletto. La disciplina delle mansioni. Optime - Grand Hotel et de Milan. 1 luglio 2015
La disciplina delle mansioni Optime - Grand Hotel et de Milan 1 luglio 2015 Jobs Act 1 (L. 16 maggio 2014, n. 78) Contratti a termine (superato dal D.lgs 15 giugno 2015, n. 81) Jobs Act 2 (L. 23 dicembre
Regressione Lineare Semplice e Correlazione
Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)
Marzo 2013. Produttività e regimi di protezione all impiego
Marzo 2013 Produttività e regimi di protezione all impiego di Paolo Pini (Università di Ferrara) È vero che maggiori rigidità nel mercato del lavoro si accompagnano a minore produttività? I dati non lo
IL LAVORO DELL OCSE SUI SISTEMI SANITARI
IL LAVORO DELL OCSE SUI SISTEMI SANITARI - analisi, confronto e rafforzamento del sistema sanitario Stefano Scarpetta, Direttore della Direzione del Lavoro, Occupazione e Affari Sociali Il Lavoro dell
Report di osservazione
Report di osservazione RIFERIMENTI DELLA RICERCA Marchio osservato: Periodo Dal 15 al 21 Agosto 2016 Pagina 1 di 5 Sommario Report di osservazione del marchio Sommario Metodologia di ricerca Analisi dei
Differenze incolmabili nelle strutture per età agiranno come fattori push nei paesi di emigrazione e fattori pull nei paesi di immigrazione
Anni Variazioni More developed Less developed Least developed Europa Nord- Africa Africa subsahariana Popolazione di età 15-64 anni 2010 838 3706 467 505 127 445 2050 757 5270 1141 409 207 1 275 Variaz.
Archiviazione elettronica e Gestione della conoscenza Dott. Timur Khoussainov Toffoletto De Luca Tamajo e Soci Studio Legale
Archiviazione elettronica e Gestione della conoscenza Toffoletto De Luca Tamajo e Soci Studio Legale Bologna, 30 ottobre 2015 CHE COS È (PER NOI) LA CONOSCENZA? Toffoletto De Luca Tamajo e Soci 2015 2
Introduzione: I fallimenti del mercato e l intervento dello Stato
Introduzione: I fallimenti del mercato e l intervento dello Stato La teoria economica ha dimostrato che una condizione di equilibrio di concorrenza perfetta corrisponde a un punto di ottimo paretiano Tra
La posizione dell Italia sui mercati mondiali alla luce dei cambiamenti in atto
La posizione dell Italia sui mercati mondiali alla luce dei cambiamenti in atto Lucia Tajoli Politecnico di Milano Milano, 8 luglio 2011 Agenda La posizione attuale dell Italia sui mercati mondiali Il
I sistemi europei di welfare: dimensioni, struttura, finanziamento
CAPITOLO 1 I sistemi europei di welfare: dimensioni, struttura, finanziamento Maria Alessandra Antonelli *, Valeria De Bonis ** SOMMARIO: 1. Introduzione. 2. Dimensioni dei sistemi di welfare: spesa sociale
Dove i produttori di vino e gli importatori si incontrano
Wine Pleasures Workshops Dove i produttori di vino e gli importatori si incontrano Opportunità di marketing e sponsorizzazione Buyer Meets Italian Cellar Buyer Meets Iberian Cellar 2 26-28 ottobre 2015
Angelo FERRO - Gianni RAELI. La relazione tra PIL ed addetti al primario Una verifica empirica
Angelo FERRO - Gianni RAELI La relazione tra PIL ed addetti al primario Una verifica empirica Verona febbraio 3 1 Indice 1. I cambiamenti strutturali di lungo periodo 3. La verifica empirica con i dati
MODELLI INTRASTAT LE NOVITA IN VIGORE DAL 2018
TAX ALERT NO. 16/2017 Milano, 18 ottobre 2017 MODELLI INTRASTAT LE NOVITA IN VIGORE DAL 2018 Dal 1 gennaio 2018 entrano in vigore le misure di semplificazione nella compilazione e presentazione degli elenchi
Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)
Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Quesito: Posso stimare il numero di ore passate a studiare statistica sul voto conseguito all esame? Potrei calcolare il coefficiente di correlazione.
Museo Internazionale della Croce Rossa. Mariagrazia Baccolo Croce Rossa Italiana _ Castiglione delle Stiviere
Museo Internazionale della Croce Rossa Mariagrazia Baccolo Croce Rossa Italiana _ Castiglione delle Stiviere Museo Internazionale Croce Rossa Castiglione delle Stiviere 1 Il Palazzo Longhi Triulzi è della
La spesa sanitaria e altri indicatori di salute nei dati Ocse 2002
HW Health World Ocse health data 2002 di Mario Coi e Federico Spandonaro Ceis Sanità, Facoltà di Economia, Università degli Studi di Roma Tor Vergata La spesa sanitaria e altri indicatori di salute nei
NUOVO LOGO DORMER brochure esplicativa
NUOVO LOGO DORMER brochure esplicativa NUOVO LOGO DORMER brochure esplicativa Nel 2014 Dormer e Pramet si sono uniti per formare Dormer Pramet. Per rappresentare il nuovo nome della società è quindi stato
Misure della disuguaglianze di reddito Rapporto tra percentili (1)
Misure della disuguaglianze di reddito Rapporto tra percentili (1) (ad es. rapporto tra decili R 90/10 ) La popolazione (famiglie/individui) è ordinata in senso crescente di reddito e divisa in dieci parti
Introduzione a rischio, rendimento e costo. dott. Matteo Rossi
Introduzione a rischio, rendimento e costo opportunità del capitale dott. Matteo Rossi Argomenti trattati La storia del mercato dei capitali Misura del rischio Rischio di portafoglio Rischio unico e beta
L etichetta di pericolo secondo il Regolamento CLP e il sistema GHS Stato di attuazione del GHS nel mondo
L etichetta di pericolo secondo il Regolamento CLP e il sistema GHS Stato di attuazione del GHS nel mondo Paolo Izzo Centro Sostanze Chimiche Istituto Superiore di Sanità Classificazione & Etichettatura
Data Mining. Prova parziale del 20 aprile 2017: SOLUZIONE
Università degli Studi di Padova Corso di Laurea Magistrale in Informatica a.a. 2016/2017 Data Mining Docente: Annamaria Guolo Prova parziale del 20 aprile 2017: SOLUZIONE ISTRUZIONI: La durata della prova
Elaborazioni da Rapporto ESPAD, 2015
Elaborazioni da Rapporto ESPAD, 2015 http://www.quotidianosanita.it/allegati/allegato659136.pdf Giuseppe Gorini-ISPO Firenze/ Sandra Bosi/ LILT Reggio Emilia-Luoghi di Prevenzione Cos è Espad Ricerca sui
Misurazione e valutazione della performance dei pubblici dipendenti: l'esperienza dell'ateneo fiorentino
Misurazione e valutazione della performance dei pubblici dipendenti: l'esperienza dell'ateneo fiorentino Prof. Carlo ODOARDI Firenze, 16 aprile 2010 VALUTARE PER VALORIZZARE GLI INDIVIDUI E PROMUOVERE
CI HANNO SCELTO. Alcune delle aziende che si sono affidate a Trivenet quale partner per la fornitura dei loro servizi di telecomunicazione:
CI HANNO SCELTO Alcune delle aziende che si sono affidate a Trivenet quale partner per la fornitura dei loro servizi di telecomunicazione: CHI SIAMO Trivenet si propone come completo partner tecnologico
Laboratorio di Statistica Aziendale Modello di regressione lineare semplice
Laboratorio di Statistica Aziendale Modello di regressione lineare semplice Dott.ssa Michela Pasetto [email protected] Caricamento del dataset Il dataset SalesData si trova nella cartella condivisa
La molluschicoltura italiana nel panorama europeo e del bacino del mediterraneo
La molluschicoltura italiana nel panorama europeo e del bacino del mediterraneo AQUAFARM Conference and Exhibition for the Sustainable Aquaculture and Fishing Industry Pordenone Fiera 27 Gennaio 2017 Giuseppe
TEST NON PARAMETRICO DI MANN-WHITNEY
TEST NON PARAMETRICO DI MANN-WHITNEY Questo test viene può essere utilizzato come test di confronto tra due campioni in maniera analoga ai test ipotesi parametrici di confronto medie (test Z se la varianza
