Regressione multipla
|
|
- Iolanda Spada
- 7 anni fa
- Visualizzazioni
Transcript
1 Regressione multipla La regressione multipla è l'ovvia generalizzazione della regressione semplice, quando abbiamo più di una variabile esplicativa. Il modello è del tipo y i = β 0 + β x i β p x pi + ε i Gli assunti che abbiamo precedentemente discusso per la regressione semplice sono richiesti anche qui; infatti, la regressione semplice può essere vista come un caso particolare della regressione multipla, quando p = (come sarà chiaro da alcune formule che vedremo in seguito). Gli strumenti per vericare gli assunti rimangono ancora dello stesso tipo: graci dei residui rispetto ai valori interpolati, normal-plot dei residui, graco di serie storiche, diagnostiche varie (residui standardizzati, punti leva, distanze di Cook,...). In aggiunta a tutto ciò può essere molto utile eettuare un graco dei residui rispetto a ciascuna singola variabile esplicativa (anche in questo caso ciò che conferma il modello è l'assenza di ogni tipo di struttura nei dati). Ci sono alcune cose diverse nella regressione multipla rispetto alla semplice: Verica d'ipotesi Ci sono due tipi di verica d'ipotesi di interesse immediato. Un test di signicatività complessiva della regressione: H 0 : β = β =... = β p = 0 H : qualche β j 0, j =,..., p Il test più comune per ipotesi di questo tipo è un test F: F = Media dei quadrati della regressione Media dei quadrati dei residui = (Somma dei quadrati della regressione)/p (Somma dei quadrati dei residui)/(n p ). Che si distribuisce sotto l'ipotesi nulla come una F di Snedecor con p e p n gradi di libertà.. Un test sulla signicatività di ciascun singolo coeciente: H 0 : β j = 0 j =,..., p H : β j 0, che può essere vericato usanto il test t: t = ˆβ j s.e.( ˆβ j ), che si distribuisce sotto H 0 come una t di Student con n p gradi di libertà. Naturalmente, nell'ipotesi nulla si possono specicare altri valori di β j (diciamo β 0 j ), nel qual caso la statistica test diviene t = ˆβ j β 0 j s.e.( ˆβ j ).
2 Proporzione di variabilità spiegata dalla regressione Come per la regressione semplice, R stima la proporzione di varianza della variabile risposta spiegata dalla regressione, ed è uguale a R = Invece l'r aggiustato è un po' diverso somma dei quadrati dei residui Somma dei quadrati totale (corretti) R a = R p n p ( R ) Stima di σ Come per la regressione semplice la varianza degli errori σ è stimata usando la media dei quadrati dei residui. La dierenza è che ora i gradi di libertà per la somma dei quadrati dei residui sono n p (invece che n ) così la media dei quadrati dei residui ha la forma ˆσ = n i= (y i ŷ i ). n p Interpretazione dei coecienti di regressione Dobbiamo essere molto chiari sull'interpretazione dei coecienti della regressione multipla. Come al solito il termine ˆβ 0 è una stima del valore atteso della variabile risposta quando le variabili esplicative assumono valore zero (solo che ora ci sono diverse variabili esplicative). ˆβj, j =,..., p rappresentano le stime delle variazioni attese di y associate ad una variazione unitaria della singola x j mantenendo ssato tutto il resto del modello ssato. Si consideri il seguente esempio. Abbiamo un campione di neo-laureati e abbiamo a disposizione il loro voto di Laurea, il voto di Maturità e la media dei voti degli esami del primo anno. Costruiamo un modello per prevedere il voto di Laurea in funzione degli altri due indicatori Voto di Laurea = Media I Anno 0.08 Voto Maturità. Da tale risultato si sarebbe tentati di dire (e molti dicono!) che il voto di Maturità ha il segno sbagliato perchè dice che alti voti di maturità sono associati con bassi voti di Laurea. Questo è assolutamente sbagliato! Quello che dice è che voti di maturità alti sono associati a bassi voti di laurea tenendo sso il voto medio degli esami del primo anno. Chiaramente voto di Maturità e media dei voti degli esami del primo anno sono correlati positivamente tra loro, quindi l'aumento di un voto nel risultato della Maturità tenendo sso il voto degli esami del primo anno potrebbe anche non accadere mai! I coecienti di una regressione multipla non devono venire interpretati marginalmente! Se si è realmente interessati nella relazione tra voto di Laurea e voto di Maturità da solo, bisognerebbe eettuare una regressione semplice tra voto di Laurea e solo il voto di Maturità. Si può vedere cosa succede con un po' di semplici calcoli algebrici. Si consideri il modello di regressione con due variabili esplicative y i = β 0 + β x i + β x i + ε i
3 Le stime ai minimi quadrati risolvono le equazioni (X T X)β = X T y In questo caso queste equazioni sono: ( ) ( ) nβ 0 + xi β + xi β = y i ( ) ( ) ( ) xi β 0 + x i β + xi x i β = x i y i ( ) ( ) ( ) xi β 0 + xi x i β + x i β = x i y i È evidente che il calcolo di ˆβ coinvolge la variabile x ; analogamente il calcolo di ˆβ coinvolge la variabile x. Cioè la forma (e il segno) dei coecienti di regressione dipendono dalla presenza o assenza di qualsiasi altra variabile nel modello. In alcuni casi, questa informazione condizionata è esattamente quello che vogliamo, e i coecienti possono essere interpretati direttamente, ma in altre situazioni il coeciente naturale si riferisce alla relazione marginale, a cui i coecienti di regressione multipla non si riferiscono. Uno dei più utili aspetti della regressione multipla è la sua capacità di rappresentare statisticamente un'azione condizionata che altrimenti sarebbe impossibile descrivere. In situazioni sperimentali, è pratica comune modicare i valori di una condizione sperimentale mantenendo ssati gli altri, in modo da isolare i suoi eetti e poterli stimare, ma un tale approccio non può essere eettuato negli studi osservazionali. La regressione multipla fornisce una versione statistica di questo approccio. Questo è infatti il ragionamento che sottende l'uso di variabili di controllo nella regressione multipla variabili, cioè che non sono necessariamente di interesse diretto, ma variabili con cui il ricercatore vuole correggere le analisi. Multicollinearità Un tema legato è la multicollinearità. Quando le variabili esplicative (x) sono altamente correlate tra loro, i coecienti di regressione risultano spesso instabili e le statistiche t per le variabili risultano errate. Da un punto di vista pratico, ciò può portare due problemi:. Se un valore di una delle variabili esplicative viene modicato anche solo di poco, i coecienti di regressione stimati possono cambiare di molto.. Può succedere che il test F per la verica di ipotesi complessiva sul modello risulti signicativo, anche se ciascuno dei test t per i singoli parametri risulti invece non signicativo. Un'altra indicazione di questo problema è che il p-value per il test F risulta considerevolmente più piccolo di tutti i p-value per i test t relativi ai singoli coecienti. La multicollinearità invece non causa alcun problema alle misure di adattamento come l'r, visto che l'aggiunta di variabili inutili al modello non può ridurre l'r (può al massimo lasciarlo circa uguale). Un altro problema causato dalla multicollinearità si incontra quando si cerca di usare la regressione a ni previsivi. In generale, modelli semplici tendono a prevedere meglio di modelli più complicati, visto che fanno meno assunzioni su come il futuro dovrebbe essere. Cioè se un modello che presenta collinearità viene usato per prevedere il futuro, si assume implicitamente che la relazione tra le variabili esplicative e la relazione tra queste e la risposta, 3
4 rimane la stessa anche nel futuro. Questo è ovviamente meno verosimile quando le variabili esplicative sono collineari. Come è possibile diagnosticare la collinearità? Possiamo avere qualche suggerimento guardando ancora una volta al modello con due variabili esplicative: Si può mostrare che, in questo caso, e y i = β 0 + β x i + β x i + ε i var( ˆβ [ ] ) = σ x i ( r) var( ˆβ [ ] ) = σ x i ( r) dove r è il coeciente di correlazione tra x e x. Si osservi che quando la collinearità aumenta, (r ±), entrambe le varianze tendono a. Possiamo quanticare questo eetto come segue: r Rapporto di var( ˆβ ) rispetto a r = Questo rapporto descrive quanto la varianza della stima del coeciente cresce al crescere della collinearità osservata rispetto a quando le variabili esplicative sono incorrelate. Uno strumento di diagnostica per la collinearità é il cosiddetto fattore di inazione della varianza (VIF - variance ination factor) per ciascuna variabile esplicativa, che è denita come VIF j =, Rj dove Rj è l'r della previsione della variabile x j usando le altre variabili esplicative. Il VIF fornisce l'aumento proporzionale nella varianza di ˆβj rispetto a quello che sarebbe stata se le variabili esplicative fossero completamente incorrelate. Se il VIF è grande signica che ci potrebbe essere un problema di collinearità. Ma quale può essere un livello soglia che segnala un problema? Un buon riferimento è ( ) V IF < max 0, Rmodello 4
5 dove R modello è l'usuale R per il modello di regressione. Tale livello superiore indica che o le variabili esplicative sono maggiormente legate alla variabile risposta che non alle altre esplicative, o che non sono particolarmente legate tra loro. In queste circostanze le stime dei coecienti non saranno particolarmetne instabili, quindi la collinearità non sembra essere un problema. Cosa si può fare per risolvere la multicollinearità? La soluzione più semplice è semplicemente di eliminare ogni variabile collineare; così se, nell'esempio, voto di Maturità e media dei voti del primo anno sono molto correlate, non è necessario mantenerle entrambe nel modello, e se ne può usare solo una. Si osservi che, tuttavia, questo è solo un suggerimento generale, e a volte due (o più) variabili collineari sono necessarie per modellare opportunamente la variabile risposta. Confronti lineari e veriche di ipotesi A volte capita di poter ipotizzare che una versione più semplice del modello completo (un modello ridotto) possa essere adeguata per adattarsi ai dati. Ad esempio, consideriamo il campione di neo-laureati in una disciplina Economica, di cui abbiamo a disposizione il loro voto di Laurea, il voto del primo esame di Matematica e il voto del primo esame di Economia Politica. Il modello di regressione completo sarà [Voto di Laurea] i = β 0 + β [Voto di Matematica] i + β [Voto di Economia] i + ε i Ci potremmo però chiedere se non sia suciente considerare la media dei voti dei due esami per prevedere il voto di Laurea cioè, (Voto di Matematica + Voto di Economia). Questo modello ridotto sarà allora [Voto di Laurea] i = γ 0 + γ ([Voto di Matematica] i + [Voto di Economia] i ) + ε i dove β = β = γ /. Questa condizione di uguaglianza è detta contrasto lineare, perché denisce una condizione lineare sui parametri del modello di regressione (che coinvolgono, cioè, solo addizioni, sottrazioni e moltiplicazioni). Possiamo ora formulare la nostra domanda sul considerare semplicemente la media dei voti dei due esami anziché i singoli voti, come una verica di ipotesi su questo contrasto lineare. Come sempre, l'ipotesi nulla consiste in ciò in cui crediamo a meno di venire convinti del contrario; in questo caso, consiste nel modello più semplice (ridotto) che la media del Voto di Matematica e del Voto di Economia sia adeguata, infatti questo modello considera una sola variabile esplicativa anzichè due. L'ipotesi alternativa è semplicemente il modello completo (senza vincoli o condizioni su β). Cioè H 0 : β = β H : β β Ipotesi di questo tipo vengono vericate utilizzando un test F parziale. La statistica F prende ora la forma F = ([Somma dei quadrati dei residui] ridotto [Somma dei quadrati dei residui] completo )/d [Somma dei quadrati dei residui] completo /(n p ) dove n è la dimensione del campione, p è il numero di variabili esplicative nel modello completo, e d è la dierenza tra il numero di parametri nel modello completo e il numero di 5
6 parametri nel modello ridotto. Alcuni pacchetti software (come SAS e Systat) permettono all'analista di specicare un contrasto lineare da vericare contestualmente alla stima del modello, e forniscono la statistica F opportuna automaticamente. Per calcolare tale statistica con altri pacchetti, si devono stimare gli opportuni modelli di regressione separatamente. Nel nostro esempio, un modello di regressione su Voto di Matematica e Voto di Economia ci fornirà la [Somma dei quadrati dei residui] completo ; per ottenere invece la [Somma dei quadrati dei residui] ridotto si costruirà una nuova variabile [Media dei due voti] = (Voto di Matematica+Voto di Economia) e si stimerà un modello di regressione di [Voto di Laurea] sulla [Media dei due voti]. La statistica così ottenuta si distribuisce, se è vera l'ipotesi nulla, come una F di Snedecor con d e n p gradi di libetrà. Così per esempio, per l'esempio dei voti p = e d = 3 =, così la statistica F osservata sarà confrontata con la distribuzione F con e n 3 gradi di libertà. I percentili della distribuzione, o l'area alla destra del valore osservato può essere agevolmente ottenuta da un qualsiasi pacchetto ad esempio R. Una forma alternativa del test F appena descritto può chiarire ciò che realmente stiamo facendo: F = (R completo R ridotto )/d ( Rcompleto )/(n p ). Cioè, se l'r del modello completo non è molto più grande dell'r del modello ridotto, la statistica F è piccola, e non sembra esserci evidenza per riutare l'ipotesi nulla, portandoci quindi ad usare il modello ridotto; se invece la dierenza degli R è grande, riutiamo il modello ridotto in favore del modello completo. Si osservi che la statistica F che abbiamo già incontrato per vericare l'adattamento complessivo di un modello di regressione è un caso particolare di questa costruzione quando il contrasto è β = β =... = β p = 0. Anche le singole statistiche t per vericare la signicatività di ciascuna variabile possono essere viste come casi particolari di questa costruzione quando il contrasto è β j = 0 e ricordando che F j = t j. 6
STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA
Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria Civile A.A. 2009-10 Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain 1 STATISTICHE, DISTRIBUZIONI CAMPIONARIE
DettagliFunzioni di regressione non lineari
Funzioni di regressione non lineari Eduardo Rossi 2 2 Università di Pavia (Italy) Maggio 2013 Rossi Regressione nonlineare Econometria - 2013 1 / 25 Sommario Funzioni di regressione non lineari - note
DettagliRegressione Lineare Semplice e Correlazione
Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)
DettagliEsercitazioni di statistica
Esercitazioni di statistica Intervalli di confidenza Stefania Spina Universitá di Napoli Federico II stefania.spina@unina.it 10 Dicembre 2014 Stefania Spina Esercitazioni di statistica 1/43 Stefania Spina
DettagliRegressione & Correlazione
Regressione & Correlazione Monia Ranalli Ranalli M. Dipendenza Settimana # 4 1 / 20 Sommario Regressione Modello di regressione lineare senplice Stima dei parametri Adattamento del modello ai dati Correlazione
DettagliANALISI MULTIVARIATA
ANALISI MULTIVARIATA Marcella Montico Servizio di epidemiologia e biostatistica... ancora sulla relazione tra due variabili: la regressione lineare semplice VD: quantitativa VI: quantitativa Misura la
Dettaglilezione 4 AA Paolo Brunori
AA 2016-2017 Paolo Brunori dove eravamo arrivati - abbiamo individuato la regressione lineare semplice (OLS) come modo immediato per sintetizzare una relazione fra una variabile dipendente (Y) e una indipendente
DettagliEconometria. lezione 13. validità interna ed esterna. Econometria. lezione 13. AA 2014-2015 Paolo Brunori
AA 2014-2015 Paolo Brunori popolazione studiata e popolazione di interesse - popolazione studiata: popolazione da cui è stato estratto il campione - popolazione di interesse: popolazione per la quale ci
DettagliData Mining. Prova parziale del 20 aprile 2017: SOLUZIONE
Università degli Studi di Padova Corso di Laurea Magistrale in Informatica a.a. 2016/2017 Data Mining Docente: Annamaria Guolo Prova parziale del 20 aprile 2017: SOLUZIONE ISTRUZIONI: La durata della prova
DettagliSTATISTICA. Esercitazione 5
STATISTICA Esercitazione 5 Esercizio 1 Ad un esame universitario sono stati assegnati in modo casuale due compiti diversi con i seguenti risultati: Compito A Compito B Numero studenti 102 105 Media dei
DettagliIl test (o i test) del Chi-quadrato ( 2 )
Il test (o i test) del Chi-quadrato ( ) I dati: numerosità di osservazioni che cadono all interno di determinate categorie Prima di tutto, è un test per confrontare proporzioni Esempio: confronto tra numero
DettagliModellare le vendite di Lowe's
Modellare le vendite di Lowe's La previsione delle vendite è ovviamente di cruciale importanza per le aziende. Anche se le successioni dei ricavi sono, chiaramente, casuali, ci si aspetta che, in alcuni
DettagliCapitolo 12 La regressione lineare semplice
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università
DettagliIl modello di regressione lineare multipla. Il modello di regressione lineare multipla
Introduzione E la generalizzazione del modello di regressione lineare semplice: per spiegare il fenomeno d interesse Y vengono introdotte p, con p > 1, variabili esplicative. Tale generalizzazione diventa
DettagliPsicometria con Laboratorio di SPSS 2
Psicometria con Laboratorio di SPSS 2 Regressione lineare semplice (vers. 1.2, 20 marzo 2018) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2017-18
DettagliCORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Associazione, correlazione e dipendenza tra caratteri In un collettivo di 11 famiglie è stata
DettagliI RADICALI QUADRATICI
I RADICALI QUADRATICI 1. Radici quadrate Definizione di radice quadrata: Si dice radice quadrata di un numero reale positivo o nullo a, e si indica con a, il numero reale positivo o nullo (se esiste) che,
DettagliStatistica. Esercitazione 16. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice
Esercitazione 16 Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () 1 / 24 Studio della relazione tra due variabili Commonly Asked Questions Qual è la relazione tra la spesa
DettagliL'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale
L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile Corso di Metodologia della ricerca sociale L analisi della varianza (ANOVA) La tecnica con cui si esplorano le relazioni
DettagliRegressione lineare - ripasso
Regressione lineare - ripasso Quando parliamo di regressione cosa intendiamo? Il modello di regressione è caratterizzato dai seguenti aspetti: 1. siamo interessati a una particolare variabile che vorremmo
DettagliCapitolo 12. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 12.1: Suggerimento
Capitolo Suggerimenti agli esercizi a cura di Elena Siletti Esercizio.: Suggerimento Per verificare se due fenomeni sono dipendenti in media sarebbe necessario confrontare le medie condizionate, in questo
DettagliTecniche statistiche di analisi del cambiamento
Tecniche statistiche di analisi del cambiamento 07a-Ripasso: Anova ad un fattore (v. 1.9a, 29 dicembre 2018) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca
DettagliAnalisi della regressione multipla
Analisi della regressione multipla y = β 0 + β 1 x 1 + β 2 x 2 +... β k x k + u 2. Inferenza Assunzione del Modello Classico di Regressione Lineare (CLM) Sappiamo che, date le assunzioni Gauss- Markov,
DettagliSTIMA DELLA VARIANZA CAMPIONARIA
STIMA DELLA VARIANZA CAMPIONARIA Abbiamo visto che una stima puntuale corretta per il valore atteso µ delle variabili aleatorie X i è x n = (x 1 +.. + x n )/n. Una stima puntuale della varianza σ 2 delle
DettagliOld Faithful, Yellowstone Park. Statistica e biometria. D. Bertacchi. Dati congiunti. Tabella. Scatterplot. Covarianza. Correlazione.
Coppie o vettori di dati Spesso i dati osservati sono di tipo vettoriale. Ad esempio studiamo 222 osservazioni relative alle eruzioni del geyser Old Faithful. Old Faithful, Yellowstone Park. Old Faithful
Dettagli4 0 = 4 2 = 4 4 = 4 6 = 0.
Elementi di Algebra e Logica 2008. Esercizi 4. Gruppi, anelli e campi. 1. Determinare la tabella additiva e la tabella moltiplicativa di Z 6. (a) Verificare dalla tabella moltiplicativa di Z 6 che esistono
DettagliCapitolo 11 Test chi-quadro
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 11 Test chi-quadro Insegnamento: Statistica Corsi di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara Docenti: Dott.
DettagliMetodi Quantitativi per Economia, Finanza e Management. Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello
Metodi Quantitativi per Economia, Finanza e Management Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello 1. Introduzione ai modelli di regressione 2. Obiettivi 3. Le
DettagliAnalisi di Regressione Multipla
Analisi di Regressione Multipla Stima OLS della relazione Test Score/STR : TestScore! = 698.9.8 STR, R =.05, SER = 18.6 (10.4) (0.5) E una stima credibile dell effetto causale sul rendimento nei test di
Dettaglis a Inferenza: singolo parametro Sistema di ipotesi: : β j = β j0 H 1 β j0 statistica test t confronto con valore t o p-value
Inferenza: singolo parametro Sistema di ipotesi: H 0 : β j = β j0 H 1 : β j β j0 statistica test t b j - b s a jj j0 > t a, 2 ( n-k) confronto con valore t o p-value Se β j0 = 0 X j non ha nessuna influenza
DettagliEsercitazione del
Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2015-2016 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliSTATISTICA CORSO BASE. Prova scritta del Tempo: 2 ore Cognome e Nome:... Matricola:...
STATISTICA CORSO BASE. Prova scritta del 4-6-2013. Tempo: 2 ore Cognome e Nome:.............................. Matricola:.............................. Attenzione: Prima di affrontare la prova si consiglia
DettagliSTATISTICA. Regressione-3 L inferenza per il modello lineare semplice
STATISTICA Regressione-3 L inferenza per il modello lineare semplice Regressione lineare: GRAFICO DI DISPERSIONE & & analisi residui A. Valutazione preliminare se una retta possa essere una buona approssimazione
DettagliMatematica Lezione 22
Università di Cagliari Corso di Laurea in Farmacia Matematica Lezione 22 Sonia Cannas 14/12/2018 Indici di posizione Indici di posizione Gli indici di posizione, detti anche misure di tendenza centrale,
DettagliEsercitazione 1. 6 Marzo 2019
Esercitazione 1 6 Marzo 019 Esercizio 1 Su un collettivo di 100 appartamenti ubicati nella stessa zona della città vengono rilevati i seguenti caratteri: X 1 affitto mensile pagato dal locatario (in Euro)
DettagliMinimi quadrati vincolati e test F
Minimi quadrati vincolati e test F Impostazione del problema Spesso, i modelli econometrici che stimiamo hanno dei parametri che sono passibili di interpretazione diretta nella teoria economica. Consideriamo
DettagliLe equazioni e i sistemi di primo grado
Le equazioni e i sistemi di primo grado prof. Roberto Boggiani Isiss Marco Minghetti 1 settembre 009 Sommario In questo documento verrà trattato in modo semplice e facilmente comprensibile la teoria delle
DettagliNel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0.
Regressione [] el modello di regressione lineare si assume una relazione di tipo lineare tra il valore medio della variabile dipendente Y e quello della variabile indipendente X per cui Il modello si scrive
DettagliModelli di regressione dinamica
Modelli di regressione dinamica Matteo Pelagatti 25 giugno 2007 Modello di regressione dinamica Il modello di regressione classico coglie solamente relazioni istantanee tra la variabile esplicative e la
DettagliDisequazioni - ulteriori esercizi proposti 1
Disequazioni - ulteriori esercizi proposti Trovare le soluzioni delle seguenti disequazioni o sistemi di disequazioni:. 5 4 >. 4. < 4. 4 9 5. 9 > 6. > 7. < 8. 5 4 9. > > 4. < 4. < > 9 4 Non esitate a comunicarmi
DettagliSTATISTICA MULTIVARIATA SSD MAT/06
Università degli studi di Ferrara Dipartimento di Matematica A.A. 2018/2019 I semestre STATISTICA MULTIVARIATA SSD MAT/06 LEZIONE 4 - Questioni di analisi e applicazione della regressione lineare Pratica
DettagliEsercitazioni di statistica
Esercitazioni di statistica Misure di associazione: Indipendenza assoluta e in media Stefania Spina Universitá di Napoli Federico II stefania.spina@unina.it 22 ottobre 2014 Stefania Spina Esercitazioni
DettagliEsame di Statistica del 7 luglio 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova).
Esame di Statistica del 7 luglio 006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola Es. 1 Es. Es. 3 Es. 4 Somma Voto finale Attenzione: si consegnano
Dettagli04 - Numeri Complessi
Università degli Studi di Palermo Scuola Politecnica Dipartimento di Scienze Economiche, Aziendali e Statistiche Appunti del corso di Matematica 04 - Numeri Complessi Anno Accademico 2015/2016 M. Tumminello,
DettagliCorso in Statistica Medica
Corso in Statistica Medica Introduzione alle tecniche statistiche di elaborazione dati Regressione e correlazione Dott. Angelo Menna Università degli Studi di Chieti G. d Annunziod Annunzio Anno Accademico
DettagliEsercizi di Matematica Classe IV A TGC Assegnati per Lunedì 5 Marzo (In preparazione alla verica di saldo debito)
Esercizi di Matematica Classe IV A TGC Assegnati per Lunedì 5 Marzo (In preparazione alla verica di saldo debito) Nota importante Per vericare l'esattezza dei tuoi procedimenti sul calcolo del mcm, del
DettagliSTATISTICA CORSO BASE. Prova scritta del Tempo: 2 ore Cognome e Nome:... Matricola:...
STATISTICA CORSO BASE. Prova scritta del 7-2-2013. Tempo: 2 ore Cognome e Nome:.............................. Matricola:.............................. Attenzione: Prima di affrontare la prova si consiglia
DettagliStatistica 1 A.A. 2015/2016
Corso di Laurea in Economia e Finanza Statistica 1 A.A. 2015/2016 (8 CFU, corrispondenti a 48 ore di lezione frontale e 24 ore di esercitazione) Prof. Luigi Augugliaro 1 / 35 Il modello di regressione
DettagliEsercizio 2: voto e ore dedicate allo studio
La seguente tabella riporta il voto riportato da 10 studenti all esame di Statistica Sociale e il numero di ore di lezione non seguite dallo studente (il corso prevede 30 ore di lezione). Ci si chiede
DettagliEsercitazioni di Statistica
Esercitazioni di Statistica Indici di posizione e di variabilità Prof. Livia De Giovanni lstatistica@dis.uniroma1.it Esercizio 1 Data la seguente distribuzione unitaria del carattere X: X : 4 2 4 2 6 4
DettagliCorrelazione e regressione
Correlazione e regressione Correlazione 1 Come posso determinare il legame tra due o più variabili? Correlazione COEFFICIENTE DI CORRELAZIONE (r di Pearson) massimo consumo di ossigeno e prestazione nelle
DettagliESERCIZI SVOLTI Giuliano Bonollo - Michele Bonollo
ESERCIZI SVOLTI Giuliano Bonollo - Michele Bonollo 1 La seguente tabella riporta le frequenze relative riguardanti gli studenti di un università e gli esiti dell esame da essi sostenuto. Qual è la percentuale
DettagliEsame di Statistica del 1 settembre 2004 (Corso di Laurea in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola
Esame di Statistica del 1 settembre 004 (Corso di Laurea in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola Es. 1 Es. Es. Es. 4 Somma Voto finale Attenzione: si consegnano SOLO
DettagliParametri statistici
SMID a.a. 2004/2005 Corso di Metodi Statistici in Biomedicina Parametri statistici 24/1/2005 Deviazione standard della media La variabilità di una distribuzione può quindi essere espressa da un indice
DettagliIl metodo delle proporzioni crescenti
Il metodo delle proporzioni crescenti Ulisse Di Corpo Abstract I modelli predittivi, che utilizzano le regressioni multiple, partono dall assunto che le relazioni tra le variabili sono lineari o traducibili
Dettaglilezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1
lezione n. 6 (a cura di Gaia Montanucci) METODO MASSIMA VEROSIMIGLIANZA PER STIMARE β 0 E β 1 Distribuzione sui termini di errore ε i ε i ~ N (0, σ 2 ) ne consegue : ogni y i ha ancora distribuzione normale,
DettagliCorrelazione. Daniela Valenti, Treccani Scuola 1
Correlazione 1 I dati di un indagine per riflettere Cominciamo con i dati di un indagine svolta in una quinta classe di scuola superiore. Dopo l Esame di Stato 12 studenti si sono iscritti a corsi di laurea
DettagliAnalisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali
Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Introduzione : analisi delle relazioni tra due caratteristiche osservate sulle stesse unità statistiche studio del comportamento di due caratteri
DettagliTest delle Ipotesi Parte I
Test delle Ipotesi Parte I Test delle Ipotesi sulla media Introduzione Definizioni basilari Teoria per il caso di varianza nota Rischi nel test delle ipotesi Teoria per il caso di varianza non nota Test
DettagliCorrelazione tra due variabili
Correlazione tra due variabili Federico Plazzi 26 Novembre 2015 Correlazione tra due variabili Correlazione tra due variabili Variabili dipendenti e variabili indipendenti La variabile indipendente è quella
Dettagliβˆ (pendenza della retta) =
LA MODELLAZIONE EMPIRICA DELLE RELAZIONI ECONOMICHE: APPLICAZIONI IN STATA 7 Maria Elena Bontempi e.bontempi@economia.unife.it V LEZIONE: OLS multivariato: effetti parziali, multicollinearità Scopo dell
DettagliEsercitazioni di Statistica Dott.ssa Cristina Mollica
Esercitazioni di Statistica Dott.ssa Cristina Mollica cristina.mollica@uniroma.it Regressione Esercizio. Siano dati i seguenti valori per le due variabili X ed Y: 4 5 3 5 3 3 Con riferimento al modello
DettagliEsame di Statistica del 19 settembre 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova).
Esame di Statistica del 19 settembre 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola Es. 1 Es. 2 Es. 3 Es. 4 Somma Voto finale Attenzione: si
DettagliMulticollinearità. Strumenti quantitativi per la gestione
Multicollinearità Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/3c_mc.html#(1) 1/13 Quando non tutto va come dovrebbe Si parla di multi-collinearità
DettagliStatistica Applicata all edilizia: il modello di regressione
Statistica Applicata all edilizia: il modello di regressione E-mail: orietta.nicolis@unibg.it 27 aprile 2009 Indice Il modello di Regressione Lineare 1 Il modello di Regressione Lineare Analisi di regressione
DettagliLEZIONE N. 11 ( a cura di MADDALENA BEI)
LEZIONE N. 11 ( a cura di MADDALENA BEI) F- test Assumiamo l ipotesi nulla H 0 :β 1,...,Β k =0 E diverso dal verificare che H 0 :B J =0 In realtà F - test è più generale H 0 :Aβ=0 H 1 :Aβ 0 A è una matrice
DettagliCORSO DI STATISTICA (parte 2) - ESERCITAZIONE 2
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 2 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. La variabile Uniforme Continua Data una scheda telefonica da 5 euro di cui non si sa se sia
DettagliMetodi statistici per la ricerca sociale Capitolo 13. Combinare regressione e ANOVA: predittori categoriali e quantitativi Esercitazione
Metodi statistici per la ricerca sociale Capitolo 13. Combinare regressione e ANOVA: predittori categoriali e quantitativi Esercitazione Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni
DettagliFacoltà di Psicologia Università di Padova Anno Accademico Corso di Psicometria - Modulo B
Facoltà di Psicologia Università di Padova Anno Accademico 2010-2011 Corso di Psicometria - Modulo B Dott. Marco Vicentini marco.vicentini@unipd.it Rev. 27/12/2010 Regressione lineare Modello geometrico
DettagliStatistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill
- metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill Es. Soluzione degli esercizi del capitolo 8 home - indice In base agli arrotondamenti effettuati nei calcoli, si
DettagliCognome e nome Tempo disponibile: 60 minuti
Corso di Laurea in Medicina e Chirurgia Statistica medica. A.A. 005-006 6 Marzo 006 Cognome e nome Tempo disponibile: 60 minuti 1. Conducete uno studio clinico controllato randomizzato di fase III per
DettagliLa regressione lineare semplice
La regressione lineare semplice Il modello di regressione lineare semplice - 1 y = β 0 + βx + ε 10 8 Una retta nel piano Variabile Y 6 4 2 0 0 1 2 3 4 Variabile X 1 Il modello di regressione lineare semplice
DettagliMetodi Matematici e Informatici per la biologia. Esercizi
Metodi Matematici e Informatici per la biologia Esercizi Esercizio 1 Il modo migliore per isolare gli effetti delle variabili nascoste sulla variabile di risposta è di effettuare uno studio di osservazione
DettagliLe equazioni di I grado
Le equazioni di I grado ITIS Feltrinelli anno scolastico 007-008 R. Folgieri 007-008 1 Le equazioni abbiamo una uguaglianza tra due quantità (espressioni algebriche, perché nei due termini ci possono essere
DettagliLezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria
Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata Prof. Massimo Aria aria@unina.it Il concetto di interpolazione In matematica, e in particolare in
DettagliArgomenti della lezione:
Lezione 9 Argomenti della lezione: La regressione multipla: Approcci analitici Regressione standard Regressione gerarchica Regressione statistica Strategie Analitiche per la regressione Tre principali
DettagliMetodi statistici per la ricerca sociale Capitolo 12. Confronto fra gruppi: L analisi della varianza. Esercitazione
Metodi statistici per la ricerca sociale Capitolo 12. Confronto fra gruppi: L analisi della varianza Esercitazione Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università
DettagliIl confronto tra due campioni
DECIMA UNITA Il confronto tra due campioni Nell unità precedente abbiamo approfondito come si può procedere nello stimare i parametri di una popolazione a partire dalle statistiche di un suo campione.
DettagliStatistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1
Statistica Capitolo 1 Regressione Lineare Semplice Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Spiegare il significato del coefficiente di correlazione lineare
DettagliStatistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione.
Statistica inferenziale La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione. Verifica delle ipotesi sulla medie Quando si conduce una
DettagliMetodi statistici per la ricerca sociale Capitolo 11. Regressione Multipla e Correlazione
Metodi statistici per la ricerca sociale Capitolo 11. Regressione Multipla e Correlazione Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università degli Studi di Firenze
DettagliRisoluzione di problemi ingegneristici con Excel
Risoluzione di problemi ingegneristici con Excel Problemi Ingegneristici Calcolare per via numerica le radici di un equazione Trovare l equazione che lega un set di dati ottenuti empiricamente (fitting
Dettagli3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17
C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica
DettagliSTATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo
STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)
DettagliMetodologie Quantitative
Metodologie Quantitative Regressione Lineare Nozioni di base M Q Marco Perugini Milano-Bicocca 1 I COMUNICAZIONE MERCOLEDI 11 NOVEMBRE NON CI SARA LEZIONE DI MQ Concetti base Con l analisi di regressione
DettagliTempo disponibile: 60 minuti
Corso di Specialistica in Biotecnologie Statistica medica. A.A. 005-006 6 Marzo 006 Tempo disponibile: 60 minuti 1. Conducete uno studio clinico controllato randomizzato di fase III per misurare l'effetto
DettagliEsercitazione 9 del corso di Statistica (parte seconda)
Esercitazione 9 del corso di Statistica (parte seconda) Dott.ssa Paola Costantini 17 Marzo 9 Esercizio 1 Esercizio Un economista del Ministero degli Esteri desidera verificare se gli accordi di negoziazione
DettagliECONOMETRIA: Laboratorio I
ECONOMETRIA: Laboratorio I Luca De Angelis CLASS - Università di Bologna Programma Laboratorio I Valori attesi e varianze Test di ipotesi Stima di un modello lineare attraverso OLS Valore atteso Data una
DettagliIl metodo della regressione
Il metodo della regressione Il matching statistico Il matching statistico si basa sull idea di abbinare a ciascun soggetto trattato un soggetto non trattato tendenzialmenre equivalente, ovvero molto simile
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative
DettagliSTATISTICA CORSO BASE. Prova scritta del Tempo: 2 ore Cognome e Nome:... Matricola:...
STATISTICA CORSO BASE. Prova scritta del 7-2-2013. Tempo: 2 ore Cognome e Nome:.............................. Matricola:.............................. Attenzione: Prima di affrontare la prova si consiglia
DettagliUlteriori applicazioni del test del Chi-quadrato (χ 2 )
Ulteriori applicazioni del test del Chi-quadrato (χ 2 ) Finora abbiamo confrontato con il χ 2 le numerosità osservate in diverse categorie in un campione con le numerosità previste da un certo modello
DettagliBiostatistica Laurea Magistrale in Biologia Risultati dell esame del 16 Giugno 2016
iostatistica Laurea Magistrale in iologia Risultati dell esame del 16 Giugno 2016 Giovedì 23 Giugno alle ore 11 presso l ufficio del docente (U7, 2 piano, ufficio 2069) sarà possibile chiedere chiarimenti
DettagliCorso di Laurea in Economia Aziendale. Docente: Marta Nai Ruscone. Statistica. a.a. 2015/2016
Corso di Laurea in Economia Aziendale Docente: Marta Nai Ruscone Statistica a.a. 2015/2016 1 Indici di posizione GLI INDICI DI POSIZIONE sono indici sintetici che evidenziano le caratteristiche essenziali
DettagliIl processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni
La statistica inferenziale Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni E necessario però anche aggiungere con
Dettagli