Modelli Multilineari e Misure di adeguatezza del modello
|
|
|
- Gaetano Patti
- 9 anni fa
- Visualizzazioni
Transcript
1 Metodi di Analisi dei Dati Sperimentali AA /2010 Pier Luca Maffettone Modelli Multilineari e Misure di adeguatezza del modello
2 Sommario Regressione multilineare Coefficiente di determinazione (modelli lineari e non lineari) Matrice di correlazione (modelli lineari) Matrice di correlazione asintotica (estensione a modelli non lineari) Analisi dei residui (modelli lineari e non lineari) 2 /47
3 Regressioni multilineari Molte applicazioni di analisi della regressione coinvolgono situazioni con più di una singola variabile indipendente. Un modello lineare che contiene più di una variabile indipendente è detto multilineare Spesso modelli multilineari sono ottenuti a valle di linearizzazioni di modelli nonlineari. Continuiamo a a considerare problemi in cui si misura una sola variabile dipendente. 3 /47
4 Regressioni multilineari Il modello dell esperimento è: Abbiamo p=k+1 parametri ed N condizioni sperimentali Per poter stimare i parametri N>>p Tipo di esperimento: (comunque esperimenti indipendenti) ε i :=N(0, σ 2 ) 4 /47
5 Regressioni multilineari Il criterio della massima verosimiglianza nelle ipotesi in cui ci siamo messi porta ad uno stimatore di tipo minimi quadrati. Come al solito vogliamo minimizzare questa sommatoria al variare dei parametri da stimare: 5 /47
6 Regressioni multilineari Con un po di algebra si arriva ad un sistema di p equazioni in p incognite 6 /47
7 Regressioni multilineari: Esempio Resistenza a trazione di un wire bond per semiconduttori Modello empirico dell esperimento: 7 /47
8 Regressioni multilineari: Esempio Grandezze utili per i calcoli 8 /47
9 Regressioni multilineari: Esempio Sistema di equazioni Con i dati Soluzione 9 /47
10 Regressioni multilineari Nei problemi multilineari conviene usare un approccio matriciale Il modello lo scriviamo così: X ij : i parametro 1..k+1 j prova 1..n 10 /47
11 Regressioni multilineari Qualche richiamo di algebra lineare y = y 1 y 2 y 3 y 4, X = 1 x 11 x 12 1 x 21 x 22 1 x 31 x 32 1 x 41 x 42, β = β 0 β 1 β 2 X β = 1 x 11 x 12 1 x 21 x 22 1 x 31 x 32 1 x 41 x 42 β 0 β 1 β 2 = β 0 + β 1 x 11 + β 2 x 12 β 0 + β 1 x 21 + β 2 x 22 β 0 + β 1 x 31 + β 2 x 32 β 0 + β 1 x 41 + β 2 x /47
12 Regressioni multilineari Qualche richiamo di algebra lineare X T X = = x 11 x 21 x 31 x 41 x 12 x 22 x 32 x 42 1 x 11 x 12 1 x 21 x 22 1 x 31 x 32 1 x 41 x 42 = 4 x 11 + x 21 + x 31 + x 41 x 12 + x 22 + x 32 + x 42 x 11 + x 21 + x 31 + x 41 x x x x 2 41 x 11 x 12 + x 21 x 22 + x 31 x 32 + x 41 x 42 x 12 + x 22 + x 32 + x 42 x 11 x 12 + x 21 x 22 + x 31 x 32 + x 41 x 42 x x x x 2 42 y T X = y 1 y 2 y 3 y 4 T 1 x 11 x 12 1 x 21 x 22 1 x 31 x 32 1 x 41 x 42 = y 1 + y 2 + y 3 + y 4 x 11 y 1 + x 21 y 2 + x 31 y 3 + x 41 y 4 x 12 y 1 + x 22 y 2 + x 32 y 3 + x 42 y 4 12 /47
13 Regressione multilineare Modello del processo: ( ) g i β = β0 + β 1 x 1i + β 2 x 2i β k x ki g ( β ) = X β La funzione scalare dei p parametri da minimizzare è in generale:(forma quadratica) Φ ( β ) = ε ε = ( y g ( β )) T ( ( )) ( ) T ( ) y g β = y X β y X β Il modello è lineare nei parametri quindi per determinare i parametri dobbiamo determinare le derivate della funzione obiettivo rispetto ai vari parametri ed uguagliarle a zero. 13 /47
14 Regressioni multilineari Qualche richiamo di algebra lineare y T X = y T X T y Φ ( β ) β = β ( y X β ) T ( y X β ) = X T (y X β ) + ( y X β ) T ( X ) = X T y + X T X β y T X + ( X β ) T X =2X T X β 2X T y 14 /47
15 Regressione multilineare In questo modo si perviene ad un sistema di p equazioni lineari in p incognite (i parametri) Φ ( β ) = 2X T (y X β ) β X T ( y X ˆβ ) =0 ovvero ( XT X ) ˆβ = X T y Sistema di equazioni lineari Matrice dei coefficienti Vettore dei termini noti Perché esistano soluzioni il determinante della matrice dei coefficienti deve essere non nullo (ma dipende dalle condizioni sperimentali). 15 /47
16 Regressione multilineare In definitiva, risolvendo in modo formale: ˆβ = ( X T X ) 1 ( XT y ) (1) Da un punto di vista pratico non conviene risolvere il sistema di equazioni lineari procedendo attraverso l inversione della matrice caratteristica. Conviene invece procedere alla soluzione del sistema di equazioni lineari con algoritmi che riducano l onere calcolativo, per esempio con il metodo di Gauss o derivati. (vedrete un esempio alle esercitazioni) 16 /47
17 Regressione multilineare Quindi il problema è di nuovo: Il modello con i parametri stimati è Esercizio da fare a casa: ripetete con l approccio matriciale l esempio nel lucido 7 17 /47
18 Regressione multilineare Come appare evidente dalla (1) lo stimatore dei parametri dipende linearmente dai risultati sperimentali per cui è una VA dello stesso tipo. Nelle ipotesi fatte le proprietà dello stimatore sono: ( ) E ˆβ = β ( ) ˆβ := N β,v ˆβ ( ) T ( ) V ˆβ = E ˆβ β ˆβ β }{{}}{{} P 1 1 P }{{} P P (2) (3) 18 /47
19 Regressione multilineare Con la 1 la 2 e la 3 si ottiene: La stima basata sulla MV della varianza: V ˆβ = σ 2 ( X T X ) 1 Matrice di Covarianza ( ) ( ˆβ) T ( Φ min = Φ ˆβ = y X y X ˆβ ) ˆσ 2 = NB il numeratore è il minimo della funzione obiettivo. Questa espressione non viene utilizzata perché parziale in genere si usa la forma non distorta: s 2 = ( y X ˆβ) T N ( y X ˆβ ) ( ˆβ) T ( y X y X ˆβ ) N P = SS E N = SS E N P 19 /47
20 Regressione multilineare RIPARAMETRIZZAZIONE Abbiamo già studiato questa procedura nel caso banale di una unica variabile indipendente: y i = β 0 + β 1 (x i x)+ε i Ovviamente possiamo generalizzare la riparametrizzazione ai modelli multilineari, ma non sarà in generale possibile disaccoppiare il sistema di equazioni necessarie a stimare i parametri. L unica equazione a disaccoppiarsi è quella per la valutazione dell intercetta 20 /47
21 Regressione multilineare Il modello diventa: y i = β 0 + β 1 (x 1i x 1 )+β 2 (x 2i x 2 ) β k (x ki x k )+ε i b i = β i b 0 = β 0 k β j x j j=1 In definitiva la stima consiste nella risoluzione di P-1 equazioni lineari. Il vantaggio sta nel miglioramento delle proprietà della matrice caratteristica. In genere conviene riparametrizzare. 21 /47
22 Regressione multilineare Che tipo di VA è lo stimatore per la varianza? ( ) T ( ) y X β y X β χ 2 N = La precedente è una forma quadratica senza doppi prodotti. σ 2 Senza addentrarci in dettagli ma estendendo le conclusioni del caso lineare semplice possiamo partizionare la precedente chi-quadro ed ottenere: χ 2 N = Q 1 + Q 2 Q 1 = Q 2 = ( y X ˆβ) T σ 2 ( y X ˆβ ) ( ˆβ θ ) T XT X ( ˆβ θ ) σ 2 22 /47
23 Regressione multilineare Inoltre si dimostra che Q 1 = χ 2 N P, Q 2 = χ 2 P inoltre le due Q sono indipendenti Lo stimatore della varianza sperimentale è indipendente dallo stimatore dei parametri s 2 = χ 2 N P σ 2 N P La Q 2 sarà utilizzata quando dovremo determinare le regioni di fiducia. 23 /47
24 Introduzione Nelle precedenti sezioni si è visto come stimare i parametri di un modello matematico a partire da una campagna sperimentale L errore sperimentale, inevitabilmente presente nella misura, non permette mai di trarre delle conclusioni certe e i parametri del modello sono affetti da incertezze Un problema essenziale è la verifica della validità del modello Il modello è adeguato per descrivere i dati sperimentali a disposizione? Non esiste una risposta definitiva a questa domanda (l errore sperimentale non permette di trarre delle conclusioni certe), ma esistono delle tecniche che possono essere implementate per avere utili informazioni al riguardo 24 /47
25 Stima con i Minimi Quadrati Riscriviamo la SS E valutata nel suo minimo: SS E = N ( y i β 0 β 1 x i ) 2 N = y i y β 1 x β 1 x i i=1 i=1 ( ) 2 = N ( y i y) 2 N β 1 x i x i=1 i=1 ( ) 2 Il primo termine a destra è la somma totale corretta dei quadrati SS TC La dipendenza dalla x della variabile dipendente determina una riduzione di SS TC. Se Y non dipende da x questo termine è trascurabile e SS E = SS TC Il secondo termine a destra quindi dipende dalla regressione D altra parte si può scrivere: 25 /47
26 Stima con i Minimi Quadrati La regressione ripartisce la somma dei quadrati, SS T, in tre termini: 1. La somma dei quadrati dovuti alla media SS M ; 2. La somma degli scarti quadratici dovuti agli errori SS E (deviazione dalla linea di regressione); 3. La somma degli scarti quadratici dovuti alla regressione SS R. In altro modo si può dire che ciascun y i è composto da tre parti: 26 /47
27 Coefficiente di determinazione Si definisce coefficiente di determinazione il rapporto R 2 = ( ŷ i y ) 2 ( y i y ) 2 = SS R S TC = 1 SS E S TC 0 R 2 1 S TC è una misura della variabilità in y senza considerare la variabilità della variabile indipendente x SS E è una misura della variabilità rimanente dopo che x è stata considerata R 2 è la porzione di variazione descritta dalla regressione lineare. Il secondo termine a destra paragona la varianza non spiegata dal modello con la varianza totale dei dati. 27/37 /47
28 Coefficiente di determinazione R 2 e una statistica che da informazioni sulla bontà del fit di un modello. Tale coefficiente da una misura di quanto bene la linea di regressione approssima i dati sperimentali. Un valore unitario indicherebbe che la regressione passa perfettamente tra i dati. (ATTENZIONE!) Possiamo avere valori di R 2 al di fuori dell intervallo 0,1. Questo può accadere quando la regressione non è lineare. Se facciamo crescere il numero di parametri R 2 può crescere. 28/37 /47
29 Coefficiente di determinazione Cautele quando si interpreta R 2 R 2 non fornisce informazioni su se: Le variabili indipendenti considerate siano la vera causa della variazione della variabile dipendente Esista una distorsione dovuta alle variabili indipendenti omesse Il modello sia corretto Siano state scelte le migliori variabili indipendenti. Il modello possa essere migliorato trasformando le variabili indipendenti 29/37 /47
30 Coefficiente di determinazione aggiustato È possibile normalizzare il coefficiente R 2 in funzione del numero p di parametri e del numero n di prove sperimentali: SS E = SS TC = N i=1 N i=1 ( y i β 0 β 1 x i ) 2 ( y i y) 2 R C 2 = 1 SS E df E df TC = 1 + ( R 2 1) n 1 SS TC n p Tale espressione risulta più significativa del coefficiente di determinazione classico in quanto tiene conto anche del numero di parametri presente nel modello. Al crescere del numero dei parametri possiamo avvicinarci sempre meglio ai dati anche se ciò può non essere significativo dal punto di vista del modello Utile soprattutto nel caso di regressioni multiple. 30 /47
31 Matrice di correlazione Nell ipotesi di regressione multilineare: La matrice di covarianza è: V ˆβ = σ 2 y = X β ( X T ) X 1 È possibile valutare una sua versione normalizzata, ovvero la matrice di correlazione: ( ) c ij = cov B B i j σ B1 σ B2 c ij = 1 i j i = j 31 /47
32 Matrice di correlazione Se i termini fuori diagonale della matrice di correlazione c ij sono molto prossimi al valore unitario: c ij 1 i j Le stime dei parametri non sono molto affidabili: Il modello sperimentale è troppo complicato per descrivere la campagna sperimentale Questo può essere legato a: Un modello difettoso che contempla la dipendenza da un numero eccessivo di variabili La campagna sperimentale è stata progettata male 32 /47
33 Multicollinearità Può accadere che nel caso di regressione multilineare variabili indipendenti siano correlate e pertanto non indipendenti. X 1 X 2 correlate indipendenti X 2 X 3 Tale eventualità può avere effetti disastrosi sulla stima dei parametri 33 /47
34 Multicollinearità Richiamando relazioni precedentemente introdotte: V ˆβ = σ 2 ( X T ) X 1 L eventualità di una dipendenza lineare tra le variabili dipendenti, di fatto, rende la matrice delle prove sperimentali vicina alla condizione di singolarità. Gli elementi della matrice inversa di X T X possono assumere valori enormi La varianza dello stimatore può essere drammaticamente amplificata rispetto alla varianza sperimentale Come individuarla: Valori elevati di R 2 ma intervalli di fiducia molto ampi per i singoli coefficienti di regressione. Correlazioni tra le variabili regressore 34 /47
35 Quantificazione della multicollinearità Autovalori: se tutti i k autovalori della matrice d e l l e c o n d i z i o n i s p e r i m e n t a l i s o n o approssimativamente uguali, la multicollinearità è bassa. Condizionamento prossimo a 1 indica bassa multicollinearità X 1 bassa correlazione λ 1 ~ λ 2 Matrice di correlazione: Se vi sono dei termini fuori diagonale per cui X 2 Alta correlazione λ 1 >> λ 2 può esistere una forte correlazione tra le variabili regressore x i e x j. X 1 X 2 35 /47
36 Come migliorare le stime dei parametri Si è visto come una campagna sperimentale condotta in modo poco attento possa avere delle conseguenze disastrose sulla stima dei parametri Da un punto di vista intuitivo, la scelta delle condizioni sperimentali deve essere dettata dall esigenza di rendere le prove sperimentali quanto più possibile linearmente indipendenti Da un punto di vista rigoroso, la matrice X T X deve essere quanto più possibile lontana dalle condizioni di singolarità Una possibile politica può essere la ricerca delle condizioni sperimentali per cui il determinante sia massimo Tale filosofia è alla base delle cosiddetti Progettazioni di Campagne Sperimentali D- ottimali (D-Optimal Design, dove D sta per determinante) 36 /47
37 Matrice di correlazione per modelli non lineari Nel caso di modelli non lineari non è possibile effettuare dei test rigorosi, dato che la maggior parte delle variabili non sono assimilabili a VA normali. Si deve far ricorso a delle approssimazioni È possibile solo esprimere giudizi qualitativi 37 /47
38 Analisi dei residui Si definisce residuo alla prova i-esima: Il residuo rappresenta la componente dell osservazione sperimentale che il modello non è in grado di descrivere Il residuo (idealmente) descrive la parte aleatoria dell esperimento essendo σ la deviazione standard dell errore sperimentale Osservazione sperimentale Parte deterministica Parte aleatoria Si può facilmente verificare che: e i 2 n 2 = SS E n 2 = MS = E s2 38 /47
39 Analisi dei residui È possibile anche introdurre il concetto di residuo standardizzato: d i = e i MS E I residui standardizzati hanno media 0 e varianza più o meno unitaria. L analisi dei residui è un analisi di tipo grafico È possibile rappresentare graficamente l errore di rispetto al valore previsto dal modello corrispondente rispetto alla variabile regressore xi non si rappresenta graficamente rispetto all osservazione yi Se il modello descrive esattamente le osservazioni, i residui si dovrebbero comportare come genuini numeri casuali Può essere utile per la determinazione di inadeguatezze del modello. 39 /47
40 Analisi dei residui Se nel diagramma i residui sono contenuti in una banda orizzontale, senza la presenza di una struttura, allora non appaiono evidenti difetti nel modello 40 /47
41 Analisi dei residui Varianza non uniforme Situazioni in cui l analisi dei residui rivela un comportamento anomalo. La varianza dei residui varia con la stima di y (eteroschedasticità): sarebbe adeguata una stima pesata dei parametri. 41 /47
42 Analisi dei residui Struttura nei residui Se il modello supposto per la descrizione dei dati non è corretto, nel residuo cade anche una parte deterministica che il modello non riesce a descrivere Modello vero Osservazione sperimentale Residuo stimato Parte deterministica Residuo: non è più un numero casuale catturata dal modello dato che in esso cade il determinismo che il modello sbagliato non può catturare Modello non corretto Parte aleatoria nel residuo Parte del residuo dovuta alla scelta (sbagliata) del modello In questo caso il valore del residuo dipende dalla variabile indipendente 42 /47
43 Analisi dei residui Struttura nei residui Nel caso rappresentato in figura, si evince la presenza di una struttura nei residui al variare della predizione di y Questo scenario è in conflitto con l assunzione iniziale (di di natura puramente casuale dell osservazione) Nel residuo vi è una parte deterministica che non è stata catturata completamente dal modello È necessario estendere e/o modificare il modello 43 /47
44 Analisi dei residui Punti isolati L analisi dei residui può aiutare a individuare punti sperimentali che siano frutto di una misura palesemente errata. Punto isolato I residui normalizzati devono comunque essere compresi più o meno nella banda [-2,2] 44 /47
45 Analisi dei residui Punti isolati Attenzione: la presenza di punti isolati può influenzare drammaticamente l interpretazione dei residui 45 /47
46 Analisi dei residui Punti isolati I residui standardizzati nel primo caso presentano una struttura molto evidente: questo non è dovuto alla mancata efficienza del modello ma alla presenza del punto isolato che perturba significativamente la stima dei parametri della regressione Rimuovendo il punto isolato, la struttura dei residui migliora significativamente. Da osservare come la varianza sia diminuita di un ordine di grandezza S 2 =0.698 S 2 = /47
47 Sommario Generalizzazione della regressione lineare al caso multilineare È possibile implementare tecniche per confermare se il modello scelto per descrivere il processo in esame sia adeguato o meno Analisi di tipo quantitativo (determinazione scalari e/o matrici) Coefficiente di determinazione Matrice di correlazione Analisi di tipo qualitativo (via grafica) Matrice di correlazione Non esiste un metodo che sia univocamente riconosciuto come il più efficiente Conviene eseguire quante più analisi possibile e confrontarne i risultati 47 /47
Il modello di regressione lineare multipla. Il modello di regressione lineare multipla
Introduzione E la generalizzazione del modello di regressione lineare semplice: per spiegare il fenomeno d interesse Y vengono introdotte p, con p > 1, variabili esplicative. Tale generalizzazione diventa
Statistica Applicata all edilizia: il modello di regressione
Statistica Applicata all edilizia: il modello di regressione E-mail: [email protected] 27 aprile 2009 Indice Il modello di Regressione Lineare 1 Il modello di Regressione Lineare Analisi di regressione
Esercitazione del
Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36
Statistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri
IL CRITERIO DELLA MASSIMA VEROSIMIGLIANZA
Metodi per l Analisi dei Dati Sperimentali AA009/010 IL CRITERIO DELLA MASSIMA VEROSIMIGLIANZA Sommario Massima Verosimiglianza Introduzione La Massima Verosimiglianza Esempio 1: una sola misura sperimentale
lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1
lezione n. 6 (a cura di Gaia Montanucci) METODO MASSIMA VEROSIMIGLIANZA PER STIMARE β 0 E β 1 Distribuzione sui termini di errore ε i ε i ~ N (0, σ 2 ) ne consegue : ogni y i ha ancora distribuzione normale,
Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo
Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è
STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo
STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)
Statistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative
I. Foglio di esercizi su vettori linearmente dipendenti e linearmente indipendenti. , v 2 = α v 1 + β v 2 + γ v 3. α v 1 + β v 2 + γ v 3 = 0. + γ.
ESERCIZI SVOLTI DI ALGEBRA LINEARE (Sono svolti alcune degli esercizi proposti nei fogli di esercizi su vettori linearmente dipendenti e vettori linearmente indipendenti e su sistemi lineari ) I. Foglio
Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale)
Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale) Esercizio 1: Un indagine su 10.000 famiglie ha dato luogo, fra le altre, alle osservazioni riportate nella
12) Metodo dei minimi quadrati e linea di tendenza
12) Metodo dei minimi quadrati e linea di tendenza 43 Si supponga di avere una tabella di dati {y exp i} i=1,,n in funzione di altri dati {x i } i=1,,n che siano il risultato di una qualche misura sperimentale.
ANOVA: ANALISI DELLA VARIANZA Prof. Antonio Lanzotti
UNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II DIPARTIMENTO DI INGEGNERIA AEROSPAZIALE D.I.A.S. STATISTICA PER L INNOVAZIONE a.a. 007/008 ANOVA: ANALISI DELLA VARIANZA Prof. Antonio Lanzotti A cura di: Ing.
Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica
Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Regressione Lineare e Correlazione Argomenti della lezione Determinismo e variabilità Correlazione Regressione Lineare
Regressione multipla
Regressione multipla L obiettivo è costruire un modello probabilistico per spiegare la variabile y tramite più di una variabile indipendente x 1, x 2,..., x k. Esempio: Per un efficiente progettazione
Variabili aleatorie scalari
Metodi di Analisi dei Dati Sperimentali AA /2010 Pier Luca Maffettone Variabili aleatorie scalari Sommario della Introduzione CDF e PDF: definizione CDF e PDF: proprietà Distribuzioni uniforme e Gaussiana
Algebra lineare con R
Università di Napoli Federico II [email protected] Standardizzare una variabile Standardizzazione Data una variabile X distribuita secondo una media µ e una varianza σ 2 la standardizzazione permette
REGRESSIONE E CORRELAZIONE
REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.
METODO DEI MINIMI QUADRATI
METODO DEI MINIMI QUADRATI Torniamo al problema della crescita della radice di mais in funzione del contenuto di saccarosio nel terreno di coltura. Ripetendo varie volte l esperimento con diverse quantità
Il metodo delle osservazioni indirette
Il metodo delle osservazioni indirette Teoria della stima ai minimi quadrati Il criterio di massima verosimiglianza Sia data una grandezza η e si abbiano n osservazioni indipendenti l i (i=1,...,n) di
Note sulla probabilità
Note sulla probabilità Maurizio Loreti Dipartimento di Fisica Università degli Studi di Padova Anno Accademico 2002 03 1 La distribuzione del χ 2 0.6 0.5 N=1 N=2 N=3 N=5 N=10 0.4 0.3 0.2 0.1 0 0 5 10 15
Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale
DIPARTIMENTO DI SCIENZE AGRARIE E AMBIENTALI PRODUZIONE, TERRITORIO, AGROENERGIA Marco Acutis [email protected] www.acutis.it CdS Scienze della Produzione e Protezione delle Piante (g59) CdS Biotecnologie
Analisi delle corrispondenze
Capitolo 11 Analisi delle corrispondenze L obiettivo dell analisi delle corrispondenze, i cui primi sviluppi risalgono alla metà degli anni 60 in Francia ad opera di JP Benzécri e la sua equipe, è quello
0 altimenti 1 soggetto trova lavoroentro 6 mesi}
Lezione n. 16 (a cura di Peluso Filomena Francesca) Oltre alle normali variabili risposta che presentano una continuità almeno all'interno di un certo intervallo di valori, esistono variabili risposta
Politecnico di Milano - Scuola di Ingegneria Industriale. II Prova in Itinere di Statistica per Ingegneria Energetica 25 luglio 2011
Politecnico di Milano - Scuola di Ingegneria Industriale II Prova in Itinere di Statistica per Ingegneria Energetica 25 luglio 2011 c I diritti d autore sono riservati. Ogni sfruttamento commerciale non
Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25
Sommario Presentazione dell edizione italiana Prefazione xv xiii Capitolo 1 I dati e la statistica 1 Statistica in pratica: BusinessWeek 1 1.1 Le applicazioni in ambito aziendale ed economico 3 Contabilità
CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)
CHEMIOMETRIA Applicazione di metodi matematici e statistici per estrarre (massima) informazione chimica (affidabile) da dati chimici INCERTEZZA DI MISURA (intervallo di confidenza/fiducia) CONFRONTO CON
Appunti su Indipendenza Lineare di Vettori
Appunti su Indipendenza Lineare di Vettori Claudia Fassino a.a. Queste dispense, relative a una parte del corso di Matematica Computazionale (Laurea in Informatica), rappresentano solo un aiuto per lo
Corso di Statistica Industriale
Corso di Statistica Industriale Corsi di Laurea Specialistica in Ingegneria Gestionale e Ingegneria Meccanica Docente: Ilia Negri Orario del corso: Martedì: dalle 14.00 alle 16.00 Venerdì: dalle 10.30
VALIDAZIONE DEI METODI RADIOCHIMICI. Analisi di alcuni aspetti: 1. Taratura. 2. Ripetibilità. Dott. Maurizio Bettinelli.
VALIDAZIONE DEI METODI RADIOCHIMICI Analisi di alcuni aspetti: 1. Taratura (verifica di Linearità) 2. Ripetibilità Dott. Maurizio Bettinelli 29 settembre 2011 www.kosmosnet.it 1 www.kosmosnet.it 2 www.kosmosnet.it
Sistemi sovradeterminati
Sistemi sovradeterminati Sia A una matrice m n ove m > n sia b R m trovare una soluzione del sistema sovradeterminato Ax = b significa cercare di esprimere un vettore di R m come combinazione lineare di
Sistemi lineari. Lorenzo Pareschi. Dipartimento di Matematica & Facoltá di Architettura Universitá di Ferrara
Sistemi lineari Lorenzo Pareschi Dipartimento di Matematica & Facoltá di Architettura Universitá di Ferrara http://utenti.unife.it/lorenzo.pareschi/ [email protected] Lorenzo Pareschi (Univ. Ferrara)
Il teorema di Rouché-Capelli
Luciano Battaia Questi appunti (1), ad uso degli studenti del corso di Matematica (A-La) del corso di laurea in Commercio Estero dell Università Ca Foscari di Venezia, campus di Treviso, contengono un
La regressione lineare multipla
13 La regressione lineare multipla Introduzione 2 13.1 Il modello di regressione multipla 2 13.2 L analisi dei residui nel modello di regressione multipla 9 13.3 Il test per la verifica della significatività
Errori di misura Teoria
Errori di misura Teoria a misura operazione di misura di una grandezza fisica, anche se eseguita con uno strumento precisissimo e con tecniche e procedimenti accurati, è sempre affetta da errori. Gli errori
Analisi descrittiva: calcolando medie campionarie, varianze campionarie e deviazioni standard campionarie otteniamo i dati:
Obiettivi: Esplicitare la correlazione esistente tra l altezza di un individuo adulto e la lunghezza del suo piede e del suo avambraccio. Idea del progetto: Il progetto nasce dall idea di acquistare scarpe
3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17
C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica
Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria
Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata Prof. Massimo Aria [email protected] Il concetto di interpolazione In matematica, e in particolare in
Distribuzioni e inferenza statistica
Distribuzioni e inferenza statistica Distribuzioni di probabilità L analisi statistica spesso studia i fenomeni collettivi confrontandoli con modelli teorici di riferimento. Tra di essi, vedremo: la distribuzione
Metodi di regressione multivariata
Metodi di regressione multivariata Modellamento dei dati per risposte quantitative I metodi di regressione multivariata sono strumenti utilizzati per ricercare relazioni funzionali quantitative tra un
Esercitazioni di Statistica
Esercitazioni di Statistica Stima Puntuale Prof. Livia De Giovanni [email protected] Esercizio In ciascuno dei casi seguenti determinare quale tra i due stimatori S e T per il parametro θ è distorto
Intervallo di fiducia del coefficiente angolare e dell intercetta L intervallo di fiducia del coefficiente angolare (b 1 ) è dato da:
Analisi chimica strumentale Intervallo di fiducia del coefficiente angolare e dell intercetta L intervallo di fiducia del coefficiente angolare (b 1 ) è dato da: (31.4) dove s y è la varianza dei valori
La matrice delle correlazioni è la seguente:
Calcolo delle componenti principali tramite un esempio numerico Questo esempio numerico puó essere utile per chiarire il calcolo delle componenti principali e per introdurre il programma SPAD. IL PROBLEMA
Statistica. Esercitazione 16. Alfonso Iodice D Enza [email protected]. Università degli studi di Cassino. Statistica. A. Iodice
Esercitazione 16 Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () 1 / 24 Studio della relazione tra due variabili Commonly Asked Questions Qual è la relazione tra la spesa
TOPOGRAFIA 2013/2014. Prof. Francesco-Gaspare Caputo
TOPOGRAFIA 2013/2014 L operazione di misura di una grandezza produce un numero reale che esprime il rapporto della grandezza stessa rispetto a un altra, a essa omogenea, assunta come unità di misura. L
Funzioni di regressione non lineari
Funzioni di regressione non lineari Eduardo Rossi 2 2 Università di Pavia (Italy) Maggio 2013 Rossi Regressione nonlineare Econometria - 2013 1 / 25 Sommario Funzioni di regressione non lineari - note
Statistica multivariata Donata Rodi 17/10/2016
Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare
Lezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo
UIVERSITA DEGLI STUDI DI BASILICATA FACOLTA DI ECOOMIA Corso di laurea in Economia Aziendale anno accademico 2012/2013 Lezioni di Statistica del 15 e 18 aprile 2013 Docente: Massimo Cristallo LA RELAZIOE
Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva
Probabilità classica Distribuzioni e leggi di probabilità La probabilità di un evento casuale è il rapporto tra il numero dei casi favorevoli ed il numero dei casi possibili, purchè siano tutti equiprobabili.
Econometria. lezione 13. validità interna ed esterna. Econometria. lezione 13. AA 2014-2015 Paolo Brunori
AA 2014-2015 Paolo Brunori popolazione studiata e popolazione di interesse - popolazione studiata: popolazione da cui è stato estratto il campione - popolazione di interesse: popolazione per la quale ci
Metodi computazionali per i Minimi Quadrati
Metodi computazionali per i Minimi Quadrati Come introdotto in precedenza si considera la matrice. A causa di mal condizionamenti ed errori di inversione, si possono avere casi in cui il e quindi S sarebbe
LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell
LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Strumenti statistici in Excell Pacchetto Analisi di dati Strumenti di analisi: Analisi varianza: ad un fattore Analisi
Statistica Metodologica Avanzato Test 1: Concetti base di inferenza
Test 1: Concetti base di inferenza 1. Se uno stimatore T n è non distorto per il parametro θ, allora A T n è anche consistente B lim Var[T n] = 0 n C E[T n ] = θ, per ogni θ 2. Se T n è uno stimatore con
Massimi e minimi vincolati
Massimi e minimi vincolati Data una funzione G C 1 (D), dove D è un aperto di R 2, sappiamo bene dove andare a cercare gli eventuali punti di massimo e minimo relativi. Una condizione necessaria affinché
Risoluzione di problemi ingegneristici con Excel
Risoluzione di problemi ingegneristici con Excel Problemi Ingegneristici Calcolare per via numerica le radici di un equazione Trovare l equazione che lega un set di dati ottenuti empiricamente (fitting
Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza.
Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza. Misure ripetute forniscono dati numerici distribuiti attorno ad un valore centrale indicabile con un indice (indice
Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.
Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:
Tema d esame del 15/02/12
Tema d esame del 15/0/1 Volendo aprire un nuovo locale, una catena di ristoranti chiede ad un consulente di valutare la posizione geografica ideale all interno di un centro abitato. A questo scopo, avvalendosi
SISTEMI LINEARI: APPROFONDIMENTI ED ESEMPI
SISTEMI LINEARI: APPROFONDIMENTI ED ESEMPI Appunti presi dalle lezioni del prof. Nedo Checcaglini Liceo Scientifico di Castiglion Fiorentino (Classe 4B) January 17, 005 1 SISTEMI LINEARI Se a ik, b i R,
Distribuzione Gaussiana - Facciamo un riassunto -
Distribuzione Gaussiana - Facciamo un riassunto - Nell ipotesi che i dati si distribuiscano seguendo una curva Gaussiana è possibile dare un carattere predittivo alla deviazione standard La prossima misura
Dal coefficiente di Correlazione lineare tra due grandezze x, y alla covarianza.
1 Dal coefficiente di Correlazione lineare tra due grandezze x, y alla covarianza. La seguente nota è dedicata ad una riorganizzazione del capitolo 9 del Taylor. Si fà notare che viene invertito l ordine,
Esercitazioni di statistica
Esercitazioni di statistica Misure di associazione: Indipendenza assoluta e in media Stefania Spina Universitá di Napoli Federico II [email protected] 22 ottobre 2014 Stefania Spina Esercitazioni
Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura
INDICE GENERALE Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura XI XIV XV XVII XVIII 1 LA RILEVAZIONE DEI FENOMENI
Dipendenza e indipendenza lineare (senza il concetto di rango)
CAPITOLO 5 Dipendenza e indipendenza lineare (senza il concetto di rango) Esercizio 5.1. Scrivere un vettore w R 3 linearmente dipendente dal vettore v ( 1, 9, 0). Esercizio 5.2. Stabilire se i vettori
Capitolo 2 Le misure delle grandezze fisiche
Capitolo 2 Le misure delle grandezze fisiche Gli strumenti di misura Gli errori di misura Il risultato di una misura Errore relativo ed errore percentuale Propagazione degli errori Rappresentazione di
La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci
La statistica Elaborazione e rappresentazione dei dati Gli indicatori statistici Introduzione La statistica raccoglie ed analizza gruppi di dati (su cose o persone) per trarne conclusioni e fare previsioni
Intervalli di confidenza
Probabilità e Statistica Esercitazioni a.a. 2006/2007 C.d.L.: Ingegneria per l Ambiente ed il Territorio, Ingegneria Civile, Ingegneria Gestionale, Ingegneria dell Informazione C.d.L.S.: Ingegneria Civile
Università degli studi della Tuscia. Principi di Statistica dr. Luca Secondi A.A. 2014/2015. Esercitazione di riepilogo Variabili casuali
Università degli studi della Tuscia Principi di Statistica dr. Luca Secondi A.A. 014/015 Esercitazione di riepilogo Variabili casuali ESERCIZIO 1 Il peso delle compresse di un determinato medicinale si
Esercizi su algebra lineare, fattorizzazione LU e risoluzione di sistemi lineari
Esercizi su algebra lineare, fattorizzazione LU e risoluzione di sistemi lineari 4 maggio Nota: gli esercizi più impegnativi sono contrassegnati dal simbolo ( ) Esercizio Siano 3 6 8 6 4 3 3 ) determinare
Generazione di Numeri Casuali- Parte 2
Esercitazione con generatori di numeri casuali Seconda parte Sommario Trasformazioni di Variabili Aleatorie Trasformazione non lineare: numeri casuali di tipo Lognormale Trasformazioni affini Numeri casuali
LE DISTRIBUZIONI CAMPIONARIE
LE DISTRIBUZIONI CAMPIONARIE Argomenti Principi e metodi dell inferenza statistica Metodi di campionamento Campioni casuali Le distribuzioni campionarie notevoli: La distribuzione della media campionaria
Il modello lineare misto
Il modello lineare misto (capitolo 9) A M D Marcello Gallucci Univerisità Milano-Bicocca Lezione: 15 GLM Modello Lineare Generale vantaggi Consente di stimare le relazioni fra due o più variabili Si applica
LEZIONE N. 11 ( a cura di MADDALENA BEI)
LEZIONE N. 11 ( a cura di MADDALENA BEI) F- test Assumiamo l ipotesi nulla H 0 :β 1,...,Β k =0 E diverso dal verificare che H 0 :B J =0 In realtà F - test è più generale H 0 :Aβ=0 H 1 :Aβ 0 A è una matrice
La regressione fuzzy. Capitolo I limiti della regressione classica. a cura di Fabrizio Maturo
Capitolo 14 La regressione fuzzy a cura di Fabrizio Maturo 14.1 I limiti della regressione classica L analisi di regressione offre una possibile soluzione per studiare l effetto di una o più variabili
Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n.
5 STIMA PUNTUALE DEI PARAMETRI [Adattato dal libro Excel per la statistica di Enzo Belluco] Sia θ un parametro incognito della distribuzione di un carattere in una determinata popolazione. Il problema
Geometria BIAR Esercizi 2
Geometria BIAR 0- Esercizi Esercizio. a Si consideri il generico vettore v b R c (a) Si trovi un vettore riga x (x, y, z) tale che x v a (b) Si trovi un vettore riga x (x, y, z) tale che x v kb (c) Si
Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica
Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università
Misure Meccaniche e Termiche. punti massa. Valore atteso: Varianza:
Fenomeni aleatori Misure Meccaniche e Termiche Sezione di Misure e Tecniche Sperimentali I fenomeni aleatori (o casuali) sono fenomeni empirici il cui risultato non è prevedibile a priori, caratterizzati
Il test (o i test) del Chi-quadrato ( 2 )
Il test (o i test) del Chi-quadrato ( ) I dati: numerosità di osservazioni che cadono all interno di determinate categorie Prima di tutto, è un test per confrontare proporzioni Esempio: confronto tra numero
PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA
PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURA/TECNICA DI ANALISI DEI DATI SPECIFICAMENTE DESTINATA A STUDIARE LA RELAZIONE TRA UNA VARIABILE NOMINALE (ASSUNTA
Distribuzione Normale
Distribuzione Normale istogramma delle frequenze di un insieme di misure di una grandezza che può variare con continuità popolazione molto numerosa, costituita da una quantità praticamente illimitata di
Covarianza, correlazione e retta di regressione. Paola Lecca, CIBIO UNITN Corso di Matematica e Statistica 2
Covarianza, correlazione e retta di regressione Paola Lecca, CIBIO UNITN Corso di Matematica e Statistica 2 Questa presentazione è stata preparata attingendo dai seguenti testi S. M. Iacus, Statistica,
Σ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica
13. Regressione lineare parametrica Esistono numerose occasioni nelle quali quello che interessa è ricostruire la relazione di funzione che lega due variabili, la variabile y (variabile dipendente, in
Variabile casuale Normale
Variabile casuale Normale La var. casuale Normale (o Gaussiana) è considerata la più importante distribuzione Statistica per le innumerevoli Applicazioni e per le rilevanti proprietà di cui gode L'importanza
UNIVERSITÀ di ROMA TOR VERGATA
UNIVERSITÀ di ROMA TOR VERGATA Corso di Statistica, anno 2010-11 P.Baldi Lista di esercizi 3. Corso di Laurea in Biotecnologie Esercizio 1 Una v.a. X segue una legge N(2, ). Calcolare a1) P(X 1) a2) P(2
Decomposizione LU di una matrice quadrata
Appendice al Cap. 5 Decomposizione LU di una matrice quadrata Una qualunque matrice quadrata M = {m ij } di ordine N, reale, invertibile, i cui minori principali siano tutti non nulli, si può sempre decomporre
1 4 Esempio 2. Si determini la distribuzione di probabilità della variabile casuale X = punteggio ottenuto lanciando un dado. Si ha immediatamente:
CAPITOLO TERZO VARIABILI CASUALI. Le variabili casuali e la loro distribuzione di probabilità In molte situazioni, dato uno spazio di probabilità S, si è interessati non tanto agli eventi elementari (o
Capitolo 12. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 12.1: Suggerimento
Capitolo Suggerimenti agli esercizi a cura di Elena Siletti Esercizio.: Suggerimento Per verificare se due fenomeni sono dipendenti in media sarebbe necessario confrontare le medie condizionate, in questo
