Interpolazione Statistica

Похожие документы

Il METODO DEI MINIMI QUDRATI

Interpolazione e metodo dei minimi quadrati

La media e la mediana sono indicatori di centralità, che indicano un centro dei dati.

E la rappresentazione grafica, in questo caso, è la dispersione x,y, cioè una nuvola di punti nel piano cartesiano

REGRESSIONE E CORRELAZIONE

Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria

INTERPOLAZIONE. Introduzione

Σ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica

Metodo dei Minimi Quadrati. Dott. Claudio Verona

Minimi quadrati pesati per la Regressione Lineare

La regressione lineare. Rappresentazione analitica delle distribuzioni

TOPOGRAFIA 2013/2014. Prof. Francesco-Gaspare Caputo

STATISTICA. Regressione-2

x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y )

Nel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0.

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre

Lezione 5 Corso di Statistica. Francesco Lagona

Esercitazione del

PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE

LEZIONE 10. S(C,ρ) Figura 10.1

METODO DEI MINIMI QUADRATI

Il metodo dei minimi quadrati e la retta di regressione

Statistica Descrittiva Soluzioni 7. Interpolazione: minimi quadrati

UNITÀ DIDATTICA 5 LA RETTA

Rappresentazioni grafiche di distribuzioni doppie

Capitolo uno STATISTICA DESCRITTIVA BIVARIATA

L EQUAZIONE DI UNA RETTA CAPITOLO 3. IL PIANO CARTESIANO E LA RETTA

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)

RAPPRESENTAZIONE GRAFICA DEI RISULTATI SPERIMENTALI INTERPOLAZIONE E CURVE DI REGRESSIONE

Lezione 5 Corso di Statistica. Domenico Cucina

Lezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo

ITCS Erasmo da Rotterdam. Anno Scolastico 2014/2015. CLASSE 4^ M Costruzioni, ambiente e territorio

Scale Logaritmiche. Matematica con Elementi di Statistica a.a. 2015/16

Capitolo 2. La teoria normativa della politica economica

1 Fit di dati sperimentali: il χ 2. Il metodo dei minimi quadrati.

La stima dei costi di produzione

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6

Capitolo 12 La regressione lineare semplice

Associazione tra caratteri quantitativi: gli indici di correlazione

Regressione e Correlazione (cap. 11) Importazione dati da file di testo

Dispensa sulla funzione gaussiana

Covarianza, correlazione e retta di regressione. Paola Lecca, CIBIO UNITN Corso di Matematica e Statistica 2

Statistica. Esercitazione 16. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice

Statistica Elementare

Indipendenza, Dipendenza e interdipendenza

Esercitazioni di statistica

MISURE DI DISPERSIONE

STIME SECONDO IL METODO DI ARGELANDER

Microeconometria Day # 3 L. Cembalo. Regressione con due variabili e metodo dei minimi quadrati

Istituzioni di Statistica 1 Esercizi su strumenti grafici e funzione di frequenza relativa cumulata

Analisi Numerica. Debora Botturi ALTAIR. Debora Botturi. Laboratorio di Sistemi e Segnali

Lab. 2 - Excel. Prof. De Michele e Farina

Capacità: Analizzare un problema semplice. Valutare la congruenza dei risultati con i dati e le informazioni iniziali.

Studio di circuiti contenenti diodi Uso di modelli semplificati

Транскрипт:

Interpolazione Statistica Come determinare una funzione che rappresenti la relazione tra due grandezze x e y a cura di Roberto Rossi novembre 2008

Si parla di INTERPOLAZIONE quando: Note alcune coppie di dati (x,y), interpretabili come punti del piano, ci si propone di costruire una funzione (interpolatrice) che sia in grado di descrivere la relazione esistente tra l insieme dei valori di x e quello dei valori di y.

Sono possibili due casi: 1. Ci troviamo in presenza di una distribuzione che riteniamo lacunosa (mancante di alcuni dati che non possono più essere rilevati). La funzione interpolante viene utilizzata per stimare i dati mancanti. Una volta fatta questa stima la distribuzione viene completata con l insieme dei dati trovati. (interpolazione Matematica/per punti)

(continua) casi possibili: 2. Ci troviamo in presenza di una distribuzione di dati alcuni dei quali vengono ritenuti affetti da errori. La funzione interpolante viene utilizzata per sostituire a quella distribuzione una distribuzione approssimata non affetta da errori. (interpolazione Statistica/fra punti) In ogni caso la funzione interpolante può essere di tipo diverso: lineare, parabolico, esponenziale

Interpolazione Statistica metodo dei minimi quadrati Consideriamo un fenomeno statistico per il quale disponiamo della seguente distribuzione di dati: x x 1 x 2 x n-1 x n y y 1 y 2 y n-1 y n

(continua) metodo dei supponiamo che rappresentando tali dati in un sistema di assi cartesiani, si ottenga il diagramma a dispersione minimi quadrati

(continua) metodo dei minimi quadrati Poiché riteniamo che i dati osservati siano affetti da errori vogliamo costruire una funzione interpolante che ci permetta di sostituire ai dati y i osservati i dati yi* interpolati, più regolari anche se approssimati. Una volta decisa la funzione interpolante bisognerà fare in modo che l approssimazione presenti un buon accostamento.

Scelta del tipo di funzione interpolante la funzione può essere di tipo diverso: lineare (primo grado), parabolica (secondo grado), esponenziale etc. in generale la scelta può essere suggerita dall esame del diagramma a dispersione. In questo primo esempio potrebbe essere logica l adozione di una funzione lineare (una certa tendenza dei dati di disporsi attorno a una retta)

Scelta del tipo di funzione interpolante In questo secondo esempio sembra più logica l adozione di una funzione esponenziale. Osservazione: in concreto viene spesso adottata una funzione lineare, ciò dipende dalla sua semplicità e dalla facilità di manipolazione che consegue.

Condizioni per un buon accostamento dopo aver scelto il tipo di funzione interpolante, come possiamo ottenere un buon accostamento tra la distribuzione dei valori osservati e quella dei valori teorici ottenuti interpolando? Consideriamo i valori y i osservati e quelli teorici y i * forniti dalla funzione interpolante. Gli errori commessi sostituendo a ciascun y i il corrispondente y i * sono dati dalle differenze: y i - y i * al fine di ottenere un buon accostamento occorre minimizzare questi errori.

(continua) buon accostamento Per raggiungere l obiettivo non possiamo prendere in considerazione la somma delle differenze: essendo alcune positive, altre negative altre ancora nulle esse potrebbero anche compensarsi. Prenderemo in considerazione la somma dei quadrati delle differenze e poniamo come condizione di accostamento: Σ i (y i - y i *) 2 = minimo (metodo dei minimi quadrati)

Interpolazione statistica metodo dei minimi quadrati qualunque sia il tipo di funzione interpolante adottato, la condizione di accostamento prevede che sia minima la somma dei quadrati delle differenze fra valori osservati e valori teorici Osservazione: precisiamo che nelle coppie (x, y) i valori di x indicano i tempi (le date) in cui i vengono rilevati i valori di y. Ecco perché si parla di evoluzione temporale di un fenomeno statistico. Le coppie mostrano come il fenomeno evolve nel tempo.

Metodo dei minimi quadrati: funzione lineare Se come funzione interpolante viene scelta la funzione lineare y*=a+bx i La condizione di accostamento diventa: Σ i [y i (a+bx i ) ] 2 = minimo Si tratta quindi di determinare i valori dei parametri a e b in modo tale che la funzione: f(a, b) =Σ i [y i (a+bx i ) ] 2 sia minima. (minimizzare una funzione di due variabili)

Valori di a e b nel caso di funzione lineare (minimi quadrati) che soddisfano la condizione di accostamento sono: b = i a [x Dove: M(x) la media dei valori di x i, M(y)la media dei valori di y i i M(x)][( i [x i - y i M(x)] M(y)] = M ( y) b M ( x) 2

Es. produzione di frumento (milioni di quintali) anni dal 1993 al 2001. I valori x i rappresentano gli anni che per semplicità vengono contati assumendo il 1993 come anno 0, il 94 come anno 1 il 2001 come l anno 8. i valori y i rappresentano la quantità di frumento prodotta nei singoli anni. continua

produzione di frumento (milioni di quintali) anni dal 1993 al 2001. anni x y X-M(x) Y-M(y) [X-M(x)][Y-M(y)] [X-M(x)]^2 y* a b 1993 0,00 85,65-4,00-6,10 24,40 16,00 88,80 0,74 88,80 1994 1,00 91,80-3,00 0,05-0,15 9,00 89,54 1995 2,00 94,60-2,00 2,85-5,70 4,00 90,27 1996 3,00 88,55-1,00-3,20 3,20 1,00 91,01 1997 4,00 86,40 0,00-5,35 0,00 0,00 91,75 1998 5,00 98,20 1,00 6,45 6,45 1,00 92,49 1999 6,00 90,50 2,00-1,25-2,50 4,00 93,23 2000 7,00 99,35 3,00 7,60 22,80 9,00 93,97 2001 8,00 90,70 4,00-1,05-4,20 16,00 94,70 36,00 825,75 0,00 0,00 44,30 60,00 825,75

S* S M(y) =91,75 4 M(x) = 825,7 5 60 44,3 0,00 0 825,75 36 94,7033 3 16-4,2-1,05 4 90,70 8 2001 93,965 9 22,8 7,60 3 99,35 7 2000 93,2266 7 4-2,5-1,25 2 90,50 6 1999 92,4883 3 1 6,45 6,45 1 98,20 5 1998 91,75 0 0-5,35 0 86,40 4 1997 91,0116 7 1 3,2-3,20-1 88,55 3 1996 90,2733 3 4-5,7 2,85-2 94,60 2 1995 89,535 9-0,15 0,05-3 91,80 1 1994 88,79667 0,738333 88,7966 7 16 24,4-6,10-4 85,65 0 1993 a b y* X-M(x) ^2 x'y' Y-M(y) X-M(x) Y X anni

valori teoici e valori osservati 102,00 prod. frumento (milioni di quintali) 100,00 98,00 96,00 94,00 92,00 90,00 88,00 86,00 84,00 1992 1994 1996 1998 2000 2002 anni Serie1 Serie2