METODO DEI MINIMI QUADRATI

Documenti analoghi
METODO DEI MINIMI QUADRATI

Dati campionari:media, varianza, bruchi

STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE

La retta di regressione

ESERCIZI SVOLTI Giuliano Bonollo - Michele Bonollo

Ricordiamo. 1. Tra le equazioni delle seguenti rette individua e disegna quelle parallele all asse delle ascisse:

La media e la mediana sono indicatori di centralità, che indicano un centro dei dati.

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

1. (Da Medicina e Odontoiatria 2012) Determinare l'area del triangolo che ha come vertici i punti (0,0), (0,1), (13,12) del piano cartesiano:

Esercitazione del

REGRESSIONE E CORRELAZIONE

Geometria analitica del piano II (M.S. Bernabei & H. Thaler)

ESERCITAZIONE IV - Soluzioni

FUNZIONI QUADRATICHE

64=8 radice perché 8 2 = 64

Statistica Descrittiva Soluzioni 7. Interpolazione: minimi quadrati

Statistica. Alfonso Iodice D Enza

SIMULAZIONE - 29 APRILE QUESITI

Capitolo 11. minimi quadrati Il metodo dei minimi quadrati

Scale Logaritmiche. Matematica con Elementi di Statistica a.a. 2015/16

INTERPOLAZIONE. Introduzione

Intervallo di fiducia del coefficiente angolare e dell intercetta L intervallo di fiducia del coefficiente angolare (b 1 ) è dato da:

ESERCIZIO SVOLTO N 1 ESERCIZIO SVOLTO N 2. Determinare e rappresentare graficamente il dominio della funzione

Regressione Lineare Semplice e Correlazione

Unità Didattica N 9 : La parabola

Soluzioni. 1. Calcolare la parte reale e immaginaria del numero complesso. z = i i. 3 (2 + i) = i i = i.

Piano cartesiano e Retta

Lezione 6 Richiami di Geometria Analitica

2 2 2 A = Il Det(A) = 2 quindi la conica è non degenere, di rango 3.

Anno 5 Regole di derivazione

SCOPO DELL ANALISI DI CORRELAZIONE

FUNZIONI LOGARITMICHE

Nel caso particolare in cui il vertice si trovi nell'origine, la parabola assume la forma: y ˆ ax 2.

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII

Stabilire se il punto di coordinate (1,1) appartiene alla circonferenza centrata nell origine e di raggio 1.

Appunti sulla circonferenza

Trasformazioni Logaritmiche

La regressione lineare. Rappresentazione analitica delle distribuzioni

Si dice parabola il luogo geometrico dei punti del piano, equidistanti da un punto fisso, detto fuoco, e da una retta fissa, detta direttrice.

PIANO CARTESIANO:EQUAZIONI

x 2 + (x+4) 2 = 20 Alle equazioni di secondo grado si possono applicare i PRINCIPI di EQUIVALENZA utilizzati per le EQUAZIONI di PRIMO GRADO.

Statistica 1 A.A. 2015/2016

Variabilità e Concentrazione Esercitazione n 02

UNITÀ DIDATTICA 5 LA RETTA

ESPONENZIALE ED EQUAZIONI DIFFERENZIALI

Tema d esame del 15/02/12

Precorso di Matematica

determinare le coordinate di P ricordando la relazione che permette di calcolare le coordinate del punto medio di un segmento si

RISPOSTE MOTIVATE QUIZ D AMMISSIONE MATEMATICA

La retta nel piano cartesiano

1 Equazioni parametriche e cartesiane di sottospazi affini di R n

Francesco Zumbo

Dispensa di Statistica

EQUAZIONE DELLA RETTA

GEOMETRIA ANALITICA 1 IL PIANO CARTESIANO

Associazione tra caratteri quantitativi: gli indici di correlazione

Σ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre

Corso di Matematica per la Chimica. Dott.ssa Maria Carmela De Bonis a.a

Esercizi di statistica descrittiva. Giulia Simi (Università di Siena) Istituzione di matematica e fondamenti di Biostatistica Siena / 30

PIANO CARTESIANO e RETTE classi 2 A/D 2009/2010

Distribuzione Normale

Esercitazione di Statistica Indici di associazione

LE EQUAZIONI DI SECONDO GRADO

PIANO CARTESIANO: un problema di programmazione lineare

Le derivate parziali

Probabilità e Statistica Prova del 29/07/2016 Traccia E TEORIA Università degli Studi di Verona Laurea in Informatica e Bioinformatica A.A.

Sistemi di equazioni

Covarianza, correlazione e retta di regressione. Paola Lecca, CIBIO UNITN Corso di Matematica e Statistica 2

Secondo parziale di Matematica per l Economia (esempio)

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1

Dal coefficiente di Correlazione lineare tra due grandezze x, y alla covarianza.

Esercizi 2016/17 - Analisi I - Ing. Edile Architettura Esponenziali e logaritmi

Ellisse. Come fa un giardiniere a creare un aiuola di forma ellittica?

Teorema del Limite Centrale

Esercizi sulle coniche (prof.ssa C. Carrara)

Liceo Scientifico Michelangelo - Forte dei Marmi. Esercizi sulla circonferenza svolti - Classe Terza

1.1 Coordinate sulla retta e nel piano; rette nel piano

I appello di calcolo delle probabilità e statistica

Richiami sullo studio di funzione

Svolgimento degli esercizi sulla circonferenza

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

Esercizi sulle coniche (prof.ssa C. Carrara)

LA RETTA. La retta è un insieme illimitato di punti che non ha inizio, né fine.

Proporzionalità e grafici

Transcript:

Vogliamo determinare una funzione lineare che meglio approssima i nostri dati sperimentali e poter decidere sulla bontà di questa approssimazione. Sia f(x) = mx + q, la coppia di dati (x i, y i ) appartiene al grafico di f(x) se e solo se vale la relazione y i = mx i + q; quindi l errore δ i = mx i + q - y i misura la distanza che c è tra il dato sperimentale (x i, y i ) ed il dato teorico (x i, f(x i )).

Abbiamo quindi n errori δ 1, δ 2,., δ n Prendiamo come misura di quanto f(x) approssima i dati la media aritmetica degli errori elevati al quadrato: n f(m,q)= Σ (mx i + q - y i ) 2 / n i=1 Vogliamo determinare m e q in modo tale da rendere minima f(m,q)

Abbiamo già visto che la media aritmetica è l unico punto di minimo della funzione n f(x) = Σ (x-x i ) 2 i=1 Possiamo quindi dire che, fissato m, abbiamo che q* = y* -mx* è senz altro il valore di q che rende minima la media degli errori al quadrato. Sostituiamo q* nella media degli errori al quadrato

n Σ (mx i - mx*+y* - y i ) 2 / n i=1 Dobbiamo ora determinare m in modo da rendere minima la precedente funzione Se sviluppiamo il quadrato, troviamo una funzione quadratica nell incognita m f(m)= {[ Σ(x i -x*) 2 ] m 2 -[2 Σ(x i -x*)(y i -y*)] m + [ Σ(y i - y*) 2 ]}/n Il punto di minimo si ha per m*= Σ(x i -x*)(y i -y*)/ Σ(x i -x*) 2 = Cov x,y / Var x

Possiamo anche scrivere: m*= Σ(x i - x*)(y i - y*)/ Σ(x i -x*) 2 = = [Σ(x i y i )/n- x* y*]/[σ(x i ) 2 /n- (x * ) 2 ]= = [(x y)* - x* y*]/[(x 2 )* - (x * ) 2 ] Abbiamo quindi trovato la funzione lineare che meglio approssima i dati; rimane da stabilire la bontà dell approssimazione

Possiamo calcolare f(m*), il valore minimo assunto: vale a dire l ordinata del vertice della parabola- grafico della funzione da minimizzare: f(m*)=σ(y i -y*) 2 /n - [Σ(x i y i )/n - x* y*] 2 /[Σ(x i ) 2 /n- (x * ) 2 ]= Σ(y i ) 2 /n- (y * ) 2 - [Σ(x i y i )/n- x* y*] 2 /[Σ(x i ) 2 /n- (x * ) 2 ] f(m*, q*) 0 ed è f(m*, q*)=0 se e solo se le coppie dei dati stanno tutte sulla retta, per cui più f(m*, q*) è vicino a 0 e più l approssimazione è buona

Poiché f(m*,q*) misura la media degli errori (assoluti) al quadrato nelle ordinate, un indice migliore della bontà dell adattamento della legge lineare ai dati è f(m*,q*)/var y Si ottiene 1 - {[(x y)* - x* y*] 2 /[((x 2 )* - (x * ) 2 ) ((y 2 )* - (y * ) 2 )]} Poiché si ha f(m*,q*)/var y 0, ne segue che {[(x y)* - x* y*] 2 /[((x 2 )* - (x * ) 2 ) ((y 2 )* - (y * ) 2 )]} 1 più è vicino a 1 migliore è l approssimazione

La radice quadrata di {[(x y)* - x* y*] 2 /[((x 2 )* - (x * ) 2 ) ((y 2 )* - (y * ) 2 )]} è (x y)* - x* y* / sqr([((x 2 )* - (x * ) 2 ) ((y 2 )* - (y * ) 2 )] più vicina è a 1, migliore è l approssimazione. Togliendo il valore assoluto al numeratore, otteniamo il coefficiente di correlazione o coefficiente di Pearson (CP) CP= [(x y)* - x* y*]/ (DS x DS y ) [-1, 1]

Applichiamo dunque il metodo dei minimi quadrati per determinare la retta di regressione che più si avvicina ai dati sperimentali: Saccarosio in gr/l : s 5 10 15 20 25 30 35 Lunghezza radice in mm: l 33 44 62 56 74 71 80 Abbiamo visto che il coefficiente angolare della retta di regressione è dato da m = [(l s)* - l* s*]/[(s 2 )* - (s * ) 2 ] = Cov s,l / Var s, mentre il termine noto q = l* -ms* Per determinare tutti gli indici necessari costruiamo un opportuna tabella:

s l s 2 l 2 s l 5 33 25 1089 165 10 44 100 1936 440 15 62 225 3844 930 20 56 400 3136 1120 25 74 625 5476 1850 30 71 900 5041 2130 35 80 1225 6400 2800 s*=20 l*=60 (s 2 )*=500 (l 2 )*=3846 (s l)*=1347.86

Possiamo procedere al calcolo di m e di q: m = (1347.68 - (20) (60))/(500-(20) 2 ) = 1.4786 q = 60 - (1.4786) (20) = 30.428 Vediamo se la retta approssima bene i dati sperimentali, calcolando il coefficiente di correlazione, detto anche di Pearson (CP):

CP =(s l)* - s* l* / sqr([((s 2 )* - (s * ) 2 ) ((l 2 )* - (l * ) 2 )] =(1347.86 - (20) (60)) / sqr [(500-(20) 2 ) (3846 - (60) 2 )] = 0.94 Dunque, essendo CP vicino ad 1, l approssimazione è buona.

Dall analisi grafica si osserva una certa differenza tra i dati del campione per i valori più grandi di s e quelli previsti in base al modello di regressione lineare. La crescita sembra aumentare con l aumentare del contenuto di saccarosio non linearmente, ma piuttosto con una relazione che potrebbe essere, ragionevolmente, di radice quadrata. Possiamo determinare la retta di regressione per i dati trasformati in modo da prendere ancora y=l, mentre x= s, vale a dire l(s) = m s +q. Sostituiamo quindi nella tabella precedente le opportune colonne dei dati trasformati s e s l

s l s l 2 s l 5 33 2.24 1089 73.92 10 44 3.16 1936 139.04 15 62 3.87 3844 239.94 20 56 4.47 3136 250.32 25 74 5 5476 370 30 71 5.48 5041 389.08 35 80 5.92 6400 473.6 s*=20 l*=60 ( s)*=4.31 (l 2 )*=3846 ( s l)*=276.56

Nella tabella precedente i dati sono stati calcolati arrotondando alla seconda cifra decimale. Calcoliamo coefficiente angolare m ed intercetta q per questa nuova retta di regressione m = [( s l)* - s* l*]/[s * - (( s) * ) 2 ] = 11.89 q = 60-11.89 4.31 = 8.75 Calcoliamo CP CP = [( s l)*- ( s) * l* ]/sqr[(s * - (( s) * ) 2 ) ((l 2 )* - (l * ) 2 )] = 17.96/350.28 = 0.96 Quindi questa curva approssima meglio i dati.