Esercitazione 3 29.5.2014 REGRESSIONE E CORRELAZIONE Accedere alle macchine con LOGIN: esame PASSWORD: didattica
Regressione Ci chiediamo quanto i dati osservati differiscano da quelli teorici, usando un modelli (lineare, esponenziale, etc.) Abbiamo visto 3 metodi: Aggiungi linea di tendenza Regr.lin Regressione Vediamo un esempio di come potete trovarli in una traccia d esame (ovviamente fate tutti gli esercizi visti nelle lezioni frontali)
Esercizio 1 In un esperimento si sono misurate le lunghezze in cm. di una molla sottoposta a successivi carichi in kg. ottenendo i seguenti risultati: Determinare l equazione di una retta di regressione e il Pesi Lunghezze 1 12 2 13,5 3 14,8 4 16,5 5 18,2 grafico dei residui (ascissa i pesi, ordinata i residui differenze tra le lunghezze sperimentali e quelle calcolate dall equazione della retta): a) Usando lo strumento Regressione (di Analisi dei dati) b) Usando la funzione Regr.Lin Facendo in modo che i due grafici siano identici. Scrivere anche quanto sono dipendenti le variabili e se il modello lineare ben rappresenta questa correlazione. Mantenere la tabella con i dati in un foglio dati e svolgere il punto a) (risp. b)) in un foglio nominato svolgimento a) (risp. svolgimento b)).
Esercizio 2 In un esperimento si sono misurate le lunghezze in cm. di una molla sottoposta a successivi carichi in kg. ottenendo i seguenti risultati: Pesi Lunghezze 1 12 2 13,5 3 14,8 4 16,5 5 18,2 Determinare l equazione di una retta di regressione e il grafico dei residui (ascissa i pesi, ordinata i residui differenze tra le lunghezze sperimentali e quelle calcolate dall equazione della retta): a) Usando lo strumento Regressione(di Analisi dei dati) b) Usando l opzione Aggiungi linea di tendenza al grafico di dispersione (per ottenere la stessa equazione della retta e R^2), e ottenendo il grafico dei residui dal calcolo esplicito dei residui (usando i coefficienti della retta), in modo che il grafico sia identico a quello ottenuto al punto a). Mantenere la tabella con i dati in un foglio dati e svolgere il punto a) (risp. b)) in un foglio nominato svolgimento a) (risp. svolgimento b)).
Cenni per la soluzione a) Strumento Regressione. E lo strumento più semplice dei tre, restituisce MOLTE tabelle e grafici, che DEVONO essere interpretati. Scrivere anche quanto sono dipendenti le variabili (occorre vedere il coeff. di determinazione R^2) e se il modello lineare ben rappresenta questa correlazione (occorre vedere il valore di Significatività). Inoltre, vengono calcolati automaticamente i grafici, tra cui quello dei residui, e i residui, che quindi possono essere poi controllati con quelli calcolati a mano. Ricorda che: Se R^2 è zero, allora sono lin. indip.; se è uno, allora sono perfettamente correlate linermente(il modello è buono). Si calcola direttamente anche con la funz. RQ ed è legato alla retta di regressione.
Cenni per la soluzione b) Per aggiungere la linea di tendenza. Si tratta della miglior retta (determinata con la tecnica dei minimi quadrati) passante per i dati. Tramite questa retta vediamo se c è dipendenza, secondo la tipologia impostata. Si procede in questo modo: Seleziona i dati In un altro foglio, clicca su Inserisci grafico (a linee con indicatori) Clicca su Seleziona Dati, dove Serie (asse verticale) inserisci le lunghezze Asse orizzontale inserisci i pesi (dovrebbe già esserci) Nel menù Layout, clicca su Analisi e seleziona Altre opzioni in Linea di tendenza (sta alla fine). Spunta ciò che serve (equazione, R^2) Aggiungi etichette agli assi (nel menù layout). Guardando il valore di R^2, si può sapere il grado di correlazione
Cenni per la soluzione c) Strumento Regr.Lin. Lavora in due fasi Guardare la lezione 6 frontale per avere dettagli su questi argomenti! Prima si costruisce una tabella con dati. Occorre selezionare una matrice 5x2. Poi si scrive la funzione Regr.Linche prende 4 dati: la Y (colonna delle lunghezze), la X (colonna dei pesi), un valore booleano che mettiamo a VERO se la retta non deve passare per l origine, altrimenti falso, e un altro valore booleano che mettiamo a VERO se vogliamo tutte le informazioni. La formula è in forma di matrice (quindi alla fine non premere INVIO, ma CTRL+SHIFT+INVIO). Ottenuta la matrice, sappiamo i coefficienti della retta (prima riga, risp. a e b con ax+bequazione della retta), il valore di R^2 (terza riga, prima colonna) da confrontare con quelli ottenuti al punto precedente e calcolare i residui Per i grafico dei residui, calcolare per ogni riga i, il valore y calcolato, y_i,calc=ax_i+b, e poi calcolare i residui y_i,sper-y_i,calc. Il grafico dei residui (dispersione) avrà nella Y i residui e nella X i pesi.
Esercizio 3 (correlazione) La seguente tabella riporta la misurazione di 10 neonati in relazione a peso alla nascita (x), aumento percentuale di peso tra il 70 e 100 giorno di vita (y) e aumento percentuale di altezza tra il 70 e 100 giorno di vita. x (peso nascita) y (peso dopo) z (alt.) 112 63 58 111 66 68 107 72 60 119 52 57 92 75 55 80 118 65 81 120 51 84 114 67 118 42 70 106 72 59 a) Valutare la correlazione tra x e y, ottenendo il grafico di dispersione e calcolando i 3 coefficienti b) Valutare la correlazione tra x e z, ottenendo il grafico di dispersione e calcolando i 3 coefficienti c) Valutare la correlazione tra y e z, ottenendo il grafico di dispersione e calcolando i 3 coefficienti d) Dterminarequaletrayezèpiùcorrelataax e) Per la variabile indicata al punto c), disegnare la retta di regressione, usando l opzione aggiungi linea di tendenza, evidenziando l equazione e il coefficiente di determinazione
Cenni di soluzione Esprime l intensità del legame tra due variabili. Usa 3 coefficienti Covarianza, correlazione (r) usando la funzione PEARSON e determinazione (R^2) usando la funzione RQ. Alle funzioni si passano i dati (se si inverte l ordine tra X e Y, si ottiene lo stesso valore). In particolare, se r=1, i dati sono allineati su retta crescente; se r=0, In particolare, se r=1, i dati sono allineati su retta crescente; se r=0, non c è relazione; se r=-1, i dati sono allineati su retta decrescente. Da questo capisco il grado di correlazione e determino la variabile più correlata a x Per avere il grafico dei residui, si inserisce il grafico di dispersione. Per aggiungere la retta di regressione, aggiungere linea di tendenza (Layout, analisi, linea di tendenza opzioni)