Esercizio General Linear Model Una delle molteplici applicazioni del General Linear Model è la Trend Surface Analysis. Questa tecnica cerca di individuare, in un modello di superficie, quale tendenza segue un set di dati. Può essere considerato come una estensione della regressione multipla usando le coordinate geografiche come variabili indipendenti. L'intento della trend surface analysis è quello di sviluppare una conoscenza generalizzata della distribuzione spaziale di un fenomeno (esistono applicazioni in geomorfologia, metereologia, ecologia, geografia economica e sociale, geoidrologia ecc.), e di conseguenza solo le più semplici tra le superfici polinomiali vengono tipicamente usate: lineare, quadratica e a volte cubica. Trend lineari descrivono solo la maggior parte del tasso di cambiamento, quadratiche e cubiche danno progressivamente descrizioni più complesse dei campioni spaziali. Possiamo anche aggiungere termini crescenti in grado per dare ordini più alti alla superficie. Ovviamente, c'è un punto di cut-off al quale parametri addizionali (per una superficie del k-esimo ordine, ci servono (k 2 + 3k)/2 parametri) aggiungono poco alla spiegazione della tendenza dei dati. Per un'approfondimento su come costruire superfici interpolanti set di dati confrontare anche componenti di scala. Quando lavoriamo con dati multivariati la normale procedura è di fare qualche assunzione circa le relazioni scegliendo deliberatamente le variabili dipendenti ed indipendenti. In realtà si incontrano molti pochi casi in cui la situazione presenta una distinzione così netta ed è quindi arbitraria la scelta delle variabili da usare come indipendenti. Il primo passo è fare una regressione lineare tra la variabile indipendente maggiormente correlata alla dipendente. Il secondo passo è includere la variabile che aggiunge molto alla spiegazione della regressione, e così via fino a quando non vengono incluse tutte le variabili dipendenti significative. L'ultimo passo incorpora tutte le variabili in una regressione multipla dei dati grezzi.
La trend surface analysis è ovviamente molto più complessa, include spesso molte più variabili e l'utilizzo di tutte le tecniche dei general linear model nel pretrattamento dei dati, nella verifica delle conclusioni e nel testare le ipotesi come indicato nella descrizione del metodo. Ci siamo limitati a fornire una introduzione all'analisi che ritenevamo essere di aiuto per mettere in evidenza i primi passi da seguire in uno degli ambiti in cui queste tecniche trovano applicazione; si possono fare molte elaborazioni combinando i dati di input (definendo ad esempio nuove variabili date da elevamenti a potenza o prodotti misti tra i dati) per accertare la relazione tra variabili dipendenti e indipendenti. Il software proposto offre la possibilità di applicare le varie tecniche che fanno parte del General Linear Model come: analisi delle statistiche base, t-test, test del Chi-quadro, ANOVA, regressione lineare, multipla, polinomiale e non lineare, correlazione. Dati di input I particolari dati selezionati si riferiscono ad uno studio di alcune proprietà dei pendii effettuato dalla Deakin Australian University; lo scopo potrebbe essere quello di costruire equazioni di predizione per mettere in relazione una variabile misurata a una o più variabili. L'area scelta per la campagna di raccolta dati è il Fiume Wye nel Galles Centrale, in un sito strumentato dell'istituto di Idrologia. Sono state effettuate misurazioni su di un'area di 365m per 182m su una griglia regolare di valori spaziati di 30.48m (100ft) e 22.86m (75ft) per un totale di 126 punti campione. In ognuno di questi punti sono stati misurati 5 parametri del pendio: 1. L'altezza sul livello medio del mare in metri 2. L'altezza sul livello del corso d'acqua lungo la linea di massima pendenza in metri 3. L'angolo di pendio in gradi 4. L'esposizione del pendio in gradi 5. La profondità del suolo in feet
L'attenzione è stata concentrata sulla correlazione tra la profondità del suolo e le altre proprietà misurate, e sulla costruzione di una equazione di previsione che mette in relazione la profondità del suolo e gli altri parametri. Inizialmente l'analisi è stata fatta da un punto di vista puramente non spaziale, è necessario guardare ai dati solo come ad un set di distribuzioni di frequenza interrelazionate. Poichè il programma è in versione demo, non è possibile salvare dati ed elaborazioni. Forniamo i dati di input in versione excel; una volta scaricati ed aperto il programma possono essere inseriti con una semplice operazione di "copia e incolla". Scarica i dati di input Risultati Il metodo più semplice per studiare le interrelazioni è fare una regressione e una analisi di correlazione tra le variabili per accertare la forma e la possibile significatività delle relazioni. La tabella mostra le correlazioni ottenibili facendo la correlazione tra le singole variabili. Matrice di correlazione Si nota che la profondità del suolo (X 5 ) è altamente correlata con tre delle quattro variabili, ma non c'è apparentemente relazione tra la profondità del terreno e l'esposizione del pendio (X 4 ). Le equazioni della regressione lineare per le correlazioni significative suggeriscono che la
profondità del suolo generalmente cresce al crescere della altezza assoluta e relativa (X 1 e X 2 ), ma decresce con il crescere dell'angolo del pendio (X 3 ). Nell'analisi bivariata, normalmente non vengono fatte assunzioni sulle possibili relazioni tra cause ed effetti, tanto che l'equazione derivata è semplicemente una constatazione della funzione che lega le due variabili (infatti i coefficienti dell'equazione dipenderanno dalla scelta tra le variabili x ed y). A verifica dell'analisi mostriamo la correlazione tra altezza assoluta e relativa e tra angolo di pendio e profondità del suolo.
Il software utilizzato è una versione demo di SigmaStat 2.03 che non permette di salvare i risultati, mostreremo quindi una schermata delle soluzioni. Mostriamo i risultati di alcune elaborazioni tra le più importanti del General linear Model: le statistiche di base, la regressione tra le variabili maggiormente correlate (profondità del suolo, altezza assoluta, altezza relativa, angolo di pendio), la regressione multipla aggiungendo una variabile alla volta fino a quella che le comprende tutte e l'analisi della varianza (ANOVA); ci sono anche dei grafici esplicativi. Ricordiamo che il programma restituisce per ogni elaborazione una pagina riassuntiva di spiegazione. Scarica i risultati
Software Il programma si presenta im maniera simile ad un foglio excel, è un programma di elaborazioni statistiche che implementa diversi modelli tra cui i General Linear Model. Per richiderlo bisogna registrarsi precedentemente, la versione è completa e perfettamente funzionante con la limitazione di non poter salvare i dati. Il link rimanda al sito dal quale scaricare. Scarica il software