General Linear Model. Esercizio



Documenti analoghi
RELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della

Opportunità e rischi derivanti dall'impiego massivo dell'informatica in statistica. Francesco Maria Sanna Roma, 3 maggio 2012

Excel Terza parte. Excel 2003

Facoltà di Psicologia - Corso FSE gennaio febbraio Marco Vicentini info@marcovicentini.it

RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL

Regressione Mario Guarracino Data Mining a.a. 2010/2011

La statistica multivariata

Prof.ssa Paola Vicard

Elaborazione dei dati su PC Regressione Multipla

lezione 18 AA Paolo Brunori

La categoria «ES» presenta (di solito) gli stessi comandi

Calcolo del Valore Attuale Netto (VAN)

Relazioni tra variabili

Guida all uso di. a cura dell Area Economia Applicata (AEA) - IPI

Analisi di scenario File Nr. 10

Corso integrato di informatica, statistica e analisi dei dati sperimentali Altri esercizi_esercitazione V

Lineamenti di econometria 2

PROGRAMMA SVOLTO NELLA SESSIONE N.

Relazioni statistiche: regressione e correlazione

Indici di dispersione

Capitolo 13: L offerta dell impresa e il surplus del produttore

(a cura di Francesca Godioli)

Sistema Informativo Geografico:

Domande a scelta multipla 1

Analisi della performance temporale della rete

Fogli Elettronici: MS Excel

Corso di. Dott.ssa Donatella Cocca

La distribuzione Normale. La distribuzione Normale

STATISTICA IX lezione

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)

Corso di Fisica generale

Definire all'interno del codice un vettore di interi di dimensione DIM, es. int array[] = {1, 5, 2, 4, 8, 1, 1, 9, 11, 4, 12};

Prof.ssa Paola Vicard

Strumenti e metodi per la redazione della carta del pericolo da fenomeni torrentizi

Uso di base delle funzioni in Microsoft Excel

Statistica. Lezione 6

Programmazione Disciplinare: Calcolo Classe: Quarte - Quinte

Excel. A cura di Luigi Labonia. luigi.lab@libero.it

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva

Studente: SANTORO MC. Matricola : 528

Interpolazione ed approssimazione di funzioni

Metodologia per l analisi dei dati sperimentali L analisi di studi con variabili di risposta multiple: Regressione multipla

Un po di statistica. Christian Ferrari. Laboratorio di Matematica

Pro e contro delle RNA

ColorSplitter. La separazione automatica dei colori di Colibri.. Perché ColorSplitter? Come opera ColorSplitter?

INTRODUZIONE A EXCEL ESERCITAZIONE I

Amministrazione, finanza e marketing - Turismo Ministero dell Istruzione, dell Università e della Ricerca PROGRAMMAZIONE DISCIPLINARE PER U. di A.

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8

Fasi di creazione di un programma

Regressione Logistica: un Modello per Variabili Risposta Categoriali

Elementi di Psicometria con Laboratorio di SPSS 1

Lezione 9: Cambio di base

La Metodologia adottata nel Corso

OSSERVAZIONI TEORICHE Lezione n. 4

Corso di Sistemi di Elaborazione delle informazioni

LA CORRELAZIONE LINEARE

Università di L Aquila Facoltà di Biotecnologie Agro-alimentari

DI IDROLOGIA TECNICA PARTE III

Come modificare la propria Home Page e gli elementi correlati

A destra è delimitata dalla barra di scorrimento verticale, mentre in basso troviamo una riga complessa.

Dimensione di uno Spazio vettoriale

Analisi statistica delle funzioni di produzione

SPC e distribuzione normale con Access

Elementi di Psicometria con Laboratorio di SPSS 1

Comparatori. Comparatori di uguaglianza

Esempi di algoritmi. Lezione III

ibooks Author! A cura di Aldo Torrebruno! versione aggiornata al 5/12/2013!

Manuale Knowledge Base

Analisi di dati di frequenza

Elementi di Psicometria con Laboratorio di SPSS 1

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it

Vittorio Casella. Calcolo del DTM. Dispense

Esempio. Approssimazione con il criterio dei minimi quadrati. Esempio. Esempio. Risultati sperimentali. Interpolazione con spline cubica.

Introduzione al Foglio Elettronico

EPG Metodologia della ricerca e Tecniche Multivariate dei dati. Dott.ssa Antonella Macchia a.macchia@unich.it.

Il database management system Access

Sistemi Informativi Territoriali. Map Algebra

[ Analisi della. concentrazione] di Luca Vanzulli. Pag. 1 di 1

Considerazioni sulla leggibilità del codice a barre e dei caratteri OCR

Prof.ssa Paola Vicard

Slide Cerbara parte1 5. Le distribuzioni teoriche

COME SCARICARE GLI EBOOK E COME USARLI CONSIGLI PASSO PER PASSO. Prendere l'elenco dei libri di testo adottati e che dovrete comprare

Aspettative, Produzione e Politica Economica

Capitolo 12 La regressione lineare semplice

Strutturazione logica dei dati: i file

Abbiamo costruito il grafico delle sst in funzione del tempo (dal 1880 al 1995).

LEZIONE n. 5 (a cura di Antonio Di Marco)

exe Learning Costruire e modificare oggetti e materiali per l apprendimento

postulato della valutazione tramite indicatori: La valutazione di un sistema sanitario tramite indicatori ipotizza

Corso di Psicometria Progredito

PowerPoint. Guida introduttiva

istruzioni per l uso

Guida alla costruzione di tavole con i database

Diritti Riservati Vietata la Rivendita e qualsiasi modifica del seguente ebook

SISTEMI DI SUPPORTO ALLE DECISIONI

Disegni di Ricerca e Analisi dei Dati in Psicologia Clinica. Indici di Affidabilità

Entrare nel sistema. Clicca su Entra per entrare nel sistema. PAGINA 1

Transcript:

Esercizio General Linear Model Una delle molteplici applicazioni del General Linear Model è la Trend Surface Analysis. Questa tecnica cerca di individuare, in un modello di superficie, quale tendenza segue un set di dati. Può essere considerato come una estensione della regressione multipla usando le coordinate geografiche come variabili indipendenti. L'intento della trend surface analysis è quello di sviluppare una conoscenza generalizzata della distribuzione spaziale di un fenomeno (esistono applicazioni in geomorfologia, metereologia, ecologia, geografia economica e sociale, geoidrologia ecc.), e di conseguenza solo le più semplici tra le superfici polinomiali vengono tipicamente usate: lineare, quadratica e a volte cubica. Trend lineari descrivono solo la maggior parte del tasso di cambiamento, quadratiche e cubiche danno progressivamente descrizioni più complesse dei campioni spaziali. Possiamo anche aggiungere termini crescenti in grado per dare ordini più alti alla superficie. Ovviamente, c'è un punto di cut-off al quale parametri addizionali (per una superficie del k-esimo ordine, ci servono (k 2 + 3k)/2 parametri) aggiungono poco alla spiegazione della tendenza dei dati. Per un'approfondimento su come costruire superfici interpolanti set di dati confrontare anche componenti di scala. Quando lavoriamo con dati multivariati la normale procedura è di fare qualche assunzione circa le relazioni scegliendo deliberatamente le variabili dipendenti ed indipendenti. In realtà si incontrano molti pochi casi in cui la situazione presenta una distinzione così netta ed è quindi arbitraria la scelta delle variabili da usare come indipendenti. Il primo passo è fare una regressione lineare tra la variabile indipendente maggiormente correlata alla dipendente. Il secondo passo è includere la variabile che aggiunge molto alla spiegazione della regressione, e così via fino a quando non vengono incluse tutte le variabili dipendenti significative. L'ultimo passo incorpora tutte le variabili in una regressione multipla dei dati grezzi.

La trend surface analysis è ovviamente molto più complessa, include spesso molte più variabili e l'utilizzo di tutte le tecniche dei general linear model nel pretrattamento dei dati, nella verifica delle conclusioni e nel testare le ipotesi come indicato nella descrizione del metodo. Ci siamo limitati a fornire una introduzione all'analisi che ritenevamo essere di aiuto per mettere in evidenza i primi passi da seguire in uno degli ambiti in cui queste tecniche trovano applicazione; si possono fare molte elaborazioni combinando i dati di input (definendo ad esempio nuove variabili date da elevamenti a potenza o prodotti misti tra i dati) per accertare la relazione tra variabili dipendenti e indipendenti. Il software proposto offre la possibilità di applicare le varie tecniche che fanno parte del General Linear Model come: analisi delle statistiche base, t-test, test del Chi-quadro, ANOVA, regressione lineare, multipla, polinomiale e non lineare, correlazione. Dati di input I particolari dati selezionati si riferiscono ad uno studio di alcune proprietà dei pendii effettuato dalla Deakin Australian University; lo scopo potrebbe essere quello di costruire equazioni di predizione per mettere in relazione una variabile misurata a una o più variabili. L'area scelta per la campagna di raccolta dati è il Fiume Wye nel Galles Centrale, in un sito strumentato dell'istituto di Idrologia. Sono state effettuate misurazioni su di un'area di 365m per 182m su una griglia regolare di valori spaziati di 30.48m (100ft) e 22.86m (75ft) per un totale di 126 punti campione. In ognuno di questi punti sono stati misurati 5 parametri del pendio: 1. L'altezza sul livello medio del mare in metri 2. L'altezza sul livello del corso d'acqua lungo la linea di massima pendenza in metri 3. L'angolo di pendio in gradi 4. L'esposizione del pendio in gradi 5. La profondità del suolo in feet

L'attenzione è stata concentrata sulla correlazione tra la profondità del suolo e le altre proprietà misurate, e sulla costruzione di una equazione di previsione che mette in relazione la profondità del suolo e gli altri parametri. Inizialmente l'analisi è stata fatta da un punto di vista puramente non spaziale, è necessario guardare ai dati solo come ad un set di distribuzioni di frequenza interrelazionate. Poichè il programma è in versione demo, non è possibile salvare dati ed elaborazioni. Forniamo i dati di input in versione excel; una volta scaricati ed aperto il programma possono essere inseriti con una semplice operazione di "copia e incolla". Scarica i dati di input Risultati Il metodo più semplice per studiare le interrelazioni è fare una regressione e una analisi di correlazione tra le variabili per accertare la forma e la possibile significatività delle relazioni. La tabella mostra le correlazioni ottenibili facendo la correlazione tra le singole variabili. Matrice di correlazione Si nota che la profondità del suolo (X 5 ) è altamente correlata con tre delle quattro variabili, ma non c'è apparentemente relazione tra la profondità del terreno e l'esposizione del pendio (X 4 ). Le equazioni della regressione lineare per le correlazioni significative suggeriscono che la

profondità del suolo generalmente cresce al crescere della altezza assoluta e relativa (X 1 e X 2 ), ma decresce con il crescere dell'angolo del pendio (X 3 ). Nell'analisi bivariata, normalmente non vengono fatte assunzioni sulle possibili relazioni tra cause ed effetti, tanto che l'equazione derivata è semplicemente una constatazione della funzione che lega le due variabili (infatti i coefficienti dell'equazione dipenderanno dalla scelta tra le variabili x ed y). A verifica dell'analisi mostriamo la correlazione tra altezza assoluta e relativa e tra angolo di pendio e profondità del suolo.

Il software utilizzato è una versione demo di SigmaStat 2.03 che non permette di salvare i risultati, mostreremo quindi una schermata delle soluzioni. Mostriamo i risultati di alcune elaborazioni tra le più importanti del General linear Model: le statistiche di base, la regressione tra le variabili maggiormente correlate (profondità del suolo, altezza assoluta, altezza relativa, angolo di pendio), la regressione multipla aggiungendo una variabile alla volta fino a quella che le comprende tutte e l'analisi della varianza (ANOVA); ci sono anche dei grafici esplicativi. Ricordiamo che il programma restituisce per ogni elaborazione una pagina riassuntiva di spiegazione. Scarica i risultati

Software Il programma si presenta im maniera simile ad un foglio excel, è un programma di elaborazioni statistiche che implementa diversi modelli tra cui i General Linear Model. Per richiderlo bisogna registrarsi precedentemente, la versione è completa e perfettamente funzionante con la limitazione di non poter salvare i dati. Il link rimanda al sito dal quale scaricare. Scarica il software