Dispense dell insegnamento di Laboratorio di GIS per la pianificazione



Documenti analoghi
PROCEDURA INFORMATIZZATA PER LA COMPENSAZIONE DELLE RETI DI LIVELLAZIONE. (Metodo delle Osservazioni Indirette) - 1 -

Variabili statistiche - Sommario

STATISTICA DESCRITTIVA CON EXCEL

Metodi e Modelli per l Ottimizzazione Combinatoria Progetto: Metodo di soluzione basato su generazione di colonne

Relazione funzionale e statistica tra due variabili Modello di regressione lineare semplice Stima puntuale dei coefficienti di regressione

Introduzione al Machine Learning

Relazioni tra variabili: Correlazione e regressione lineare

* * * Nota inerente il calcolo della concentrazione rappresentativa della sorgente. Aprile 2006 RL/SUO-TEC 166/2006 1

LA STATISTICA: OBIETTIVI; RACCOLTA DATI; LE FREQUENZE (EXCEL) ASSOLUTE E RELATIVE

LA COMPATIBILITA tra due misure:

Ministero della Salute D.G. della programmazione sanitaria --- GLI ACC - L ANALISI DELLA VARIABILITÀ METODOLOGIA

TITOLO: L INCERTEZZA DI TARATURA DELLE MACCHINE PROVA MATERIALI (MPM)

Ricerca Operativa e Logistica Dott. F.Carrabs e Dott.ssa M.Gentili. Modelli per la Logistica: Single Flow One Level Model Multi Flow Two Level Model

Università degli Studi di Urbino Facoltà di Economia

Analisi ammortizzata. Illustriamo il metodo con due esempi. operazioni su di una pila Sia P una pila di interi con le solite operazioni:

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI CONFRONTO DI PIU MEDIE IL METODO DI ANALISI DELLA VARIANZA

RETI TELEMATICHE Lucidi delle Lezioni Capitolo VII

Calcolo della caduta di tensione con il metodo vettoriale

Esame di Statistica Corso di Laurea in Economia

Dipartimento di Statistica Università di Bologna. Matematica finanziaria aa lezione 13: 24 aprile 2013

Il modello markoviano per la rappresentazione del Sistema Bonus Malus. Prof. Cerchiara Rocco Roberto. Materiale e Riferimenti

Lezione 10. L equilibrio del mercato finanziario: la struttura dei tassi d interesse

INDICI STATISTICI MEDIA, MODA, MEDIANA, VARIANZA

3. Esercitazioni di Teoria delle code

STATISTICA DESCRITTIVA - SCHEDA N. 5 REGRESSIONE LINEARE

Strutture deformabili torsionalmente: analisi in FaTA-E

STATISTICA SOCIALE Corso di laurea in Scienze Turistiche, a.a. 2007/2008 Esercizi 16 novembre2007

Macchine. 5 Esercitazione 5

Dipartimento di Statistica Università di Bologna. Matematica Finanziaria aa Esercitazione: 4 aprile 2013

Aritmetica e architetture

CAPITOLO IV CENNI SULLE MACCHINE SEQUENZIALI

Capitolo 3 Covarianza, correlazione, bestfit lineari e non lineari

MACROECONOMIA A.A. 2014/2015

Leggere i dati da file

La regressione. La Regressione. La Regressione. min. min. Var X. X Variabile indipendente (data) Y Variabile dipendente

CAPITOLO 3 Incertezza di misura Pagina 26

Elementi di statistica

La verifica delle ipotesi

Norma UNI CEI ENV 13005: Guida all'espressione dell'incertezza di misura

La retroazione negli amplificatori

Studio grafico-analitico di una funzioni reale in una variabile reale

LEZIONE 2 e 3. La teoria della selezione di portafoglio di Markowitz

ELEMENTI DI STATISTICA

Esercitazioni del corso di Relazioni tra variabili. Giancarlo Manzi Facoltà di Sociologia Università degli Studi di Milano-Bicocca

8.1 Sintesi, descrizione, interpretazione

Modelli descrittivi, statistica e simulazione

Corso di Statistica (canale P-Z) A.A. 2009/10 Prof.ssa P. Vicard

Trigger di Schmitt. e +V t

Capitolo 6 Risultati pag a) Osmannoro. b) Case Passerini c) Ponte di Maccione

Capitolo 3. Cap. 3-1

Esercitazioni del corso: STATISTICA

Statistica e calcolo delle Probabilità. Allievi INF

Apprendimento Automatico e IR: introduzione al Machine Learning

CIRCOLARE N. 9. CIRCOLARI DELL ENTE MODIFICATE/SOSTITUITE: nessuna. Firmato: ing. Carlo Cannafoglia

Soluzione esercizio Mountbatten

Analisi di mercurio in matrici solide mediante spettrometria di assorbimento atomico a vapori freddi

PARENTELA e CONSANGUINEITÀ di Dario Ravarro

Lezioni di Statistica (25 marzo 2013) Docente: Massimo Cristallo

Indicatori di dimensione e di concentrazione

Corso di. Dott.ssa Donatella Cocca

Economie di scala, concorrenza imperfetta e commercio internazionale

A. AUMENTO DELLA SPESA PUBBLICA FINANZIATO ESCLUSIVAMENTE TRAMITE INDEBITAMENTO

Simulazione seconda prova Tema assegnato all esame di stato per l'abilitazione alla professione di geometra, 2006

{ 1, 2,..., n} Elementi di teoria dei giochi. Giovanni Di Bartolomeo Università degli Studi di Teramo

SOFTWARE NBSI (NEIGHBOURHOOD BASED STRUCTURAL INDICES)

* PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE *

La contabilità analitica nelle aziende agrarie

Capitolo 2 Dati e Tabelle

PROGRAMMAZIONE DIDATTICA

Indicatori di rendimento per i titoli obbligazionari

Dipartimento di Economia Aziendale e Studi Giusprivatistici. Università degli Studi di Bari Aldo Moro. Corso di Macroeconomia 2014

Matematica Computazionale(6cfu) Ottimizzazione(8cfu)

Risoluzione quesiti I esonero 2011

Elementi di linear discriminant analysis per la classificazione e il posizionamento nelle ricerche di marketing

Scelta dell Ubicazione. di un Impianto Industriale. Corso di Progettazione Impianti Industriali Prof. Sergio Cavalieri

Circuiti di ingresso differenziali

Regressione Multipla e Regressione Logistica: concetti introduttivi ed esempi

Test delle ipotesi Parte 2

Economia del Settore Pubblico 97. Economia del Settore Pubblico 99. Quale indice di diseguaglianza usare? il rapporto interdecilico PROBLEMA:

Corso AFFIDABILITÀ DELLE COSTRUZIONI MECCANICHE. Prof. Dario Amodio Ing. Gianluca Chiappini

Valore attuale di una rendita. Valore attuale in Excel: funzione VA

lxmi.mi.infn.it/~camera/silsis/laboratorio-1/2-statistica.ppt Misura:

Concetti principale della lezione precedente

DBMS multimediali A L B E R T O B E L U S S I B A S I D I D A T I A N N O A C C A D E M I C O /

Fondamenti di Visione Artificiale (Seconda Parte) Corso di Robotica Prof.ssa Giuseppina Gini Anno Acc /2007

PIANIFICAZIONE DEI TRASPORTI

Calibrazione. Lo strumento idealizzato

La tua area riservata Organizzazione Semplicità Efficienza

Tutti gli strumenti vanno tarati

Dati di tipo video. Indicizzazione e ricerca video

L AUTORITÀ PER L ENERGIA ELETTRICA E IL GAS

L ANALISI MONOVARIATA: Variabilità e mutabilità. Prof. Maria Carella

Università di Napoli Parthenope Facoltà di Ingegneria

Soluzioni per lo scarico dati da tachigrafo innovativi e facili da usare.

PARTE II LA CIRCOLAZIONE IDRICA

Fisica Generale I Misure di grandezze fisiche e incertezze di misura Lezione 3 Facoltà di Ingegneria Livio Lanceri

Fisica Generale I Misure di grandezze fisiche e incertezze di misura Lezione 3 Facoltà di Ingegneria Livio Lanceri

TIPI DI ANALISI DEI DATI ORGANIZZATI IN MATRICI CASI X VARIABILI

Verifica termoigrometrica delle pareti

VA TIR - TA - TAEG Introduzione

Transcript:

Facoltà d Archtettura e Socetà Facoltà d Ingegnera Cvle, Ambentale e Terrtorale Centro per lo Svluppo del Polo d Cremona, Poltecnco d Mlano Va Sesto 41 26100 Cremona Master unverstaro nterfacoltà d II lvello n Governo del terrtoro e delle rsorse fsche Ingegnera del suolo e delle acque http://www.cremona.polm.t/msa Drezone del Master unverstaro: prof. Enrco Larcan (Facoltà d Ingegnera Cvle, Ambentale e Terrtorale, Poltecnco d Mlano) prof. Per Lug Paolllo (Facoltà d Archtettura e Socetà, Poltecnco d Mlano) Commssone d Master unverstaro: prof. Enrco Larcan Facoltà d Ingegnera Cvle, Ambentale e Terrtorale, Poltecnco d Mlano ng. Stefano Loff Drettore del Consorzo per l Incremento dell Irrgazone nel Terrtoro Cremonese prof. Claudo Maffezzon Presdente del Centro per lo Svluppo del Polo d Cremona, Poltecnco d Mlano prof. Enrco Ors Facoltà d Ingegnera Cvle, Ambentale e Terrtorale, Poltecnco d Mlano prof. Per Lug Paolllo (presdente) Facoltà d Archtettura e Socetà, Poltecnco d Mlano Dspense dell nsegnamento d Laboratoro d GIS per la panfcazone Concorrono al Master unverstaro n Governo del terrtoro e delle rsorse fsche Ingegnera del suolo e delle acque: Consorzo per l ncremento dell rrgazone nel terrtoro cremonese http://www.consorzorrgazon.t Ordne degl ngegner della provnca d Cremona http://www.ordng.cr.t

POLITECNICO DI MILANO Master unverstaro nterfacoltà d II lvello n Governo del terrtoro e delle rsorse fsche Ingegnera del suolo e delle acque http://www.cremona.polm.t/msa Indce 140 La rlevanza dell anals multvarata come strumento d classfcazone e d 144 auslo alla decsone 140.1 Introduzone alla statstca descrttva 144 140.2 Le varabl statstche undrezonal 144 140.3 Gl ndc d poszone 145 140.4 Gl ndc d dspersone 146 140.5 Gl ndc d forma 146 141 Strument e metod per l ndagne - esplorazone de dat 147 141.1 Fenomenologa della statstca: causaltà e correlazone 148 141.2 Le tecnche multvarate, metod d proezone delle potes. Anals e statstca 148 multvarata 142 I passagg canonc, da tradurs n pratca con Addat 1 (software d anals 149 multvarata d dat terrtoral), per l trattamento d varabl qualtatve 143 Il trattamento, medante Addat, d alcune varabl qualtatve della carta 152 pedologca e successva spazzalzzazone delle rsultanze con ArcVew 3.x 143.1 Impostazon prelmnar d Addat e formattazone del fle d Input 155 143.2 La creazone d tpologe 156 1 S consgla d leggere come ntegrazone l ottmo manuale prodotto dal Prof. Grguolo, deatore e scrttore d Addat, reperble all ndrzzo http://cdoc.uav.t/~slvo/addat_t.html

144 140 1. La rlevanza dell anals multvarata come strumento d classfcazone e d auslo alla decsone La dscplna urbanstca ha quale suo scopo l addvenre a scelte o decson che sano ntmamente motvate. Cò che da soldtà e fondatezza all mpanto d anals attraverso cu s gunge a formulare gudz è, da una parte, la componente normatva e, dall altra la scentfctà de metod - modell utlzzabl. La decsone, qund, deve sempre confrontars con un nfnta d dat, l pù delle volte, appartenent ad una realtà complessa. Per rdurre d complesstà l assetto reale e rcondurlo a modell nterpretatv utlzzabl occorre rmetters alla statstca multvarata. Con l termne multvarato s ntende ndcare una sere d fenomen, d varazon da uno stato nzale, non tutte dello stesso ordne e genere e non consecutve, ma contemporanee. La realtà s può faclmente ascrvere a questa descrzone, s pens, per esempo, allo stato d salute d un ndvduo o al suono d un volno. L osservazone e la msurazone della realtà che può essere, dunque, dretta (la temperatura msurata attraverso un termometro) o ndretta (l lvello d nqunamento d una falda, frutto d dverse presson, ognuna delle qual da valutare sngolarmente per conoscere l fenomeno nel suo complesso). In statstca, le osservazon, gl element costtutv, s traducono n vettor chamat varabl: convenzonalmente le varabl x sono quelle drettamente msurate o msurabl, mentre le varabl y sono le varabl da predre (frutto d potes nterpretatve del fenomeno - n urbanstca, prevson). Smmetrcamente s ntende p l numero delle varabl x e q l numero delle varabl y (sa n = numero degl element). x 11 x 1p y 11 y 1q x n1 y n1 140.1. Introduzone alla statstca descrttva Quello che c s propone d realzzare è:. organzzare dat raccolt relatvamente ad un certo fenomeno, n modo da descrverlo solo sulla base delle manfestazon osservate del fenomeno stesso;. nterpretare l fenomeno sulla base de dat raccolt, per confronto con le varabl casual, consderate strutture d rfermento. Al fne della descrzone del fenomeno occorre stablre schem d classfcazone delle osservazon. Tal schem generano le varabl statstche che rappresentano con quale frequenza s presenta un certo carattere del fenomeno n esame (dstrbuzone d frequenza). Le nformazon contenute nelle varabl statstche possono essere sntetzzate con:. msure d poszone (centro, meda, medana, moda);. msure d dspersone delle osservazon rspetto al centro (ndc d affdabltà o rappresentatvtà de centr);. msure della forma della dstrbuzone (asmmetra, curtos). 140.2. Le varabl statstche undrezonal S supponga d avere a dsposzone dat relatv ad un certo fenomeno, e che la loro numerostà sa N: che esstano, coè, esegute n osservazon. Una prma classfcazone elementare è quella che dà luogo ad una dstrbuzone d presenze: X x 1 x 2 x 3 x x n valor dell argomento, qualtatvo o quanttatvo n 1 n 2 n 3 n n n frequenze assolute (numero d volte che x s è presentato) 1 Captolo tratto e relaborato dalla monografa fnale d laboratoro d progettazone ambentale II A.A. 2004-2005 Prof. Per Lug Paolllo, gruppo: Andrea Pastor, Chara Cazzanga, Francesca Bondon.

145 Deve valere la condzone: n n = N S ntroducano ora le frequenze relatve: La dstrbuzone d frequenza, qund, s può scrvere come : f = n N X x 1 x 2 x 3 x x n valor dell argomento, qualtatvo o quanttatvo f 1 f 2 f 3 f f n frequenze relatve 140.3. Gl ndc d poszone Supponamo d dover rsolvere l seguente problema: concentrare le nformazon contenute nella varable statstca x n un unco numero C detto centro, n grado d esprmere la poszone o tendenza centrale del fenomeno studato. In pratca C nforma sulla poszone n cu l fenomeno s concentra. La condzone per determnare l centro C d una varable statstca x è mporre che C sta alla mnma dstanza possble dall nseme de valor argomental, tenendo conto delle loro frequenze. La formulazone matematca che esprme questo concetto: sa rcercato l valore d Cr che mnmzza la funzone : Z n = x C r f S defnscono così centr d ordne r : r = 2 r = 1 r = 0 C 2 = meda artmetca C 1 = medana C 0 = moda Da cu: meda - ottenuta dvdendo la somma per l numero d dat o conteggo: E( x) n = = 1 n x medana - l valore che dvde a metà dat dell nseme; moda - l valore che s presenta con maggor frequenza nell nseme d dat:

146 V ( x) = n = 1 ( x E( x) ) n 1 2 devazone standard - la radce quadrata della varanza: σ x = n = 1 ( x E( x) ) n 1 2 covaranza - tra due varabl, x e y è la msura della loro assocazone lneare: ( x, y) = 1 cov = n [ x E( x) ][ y E( y) ] n 1 errore standard - la msura dell ncertezza sulla meda. E utlzzato per l nferenza statstca (ntervall d confdenza e verfca delle potes); correlazone - concetto statstco che s usa per le relazon lnear, è una msura neutra del fenomeno; esprme l grado d correlazone tra due varabl n qualunque untà d msura esse sano espresse: 140.4. Gl ndc d dspersone Danno nformazon sull affdabltà o rappresentatvtà degl ndc d poszone. Ess, nfatt, sono tanto maggor, quanto mnore è la dspersone de valor argomental d una varable statstca rspetto al suo centro, coè quanto mnore dal centro è la dstanza delle osservazon. Qu consderamo la dspersone rspetto alla meda, coè la varanza - la msura della devazone de valor della varable rspetto alla meda: è l mnmo valore della funzone (per r = 2) cov ρ = σ σ ( x, y) x y Z n = x C r f 140.5. Gl ndc d forma Per rcavare nformazon sulla forma d una varable statstca s utlzzno gl ndc d poszone e dspersone defnt precedentemente. Introducamo ora l concetto d asmmetra e successvamente l grado d smmetra msurable dall ndce d asmmetra. Asmmetra - una varable statstca è smmetrca attorno alla meda artmetca della dstrbuzone se:

147 f ( µ δ ) = f ( µ + δ ) Ne derva che l grado d smmetra della dstrbuzone può essere msurato dall ndce d asmmetra (γ 1 = ndce admensonale): γ 1 = n 1 n 1 ( x µ ) 1 ( x µ ) 1 3 2 f f 3 D cu le prncpal propretà: se se γ 0 1 dstrbuzone asmmetrca γ = 0 1 non è condzone suffcente per provare la smmetra della varable statstca 141. Strument e metod per l ndagne - esplorazone de dat L utlzzo d tecnche chemometrche permette d ottenere una razonalzzazone nel cclo d produzone, n partcolar modo nella panfcazone degl esperment: sono nfatt n grado d rcercare nformazon effettvamente utl ne dat e d massmzzare le capactà e le performance predttve de modell. In presenza d dat multvarat (ovvero dat descrtt da un elevato numero d varabl), l anals e la vsualzzazone dell nformazone rsultano dffcoltose. L anals delle Component Prncpal (PCA) è la tecnca pù dffusa per questa fnaltà: permette nfatt d estrarre nformazone utle da dat multvarat e analzzare le relazon tra campon e varabl. E utle per rdurre l numero d varabl nel set d dat senza perdere nformazon, oppure per scoprre una o due combnazon lnear d varabl che speghno la varazone come se fossero l ntera sere d dat. L anals de Cluster (Cluster Analyss) è un altro strumento chemometrco molto mportante, permette d gestre grand quanttà d sere d dat per dentfcare n grupp d osservazon le caratterstche sml; è utle nello studo della smlartà - dverstà tra gl oggett del sstema e nella rcerca d grupp e outlers. La descrzone de dat porta alla formulazone d potes, per descrvere quanttatvamente l valore d una o pù varabl come funzone de valor d altre varabl (modell d regressone) o per provare a classfcare oggett n funzone de valor delle varabl che l descrvono (modell d classfcazone). Per ottenere modell (d classfcazone o regressone) realmente applcabl, la selezone delle varabl goca un ruolo decsvo. Esstono dverse tecnche d selezone delle varabl: gl Algortm Genetc (Genetc Algorthm) s sono dmostrat essere l approcco pù performante, n presenza d un elevato numero d varabl. L Anals Dscrmnante auta nel predre a quale gruppo appartengano dat. Le fnestre d dalogo conducono nel senso d una classfcazone n uno o pù grupp, nel determnare qual varabl ndpendent contrbuscano maggormente alla dfferenza e nel predre n quale gruppo s trov un nuovo caso.

148 141.1. Fenomenologa della statstca: causaltà e correlazone S ntenda, l termne correlazone come concetto statstco atto a msurare le relazon lnear tra due varabl, essa è una msura neutra del fenomeno n oggetto. In partcolare, le relazon tra x e y non s possono rcondurre alla semplce funzone x - causa e y - effetto, nella statstca multvarata le relazon non sono determnstche, non afferscono al campo della causaltà. La statstca non nterpreta le relazon causal, ma è strumento per la descrzone de fenomen (per esempo, le relazon tra altezza e peso corpore). 141.2. Le tecnche multvarate, metod d proezone delle potes. Anals e statstca multvarata Nella nferenza statstca e nella verfca d potes è molto mportante la parte relatva al rumore (o errore), mentre l anals multvarata è ncentrata solo sulla struttura de dat d nteresse, l resto vene rmosso con metodologe opportune. Tuttava elmnare l nformazone rdondante non deve essere un passaggo affrettato, nfatt la struttura d tal dat potrebbe costture la prova del nove rspetto alla bontà della metodologa adottata. I OBIETTIVO II OBIETTIVO III OBIETTIVO Esplorare dat Dscrmnare e classfcare Regressone e predzone Statstca descrttva Anals n component prncpal Cluster Analyss Tecnche d classfcazone Regressone n component prncpal (PCR) Regressone a mnm quadrat (PLS-R) Regressone lneare multpla (MLR)

149 142. I passagg canonc, da tradurs n pratca con Addat 2 (software d anals multvarata d dat terrtoral), per l trattamento d varabl qualtatve Il trattamento dell nformazone qualtatva, medante anals statstca multvarata, al fne d ottenere una dstrbuzone smulata d n punt su p dmenson. A segure verranno sntetcamente espost passagg fondamental. a) Rconversone delle varabl qualtatve (o categoral) n scala ordnale, quando gl element dell nseme X j sono ordnat senza che s possa operare alcun confronto quanttatvo. La sua adozone può essere mposta dalla necesstà d un lvello omogeneo d msura delle varabl. Spesso le K modaltà d una varable ordnale sono contraddstnte dall nseme de numer nter postv da 1 ad K: suo element sono dotat d una struttura d ordne, ma non hanno un sgnfcato metrco. Non sono pertanto lecte operazon metrche come la meda o la dfferenza; b) realzzazone della tavola logca X(n, p) ad n rghe e p colonne. Il generco ndvduo è rappresentato da p numer nter postv a cu s assoca un vettore (o punto) x = (x 1,, x p ) d uno spazo vettorale R p (ved fgura sottostante). c) s passa ad effettuare l anals delle tpologe medante l comando 3 d Addat. Come abbamo gà vsto n precedenza, una tavola d varabl d tpo categorale non può essere drettamente analzzata poché su d essa non sono effettuabl calcol d nessun genere. Qund la tavola rsultante conserverà l numero n d rghe della tavola categorale orgnara, ma avrà un numero d colonne q par al totale della somma d tutte le categore assunte dalle p varabl categoral consderate e potrà essere consderata una tavola d contngenza o d conteggo. In una tavola d conteggo è sgnfcatvo effettuare total d rga e total d colonna, ossa ottenere valor margnal. Nella tavola ottenuta, nfatt, margnal d rga assumeranno tutt l medesmo valore par a p ove p è l numero d varabl orgnare; margnal d colonna, nvece, rappresenteranno la frequenza d quella modaltà j sul campone consderato. 1 2.. t 1.. q f(t) La nuova tavola dervante, (ved fgura a fanco) dunque, sarà una tavola formata da t rghe - che soltamente, sono n numero sensblmente nferore rspetto alle n orgnal - rappresentant le t tpologe e da q colonne par al numero totale delle modaltà assunte dalle varabl complessvamente oltre alla colonna relatva al peso d ogn tpologa, ossa relatva alla frequenza rlevata nella tavola de dat d quel record vettore bnaro. 2 S consgla d leggere come ntegrazone l ottmo manuale prodotto dal Prof. Grguolo, deatore e scrttore d Addat, reperble all ndrzzo http://cdoc.uav.t/~slvo/addat_t.html 3 Dalla schermata nzale d Addat s selezona l menu Anals e successvamente s selezona Crea Tpologe ; Addat qund carcherà l applcatvo TYPOLOG, proponendoc un nterfacca d dalogo n modaltà DOS.

150 d) La tavola d contngenza, sarà utlzzata per l anals delle corrspondenze medante l comando 4 d Addat che è un anals fattorale che tende come rsultato alla sosttuzone delle varabl orgnal con nuove varabl dervate come combnazone delle prme, n numero nferore per la perdta d una mnma quota dell nerza orgnale, ossa mantenendo l pù possble ntegro l valore orgnaro della tavola de dat. Lo scopo del metodo è d analzzare la somglanza tra le rghe (rspetto alle colonne) e quella tra le colonne (rspetto alle rghe) ed anche le relazon che ntercorrono tra rghe e colonne. Calcolando rspettv valor margnal per rghe e per colonne, s possono ottenere, dalla tavola categorale d cu trattas, due nuove tavole rguardant le dstrbuzon d probabltà condzonal (X e Y). Se s dvde, rspettvamente, ogn rga per l suo totale margnale f, ovvero ogn colonna j per l suo totale margnale f j. La rga della tavola X avrà dunque, come element: f 1 /f.,... f p /f. e rappresenterà la dstrbuzone percentuale o proflo delle j modaltà nella tpologa, o, ancora, l vettore della tpologa nello spazo R p e l suo totale margnale darà la stessa nformazone rferta all ntero sstema rappresentando la dstrbuzone globale della tpologa rspetto alla tpologa -esma e, pertanto, l suo peso. Il medesmo ragonamento s potrà fare sulla colonna j-esma della tavola Y, nella quale però l vettore rappresenterà la probabltà d dstrbuzone d ogn tpologa rspetto ad ogn sngola modaltà e l suo totale margnale darà la stessa nformazone rferta all ntero sstema rappresentando la dstrbuzone globale della tpologa rspetto alla modaltà j-esma e, pertanto, l suo peso. Le tavole X e Y sono dunque dverse tra loro, ma rspettv sgnfcat sono smmetrc. La dstanza tra due punt-proflo n R p vene calcolata secondo una modfcazone dell usuale formula ptagorca nota come dstanza del ch-quadro rappresentata dalla formula sotto rportata. χ 2 = j (f o j - f e j) 2 / f e j e) Al fne d rdurre ulterormente d complesstà le nformazon a dsposzone un ulterore passo da affrontare è quello dell anals cluster (o d classfcazone). Lo scopo d una classfcazone numerca è quello d raggruppare untà (o meglo le coordnate fattoral rcavate dall anals delle corrspondenze) a comportamento smle n un numero lmtato d grupp chamat anche class o cluster. La smlartà tra due untà può venre osservata drettamente o calcolata a partre da un nseme d varabl osservate che offrano una opportuna descrzone degl oggett analzzat. La smlartà, noltre, dpende dalle varabl prese n consderazone e, qund, dalla partcolare descrzone adottata per gl oggett dall anals ntrapresa. C sono molt mod per defnre l lvello d smlartà d due oggett. In coerenza con quanto argomentato sno ad ora, s assumerà, per la classfcazone, la stessa nozone d dstanza utlzzata nelle anals fattoral e, n partcolare la dstanza del ch-quadro, n quanto s stanno trattando varabl qualtatve. La dstanza, qund, rappresenta un ndcatore complesso che deve essere calcolato attraverso contrbut d tutte le varabl poste n goco e, convenzonalmente, può essere assunta come ndcatore d dssmlartà. E qund coerente consderare due untà pù sml tra loro rspetto ad altre due, quando loro punt rappresentatv gaccono pù vcn (nello spazo d rappresentazone) d quell che rappresentano le altre due untà. S dmostra assa utle per lo scopo affrontare la classfcazone utlzzando l metodo della classfcazone non gerarchca o meglo l metodo delle nub dnamche d E. Dday. 4 Dalla schermata nzale d Addat s selezona l menu Anals e successvamente s selezona Anals delle Corrspondenze ; Addat qund carcherà l applcatvo ACCOR, proponendoc un nterfacca d dalogo n modaltà DOS.

151 Tale metodologa s rtrova all nterno 5 software Addat. Vedamo nel seguto la modaltà d partzone proposta da Addat. Il metodo proposto e mplementato procede n due fas successve: la prma, denomnata fase esploratva, la seconda, denomnata fase d ottmzzazone, che produce la partzone ottma fnale. In partcolare, nella fase esploratva: vengono calcolate numerose partzon d base (ndcatvamente da 4 a 10), cascuna con un numero d class defnto dall utente (per ogn partzone vene consglato d chedere un numero d class par a quello che s vorrebbe ottenere nella partzone fnale); centr nzal sono scelt attraverso alcune alternatve ma, per lo pù, n modo casuale; le partzon che presentano l valore pù elevato della funzone-obettvo vengono ncrocate tra loro; la partzone/prodotto ottenuta avrà un numero d class a pror ndetermnato: per costruzone, gl element d una classe sono stat classfcat conguntamente (o, meglo, sono stat assegnat ad uno stesso gruppo) n tutte le partzon d base ncrocate e sussste dunque una ragonevole convnzone sulla fondatezza della loro somglanza. Propro per tale motvo le class della partzone/prodotto sono note come class stabl o forme fort. Anche se spesso sono n numero eccessvo per gl scop della rcerca, esse offrono una descrzone dettaglata e spesso esaustva de prncpal comportament ravvsabl nel contesto d anals dato. vene ottmzzata la partzone/prodotto ottenuta e vene salvata su fle una sua descrzone essenzale; vene operata una classfcazone gerarchca sulle q class ottenute attraverso terazon successve: aggregando le due class tra loro pù sml e calcolando la funzone-obettvo ottenuta con un numero d class j = q-1 e così contnuando sno a che tutte le class non saranno aggregate n un unca classe; dfferent valor della funzone-obettvo calcolat ad ogn aggregazone vengono proettat su d un grafco che mostra l andamento della funzone, sa n fase ascendente, sa n fase dscendente (con la varazone del numero d class ottenute). Nella fase d ottmzzazone, ntervene l utente che: osserva l grafco proettato e dentfca l numero d class pù promettent, ossa quelle cu corrsponde un alta perdta d nerza quando l numero de grupp venga ulterormente rdotto d una untà; chede al programma d descrvere la partzone con l numero d class dentfcato, o d descrvere dverse partzon se l grafco dentfca pù punt d nteresse; scegle defntvamente la partzone d nteresse attraverso la lettura e la valutazone delle descrzon delle partzon rcheste al programma. 5 Dalla schermata nzale d Addat s selezona l menu Anals e successvamente s selezona Classfcazone non Gerarchca ; Addat qund carcherà l applcatvo CLSSSIFICAZIONE GERARCHICA, proponendoc un nterfacca d dalogo n modaltà DOS.

152 143 6. Il trattamento, medante Addat, d alcune varabl qualtatve della carta pedologca 7 e successva spazzalzzazone delle rsultanze con ArcVew 3.x Come prma operazone, fondamentale per la corretta formazone della tabella dat rcodfcat d varabl qualtatve che successvamente verrà sottoposta ad anals statstca multvarata con Addat, rsulta essere l allneamento rspetto alle necessta d Sw e nformazon. Impostazon prelmnar per ArcVew Estenson (Extensons) Scrpt 8 Fles (*.shp). Spatal Analyst. Memo Tool. Converts a grd to a pont. Pont to polygons. Pedof2_CR.shp. comun_cr.shp Avendo verfcato la presenza d tutto quanto rchesto s effettu la prma operazone n ambente ArcVew e qund la predsposzone uno stralco dell ntera carta pedologca solo per l comune d Cremona, ottenendo una tabella attrbut d dmensone 203 x 18. Successvamente alla produzone d uno shape dervato dall operazone d clp (tra Pedof2_CR.shp e la selezone del comune d Cremona da comun_cr.shp) effettuamo l passaggo dalla dmensone contnua a quella dscreta medante l comando Theme Convert to Grd avendo cura d (s veda mmagne a fanco rportata) d mpostare correttamente parametr d conversone (che nel proseguo della dspensa chameremo Grd). Successvamente a tale fnestra verrà rchesto quale colonna prendere come valore per le celle Al fne d produrre una dscretzzazone d tutto l terrtoro del comune d Cremona è fondamentale aver nserto precedentemente nella tabella attrbut 203 x 18 una colonna Id_Pl ovvero un ndce per ogn record presente da 1,.., 203. Successvamente alla domanda d unre le nformazon present nella tabella sorgente s rsponda d s (yes) Qund a passagg ultmat la tabella attrbut assocata alla grgla prodotta sarà d dmenson 148 x 18. Ora s deve effettuare l passaggo dalla dmensone dscreta a quella puntuale, ovvero medante uno scrpt Converts a grd to a pont verrà realzzato un punto collocato nel centrode d ogn cella, 6 Tale metodologa n ambente ArcVew 3.x è stata svluppata n parte nel laboratoro d progettazone ambentale II A.A. 2004-2005 Prof. Per Lug Paolllo, n partcolare con l gruppo:pergorgo Roveda e Alessandra Duna 7 Argomento ampamente trattato nella dspensa n 6, cap. 80 pag. 85 e nell allegato B entramb present nel sto del Master 8 Recuperabl all ndrzzo www.esr.com

153 qund facendo la somma della colonna Count sapremo che verranno prodott 7.031 punt rappresentatv d 7.031 celle d lato 100 m. Con l accortezza d mpostare la Path desderata, al fne d salvare nella poszone desderata l rsultato dell esecuzone dello scrpt, che come logcamente c s attende sarà uno shape puntuale. L nformazone fondamentale che tale conversone produce è contenuta nella tabella attrbut, la quale avrà una dmensone 7.031 x 3, dove la prma colonna sarà Shape la seconda Pontd (un dentfcatvo progressvo 1,.., 7031) e la terza colonna fondamentale Grd_code la quale è la colonna chave rspetto alla colonna Value contenuta nella tabella attrbut della grgla (con dmensone della tabella attrbut 148 x 18). L obbettvo mprescndble per poter effettuare l anals multvarata è quello d ottenere l ndpendenza d cella ovvero 7.031 celle d lato 100 m (qund 7.031 records) caratterzzate da pù varabl (le colonne delle tabelle attrbut), al fne d evtare quello che l comando d Saptal Analyst - Convert to Grd, produce ovvero l aggregazone d records e qund d celle. Ora medante lo scrpt Pont to polygons rendendo attvo l tema puntuale, precedentemente creato, realzzeremo una cella d lato 100 m per ognuno de 7.031 punt (che nel proseguo della dspensa lo shape prodotto lo chameremo Grd_pl). La tabella attrbut sarà d dmenson 7.031 x 3; avendo cura d nserre successvamente una colonna sosttutva, avente come etchetta Cell_Id ovvero un numero progressvo 1,,7.031 (medante l comando rec+1) che sarà l dentfcatvo unvoco per ogn cella fondamentale per tutte le possbl anals producbl. Non dobbamo dmentcare che all nterno della tabella attrbut c è la colonna Grd_code che utlzzeremo successvamente come colonna chave per effettuare l Jon con la tabella attrbut della Grd (dmenson della tabella 148 x 18) qund s effettuerà un jon da uno a molt. Rsulta fondamentale poter effettuare l Jon tra le tabelle attrbut de layers Grd e Grd_pl (Grd_pl ottenuto con lo scrpt Pont to polygons ), mmedatamente tale operazone non è possble. Ora s deve utlzzare l estensone Memo Tool la quale c permetterà d esportare n formato *.dbf la tabella attrbut della Grd. Qund, s deve edtare la tabella attrbut della Grd e nella barra de comand alla voce MemoTab selezonare l comando Export sorted Table. Dopo aver salvato la tabella ed averla successvamente edtata, rsulta ora possble effettuare l Jon, ottenendo conseguentemente l attrbuzone dell nformazone qualtatva d alcune varabl della carta pedologca ad ognuna delle 7.031 celle d lato 10m. La tabella opportunamente formattata sarà d dmenson 7.031 x 9, uguale all mmagne presente nella successva pagna.

154 Le varabl che analzzeremo, qund le colonne della tabella, sono: Varable LCC_sotto Lquam Fangh Acq_sup Acq_sot Descrzone varable Codce della classe e sottoclasse d capactà d uso n base al modello nterpretatvo Land Capablty Classfcaton Codce della classe d atttudne allo spandmento agronomco de lquam n base al modello nterpretatvo Codce della classe d atttudne allo spandmento d fangh d orgne urbana n base al modello nterpretatvo Codce della classe d capactà protettva ne confront delle acque superfcal n base al modello nterpretatvo Codce della classe d capactà protettva ne confront delle acque sotterranee n base al modello nterpretatvo Ora rspettando quanto precedentemente descrtto s deve effettuare la rcodfca delle sngole nformazon qualtatve, che popolano le colonne, n nformazone quanttatve medante l assegnazone d un numero ntero postvo a partre da 1. Il crtero d recodfca sarà qund: LCC_sotto Rec. Lquam Rec. Fangh Rec. Acq_sot Rec. Acq_sup Rec. 1 1 S1 1 S1 1 E 1 E 1 1/3s 1 S2 2 S2 2 M 2 E/M 1 2s 2 S2d 2 S3 3 M/B 2 M 2 2s/3s 2 S3 3 N 3 B 3 B 3 2w 2 S3/S2 3 N.c. 4 N.c. 4 N.c. 4 2w/1 2 S3dt 3 2ws/1 2 S3t 3 3s 3 N.c. 4 3w 3 4w 3 N.c. 4

155 Personalmente per la rcodfca prefersco esportare la tabella attrbut n Excel e tramte la funzone trova e sosttusc effettuare l assegnazone delle nformazon quanttatve. Producendo una tabella d 5 varabl tutte con 4 modaltà Comunque tale operazone è possble realzzarla anche n ambente ArcVew medante le funzon descrtte nelle scorse dspense. È opportuno antcpare che per la produzone della tabella dat d nput per Addat s rchede un fle n formato *.Txt. 143.1. Impostazon prelmnar d Addat e formattazone del fle d Input Successvamente all avventa nstallazone avvare Addat e nella barra de comand selezonare la voce fle e successvamente l comando Drectory attva, n cu addat cercherà l fle d Input e dove salverà fle Output d anals. FILE DI INPUT FILE DI OUTPUT Successvamente è opportuno convertre l fle pedo.txt prodotto dal fne d Excel, opportunamente depurato delle ntestazon delle colonne e della colonna Grd_code, n pedo.dat fle formattato per consentre un elaborazone ottmale n ambente Addat

143.2. La creazone d tpologe 156 S effettua tale anals perché una tavola d varabl d tpo categorale non può essere drettamente analzzata poché su d essa non sono effettuabl calcol d nessun genere. Il prmo passaggo per l trattamento d una smle tavola è quello d rcodfcarla n forma dsguntva completa, ossa n forma bnara. Dal menu anals attvare l comando Crea Tpologa Fnestra DOS dell estensone TYPOLOG Addat fno al termne d ogn anals che effettueremo, n questo caso specfco per la creazone delle tpologe c accompagnerà con delle fnestre (ved mmagne n alto a destra) nelle qual dobbamo rspondere alle opzon che c vengono fornte. Qund dando avvo alla creazone delle tpologe dal menu d anals d Addat; alla domanda: I parametr per l anals vanno lett s dgt: uno (1) S prema nvo per procedere.

157 Alla domanda: Ttolo dell anals S prema nvo per procedere. s dgt: creazone d tpologe da varabl pedologche Alla domanda: Nome del fle de dat s dgt l nome con cu s è salvato l fle convertto precedentemente. Se s è mpostata la Drectory d lavoro, s deve nserre l nome del fle completo d estensone, non è necessaro fornre la path completa. Nel caso n esempo s dgt pedo.dat Alla domanda: Numero totale de CASI S prema nvo per procedere. s dgt: tutt

158 Alla domanda: Numero totale delle anals s dgt: cnque (5) S prema nvo per procedere. Alla domanda: Nel fle d ngresso le varabl sono codfcate s dgt: due (2) S prema nvo per procedere. Alla domanda: Lo scopo è d s dgt: uno (1) S prema nvo per procedere.

159 Alla domanda: Numero delle MODALITA d tutte le varabl s dgt: 4 4 4 4 4 S prema nvo per procedere. Alla domanda: Conferm? s prema: s S prema nvo per procedere. Alla domanda: Fornsc una etchetta per le modaltà delle varabl Fan1/4 Aso1/4 Asu1/4 S prema nvo per procedere. s dgt: Lcc1/4 Lq1/4

160 Alla domanda: Conferm? s prema: s S prema nvo per procedere. Alla domanda: Quante varabl SUPPLEMENTARI s dgt: zero (0) S prema nvo per procedere. Alla domanda: Ad ogn caso va assegnato s dgt: uno (1) S prema nvo per procedere.

161 Alla domanda: Fornsc un FORMATO per leggere l fle n entrata s prema: astersco (*) S prema nvo per procedere. Alla domanda: Prem a questo punto le mpostazon sono termnate, ma se c samo accort d aver nserto delle nformazon non corrette prossmo rpercorrere l anals premendo uno (1) oppure passare all esecuzone premendo l tasto due (2). La creazone delle tpologe è stata termnata n modo regolare, s osserv nfatt che cas lett corrspondono a quell accertat. Ha prodotto 18 tpologe, una notevole rduzone d complesstà.

162 Come s può leggere charamente, 7.031 cas lett corrspondono alle 7.031 celle d lato 100 m attraverso le qual è stato suddvso l comune d Cremona n anals. Ogn cella è stata descrtta attraverso 5 varabl categoral nomnal, assommant a 20 modaltà complessve. Le dverse combnazon delle modaltà assunte dalle celle analzzate, dunque, assommano a 18, e, pertanto, la nuova tavola (s osserv l mmagne sotto rportata) d descrzone delle cnque varabl assunte nell area n studo, è così trasformata dal programma n una nuova tavola d 18 rghe (par al numero delle tpologe dentfcate) e d 21 colonne: le prme 20 rappresentano le modaltà orgnal, pesate attraverso la relatva frequenza, la 21-esma colonna rappresenta la frequenza rlevata d ogn tpologa, all nterno della tavola de dat analzzata. Ora è possble fare alcune consderazon sa su fles d output prodott da Addat che della matrce formata da t rghe - che soltamente, sono n numero sensblmente nferore rspetto alle n orgnal - rappresentant le t tpologe e da q colonne par al numero totale delle modaltà assunte dalle varabl complessvamente oltre alla colonna relatva al peso d ogn tpologa, ossa relatva alla frequenza rlevata nella tavola de dat d quel record vettore bnaro. Qund tutte le untà che presentano gl stess valor lett sulle rspettve modaltà sono consderate equvalent e vengono assegnate ad una medesma tpologa. S sottolnea l estrema versatltà d Addat, poché tutt fles prodott ed utlzzat sono edtabl con un semplcssmo edtor d testo oppure sempre n ambente Addat dal menu de comand Fle Edta/Mostra fle d testo. Nome fle d Output TYP.OUT Descrzone Una descrzone degl eventual error cocess la rtrovamo all nterno d tale fle. Inoltre contene tutta la descrzone dettaglata delle rsposte data alle sngole domande, ACORINP.LV La tavola che sarà utlzzata nell anals delle corrspondenze. Successvamente la edteremo e la commenteremo poché s possono produrre delle valdssme nterpretazon. TYPCLAS All nterno d tale fle sono regstrate tutte le tpologe, nel nostro caso da 1,..,18, n ordne assegnate a records della tavola n entrata. Commento della tavola presente nel fle ACORINP.LV Nella prma rga trovamo una sequenza d numer 18 7031 20 0 5 3, qual nel ordne n cu sono stat trascrtt s rferscono:. al numero totale delle tpologe ndvduate (18);. al numero totale de cas lett (7.031) nel nostro caso s rferscono a celle d lato 100 m;. modaltà complessve utlzzate (20) per descrvere tutte e cnque le varabl, nfatt sono state utlzzate quattro modaltà per ogn varable qund (5*4 = 20); v. numero d untà

163 supplementar che non ve ne sono qund zero (0); v. numero d varabl utlzzate cnque (5); v. Il numero d varabl attve. Nella rga successva sono rportat le lables assegnate alle modaltà s osserv la tabella replogatva sotto rportata. Varable Lable Addat Descrzone varable LCC_sotto Lcc Lquam Fangh Acq_sup Acq_sot Lq Fan Asu Aso Codce della classe e sottoclasse d capactà d uso n base al modello nterpretatvo Land Capablty Classfcaton Codce della classe d atttudne allo spandmento agronomco de lquam n base al modello nterpretatvo Codce della classe d atttudne allo spandmento d fangh d orgne urbana n base al modello nterpretatvo Codce della classe d capactà protettva ne confront delle acque superfcal n base al modello nterpretatvo Codce della classe d capactà protettva ne confront delle acque sotterranee n base al modello nterpretatvo Rsulta fondamentale per poter appeno nterpretare rsultat ottenut spazzalzzare le 18 tpologe determnate (s veda mmagne sopra rportata). Come antcpato (pagna precedente) nella tabella rassuntva de fles d output prodott da Addat, s rleva d fondamentale mportanza per la spazzalzzazone delle tpologe l fle TYPCLAS, l quale se provamo ad edtarlo sarà un vettore colonna d numer da 1,,18 d 7.031 caratter. Qund non c resta che mportate questa colonna nella tabella attrbut del layer Grd_pl.