Modelli statistici per l analisi dei dati e la valutazione d efficacia Il caso del Comune di Perugia



Documenti analoghi
Regressione Logistica

REGRESSIONE MULTIPLA E CORRELAZIONE. Nicola Tedesco (Statistica Sociale) REGRESSIONE MULTIPLA E CORRELAZIONE 1 / 16

> d = alimentazione == "benz" > mean(percorr.urbana[!d]) - mean(percorr.urbana[d]) [1] > sd(percorr.urbana[d]) [1] 2.

7.2 Indagine di Customer Satisfaction

Nicola Magnavita Istituto di Medicina del Lavoro, UCSC, Roma

Strumenti informatici 13.1

Capitolo 12 La regressione lineare semplice

Introduzione. Strumento di misurazione, numerosità

Corso di Statistica Medica. Studio dell effetto di più variabili indipendenti su una variabile dipendente: Regressione lineare multipla

ACCESSI AL PRONTO SOCCORSO PER INCIDENTE STRADALE E AUMENTO DEL PREZZO DEI CARBURANTI: UN ANALISI NELLA REGIONE LAZIO, ANNI

Metodologie Quantitative

Risultati dello studio sperimentale sull uso del prodotto Zerosmoke Come coadiuvante nella cessazione del tabagismo Soggetti

7.2 Indagine di Customer Satisfaction

3) ANALISI DEI RESIDUI

Stime sul costo e sugli effetti distributivi di programmi di contrasto alla povertà. Massimo Baldini (CAPP) Daniele Pacifico (CAPP e MLPS)

Statistica. Lezione 6

Prova di autovalutazione Prof. Roberta Siciliano

La sicurezza sul lavoro

Lineamenti di econometria 2

Criteri di selezione del collettivo e definizioni

La dispersione dei prezzi al consumo. I risultati di un indagine empirica sui prodotti alimentari.

Questionario di Gradimento Seminario Il Questionario Insegnante e il Questionario Scuola: teorie, strumenti e risultati

Tasso di occupazione per fasce di età. Provincia di Piacenza, ,3 83,1 77,7 27,6 16, anni anni anni.

Elaborazione dei dati su PC Regressione Multipla

SCHEDA PER LA RILEVAZIONE DELLA CUSTOMER SATISFACTION

PROGETTO INDAGINE DI OPINIONE SUL PROCESSO DI FUSIONE DEI COMUNI NEL PRIMIERO

INDICE PREFAZIONE VII

Introduzione alla regressione multipla. Giovanni Battista Flebus Lezioni di psicometria

Abbiamo costruito il grafico delle sst in funzione del tempo (dal 1880 al 1995).

Sicurezza alimentare. La percezione dei consumatori. Marzo 2011

I processi decisionali all interno delle coppie

Regressione Logistica: un Modello per Variabili Risposta Categoriali

UNA CITTÁ CONTRO LA VIOLENZA

Risultati dell indagine sul benessere dei dipendenti 2014

Rapporto dal Questionari Insegnanti

GLI STUDENTI TRENTINI E IL LORO FUTURO Trento, 6 marzo 2015

Censimento industria e servizi

Elementi di Psicometria con Laboratorio di SPSS 1

SPC e distribuzione normale con Access

La popolazione residente in provincia di Trento attraverso l anagrafe e i flussi demografici anche in un ottica di Comunità di Valle

A5. Elaborazioni connesse alla metodologia per la stima per stima dei consumi di gas a livello comunale

GRUPPO QUATTRO RUOTE. Alessandro Tondo Laura Lavazza Matteo Scordo Alessandro Giosa Gruppo Quattro Ruote 1

LA POVERTÀ IN ITALIA. Anno luglio INCIDENZA DI POVERTÀ RELATIVA PER RIPARTIZIONE GEOGRAFICA. Anni , valori percentuali

Ufficio Scolastico Regionale per l Abruzzo. Rapporto dal Questionari Studenti

LA CORRELAZIONE LINEARE

1. Distribuzioni campionarie

Un approfondimento sull Italia

Le condizioni di vita nelle città universitarie

Sintesi dei risultati

MISURARE IL COSTO DELLA VITA. Harcourt Brace & Company

LEZIONE n. 5 (a cura di Antonio Di Marco)

Ricerca sulle conoscenze e-learning dei docenti

Istituzioni di Statistica e Statistica Economica

Analisi della varianza (anova) a due vie

[ Analisi della. concentrazione] di Luca Vanzulli. Pag. 1 di 1

L Analisi della Varianza ANOVA (ANalysis Of VAriance)

Gli spostamenti quotidiani per Studio e per Lavoro a Monza. La mobilità giornaliera

Il campionamento statistico

13 Rapporto sulle Retribuzioni in Italia

Regressione logistica. Strumenti quantitativi per la gestione

QUESTIONARIO COMMISSIONE INARCASSA

L esperienza trentina del reddito di garanzia e la sua valutazione

Manuale d uso applicazione on line

IL COLLAUDO DI ACCETTAZIONE

Analisi dei dati dell Osservatorio sul disagio emotivo di Telefono Amico Italia. Rapporto annuale 2011

Metodi Matematici ed Informatici per la Biologia Esame Finale, I appello 1 Giugno 2007

TAV. 1 Popolazione residente nelle Province della Regione Sardegna nel 2001 fonte: Istat

Capitolo 2 Distribuzioni di frequenza

LINEA DIRETTA CON ANFFAS

Il decision making nel Triage infermieristico in pronto soccorso: studio descrittivo multicentrico

Report Che Piazza! Campione. Consumo Alcolici

LA POVERTÀ IN ITALIA. Anno luglio 2014

L EFFICACIA DELLE MISURE DI POLITICA ATTIVA DEL LAVORO REALIZZATE IN PROVINCIA DI TORINO NEL

FACOLTÀ DI ECONOMIA Soluzione della Prova di autovalutazione 2012 (primi 6 CFU) ANALISI STATISTICA PER L IMPRESA

5 La popolazione disabile

INTRODUZIONE AL DOE come strumento di sviluppo prodotto Francesca Campana Parte 3 Piani a fattore singolo e relativi test di interpretazione

Igiene urbana. Indagine sulla soddisfazione degli utenti Confronto tra Torino, Milano, Bologna e Roma. Anno a cura di Mirko Dancelli

Analisi statistica delle funzioni di produzione

Il metodo della regressione

LE PREVISIONI DELLE FAMIGLIE

INDAGINE PROFESSIONI A CONFRONTO: COME I RELATORI PUBBLICI E I GIORNALISTI ITALIANI PERCEPISCONO LA PROPRIA PROFESSIONE E QUELLA DELL ALTRO

Paolo Lauriola Direttore Struttura Tematica di Epidemiologia Ambientale ARPA EMILIA ROMAGNA

Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI

Come si spostano le donne e gli uomini bolognesi

Corso di Psicometria Progredito

come nasce una ricerca

LA REVISIONE LEGALE DEI CONTI La comprensione

RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL

COMUNE DI UDINE. Dipartimento Programmazione Risorse finanziarie e patrimoniali - Politiche di acquisto U. Org. Studi e Statistica U.S.

4 I LAUREATI E IL LAVORO

lezione 18 AA Paolo Brunori

Web sentiment analysis

Parimenti una gestione delle scorte in maniera non oculata può portare a serie ripercussioni sul rendimento sia dei mezzi propri che di terzi.

Monitoraggio sulla conversione dei prezzi al consumo dalla Lira all Euro

ANALISI DEL MUTUATARIO

Esercitazione Statistica Computazionale B Modelli di regressione lineare semplice Verifica di ipotesi - Analisi della varianza

17. Criminalità: le sostanze stupefacenti

CAPITOLO II. (non downloader consapevoli)

6.5. Risultati simulazioni sistema rifiuti e riscaldamento

RISCHIO E CAPITAL BUDGETING

Transcript:

Modelli statistici per l analisi dei dati e la valutazione d efficacia Il caso del Comune di Perugia Alessandra Pelliccia Matteo Cataldi Matteo Filippo Donadi 0

AGENDA Fonti Descrizione dei dati Variabili utilizzate Prima indagine: regressione logistica Seconda indagine: regressione lineare multipla Conclusione Appendice: output 1

Le fonti database appartenente ad una ricerca effettuata dall ISTAT nel marzo 2009: è stato sottoposto un questionario ad un campione di 192 cittadini residenti all interno del Comune di Perugia; Il questionario si focalizza sulle aree di maggiore interesse per il Comune stesso: Utilizzo di uffici anagrafici comunali circoscrizionali; Conoscenza e utilizzo di servizi di certificazione e semplificazione procedurale; Trasporti; Sicurezza Vita quotidiana. 2

Descrizione dei dati Dato che i soggetti sottoposti al questionario in esame sono stati casualmente selezionati all interno della popolazione residente nel Comune di Perugia, è possibile classificare questa analisi come sperimentale ; Si è deciso di estrarre dal database originario esclusivamente dati relativi a sicurezza e vita quotidiana, oltre a quelli anagrafici; I dati raccolti sono sia di tipo continuo, che di tipo discreto. 3

Variabili Età Sesso Professione Titolo di studio Sezione censimento Vita quotidiana Sicurezza percepita Tipo di area Tipo di zona Lavoro, extracomunitari 4

Variabile Tipo di zona In particolare: per la variabile Tipo di zona sono state ridotte a 3 categorie le numerose sezioni censimento presenti nel database originario, suddivise in base alla loro distanza dal centro. Si è divisa una mappa della città in tre aree circolari concentriche: - la più interna ha un raggio di 4,5 km (centro) - la successiva ha un raggio pari a 9 km (zone limitrofe) - la più esterna ha un raggio di oltre 9 km (campagna) 5

Mappa 4,5 Km 9 Km 6

Prima indagine Dei 192 cittadini del campione, 107 percepiscono la disoccupazione come problema più urgente: quali sono le variabili rilevanti per spiegare tale tipo di percezione? Abbiamo utilizzato la variabile vita quotidiana come VD (dicotomica con valori 0 = altro; 1= disoccupazione); Si è provato a spiegarla attraverso le VI titolo di studio, età, sesso e professione. 7

Regressione logistica Grazie all utilizzo di una regressione logistica, abbiamo verificato che: - Le variabili con p-value maggiore di 0,05 (e quindi non significative nel modello) sono: età, sesso e titolo di studio ; - L unica variabile che si è rilevata significativa è stata quella relativa alla professione. Questa, presa nella sua totalità (prescindendo dai suoi outcome), è risultata significativa, in quanto riporta un P-value = 0,036 (<0,05). 8

Variabile Professione Ad ogni outcome PROFESSIONE(n) (con n=1,2,3,4,5,6,7,8) corrisponde una tra le professioni contenute nel database; PROFESSIONE(7), corrispondente alla categoria operai, è risultata essere la più significativa (P-value minore di 0,05, odds-ratio Exp(B) pari a 21,667); Nel caso in cui il soggetto del campione sia un operaio, è risultato più probabile che questi sia preoccupato primariamente dal problema disoccupazione. 9

Variabile Professione Un altra VI che è risultata significativa, avendo un P-value < 0,05, è PROFESSIONE(3), corrispondente alla categoria disoccupati ; Se il soggetto del campione è un disoccupato, la probabilità che questi sia preoccupato dal problema disoccupazione aumenta del 11,9% (Exp(B)) rispetto al caso in cui non sia disoccupato. 10

Variabile Lavoro Introduzione nel modello la VI lavoro, che indica il livello percepito di difficoltà di trovare lavoro relativamente al solo Comune di Perugia e non al Paese intero; Lo scopo è stato quello di verificare se il problema disoccupazione viene percepito come rilevante in quanto vissuto in prima persona dai cittadini del campione oppure in quanto più generalmente percepito all interno del Paese. 11

Variabile Lavoro La variabile è risultata significativa, in quanto riporta un P- value molto basso; Tuttavia, l incremento di probabilità che il soggetto sia sensibile al problema disoccupazione, conseguente all incremento unitario nella scala relativa al livello di difficoltà percepito nel trovare lavoro all interno del Comune, si è rivelato modesto (solo 1,719%) Dal LR test emerge che il modello completo (con la VI lavoro ) è significativamente migliore di quello ridotto. 12

Seconda indagine Tra i dati del questionario in esame ci si è poi proposti di indagare sui fattori anagrafici e territoriali che incidono sulla percezione del livello di sicurezza da parte dei cittadini del campione; Abbiamo considerato come VD Sicurezza percepita, che è stata trattata come una variabile continua con un minimo di 1 e un massimo di 6; Le VI utilizzate sono: Età, Tipo zona, Area ed Extracomunitari. 13

Regressione lineare multipla Per procedere in questa analisi abbiamo utilizzato una regressione lineare multipla; Le uniche VI significative del modello sono risultate essere età e tipo zona ; Si è osservato, analizzando i rispettivi Beta, che risultano entrambe correlate negativamente; 14

Età e Tipo di zona Per la variabile Età questo indica che, all aumentare dell età dei soggetti del campione, diminuisce il livello di sicurezza percepita: i soggetti più anziani sono quindi risultati essere relativamente più timorosi ; Per la variabile Tipo di zona un Beta uguale a -0,425 indica che i residenti nel centro città si sentono meno sicuri rispetto ai residenti nelle altre zone. Non sono presenti problemi di collinearità tra le variabili 15

Conclusioni Dall analisi effettuata sui dati fornitici dal Comune di Perugia si possono trarre diverse conclusioni; La preoccupazione per il problema della disoccupazione a livello nazionale è significativamente influenzata dalla professione dei cittadini del campione, in particolare se operai o disoccupati. I soggetti del campione risultano preoccupati riguardo al problema della disoccupazione anche in quanto vivono tale problema in prima persona, all interno del Comune stesso; 16

Conclusioni Rispetto ai soggetti più giovani, quelli relativamente più anziani percepiscono un livello di sicurezza minore, in quanto questi generalmente evitano di uscire durante le ore notturne proprio perché non si sentono al sicuro. I soggetti residenti nel centro città tendono a sentirsi meno sicuri rispetto ai soggetti residenti al di fuori del centro. Questo risultato potrebbe essere spiegato dalla presenza nel centro cittadino di numerosi luoghi usualmente frequentati anche durante le ore notturne. 17

Output regressione logistica Model Summary Cox & Snell R Nagelkerke R Step -2 Log likelihood Square Square 1 240,739 a,112,151 a. Estimation terminated at iteration number 4 because parameter estimates changed by less than,001. Classification Table a Predicted Observed Vita quotidiana 2 0 1 Percentage Correct Step 1 Vita quotidiana 2 0 46 39 54,1 1 28 79 73,8 Overall Percentage 65,1 a. The cut value is,500 18

Output regressione logistica Variables in the Equation B S.E. Wald df Sig. Exp(B) Step 1 a ETAanni -,008,014,359 1,549,992 SESSO(1),361,344 1,101 1,294 1,434 PROFESSIONE 16,519 8,036 PROFESSIONE(1) 1,285 1,065 1,458 1,227 3,616 PROFESSIONE(2) 2,226 1,139 3,822 1,051 9,262 PROFESSIONE(3) 2,476 1,003 6,098 1,014 11,899 PROFESSIONE(4) 1,111,912 1,484 1,223 3,037 PROFESSIONE(5) 2,061 1,084 3,615 1,057 7,858 PROFESSIONE(6) 1,616,929 3,025 1,082 5,033 PROFESSIONE(7) 3,076,977 9,913 1,002 21,677 PROFESSIONE(8) 1,250 1,022 1,496 1,221 3,489 TIT.DISTUDIO,033,067,235 1,628 1,033 Constant -1,261,892 1,999 1,157,283 a. Variable(s) entered on step 1: ETAanni, SESSO, PROFESSIONE, TIT.DISTUDIO. Torna indietro 19

Output regressione logistica Variables in the Equation B S.E. Wald df Sig. Exp(B) Step 1 a PROFESSIONE 12,498 8,130 Torna indietro PROFESSIONE(1),785 1,112,498 1,480 2,193 PROFESSIONE(2) 1,606 1,171 1,880 1,170 4,981 PROFESSIONE(3) 1,873 1,033 3,286 1,070 6,505 PROFESSIONE(4),552,941,344 1,557 1,737 PROFESSIONE(5) 1,705 1,120 2,319 1,128 5,501 PROFESSIONE(6) 1,066,959 1,237 1,266 2,905 PROFESSIONE(7) 2,444 1,012 5,825 1,016 11,515 PROFESSIONE(8),608 1,071,322 1,570 1,836 TIT.DISTUDIO,046,071,423 1,516 1,047 ETAanni,000,015,000 1,992 1,000 SESSO(1),361,363,992 1,319 1,435 Lavoro,542,137 15,728 1,000 1,719 Constant -3,456 1,083 10,182 1,001,032 a. Variable(s) entered on step 1: PROFESSIONE, TIT.DISTUDIO, ETAanni, SESSO, Lavoro. 20

Output regressione lineare multipla Model Summary b Model R R Square Adjusted R Square Std. Error of the Estimate 1,318 a,101,082 1,29122 a. Predictors: (Constant), tipozona, ETA' (anni), Extracomunitari, Area b. Dependent Variable: sicurezza2 ANOVA b Model Sum of Squares df Mean Square F Sig. 1 Regression 35,176 4 8,794 5,275,000 a Residual 311,777 187 1,667 Total 346,953 191 a. Predictors: (Constant), tipozona, ETA' (anni), Extracomunitari, Area b. Dependent Variable: sicurezza2 21

Output regressione lineare multipla Coefficients a el Standardized Unstandardized Coefficients Coefficients B Std. Error Beta Collinearity Statistics t Sig. Tolerance VIF (Constant) 5,445,533 10,214,000 ETA' (anni) -,020,005 -,286-4,112,000,992 1,008 Extracomunitari -,086,073 -,083-1,177,241,977 1,023 Area,317,357,065,886,377,890 1,123 tipozona -,425,213 -,147-1,999,047,884 1,131 ependent Variable: sicurezza2 Torna indietro 22