Business Intelligence e CRM CLAMM G.Tassinari. Laboratorio Regressione Logistica. 24 Settembre 2014 S.Benigni
|
|
- Ambra Bianchini
- 5 anni fa
- Visualizzazioni
Transcript
1 Business Intelligence e CRM CLAMM G.Tassinari Laboratorio Regressione Logistica 24 Settembre 2014 S.Benigni
2 Obiettivo dell Analisi Individuare quali variabili possono incidere nella decisione di un impresa a internazionalizzare, cioe trasferire parte delle proprie attivita produttive all estero Base Dati Indagine su un campione rappresentativo di imprese manifatturiere italiane
3 Descrizione delle variabile analizzate Dipendente D311: Internazionalizzazione della produzione (Attualmente l impresa realizza almeno in parte la propria attività produttiva in un altro Paese?) (1=si; 0=no) Indipendenti 1. DUMMIES PER SETTORI PAVITT: pavitt_1 se pavitt=1 Supplier Dominated pavitt_2 se pavitt=2 Scale Intensive pavitt_3 se pavitt=3 Specialized Suppier pavitt_4 se pavitt=4 Science Based 2. DUMMIES PER RIPARTIZIONE TERRITORIALE: zona_1 se zona=1 (N-O) zona_2 se zona=2 (N-E) zona_3 se zona=3 (C) zona_4 se zona=4 (S) 3. DUMMY PER L APPARTENENZA O MENO AD UN DISTRETTO: DISTRETTI_2001 (0=distretto non industriale; 1=distretto industriale) 4. APPARTENENZA DELL AZIENDA AD UN GRUPPO Variabile: A81. Assume valori 1/2 5. IMPRESA QUOTATA IN BORSA Variabile: F24. Assume valori 1/2/3 6. RICORSO A INCENTIVI FINANZIARI E/O FISCALI Variabile: F3. Assume valori 1/2
4 7. WHITE COLLAR PctWhiteCollar=WhiteCollar/addetti06; Metto a zero i missing per le variabili B111 (imprenditori 2006), B1121(dirigenti familiari 2006), B1122 (dirigenti esterni alla famiglia 2006), B113 (Quadri 2006), B114 (Nel questionario corrisponde a impiegati) WhiteCollar=B111_new+B1121_new+B1122_new+B113_new+B114_new; Addetti06= WhiteCollar+B1151+B1152 B1151=operai qualificati 2006 e B1152=operai comuni e apprendisti COSTO PER MATERIE PRIME E CONSUMO Variabili derivanti da bilanci:materieprimeeconsumo06 9. COSTO DEL LAVORO Variabile derivante da bilanci: TOTALECOSTIDELPERSONALE Log (salari e stipendi/dipendenti)2005 Variabili derivanti da bilanci: SALARIESTIPENDI05 DIPENDENTI Log (esportazioni/fatturato) 2006 Nella survey è presente la variabile D112 che indica le esportazioni espresse già in percentuale del fatturato. Variabile usata nel PS: log_pctexport=log(d112) 12. Log (occupati) 2006 Log(materieprimeeconsumo/dipendenti) 2005 In bilanci: MATERIEPRIMEECONSUMO05 DIPENDENTI05 Variabile usata nel PS: log_materieprimedip05=log(materieprimedip05)
5 Statistiche Descrittive D311 COUNT PERCENT CUM_FREQ CUM_PCT % % % % Freq pavitt_1 pavitt_2 pavitt_3 pavitt_4 zona_1 zona_2 zona_3 zona_4 Distretto Supplier dominated Scale Intensive Specialized Supplier Science based N-O N-E C S ind (si=1) 0 48% 82% 72% 95% 53% 72% 87% 88% 58% 1 52% 18% 28% 5% 47% 28% 13% 12% 42% INCIDENZA PERC DELLE VAR=1 PER LE IMPRESE INTERNAZIONALIZZATE (D311=1) E NON (D311=0) D311 pavitt_1 pavitt_2 pavitt_3 pavitt_4 zona_1 zona_2 zona_3 zona_4 Distretto Supplier dominated Scale Intensive Specialized Supplier Science based N-O N-E C S ind (si=1) 0 48% 19% 28% 5% 48% 28% 12% 12% 41% VS TOT D311=0 1 51% 14% 30% 6% 45% 33% 16% 6% 48% VS TOT D311=1 D311 _STAT_ PctWhiteCollar MATERIEPRIMEECONSUMO06 TOTALECOSTIDELPERSONALE05 log_saldipratio log_pctexport log_occupati06 0 N MIN MAX MEAN 40% STD N MIN MAX MEAN 43% STD
6 Risultati della regressione logistica The LOGISTIC Procedure Model Information Data Set LOGISTIC.LOGISTICA Response Variable D311 Number of Response Levels 2 Number of Observations 2344 Model binary logit Optimization Technique Fisher's scoring Metodo di stima iterattiva del modello di regressione Response Profile Ordered Total Value D311 Frequency Probabili modeled is D311=1. Indica quale livello della variabile dipendente stiamo modellando
7 Model Convergence Status Convergence criterion (GCONV=1E-8) satisfied Indica la convergenza dell algoritmo di massima verosimiglianza, il criterio usato per confermarla e il Gradiente di Convergenza con una precisione di 10-8 Model Fit Statistics Intercept Intercept and Criterion Only Covariates AIC SC Log L AIC - Akaike Information Criterion. AIC = -2 Log L + 2((k-1) + s), dove k e il numero dei livelli della variabile dipendente e s il numero dei previsori del modello. AIC viene utilizzato per confrontare modelli non annidati sullo stesso campione. Quello con AIC inferiore e il migliore, da solo il valore non e significativo SC - Schwarz Criterion. SC= - 2 Log L + ((k-1) + s)*log(σ f i ), dove f i 's e la frequenza della i th osservazione, e k e s sono definiti a priori. Come AIC, SC e penalizzato dal numero dei previsori, inferiore e il migliore, da solo il valore non e significativo -2 Log L - E due volte il negativo del Log-Verosimiglianza (Likelihood). Viene usato per testare le ipotesi di modelli annidati e il valore da solo non e significativo Intercept Only: solo variabile dipendente, Intercept and Covariates: modello completo con anche I previsori. I due modelli vanno confrontati
8 Testing Global Null Hypothesis: BETA=0 Test Chi-Square DF Pr > ChiSq Likelihood Ratio <.0001 Score <.0001 Wald <.0001 Test - Sono tre Test di Chi-Quadro equivalenti per l ipotesi nulla che il coefficente di regressione di almeno uno dei previsori non e uguale a zero nel modello. Likelihood Ratio -2 Log L(null model) - 2 Log L(fitted model) dove L(null model) riferisce alla Intercept Only model e L(fitted model) riferisce al modello con Intercept and Covariates Degrees of Freedom (DF) e p-value (PR>ChiSq) corrispondono al test che tutti i previsori siano in simultanea uguali a zero. Stiamo testando la probabilita (PR>ChiSq) di osservare una statistica Chi-Square sotto l ipotesi nulla che tutti I coefficienti del modello siano uguali a zero.df definisce la distribuzione di Chi-Square ed e definito dal numero delle variabili del modello. Di solito, PR>ChiSq e confrontato a uno specifico valore di alfa, che rappresenta il tipo di errore accettabile, che di solito e tra 0.05 e Il basso numero di p derivante da tutti e tre I test ci porta a concludere che almeno uno dei coefficienti di regressione nel modello non e uguale a zero
9 Analysis of Maximum Likelihood Estimates Standard Wald Parameter DF Estimate Error Chi-Square Pr > ChiSq Intercept <.0001 pavitt_ pavitt_ pavitt_ pavitt_ zona_ zona_ zona_ zona_ Distretti_ A F F F <.0001 PctWhiteCollar MATERIEPRIMEECONSUMO E E TOTALECOSTIDELPERSON E E log_saldipratio <.0001 log_pctexport <.0001 log_occupati Estimate - E la stima del modello di regressione logistica binaria per I Parametri del Modello. Il modello di regressione logistica stima il log odds di un responso positivo, cioe che D113=1 in funzione di una combinazione lineare delle variabili.possiamo interpretare I parametri stimati come segue: per una unita di variazione della variabile predittiva, la differenza in log-odds per un impatto positivo e proporzionale al relativo coefficiente, tenute costanti le altre variabili del modello Intercept - e la stima della regressione logistica quando tutte le altre variabii sono ugualia a zero Standard Error - relativo a ogni coefficiente di regressione, utilizzato sia 95% Wald Confidence Limits, e Chi-Square test Chi-Square - Test dell hp nulla che il coefficiente di regressione di un previsore sia uguale a zero, date le altre variabili del modello, contro l ipotesi che la stima non e uguale a zero. La probabilita dell ipotesi nulla del Chi-Square e data da Pr>ChiSq. NOTE: The following parameters have been set to 0, since the variables are a linear combination of other variables as shown. pavitt_40 = 2 * Intercept - pavitt_10 - pavitt_20 - pavitt_30, zona_40 = 2 * Intercept - zona_10 - zona_20 - zona_30
10 Odds Ratio Estimates Point 95% Wald Effect Estimate Confidence Limits pavitt_1 0 vs pavitt_2 0 vs pavitt_3 0 vs zona_1 0 vs zona_2 0 vs zona_3 0 vs Distretti_ vs A81 1 vs F24 1 vs F24 2 vs F3 1 vs PctWhiteCollar MATERIEPRIMEECONSUMO TOTALECOSTIDELPERSON log_saldipratio log_pctexport log_occupati Effect - Sono le variabili interpretate in termini di odds ratios. Point Estimate - Sono gli odds ratio degli Effect. Ricordiamo che gli Odds Ratio maggiori di 1 rappresentano un impatto positivo che la variabile indipendente assuma valore 1; gli odds ration fra 0-1 un impatto negativo, gli odds ration pari a 1 nessuna relazione 95% Wald Confidence Limits - indica che siamo confident al 95% che i limiti di confidenza indicati contengono i valori effettivi degli odds ratio. Il vantaggio dei limiti di confidenza e che fornisce informazioni sui valori che il paramentro potrebbe assumere e quindi il livello di precisione della stima dell odds ratio e quindi dell impatto della variabile predittiva, nel modello, dati gli altri predittori. Da cui si evince che le variabili che hanno verosimilmente, con una probabilita del 95%, un impatto positivo sulla scelta di un impresa a internazionalizzare sono: F3, cioe il riscorso a incentivi fianziari e/o fiscali, la Percentuale di impiegati, la Percentuale di Esportazioni e la dimensione dell impresa calcolata attraverso il numero degli occupati.
11 The LOGISTIC Procedure Association of Predicted Probabilities and Observed Responses Percent Concordant 80.8 Somers' D Percent Discordant 18.9 Gamma 0.62 Percent Tied 0.4 Tau-a Pairs c Percent Concordant - Una coppia di osservazioni si dice concordante se l oss.ne con il piu basso responso ha un valore medio previsto inferiore della variabile con un piu alto valore del responso Percent Discordant - Una coppia di osservazioni si dice discordante se l oss.ne con il piu basso responso ha un valore medio previsto superiore rispetto alla variabile con un piu alto valore del responso Percent Tied - Una coppia di osservazioni che non e concordante, ne discordante Somers' D - Misura la forza e la direzione delle relazioni tra coppie di variabili. Varia tra -1.0 (tutte le coppie in disacordo), e 1.0 (tutte le coppie in accordo) Gamma - Il metodo di Goodman-Kruskal Gamma va da -1.0 (no association) a 1.0 (perfect association). Dato che non penalizza per i Ties, il suo valore e in genere piu grande di Somers D Tau-a - Kendall's Tau-a e una variante di Somer's D che tiene in considerazione la differenza tra le coppie possibili osservate e il numero di coppie con un responso differente. Di solito e molto piu piccolo di Somer s D dato che ci sono molte coppie uguali c e equivalente alla misura di ROC, varia tra 0.5 e 1, con 0.5 si intende il modello che prevede il responso in modo casuale, mentre 1 indica il modello che discrimina il responso in modo perfetto
12 Allegato: Procedure SAS utilizzate nell esercizio Libname LOGISTIC V8 M:\BENIGNI\LOGISTICA\INPUT ; proc freq data=logistic.logistica; tables D311 D311*(pavitt_1 pavitt_2 pavitt_3 pavitt_4 zona_1 zona_2 zona_3 zona_4 distretti_2001 A81 F24 F3); run; proc sort data=logistic.logistica; by d311; run; proc means data=logistic.logistica; by d311; vars PctWhiteCollar materieprimeeconsumo06 totalecostidelpersonale05 log_saldipratio log_pctexport log_occupati06; run; proc logistic data=logistic.logistica descending; class pavitt_1 pavitt_2 pavitt_3 pavitt_4 zona_1 zona_2 zona_3 zona_4 distretti_2001 A81 F24 F3; model D311=pavitt_1 pavitt_2 pavitt_3 pavitt_4 zona_1 zona_2 zona_3 zona_4 distretti_2001 A81 F24 F3 PctWhiteCollar materieprimeeconsumo06 totalecostidelpersonale05 log_saldipratio log_pctexport log_occupati06; output out=output.model pred=prob; run;
Metodi Statistici per il Management
Metodi Statistici per il Management Modelli statistici di dipendenza Simone Borra - Roberto Rocci Modelli statistici di dipendenza Modelli: strutture formali che hanno l obiettivo di descrivere, spiegare
Dettagli9 Confronto fra due o più popolazioni attraverso test non parametrici
9 Confronto fra due o più popolazioni attraverso test non parametrici I test non parametrici prescindono per la loro validità dalle condizioni di normalità ed omogeneità delle varianze delle popolazioni
DettagliParte Pratica II Il modello logistico nello studio caso-controllo
Università degli Studi di Genova Facoltà di Scienze Matematiche, Fisiche e Naturali Anno Accademico 2006-2007 Corso di Laurea in Statistica Matematica e Trattamento Informatico dei Modulo di lezioni nell
DettagliMetodi Statistici per il Management
Metodi Statistici per il Management Statistica Multivariata I Simone Borra - Roberto Rocci Introduzione e obiettivi La statistica multivariata si occupa di analizzare e studiare in modo simultaneo un set
DettagliLaboratorio di Statistica Aziendale Modello di regressione lineare multipla
Laboratorio di Statistica Aziendale Modello di regressione lineare multipla Michela Pasetto michela.pasetto2@unibo.it Definizione del modello OLS (semplice) L obiettivo della regressione lineare è di valutare
DettagliMetodi Quantitativi per Economia, Finanza e Management. Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello
Metodi Quantitativi per Economia, Finanza e Management Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello 1. Introduzione ai modelli di regressione 2. Obiettivi 3. Le
DettagliUniversità di Pavia Econometria Esercizi 5
Università di Pavia Econometria 2007-2008 Esercizi 5 Maggio, 2008 1. Una regressione lineare multipla di y su una costante, x 2 e x 3 produce i seguenti risultati: ŷ t = 4 + 0.4x t2 + 0.9x t3 con X X =
DettagliIl modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)
Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Quesito: Posso stimare il numero di ore passate a studiare statistica sul voto conseguito all esame? Potrei calcolare il coefficiente di correlazione.
DettagliConfronto fra gruppi: il metodo ANOVA. Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23
Confronto fra gruppi: il metodo ANOVA Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23 1 Nella popolazione, per ciascun gruppo la distribuzione della variabile risposta
DettagliRegressione. Monica Marabelli. 15 Gennaio 2016
Regressione Monica Marabelli 15 Gennaio 2016 La regressione L analisi di regressione é una tecnica statistica che serve a studiare la relazione tra variabili. In particolare, nel modello di regressione
DettagliIntroduzione alla Regressione Logistica
Introduzione alla Regressione Logistica Contenuto regressione lineare semplice e multipla regressione logistica lineare semplice La funzione logistica Stima dei parametri Interpretazione dei coefficienti
DettagliLABORATORIO DI PROBABILITA E STATISTICA
UNIVERSITA DEGLI STUDI DI VERONA LABORATORIO DI PROBABILITA E STATISTICA Docente: Bruno Gobbi 6 ESERCIZI RIEPILOGATIVI PRIME 3 LEZIONI REGRESSIONE LINEARE: SPORT - COLESTEROLO ESERCIZIO 8: La tabella seguente
DettagliBLAND-ALTMAN PLOT. + X 2i 2 la differenza ( d ) tra le due misure per ognuno degli n campioni; d i. X i. = X 1i. X 2i
BLAND-ALTMAN PLOT Il metodo di J. M. Bland e D. G. Altman è finalizzato alla verifica se due tecniche di misura sono comparabili. Resta da comprendere cosa si intenda con il termine metodi comparabili
DettagliRegressione logistica
Regressione logistica Metodi Quantitativi per Economia, Finanza e Management Esercitazione n 11 Consegna Lavoro di gruppo Scadenza per la consegna del lavoro di gruppo e dell homework facoltativo (per
DettagliFallstudium 8 - Soluzioni Dr Giorgio Pioda 15 gennaio 2019
Fallstudium 8 - Soluzioni Dr Giorgio Pioda 15 gennaio 2019 Regressione logistica La regressione logistica è molto utile per valutare l impatto di descrittori (x) scalari o categoriali sulla probabilità
DettagliEsercitazione. 24 Aprile 2012
Esercitazione 24 Aprile 2012 Il modello di regressione logistica viene utilizzato quando si è interessati a studiare o analizzare la relazione causale tra una variabile dipendente dicotomica e una o più
DettagliVariabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.
Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:
DettagliAnova e regressione. Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Universitá degli Studi di Perugia 22 marzo 2011
Anova e regressione Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Universitá degli Studi di Perugia 22 marzo 2011 Nella sperimentazione agronomica e biologica in genere è normale organizzare
DettagliTECNICHE DI CLASSIFICAZIONE
TECNICHE DI CLASSIFICAZIONE La tecnica di classificazione più conosciuta è la cluster analysis, che ha l obiettivo di identificare gruppi di soggetti (o oggetti) omogenei al loro interno ed eterogenei
DettagliMetodi Quantitativi per Economia, Finanza e Management. Lezione n 5 Analisi Bivariata I Parte
Metodi Quantitativi per Economia, Finanza e Management Lezione n 5 Analisi Bivariata I Parte Statistica descrittiva bivariata Indaga la relazione tra due variabili misurate. Si distingue rispetto alla
DettagliESERCITAZIONE C. Analisi di dati sperimentali PARTE 3: REGRESIONE
Università degli Studi di Padova Facoltà di Scienze MM.FF.NN. Corso di Laurea Magistrale: Biologia Sanitaria/Biologia Molecolare Insegnamento: Statistica Applicata Docente: Prof.ssa Alessandra R. Brazzale
DettagliModelli che spiegano l attività fotosintetica alla luce di parametri fisiologici della vegetazione. Dr. Alessandro Ferrarini
Modelli che spiegano l attività fotosintetica alla luce di parametri fisiologici della vegetazione Dr. Alessandro Ferrarini variabile dipendente: NDVI (indice di attività fotosintetica) variabili indipendenti:
DettagliRegressione logistica. Strumenti quantitativi per la gestione
Regressione logistica Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/classes/4a_rlg.html#(22) 1/28 Metodi di classificazione I
DettagliStatistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1
Statistica Capitolo 1 Regressione Lineare Semplice Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Spiegare il significato del coefficiente di correlazione lineare
DettagliAnalisi grafica residui in R. Da output grafico analisi regressionelm1.csv Vedi dispensa. peso-statura
Analisi grafica residui in R Da output grafico analisi regressionelm1.csv Vedi dispensa peso-statura 1) Il plot in alto a sinistra mostra gli errori residui contro i loro valori stimati. I residui devono
DettagliLuigi Santoro. Hyperphar Group S.p.A., MIlano
Come modellare il rischio Luigi Santoro Hyperphar Group S.p.A., MIlano Gli argomenti discussi Le definizioni del termine rischio L utilità di un modello predittivo di rischio Come costruire modelli predittivi
DettagliUn applicazione della modellistica ARCH-GARCH
Un applicazione della modellistica ARCH-GARCH Federico Andreis Tesina per l esame di Metodi Statistici per la Finanza e le Assicurazioni A.A. 2005/2006 Prof. Diego Zappa Il grafico della serie storica
DettagliStatistica multivariata! Analisi fattoriale
Parte 3 : Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Statistica multivariata! Analisi
DettagliMetodologie Quantitative
Metodologie Quantitative Regressione Logistica II M Q Marco Perugini Milano-Bicocca 1 La regressione logistica La regressione logistica si propone di studiare e quantificare le relazioni tra una o più
DettagliMultiple Logistic Regression
Multiple Logistic Regression f(- ) Logistic function ( ) + e 0 + e /2 0 f( + ) (+ ) + e + e +. ก. ก Fitting Multiple Logistic Regression ก (Outcome, Dependent, Response) discrete (two
DettagliI modelli lineari generalizzati: il modello di Poisson
I modelli lineari generalizzati: il modello di Poisson Massimo Borelli May 13, 2014 Massimo Borelli () I modelli lineari generalizzati: il modello di Poisson May 13, 2014 1 / 15 Contenuti 1 Motivazioni
DettagliREGRESSIONE MULTIPLA E CORRELAZIONE. Nicola Tedesco (Statistica Sociale) REGRESSIONE MULTIPLA E CORRELAZIONE 1 / 16
REGRESSIONE MULTIPLA E CORRELAZIONE Nicola Tedesco (Statistica Sociale) REGRESSIONE MULTIPLA E CORRELAZIONE 1 / 16 y a b 1 x 1 (x 2 0) a b 2 x 2 (x 1 0) a a b 1 x 1 b 2 x 2 0 x 2 x 1 x 2 Plane x 1 Nicola
DettagliModelli statistici per l analisi dei dati e la valutazione d efficacia Il caso del Comune di Perugia
Modelli statistici per l analisi dei dati e la valutazione d efficacia Il caso del Comune di Perugia Alessandra Pelliccia Matteo Cataldi Matteo Filippo Donadi 0 AGENDA Fonti Descrizione dei dati Variabili
DettagliCAPITOLO 5 Introduzione ai piani fattoriali
Douglas C. Montgomery Progettazione e analisi degli esperimenti 2006 McGraw-Hill CAPITOLO 5 Introduzione ai piani fattoriali Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria
DettagliMetodi Quantitativi per Economia, Finanza e Management. Lezione n 4 Analisi Bivariata I Parte
Metodi Quantitativi per Economia, Finanza e Management Lezione n 4 Analisi Bivariata I Parte Statistica descrittiva bivariata Indaga la relazione tra due variabili misurate. Si distingue rispetto alla
DettagliL'analisi bivariata (associazione e cograduazione)
L'analisi bivariata (associazione e cograduazione) Prof. Stefano Nobile Corso di Metodologia della ricerca sociale L analisi bivariata L analisi bivariata è un analisi delle relazioni tra due caratteristiche
DettagliANALISI DEI DATI EPIDEMIOLOGICI
ANALISI DEI DATI EPIDEMIOLOGICI Statistica descrittiva ed inferenziale Campione Media, dev. standard, RR, RD, Stat. descrittiva Statistica descrittiva ed inferenziale Popolazione Campione Media, dev.
DettagliCOGNOME.NOME...MATR..
STATISTICA 29.01.15 - PROVA GENERALE (CHALLENGE) Modalità A (A) ai fini della valutazione verranno considerate solo le risposte riportate dallo studente negli appositi riquadri bianchi: in caso di necessità
Dettagli8 Analisi della covarianza
8 Analisi della covarianza Nota sull Analisi...(2 a ed.) L'analisi della covarianza può definirsi principalmente come una via per ridurre l'errore dovuto a sorgenti esterne di variabilità nel verificare
DettagliCognome e nome. 2 In uno studio viene misurata la pressione arteriosa sistolica a 5 maschi adulti, con i seguenti risultati : 129; 134; 142; 128; 146
Statistica medica. Biotecnologie mediche A.a. 2004-2005 1 Febbraio 2005 Tempo previsto 60 minuti Cognome e nome 1 Indicate a quale categoria appartengono le seguenti variabili: Nominale Ordinale Numerica
DettagliESERCITAZIONE ANCOVA
ESERCITAZIONE ANCOVA I dati provengono da un articolo di Cyril Burt del 1996 intitolato The genetic determination of differences in intelligence: A study of monozygotic twins reared apart. I dati contengono
DettagliStatistica Applicata all edilizia Lezione: approccio stocastico all analisi delle serie storiche
Lezione: approccio stocastico all analisi delle serie storiche E-mail: orietta.nicolis@unibg.it 3 maggio 2011 Programma 1 Approccio stocastico all analisi delle serie storiche Programma Approccio stocastico
DettagliQuiz di verifica - Alberi e FC Strumenti Quantitativi per la gestione
Quiz di verifica - Alberi e FC Strumenti Quantitativi per la gestione Le domande 1-6 si riferiscono al seguente problema Un data set contiene i dati sui consumi di diversi tipi di automobili e alcune loro
Dettagli0.1 Percorrenza e Cilindrata
0.1 Percorrenza e Cilindrata Iniziamo ora un analisi leggermente più complessa basata sempre sui concetti appena introdotti. Innanzi tutto possiamo osservare, dal grafico ottenuto con il comando pairs,
DettagliAncova: il modello lineare in generale
Ancova: il modello lineare in generale Massimo Borelli May 9, 2014 Massimo Borelli () Ancova: il modello lineare in generale May 9, 2014 1 / 18 Contenuti 1 L analisi della covarianza la notazione di Wilkinson
DettagliRAPPORTO CER Aggiornamenti
RAPPORTO CER Aggiornamenti 12 Ottobre 2012 LO SPREAD PROSSIMO VENTURO Quanto potrà scendere lo spread Btp-Bund dopo le misure di austerità fiscale? Per rispondere, forniamo una semplice stima derivata
DettagliMetodi statistici per la ricerca sociale Capitolo 15. Regressione logistica: modellare variabili risposta categoriali
Metodi statistici per la ricerca sociale Capitolo 15. Regressione logistica: modellare variabili risposta categoriali Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università
DettagliLABORATORIO 5. ANALISI DELLA VARIANZA AD UN CRITERIO DI CLASSIFICAZIONE
LABORATORIO 5. ANALISI DELLA VARIANZA AD UN CRITERIO DI CLASSIFICAZIONE 5.1 ESEMPIO DI ANOVA AD UNA VIA In un esperimento un gruppo di bambini è stato assegnato a caso a 3 trattamenti, allo scopo di determinare
DettagliCapitolo 12 La regressione lineare semplice
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università
DettagliOld Faithful, Yellowstone Park. Statistica e biometria. D. Bertacchi. Dati congiunti. Tabella. Scatterplot. Covarianza. Correlazione.
Coppie o vettori di dati Spesso i dati osservati sono di tipo vettoriale. Ad esempio studiamo 222 osservazioni relative alle eruzioni del geyser Old Faithful. Old Faithful, Yellowstone Park. Old Faithful
DettagliNel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0.
Regressione [] el modello di regressione lineare si assume una relazione di tipo lineare tra il valore medio della variabile dipendente Y e quello della variabile indipendente X per cui Il modello si scrive
DettagliTest F per la significatività del modello
Test F per la significatività del modello Per verificare la significatività dell intero modello si utilizza il test F Si vuole verificare l ipotesi H 0 : β 1 = 0,, β k = 0 contro l alternativa che almeno
DettagliTempo disponibile: 60 minuti
Corso di Specialistica in Biotecnologie Statistica medica. A.A. 005-006 6 Marzo 006 Tempo disponibile: 60 minuti 1. Conducete uno studio clinico controllato randomizzato di fase III per misurare l'effetto
DettagliEsercizio 1 GRAFICO 1. X e Y sono indipendenti. X e Y non sono correlate. La correlazione tra X e Y è <1. X e Y sono perfettamente correlate
Esercizio 1 Osservare il grafico 1 riportato in figura che mette in relazione una variabile dipendente Y ed una variabile indipendente X e rispondere alle seguenti domande. 400 300 200 GRAFICO 1 100 0
DettagliAnalisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali
Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Introduzione : analisi delle relazioni tra due caratteristiche osservate sulle stesse unità statistiche studio del comportamento di due caratteri
DettagliCognome e nome Tempo disponibile: 60 minuti
Corso di Laurea in Medicina e Chirurgia Statistica medica. A.A. 005-006 6 Marzo 006 Cognome e nome Tempo disponibile: 60 minuti 1. Conducete uno studio clinico controllato randomizzato di fase III per
DettagliMISURA DELLA VARIAZIONE CONCOMITANTE (COVARIAZIONE/ CONTROVARIAZIONE) DI VARIABILI CARDINALI O QUASI- CARDINALI
ANALISI DELLA CORRELAZIONE MISURA DELLA VARIAZIONE CONCOMITANTE (COVARIAZIONE/ CONTROVARIAZIONE) DI VARIABILI CARDINALI O QUASI- CARDINALI VINCOLI CHE SI IMPONGONO ALLA SUA UTILIZZAZIONE: LA RELAZIONE
DettagliA) COSTRUIRE LA FIGURA RELATIVA AL DIAGRAMMA DEL MODELLO (2 punti) B) CALCOLARE I GRADI DI LIBERTA' DEL MODELLO (2 punti)
DATO IL SEGUENTE PROGRAMMA MPLUS TITLE: ESERCIZIO EX LISREL DATA: FILE IS EX34.DAT; TYPE IS CORRELATION; NOBSERVATION IS 145; VARIABLE: NAMES ARE X1-X6 Y1-Y3; MODEL: KSI1 BY X1-X3 ; KSI2 BY X4-X6 ; ETA1
DettagliStatistiche di sintesi
Esercizio 2 E stato condotto uno studio per valutare la variazione della pressione sistolica in funzione dell etá. I dati sono riportati nel file sbp.xls. Effettua un analisi di regressione e disegna gli
Dettagli1. In uno studio viene misurata la pressione arteriosa sistolica a 36 soggetti, con i seguenti risultati. Media = 172,8 Deviazione standard= 24,25
1. In uno studio viene misurata la pressione arteriosa sistolica a 36 soggetti, con i seguenti risultati. Media = 172,8 Deviazione standard= 24,25 Commento generale: in questo esercizio l unica stima della
DettagliECONOMETRIA: Laboratorio I
ECONOMETRIA: Laboratorio I Luca De Angelis CLASS - Università di Bologna Programma Laboratorio I Valori attesi e varianze Test di ipotesi Stima di un modello lineare attraverso OLS Valore atteso Data una
DettagliCHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)
CHEMIOMETRIA Applicazione di metodi matematici e statistici per estrarre (massima) informazione chimica (affidabile) da dati chimici INCERTEZZA DI MISURA (intervallo di confidenza/fiducia) CONFRONTO CON
DettagliEsercitazioni_parte B
Esercitazioni_parte B Analisi degli antecedenti temporali Si intende verificare se l insoddisfazione corporea al T sia un antecedente temporale del cambiamento nei livelli di Impulso alla magrezza al T
DettagliPROBABILITÀ ELEMENTARE
Prefazione alla seconda edizione XI Capitolo 1 PROBABILITÀ ELEMENTARE 1 Esperimenti casuali 1 Spazi dei campioni 1 Eventi 2 Il concetto di probabilità 3 Gli assiomi della probabilità 3 Alcuni importanti
DettagliREGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori
REGRESSIONE lineare e CORRELAZIONE Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori Y X La NATURA e la FORZA della relazione tra variabili si studiano con la REGRESSIONE
DettagliModelli di Regressione Spline per la Stima. della Relazione Dose-Risposta in Studi. Epidemiologici
Modelli di Regressione Spline per la Stima della Relazione Dose-Risposta in Studi Epidemiologici Vincenzo Bagnardi Dipartimento di Statistica e Metodi Quantitativi, Università degli Studi di Milano - Bicocca
DettagliSTATISTICA. Esercitazione 5
STATISTICA Esercitazione 5 Esercizio 1 Ad un esame universitario sono stati assegnati in modo casuale due compiti diversi con i seguenti risultati: Compito A Compito B Numero studenti 102 105 Media dei
DettagliUniversità del Piemonte Orientale. Corsi di laurea triennale di area tecnica. Corso di Statistica Medica. Intervalli di confidenza
Università del Piemonte Orientale Corsi di laurea triennale di area tecnica Corso di Statistica Medica Intervalli di confidenza Corsi di laurea triennale di area tecnica - Corso di Statistica Medica -
DettagliUniversità del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. Analisi dei dati quantitativi :
Università del Piemonte Orientale Corso di laurea in medicina e chirurgia Corso di Statistica Medica Analisi dei dati quantitativi : Analisi della varianza Università del Piemonte Orientale Corso di laurea
Dettagli0 altimenti 1 soggetto trova lavoroentro 6 mesi}
Lezione n. 16 (a cura di Peluso Filomena Francesca) Oltre alle normali variabili risposta che presentano una continuità almeno all'interno di un certo intervallo di valori, esistono variabili risposta
DettagliPOPOLAZIONE E CAMPIONI
p. 1/2 POPOLAZIONE E CAMPIONI POPOLAZIONE insieme di tutti quegli elementi che hanno almeno una caratteristica comune (persone, oggetti,misure, osservazioni). Consideriamo il caso di caratteristiche associate
DettagliRegressione Logistica
Regressione Logistica Esercizio Data set: Nel data set heart.txt (o heart.sav) sono contenute informazioni riguardo 302 pazienti che hanno avuto infarto e 60 che non hanno avuto infarto in uno studio retrospettivo
DettagliStatistica multivariata
Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Analisi multivariata Cercare di capire le relazioni
DettagliINFORMAZIONI. p. 1/23
p. 1/23 INFORMAZIONI Prossime lezioni Giorno Ora Dove Giovedi 11/02 14:30 Laboratorio (via Loredan) Martedi 16/02 14:30 P50 Lunedi 22/02 09:30 P50 Martedi 23/02 14:30 P50 Giovedi 25/02 14:30 Aula informatica
DettagliStatistica multivariata
Parte 3 : Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Analisi multivariata Cercare di capire
DettagliMODELLI RIDOTTI COME SI EFFETTUA IL TEST DI NULLITÀ DI UN SOTTOINSIEME DI COEFFICIENTI IN SAS
MODELLI RIDOTTI COME SI EFFETTUA IL TEST DI NULLITÀ DI UN SOTTOINSIEME DI COEFFICIENTI IN SAS proc reg data=fitness; model Oxygen=Age Weight RunTime RunPulse RestPulse MaxPulse ; test Weight, RestPulse;
DettagliUniversità del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. Analisi dei dati quantitativi :
Università del Piemonte Orientale Corso di laurea in medicina e chirurgia Corso di Statistica Medica Analisi dei dati quantitativi : Analisi della varianza Università del Piemonte Orientale Corso di laurea
DettagliModelli Statistici per l Economia. Regressione lineare con un singolo regressore (terza parte)
Modelli Statistici per l Economia Regressione lineare con un singolo regressore (terza parte) 1 Verifica di ipotesi su β 1 H 0 : β 1 = β 1,0 H 1 : β 1 β 1,0 Se è vera H 0 (cioè sotto H 0 ) e n è grande,
DettagliUniversità del Piemonte Orientale. Corso di laurea specialistica in biotecnologie mediche. Corso di Statistica Medica. Analisi dei dati quantitativi :
Università del Piemonte Orientale Corso di laurea specialistica in biotecnologie mediche Corso di Statistica Medica Analisi dei dati quantitativi : Analisi della varianza Università del Piemonte Orientale
DettagliMetodi Quantitativi per Economia, Finanza e Management
Metodi Quantitativi per Economia, Finanza e Management Lezione n 9 Regressione lineare multipla: la valutazione del modello, multicollinearità, metodi automatici di selezione dei regressor, analisi di
DettagliCOGNOME.NOME...MATR..
STATISTICA 29.01.15 - PROVA GENERALE (STANDARD) Modalità B (A) ai fini della valutazione verranno considerate solo le risposte riportate dallo studente negli appositi riquadri bianchi: in caso di necessità
DettagliAnalisi Bivariata. Metodi Quantitativi per Economia, Finanza e Management. Esercitazione n 4
Analisi Bivariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n 4 Lavoro di gruppo Inviare il questionario via mail a gdeppieri@liuc.it e gmagistrelli@liuc.it entro oggi 30/10/2015
DettagliCopyright Esselibri S.p.A.
70 3000 500 000 1500 1000 500 A B C D (a) Capitolo Terzo A B C D 500 1000 1500 000 5003000 3500 Fig. 1 - Ortogramma a colonne (a) e ortogramma a nastri (b) 4. MISURE DI ASSOCIAZIONE E DI COGRADUAZIONE
DettagliQuiz di verifica Classificazione
Quiz di verifica Classificazione Strumenti Quantitativi per la gestione Le domande 1 4 si riferiscono al seguente problema: Supponiamo di raccogliere dati per un gruppo di studenti della classe di SQG
DettagliUniversità del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. Intervalli di confidenza
Università del Piemonte Orientale Corso di laurea in medicina e chirurgia Corso di Statistica Medica Intervalli di confidenza Università del Piemonte Orientale Corso di laurea in medicina e chirurgia Corso
DettagliAnalisi Bivariata: Test Statistici
Analisi Bivariata: Test Statistici Metodi Quantitativi per Economia, Finanza e Management Esercitazione n 5 Prima di iniziare.. Controllare se sul pc su cui state lavorando esiste già una cartella C:\corso.
DettagliINDICATORI DI TENDENZA CENTRALE
INDICATORI DI TENDENZA CENTRALE INDICATORI DI TENDENZA CENTRALE Consentono di sintetizzare un insieme di misure tramite un unico valore rappresentativo indice che riassume o descrive i dati e dipende dalla
DettagliESERCITAZIONE del 07/04/2016 Anova a una via
ESERCITAZIONE del 07/04/2016 Anova a una via Si vuole studiare se l età media a cui le donne hanno il primo figlio è influenzata dal livello di istruzione. Su un campione di 63 donne di 45 anni è stata
DettagliRegressione Lineare Multipla
Regressione Lineare Multipla Fabio Ruini Abstract La regressione ha come scopo principale la previsione: si mira, cioè, alla costruzione di un modello attraverso cui prevedere i valori di una variabile
DettagliStatistica economica
Statistica economica a.a. 013/14 Dr. Luca Secondi 10.a. Output tipico di un modello di regressione lineare multipla 1 Le analisi basate sul modello di regressione prevedono la stima dei coefficienti associati
DettagliProf. Anna Paola Ercolani (Università di Roma) Lez Indicatori di tendenza centrale
INDICATORI DI TENDENZA CENTRALE Consentono di sintetizzare un insieme di misure tramite un unico valore rappresentativo indice che riassume o descrive i dati e dipende dalla scala di misura dei dati in
DettagliUniversità degli Studi Roma Tre Anno Accademico 2014/2015 ST410 Statistica 1
Università degli Studi Roma Tre Anno Accademico 2014/2015 ST410 Statistica 1 Lezione 1 - Martedì 23 Settembre 2014 Introduzione al corso. Richiami di probabilità: spazi di probabilità, variabili aleatorie,
DettagliElementi di Epidemiologia per la Valutazione Comparativa di Esito
Elementi di Epidemiologia per la Valutazione Comparativa di Esito La valutazione della qualità dell assistenza: quali domande? L incidenza di alcuni esiti negativi dell assistenza ospedaliera (come la
DettagliLaboratorio BUSINESS INTELLIGENCE AND CUSTOMER RELATIONSHIP MANAGEMENT CLAMM
Laboratorio BUSINESS INTELLIGENCE AND CUSTOMER RELATIONSHIP MANAGEMENT CLAMM Regressione Logistica Esempio Churn analysis Obiettivi: 1. determinare le variabili che possono incidere nella decisione del
DettagliCAPITOLO 3 Esperimenti con un singolo fattore: l Analisi della Varianza
Douglas C. Montgomery Progettazione e analisi degli esperimenti 006 McGraw-Hill CAPITOLO 3 Esperimenti con un singolo fattore: l Analisi della Varianza Metodi statistici e probabilistici per l ingegneria
DettagliLABORATORI DI STATISTICA SOCIALE
Università degli Studi di Bergamo Dipartimento di Scienze Umane e Sociali Corso di Laurea in Scienze Psicologiche LABORATORI DI STATISTICA SOCIALE Lezione III Dott.ssa Roberta Adorni Dott.ssa Giulia Fusi
DettagliComputazione per l interazione naturale: Regressione probabilistica
Computazione per l interazione naturale: Regressione probabilistica Corso di Interazione Naturale Prof. Giuseppe Boccignone Dipartimento di Informatica Università di Milano boccignone@di.unimi.it boccignone.di.unimi.it/in_2018.html
Dettaglilezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1
lezione n. 6 (a cura di Gaia Montanucci) METODO MASSIMA VEROSIMIGLIANZA PER STIMARE β 0 E β 1 Distribuzione sui termini di errore ε i ε i ~ N (0, σ 2 ) ne consegue : ogni y i ha ancora distribuzione normale,
Dettagli