Statistica multivariata

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Statistica multivariata"

Transcript

1 Parte 3 : Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Analisi multivariata Cercare di capire le relazioni che intercorrono tra le variabili Introdurre tante variabili in un analisi non ha molto senso, né al livello biologico, né al livello statistico.! Il modello diventa troppo complesso.! Diventa difficile interpretare i risultati.! Le stime dei parametri diventano molto instabili.! Più parametri inseriamo, più osservazioni ci vogliono per stimarli. Eliminiamo le variabili che sono molto correlate tra di loro. Se due variabili sono molto correlate, allora l informazione di una è contenuta quasi completamente nell altra. Statistica multivariata Dati multivariati Variabili statistiche! Analisi fattoriale analisi (prevalentemente) simmetrica rappresentare un numero elevato di variabili per mezzo di un numero inferiore di variabili ipotetiche (o latenti), i cosiddetti fattori Unità statistiche 1 2 Var. 1 x 11 x 21 Var. 2 x 12 x 22 Var. m x 1m x 2m! Regressione multipla analisi asimmetrica formulare opportuni modelli descrittivi/interpretativi n x n1 x n2 osservazioni, rilevazioni, x nm atrice dei dati (n!m) : n righe, m colonne con n!m valori isure di concordanza Covarianza Voglio un indice (una misura) che mi dica il grado di concordanza tra i valori di una variabile X con quelli di una variabile Y. Var. 1 Variabili statistiche Var. 2 Var. m 1 x 11 x 12 x 1m Concordanza positiva Concordanza negativa Unità statistiche 2 n x 21 x n1 x 22 x n2 x 2m x nm x.1 x.2 x.m Covarianza : indice della relazione (lineare) tra due variabili Assenza di concordanza

2 Correlazione atrice di covarianza Varianza : indice di dispersione Covarianza : indice di relazione Correlazione : indice di relazione normato Diagonale principale: varianza della variabile ima Altre celle: covarianza tra variabili Quadrata e simmetrica e se le variabili sono di tipo qualitativo? Associazione tra due variabili quantitative: indice di correlazione tra due variabili qualitative: indice del chi-quadro tra variabile quantitativa e qualitativa: Sia X categoriale con categorie 1, 2,,. Sia Y numerica. Allora: chi-quadro indici di associazione nominali Coefficiente! Coefficiente di contingenza ordinali # di Kendall D di Somers Coefficiente " dove le Y i sono le medie dei valori di Y a cui è associata la modalità ima della variabile X. Coefficiente V di Cramér Assumendo: Analisi della varianza ad una via indipendenza dei campioni e delle osservazioni normalità dei dati varianze all interno dei gruppi uguali (test /test di Levene) Varianza entro gruppi $ 2 w Varianza tra gruppi $ 2 B Statistica multivariata! Analisi fattoriale analisi (prevalentemente) simmetrica rappresentare un numero elevato di variabili per mezzo di un numero inferiore di variabili ipotetiche (o latenti), i cosiddetti fattori! Regressione multipla analisi asimmetrica formulare opportuni modelli descrittivi/interpretativi = $ 2 B / $2 w ~ -1, n-

3 etodi multivariati - 1 Ross et al. (2000) Nature Gen. 24: Riduzione di dimensione! componenti principali (PCA)! multidimensional scaling (DS) Analisi fattoriale Analisi di raggruppamento tecnica descrittiva - analisi di segmentazione/cluster - analisi interna (unsupervised learning) Analisi discriminante tecnica predittiva - classificazione (machine/supervised learning) etodi multivariati - 2 Regressione lineare - risposta continua - predittori continui/categoriali Regressione multipla Regressione logistica - risposta binaria - predittori continui/categoriali Dati di sopravvivenza Alizadeh et al. (2000) Nature 403: dati di durata - predittori continui/categoriali odello di regressione inimi quadrati Quando ho una variabile risposta Y e tante variabili esplicative X i, si può ipotizzare di spiegare la relazione tra Y e le X i attraverso un modello lineare (nei parametri). Caso univariato semplice Come stimare i parametri? etodo dei minimi quadrati (Q) Nel caso univariato semplice lavoriamo in un piano; man mano che aumentano le X i aumentano le dimensioni dello spazio. Esempio: y = % 0 x 1 x 2 Lavoriamo in 3 dimensioni. Caso multivariato X 2 + " + % X Logica Rendiamo minima la differenza tra i valori osservati (blu) e quelli predetti dal modello (rossi): Qui & è la componente casuale che si suppone abbia media nulla e varianza costante pari a $ 2. min ' i [ y i (% 0 i X 2i + " + % X i )] 2

4 Come stimare i parametri? etodo dei minimi quadrati (Q) inimi quadrati inimi quadrati Caso monovariato (una sola variabile esplicativa): Allora, in base al Q: b 0 = y b 1 b 1 = Cov(X,Y) Var(X) Caso multivariato: b = (X!X) -1 X!y Var. 1 Var. 2 Var. m dove X è la matrice dei dati. 1 x 11 x 12 x 1m 2 x 21 x 22 x 2m n x n1 x n2 x nm Analisi di regressione Il mio modello è un buon modello? R 2 È la percentuale della variabilità spiegata dal modello rispetto alla variabilità totale. Più tende a 1 più il modello è buono. Test sui parametri Residui vs. valori predetti Deviazioni dalla casualità indicano una specificazione errata del modello. Analisi dei residui Può essere utile fare delle verifiche di ipotesi sul valore dei singoli parametri. Se H 0 : % i = 0 Residui vs. x i non è rifiutata allora la variabile può essere eliminata senza perdita di informazione. Analisi grafica dei residui I residui ottenuti dal modello, in base al modello che abbiamo utilizzato, dovrebbero essere quantità con media nulla e varianza costante. Quindi, ci aspettiamo che siano omogeneamente distribuiti intorno allo zero. Analisi dei residui Una terza condizione necessaria per poter fare inferenza sul modello (parametri e R 2 ) è la NORALITÀ del termine d'errore. Confondente vs odificatore d'effetto (interazione) Q-Q plot

5 Confondente vs odificatore d'effetto (interazione) Scelta del modello Quante e quali variabili inserire nel modello quando se ne hanno a disposizione molte? X % X Regressione step-wise 1. Parto dal modello con una variabile: e man mano ne aggiungo un'altra. Se l inclusione della variabile è significativa, la tengo; altrimenti, la scarto. 2. Parto dal modello completo: X % X forward bacward e man mano ne levo una. Se l esclusione della variabile è significativa, la tengo; altrimenti, la scarto. odello di regressione casi particolari E se la variabile (o le variabili) X sono delle variabili categoriali (fattori)? Il modello lineare non è altro che un'analisi della varianza ad una o a più vie. Y ij = % 0 + ( i + % j ij In questo caso la matrice X è una matrice di dummies (cioè di zeri e uno). Le analisi fatte finora sono valide se Y è una variabile numerica. E se non lo fosse? Età e sintomi di malattia coronarica (CHD) Età CHD Età CHD Età CHD grafico di dispersione / a punti tabella della prevalenza % alati Gruppo d età # in gruppo # % Divido in classi d età. 0 con probabilità ) Y = 1 con probabilità 1-) Utilizzo le percentuali all interno delle classi. alati % Età (anni)

6 0.0 Vantaggi del logit Probabilità di malattia P # y$x%= e! + " x 1 +e! + " x " Transformazione semplice di P(y x) " Relazione lineare con x... "... e continua (logit tra - ' to + ') " Distribuzione nota: binomiale (P tra 0 ed 1) " Diretto legame con la nozione di odds di malattia x P# y$x % ln[ 1 &P# y$x %] =! + " x P # y$x% ln [ 1&P # y$x %] =! + " x logit of P(y x) Interpretazione di % Esposizione (x) Esempio Rischio di sviluppare malattia delle arterie coronarie in accordo con età (< 55 e 55+ anni) alati (y) Si No Si P # y$x=1 % P # y$x=0 % No 1&P# y$x=1 % 1&P# y$x= 0 % CHD 55+ (1) < 55 (0) Present (1) Absent (0) 6 51 odds d$e = e! + " odds d$(e = e! OR = e! + " = e " e! ln #OR % = " Odds of disease among exposed = 21/6 Odds of disease among unexposed = 22/51 Odds ratio = 8.1 ln# P 1 -P % =! + " Age = & Age Coefficient SE Coeff/SE Age Constant Log-odds = OR = e = 8.1 Regressione logistica multipla ) Più di una variabile indipendente dicotomica, ordinale, nominale, continua, ) Interpretazione di % i incremento del log odds per un incremento unitario di x i con tutte le altre x j constanti

Statistica multivariata. Statistica multivariata. Analisi multivariata. Dati multivariati. x 11 x 21. x 12 x 22. x 1m x 2m. x nm. x n2.

Statistica multivariata. Statistica multivariata. Analisi multivariata. Dati multivariati. x 11 x 21. x 12 x 22. x 1m x 2m. x nm. x n2. Analisi multivariata Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Cercare di capire le relazioni

Dettagli

Statistica multivariata 27/09/2016. D.Rodi, 2016

Statistica multivariata 27/09/2016. D.Rodi, 2016 Statistica multivariata 27/09/2016 Metodi Statistici Statistica Descrittiva Studio di uno o più fenomeni osservati sull INTERA popolazione di interesse (rilevazione esaustiva) Descrizione delle caratteristiche

Dettagli

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17 C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica

Dettagli

L A B C di R. Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010

L A B C di R. Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010 L A B C di R 0 20 40 60 80 100 2 3 4 5 6 7 8 Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010 La scelta del test statistico giusto La scelta della analisi

Dettagli

Regressione lineare semplice

Regressione lineare semplice Regressione lineare semplice Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Statistica con due variabili var. nominale, var. nominale: gruppo sanguigno - cancro

Dettagli

Introduzione alla Regressione Logistica

Introduzione alla Regressione Logistica Introduzione alla Regressione Logistica Contenuto regressione lineare semplice e multipla regressione logistica lineare semplice La funzione logistica Stima dei parametri Interpretazione dei coefficienti

Dettagli

Sommario. 2 I grafici Il sistema di coordinate cartesiane Gli istogrammi I diagrammi a torta...51

Sommario. 2 I grafici Il sistema di coordinate cartesiane Gli istogrammi I diagrammi a torta...51 Sommario 1 I dati...15 1.1 Classificazione delle rilevazioni...17 1.1.1 Esperimenti ripetibili (controllabili)...17 1.1.2 Rilevazioni su fenomeni non ripetibili...18 1.1.3 Censimenti...19 1.1.4 Campioni...19

Dettagli

Statistica multivariata Donata Rodi 17/10/2016

Statistica multivariata Donata Rodi 17/10/2016 Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare

Dettagli

Analisi della varianza

Analisi della varianza Università degli Studi di Padova Facoltà di Medicina e Chirurgia Facoltà di Medicina e Chirurgia - A.A. 2009-10 Scuole di specializzazione Lezioni comuni Disciplina: Statistica Docente: dott.ssa Egle PERISSINOTTO

Dettagli

Teoria e tecniche dei test. Concetti di base

Teoria e tecniche dei test. Concetti di base Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi

Dettagli

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Strumenti statistici in Excell Pacchetto Analisi di dati Strumenti di analisi: Analisi varianza: ad un fattore Analisi

Dettagli

Dispensa di Statistica

Dispensa di Statistica Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza

Dettagli

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURA/TECNICA DI ANALISI DEI DATI SPECIFICAMENTE DESTINATA A STUDIARE LA RELAZIONE TRA UNA VARIABILE NOMINALE (ASSUNTA

Dettagli

Esercitazione di Statistica Indici di associazione

Esercitazione di Statistica Indici di associazione Esercitazione di Statistica Indici di associazione 28/10/2015 La relazione tra caratteri Indipendenza logica Quando si suppone che tra due caratteri non ci sia alcuna relazione di causa-effetto. Indipendenza

Dettagli

Regressione Lineare Semplice e Correlazione

Regressione Lineare Semplice e Correlazione Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)

Dettagli

Statistiche e relazioni

Statistiche e relazioni tatistiche descrittive per frequenze e misure Frequenze e misure Per le frequenze e le misure, molte di queste statistiche perdono senso. In compenso, esistono indici appropriati, inutilizzabili per i

Dettagli

Analisi delle corrispondenze

Analisi delle corrispondenze Analisi delle corrispondenze Obiettivo: analisi delle relazioni tra le modalità di due (o più) caratteri qualitativi Individuazione della struttura dell associazione interna a una tabella di contingenza

Dettagli

Strumenti di indagine per la valutazione psicologica

Strumenti di indagine per la valutazione psicologica Strumenti di indagine per la valutazione psicologica 1.5 Correlazione e causazione Davide Massidda davide.massidda@gmail.com Metodi simmetrici vs asimmetrici Relazioni tra variabili Nei metodi di studio

Dettagli

Statistica multivariata Donata Rodi 08/11/2016

Statistica multivariata Donata Rodi 08/11/2016 Statistica multivariata Donata Rodi 08/11/2016 MANOVA: Multivariate Analysis of Variance Due o più variabili dipendenti quantitative Una o più variabili indipendenti categoriali (con più livelli) Residui

Dettagli

Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii

Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii Sommario Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii xv Parte I Statistica descrittiva 1 Capitolo 1 Introduzione 3 Perché studiare statistica? 4

Dettagli

CORSO INTEGRATO DI STATISTICA E INFORMATICA MEDICA

CORSO INTEGRATO DI STATISTICA E INFORMATICA MEDICA CORSO INTEGRATO DI STATISTICA E INFORMATICA MEDICA Settore Scientifico-Disciplinare: MED/01 Statistica Medica; INF/01 Informatica CFU Tot.: 5 Coordinatore: Prof. Dario Bruzzese Dip.: Sanità Pubblica.,

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri

Dettagli

Ringraziamenti dell Editore

Ringraziamenti dell Editore Indice Elenco dei simboli e delle abbreviazioni in ordine di apparizione Ringraziamenti dell Editore XI XVII 1 Introduzione FAQ e qualcos altro, da leggere prima 1 1.1 QuestoèunlibrodiStatistica....................

Dettagli

Argomenti della lezione:

Argomenti della lezione: Lezione 13 L analisi della Varianza (ANOVA): il modello lineare Argomenti della lezione: Modello lineare Disegni a una via L Analisi della Varianza (ANOVA): Esamina differenze tra le medie di due o più

Dettagli

PROBABILITÀ ELEMENTARE

PROBABILITÀ ELEMENTARE Prefazione alla seconda edizione XI Capitolo 1 PROBABILITÀ ELEMENTARE 1 Esperimenti casuali 1 Spazi dei campioni 1 Eventi 2 Il concetto di probabilità 3 Gli assiomi della probabilità 3 Alcuni importanti

Dettagli

BLAND-ALTMAN PLOT. + X 2i 2 la differenza ( d ) tra le due misure per ognuno degli n campioni; d i. X i. = X 1i. X 2i

BLAND-ALTMAN PLOT. + X 2i 2 la differenza ( d ) tra le due misure per ognuno degli n campioni; d i. X i. = X 1i. X 2i BLAND-ALTMAN PLOT Il metodo di J. M. Bland e D. G. Altman è finalizzato alla verifica se due tecniche di misura sono comparabili. Resta da comprendere cosa si intenda con il termine metodi comparabili

Dettagli

Esercitazione. 24 Aprile 2012

Esercitazione. 24 Aprile 2012 Esercitazione 24 Aprile 2012 Il modello di regressione logistica viene utilizzato quando si è interessati a studiare o analizzare la relazione causale tra una variabile dipendente dicotomica e una o più

Dettagli

Metodi di analisi statistica multivariata

Metodi di analisi statistica multivariata Metodi di analisi statistica multivariata lzo V

Dettagli

Inferenza statistica Donata Rodi 04/10/2016

Inferenza statistica Donata Rodi 04/10/2016 Inferenza statistica Donata Rodi 04/10/2016 Popolazione Campionamento Campione Parametri Inferenza Statistiche µ, ϭ 2 descrittive Stima X, s 2 Quale test? Parametrico o no Scala di misura 1 gruppo 2 gruppi

Dettagli

DISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a Prerequisiti Popolazione, unità, carattere Come nascono i dati:

DISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a Prerequisiti Popolazione, unità, carattere Come nascono i dati: DISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a. 2007-2008 Prerequisiti Popolazione, unità, carattere Come nascono i dati: osservazione e sperimentazione Popolazione: reale e virtuale Classificazione

Dettagli

Analisi delle corrispondenze

Analisi delle corrispondenze Capitolo 11 Analisi delle corrispondenze L obiettivo dell analisi delle corrispondenze, i cui primi sviluppi risalgono alla metà degli anni 60 in Francia ad opera di JP Benzécri e la sua equipe, è quello

Dettagli

x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y )

x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y ) Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 0/03 lezioni di statistica del 5 e 8 aprile 03 - di Massimo Cristallo - A. Le relazioni tra i fenomeni

Dettagli

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25 Sommario Presentazione dell edizione italiana Prefazione xv xiii Capitolo 1 I dati e la statistica 1 Statistica in pratica: BusinessWeek 1 1.1 Le applicazioni in ambito aziendale ed economico 3 Contabilità

Dettagli

0 altimenti 1 soggetto trova lavoroentro 6 mesi}

0 altimenti 1 soggetto trova lavoroentro 6 mesi} Lezione n. 16 (a cura di Peluso Filomena Francesca) Oltre alle normali variabili risposta che presentano una continuità almeno all'interno di un certo intervallo di valori, esistono variabili risposta

Dettagli

Presentazione dell edizione italiana

Presentazione dell edizione italiana 1 Indice generale Presentazione dell edizione italiana Prefazione xi xiii Capitolo 1 Una introduzione alla statistica 1 1.1 Raccolta dei dati e statistica descrittiva... 1 1.2 Inferenza statistica e modelli

Dettagli

Statistica di base per l analisi socio-economica

Statistica di base per l analisi socio-economica Laurea Magistrale in Management e comunicazione d impresa Statistica di base per l analisi socio-economica Giovanni Di Bartolomeo gdibartolomeo@unite.it Definizioni di base Una popolazione è l insieme

Dettagli

La matrice delle correlazioni è la seguente:

La matrice delle correlazioni è la seguente: Calcolo delle componenti principali tramite un esempio numerico Questo esempio numerico puó essere utile per chiarire il calcolo delle componenti principali e per introdurre il programma SPAD. IL PROBLEMA

Dettagli

viii Indice generale

viii Indice generale Indice generale 1 Introduzione al processo di ricerca 1 Sommario 1 Il processo di ricerca 3 Concetti e variabili 5 Scale di misura 8 Test di ipotesi 10 Evidenza empirica 10 Disegni di ricerca 11 Sintesi

Dettagli

JMP 10 Student Edition: Guida rapida

JMP 10 Student Edition: Guida rapida JMP 10 Student Edition: Guida rapida Queste istruzioni presuppongono una tabella di dati aperta, le impostazioni delle preferenze predefinite, e le variabili di interesse con l appropriato tipo di modellazione.

Dettagli

Statistica per le ricerche di mercato

Statistica per le ricerche di mercato Università degli studi della Tuscia Dipartimento di Economia e Impresa Statistica per le ricerche di mercato a.a. 2012/13 Dr. Luca Secondi 01. Introduzione al corso 1 Statistica per le ricerche di mercato

Dettagli

STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE

STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 2 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1.1

Dettagli

Obiettivo: confrontare due proporzioni, studiare il legame in presenza di un fattore di stratificazione

Obiettivo: confrontare due proporzioni, studiare il legame in presenza di un fattore di stratificazione Prof.ssa G. Serio, Prof. P. Trerotoli, Cattedra di Statistica Medica, Università di Bari 1/13 Il chi-quadro di Mantel-Haenszel Obiettivo: confrontare due proporzioni, studiare il legame in presenza di

Dettagli

Istituzioni di Statistica

Istituzioni di Statistica Istituzioni di Statistica CORSO DI LAUREA IN ECONOMIA DEL COMMERCIO INTERNAZIONALE CORSO DI LAUREA IN ECONOMIA E AMMINISTRAZIONE DELLE IMPRESE A.A. 2007/2008 DOCENTE: Marco Minozzo PROGRAMMA - STATISTICA

Dettagli

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla Introduzione E la generalizzazione del modello di regressione lineare semplice: per spiegare il fenomeno d interesse Y vengono introdotte p, con p > 1, variabili esplicative. Tale generalizzazione diventa

Dettagli

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura INDICE GENERALE Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura XI XIV XV XVII XVIII 1 LA RILEVAZIONE DEI FENOMENI

Dettagli

Corso di Psicometria Progredito

Corso di Psicometria Progredito Corso di Psicometria Progredito 5. La correlazione lineare Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014 Sommario 1 Tipi di relazione

Dettagli

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Quesito: Posso stimare il numero di ore passate a studiare statistica sul voto conseguito all esame? Potrei calcolare il coefficiente di correlazione.

Dettagli

Corso di Laurea in Amministrazione Aziendale Complex Learning. Statistica per l azienda (T) SECS-S/01 a. a. 2017/2018

Corso di Laurea in Amministrazione Aziendale Complex Learning. Statistica per l azienda (T) SECS-S/01 a. a. 2017/2018 Corso di Laurea in Amministrazione Aziendale Complex Learning Statistica l azienda (T) SECS-S/01 a. a. 2017/2018 DOCENTI TITOLARI : Prof. Nicoletta Melis ORE DI LEZIONE ON LINE : 18 ore : 6 3 TIPOLOGIE

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative

Dettagli

Università degli Studi di Cassino. Corso di Laurea in Economia Aziendale. Corso di. Statistica. Docente: Simona Balzano.

Università degli Studi di Cassino. Corso di Laurea in Economia Aziendale. Corso di. Statistica. Docente: Simona Balzano. Università degli Studi di Cassino Corso di Laurea in Economia Aziendale Corso di Statistica Docente: Simona Balzano s.balzano@unicas.it a.a. 2013-14 Statistica = Scienza delle decisioni in condizioni di

Dettagli

Lezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo

Lezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo UIVERSITA DEGLI STUDI DI BASILICATA FACOLTA DI ECOOMIA Corso di laurea in Economia Aziendale anno accademico 2012/2013 Lezioni di Statistica del 15 e 18 aprile 2013 Docente: Massimo Cristallo LA RELAZIOE

Dettagli

INDICATORI DI TENDENZA CENTRALE

INDICATORI DI TENDENZA CENTRALE INDICATORI DI TENDENZA CENTRALE INDICATORI DI TENDENZA CENTRALE Consentono di sintetizzare un insieme di misure tramite un unico valore rappresentativo indice che riassume o descrive i dati e dipende dalla

Dettagli

ANALISI MULTIDIMENSIONALE DEI DATI (AMD)

ANALISI MULTIDIMENSIONALE DEI DATI (AMD) ANALISI MULTIDIMENSIONALE DEI DATI (AMD) L Analisi Multidimensionale dei Dati (AMD) è una famiglia di tecniche il cui obiettivo principale è la visualizzazione, la classificazione e l interpretazione della

Dettagli

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è

Dettagli

La multicollinearità sorge quando c è un elevata correlazione tra due o più variabili esplicative.

La multicollinearità sorge quando c è un elevata correlazione tra due o più variabili esplicative. Lezione 14 (a cura di Ludovica Peccia) MULTICOLLINEARITA La multicollinearità sorge quando c è un elevata correlazione tra due o più variabili esplicative. In un modello di regressione Y= X 1, X 2, X 3

Dettagli

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di tendenza centrale

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di tendenza centrale INDICATORI DI TENDENZA CENTRALE Consentono di sintetizzare un insieme di misure tramite un unico valore rappresentativo indice che riassume o descrive i dati e dipende dalla scala di misura dei dati in

Dettagli

Esplorazione grafica di dati multivariati. N. Del Buono

Esplorazione grafica di dati multivariati. N. Del Buono Esplorazione grafica di dati multivariati N. Del Buono Scatterplot Scatterplot permette di individuare graficamente le possibili associazioni tra due variabili Variabile descrittiva (explanatory variable)

Dettagli

Statistica per le ricerche di mercato

Statistica per le ricerche di mercato Università degli studi della Tuscia Dipartimento di Economia e Impresa Statistica per le ricerche di mercato a.a. 2014/15 Prof.ssa Tiziana Laureti 01. Introduzione al corso 1 Statistica per le ricerche

Dettagli

Associazione tra caratteri quantitativi: gli indici di correlazione

Associazione tra caratteri quantitativi: gli indici di correlazione Associazione tra caratteri quantitativi: gli indici di correlazione Per correlazione si intende una relazione tra due variabili tale che a ciascun valore della prima variabile corrisponda con una certa

Dettagli

Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale

Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale DIPARTIMENTO DI SCIENZE AGRARIE E AMBIENTALI PRODUZIONE, TERRITORIO, AGROENERGIA Marco Acutis marco.acutis@unimi.it www.acutis.it CdS Scienze della Produzione e Protezione delle Piante (g59) CdS Biotecnologie

Dettagli

Esercitazione del

Esercitazione del Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36

Dettagli

Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria

Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata Prof. Massimo Aria aria@unina.it Il concetto di interpolazione In matematica, e in particolare in

Dettagli

Inferenza statistica II parte

Inferenza statistica II parte Inferenza statistica II parte Marcella Montico Servizio di epidemiologia e biostatistica Test statistici II parte Variabili quantitative Caso 1 Variabile Dipendente = quantitativa Variabile Indipendente

Dettagli

ANALISI DEI DATI PER IL MARKETING 2014

ANALISI DEI DATI PER IL MARKETING 2014 ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it ANALISI DELLE CORRISPONDENZE (cap. VII) Problema della riduzione delle dimensioni L ANALISI DELLE COMPONENTI PRINCIPALI

Dettagli

REGRESSIONE E CORRELAZIONE

REGRESSIONE E CORRELAZIONE REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.

Dettagli

Analisi della varianza

Analisi della varianza Analisi della varianza Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona ANALISI DELLA VARIANZA - 1 Abbiamo k gruppi, con un numero variabile di unità statistiche.

Dettagli

LEZIONE N. 11 ( a cura di MADDALENA BEI)

LEZIONE N. 11 ( a cura di MADDALENA BEI) LEZIONE N. 11 ( a cura di MADDALENA BEI) F- test Assumiamo l ipotesi nulla H 0 :β 1,...,Β k =0 E diverso dal verificare che H 0 :B J =0 In realtà F - test è più generale H 0 :Aβ=0 H 1 :Aβ 0 A è una matrice

Dettagli

INDICATORI DI TENDENZA CENTRALE

INDICATORI DI TENDENZA CENTRALE Psicometria (8 CFU) Corso di laurea triennale INDICATORI DI TENDENZA CENTRALE Torna alla pri ma pagina INDICATORI DI TENDENZA CENTRALE Consentono di sintetizzare un insieme di misure tramite un unico valore

Dettagli

Inferenza statistica

Inferenza statistica Inferenza statistica Marcella Montico e Lorenzo Monasta Servizio di epidemiologia e biostatistica Inferenza statistica: insieme di metodi che permette di generalizzare i risultati ottenuti dai dati raccolti

Dettagli

INFERENZA STATISTICA I (CANALE B)

INFERENZA STATISTICA I (CANALE B) INFERENZA STATISTICA I (CANALE B) FORMULE E TAVOLE PER L ESAME a.a. 2003/04 Indice A. Formule 2 B. Quantili di una distribuzione normale standard 4 C. Quantili di una distribuzione t di Student 5 D. Quantili

Dettagli

Applicazioni statistiche e utilizzo del package statistico Spss - 7

Applicazioni statistiche e utilizzo del package statistico Spss - 7 Applicazioni statistiche e utilizzo del package statistico Spss - 7 CISI 27 gennaio 2005 ricercapsicologica@tiscali.it Illustrare le principali statistiche mono e bivariate. Valutare quando è opportuno

Dettagli

Data Mining. Prova parziale del 20 aprile 2017: SOLUZIONE

Data Mining. Prova parziale del 20 aprile 2017: SOLUZIONE Università degli Studi di Padova Corso di Laurea Magistrale in Informatica a.a. 2016/2017 Data Mining Docente: Annamaria Guolo Prova parziale del 20 aprile 2017: SOLUZIONE ISTRUZIONI: La durata della prova

Dettagli

ANALISI MULTIVARIATA

ANALISI MULTIVARIATA ANALISI MULTIVARIATA Marcella Montico Servizio di epidemiologia e biostatistica... ancora sulla relazione tra due variabili: la regressione lineare semplice VD: quantitativa VI: quantitativa Misura la

Dettagli

Introduzione all Analisi della Varianza (ANOVA)

Introduzione all Analisi della Varianza (ANOVA) Introduzione all Analisi della Varianza (ANOVA) AMD Marcello Gallucci marcello.gallucci@unimib.it Variabili nella Regressione Nella regressione, la viariabile dipendente è sempre quantitativa e, per quello

Dettagli

STATISTICA 1 ESERCITAZIONE 6

STATISTICA 1 ESERCITAZIONE 6 STATISTICA 1 ESERCITAZIONE 6 Dott. Giuseppe Pandolfo 5 Novembre 013 CONCENTRAZIONE Osservando l ammontare di un carattere quantitativo trasferibile su un collettivo statistico può essere interessante sapere

Dettagli

docente: J. Mortera/P. Vicard Nome

docente: J. Mortera/P. Vicard Nome A opportuni passaggi). Verrà accettato in consegna solo il presente plico. 2. [9] Una certa zona è servita da 4 compagnie telefoniche. Per ciascuna compagnia è stato rilevato il costo al minuto (in centesimi

Dettagli

INDICATORI DI TENDENZA CENTRALE

INDICATORI DI TENDENZA CENTRALE INDICATORI DI TENDENZA CENTRALE INDICATORI DI TENDENZA CENTRALE Consentono di sintetizzare un insieme di misure tramite un unico valore rappresentativo è indice che riassume o descrive i dati e dipende

Dettagli

Laboratorio di Statistica I

Laboratorio di Statistica I Salvatore Ingrassia Carmela Senatore Laboratorio di Statistica I Guida alle Attività Facoltà di Economia, Università della Calabria Corso di Laurea in Statistica Anno Accademico 22-23 Indice 1 Statistiche

Dettagli

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2010/2011 Statistica Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza

Dettagli

INFERENZA STATISTICA I (CANALE B)

INFERENZA STATISTICA I (CANALE B) INFERENZA STATISTICA I (CANALE B) FORMULE E TAVOLE a.a. 2005/06 Indice A. Formule 2 B. Quantili di una distribuzione normale standard 4 C. Quantili di una distribuzione t di Student 5 D. Quantili di una

Dettagli

Statistica descrittiva in due variabili

Statistica descrittiva in due variabili Statistica descrittiva in due variabili 1 / 65 Statistica descrittiva in due variabili 1 / 65 Supponiamo di misurare su un campione statistico due diverse variabili X e Y. Indichiamo come al solito con

Dettagli

le scale di misura scala nominale scala ordinale DIAGNOSTICA PSICOLOGICA lezione si basano su tre elementi:

le scale di misura scala nominale scala ordinale DIAGNOSTICA PSICOLOGICA lezione si basano su tre elementi: DIAGNOSTICA PSICOLOGICA lezione! Paola Magnano paola.magnano@unikore.it si basano su tre elementi: le scale di misura sistema empirico: un insieme di entità non numeriche (es. insieme di persone; insieme

Dettagli

ANALISI DELLE SERIE STORICHE

ANALISI DELLE SERIE STORICHE ANALISI DELLE SERIE STORICHE De Iaco S. s.deiaco@economia.unile.it UNIVERSITÀ del SALENTO DIP.TO DI SCIENZE ECONOMICHE E MATEMATICO-STATISTICHE FACOLTÀ DI ECONOMIA 24 settembre 2012 Indice 1 Funzione di

Dettagli

Variabili aleatorie discrete. Giovanni M. Marchetti Statistica Capitolo 5 Corso di Laurea in Economia

Variabili aleatorie discrete. Giovanni M. Marchetti Statistica Capitolo 5 Corso di Laurea in Economia Variabili aleatorie discrete Giovanni M. Marchetti Statistica Capitolo 5 Corso di Laurea in Economia 2015-16 1 / 45 Variabili aleatorie Una variabile aleatoria è simile a una variabile statistica Una variabile

Dettagli

Regressione Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007

Regressione Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007 Regressione Esempio Un azienda manifatturiera vuole analizzare il legame che intercorre tra il costo mensile Y di produzione e il corrispondente volume produttivo X per uno dei propri stabilimenti. Volume

Dettagli

Analisi in Componenti Principali (ACP)

Analisi in Componenti Principali (ACP) Analisi in Componenti Principali (ACP) Metodi di analisi fattoriale Obiettivo: individuazione di variabili di sintesi = dimensioni = variabili latenti = variabili non osservate Approccio: Ordinamenti tra

Dettagli

Analisi in Componenti Principali

Analisi in Componenti Principali Analisi in Componenti Principali 1/20 Analisi in Componenti Principali tecnica di riduzione e interpretazione dei dati spesso gioca un ruolo ausiliario rispetto ad altre tecniche (es. analisi fattoriale,

Dettagli

Statistica Applicata all edilizia: il modello di regressione

Statistica Applicata all edilizia: il modello di regressione Statistica Applicata all edilizia: il modello di regressione E-mail: orietta.nicolis@unibg.it 27 aprile 2009 Indice Il modello di Regressione Lineare 1 Il modello di Regressione Lineare Analisi di regressione

Dettagli

ESERCIZIO 1. Vengono riportati di seguito i risultati di un analisi discriminante.

ESERCIZIO 1. Vengono riportati di seguito i risultati di un analisi discriminante. ESERCIZIO 1. Vengono riportati di seguito i risultati di un analisi discriminante. Test di uguaglianza delle medie di gruppo SELF_EFF COLL_EFF COIN_LAV IMPEGNO SODDISF CAP_IST COLLEGHI Lambda di Wilks

Dettagli

Analisi avanzate basate sulla regressione (Cap. 7)

Analisi avanzate basate sulla regressione (Cap. 7) Analisi avanzate basate sulla regressione (Cap. 7) AMD Marcello Gallucci marcello.gallucci@unimib.it Regressione Multipla A seconda dello status delle variabili indipendenti, possiamo differenziare diversi

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unina.it Università degli studi di Cassino () Statistica 1 / 24 Outline 1 () Statistica 2 / 24 Outline 1 2 () Statistica 2 / 24 Outline 1 2 3 () Statistica 2 /

Dettagli

I Dati: aspetti da considerare

I Dati: aspetti da considerare I Dati: aspetti da considerare!! Tipo!! Quantitativi, qualitativi, serie temporali,!! Qualità!! I dati non sono mai perfetti!! Mancanti, inconsistenti, duplicati, errati!! Outliers!! Piccola parte di dati

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unina.it Università degli studi di Cassino () Statistica 1 / 1 Outline 1 () Statistica 2 / 1 Outline 1 2 () Statistica 2 / 1 Outline 1 2 3 () Statistica 2 / 1

Dettagli

Correlazione e regressione

Correlazione e regressione SMID a.a. 2004/2005 Corso di Metodi Statistici in Biomedicina Correlazione e regressione 28/1/2005 Relazioni Che rapporto c'è tra la pressione arteriosa e il peso corporeo? relazione tra due variabili

Dettagli

Indice generale. Introduzione. Capitolo 1 Essere uno scienziato dei dati... 1

Indice generale. Introduzione. Capitolo 1 Essere uno scienziato dei dati... 1 Introduzione...xi Argomenti trattati in questo libro... xi Dotazione software necessaria... xii A chi è rivolto questo libro... xii Convenzioni utilizzate... xiii Scarica i file degli esempi... xiii Capitolo

Dettagli

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli. Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:

Dettagli

Tecniche statistiche di analisi del cambiamento

Tecniche statistiche di analisi del cambiamento Tecniche statistiche di analisi del cambiamento 07-Anova con covariata (vers. 1.2, 20 marzo 2017) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2016-17

Dettagli

STATISTICA NOZIONI DI BASE

STATISTICA NOZIONI DI BASE STATISTICA NOZIONI DI BASE Italo Nofroni Statistica medica - Sapienza - Roma Si definisce statistica la scienza cha ha per oggetto la raccolta, l analisi e l interpretazione dei dati (intensità e/o frequenze)

Dettagli

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Regressione Lineare e Correlazione Argomenti della lezione Determinismo e variabilità Correlazione Regressione Lineare

Dettagli

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)

Dettagli