Statistica multivariata
|
|
|
- Camillo Bertoni
- 6 anni fa
- Visualizzazioni
Transcript
1 Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Analisi multivariata Cercare di capire le relazioni che intercorrono tra le variabili Introdurre tante variabili in un analisi non ha molto senso, né al livello biologico, né al livello statistico.! Il modello diventa troppo complesso.! Diventa difficile interpretare i risultati.! Le stime dei parametri diventano molto instabili.! Più parametri inseriamo, più osservazioni ci vogliono per stimarli. Eliminiamo le variabili che sono molto correlate tra di loro. Se due variabili sono molto correlate, allora l informazione di una è contenuta quasi completamente nell altra.
2 Statistica multivariata! Analisi fattoriale analisi (prevalentemente) simmetrica rappresentare un numero elevato di variabili per mezzo di un numero inferiore di variabili ipotetiche (o latenti), i cosiddetti fattori! Regressione multipla analisi asimmetrica formulare opportuni modelli descrittivi/interpretativi Dati multivariati Var. 1 Variabili statistiche Var. 2 Var. m 1 x 11 x 12 x 1m Unità statistiche 2 x 21 x 22 x 2m n x n1 x n2 x nm osservazioni, rilevazioni, Matrice dei dati (n!m) : n righe, m colonne con n!m valori
3 Misure di concordanza Voglio un indice (una misura) che mi dica il grado di concordanza tra i valori di una variabile X con quelli di una variabile Y. Concordanza positiva Concordanza negativa Assenza di concordanza Covarianza Var. 1 Variabili statistiche Var. 2 Var. m 1 x 11 x 12 x 1m Unità statistiche 2 x 21 x 22 x 2m n x n1 x n2 x nm x.1 x.2 x.m Covarianza : indice della relazione (lineare) tra due variabili k
4 Correlazione Varianza : indice di dispersione Covarianza : indice di relazione k Correlazione : indice di relazione normato k k Matrice di covarianza Diagonale principale: varianza della variabile ima Altre celle: covarianza tra variabili Quadrata e simmetrica e se le variabili sono di tipo qualitativo?
5 Associazione tra due variabili quantitative: indice di correlazione tra due variabili qualitative: indice del chi-quadro tra variabile quantitativa e qualitativa: Sia X categoriale con categorie 1, 2,, k. Sia Y numerica. Allora: dove le Y i sono le medie dei valori di Y a cui è associata la modalità ima della variabile X. chi-quadro indici di associazione nominali ordinali Coefficiente! # di Kendall D di Somers Coefficiente di contingenza Coefficiente " Coefficiente V di Cramér
6 Assumendo: Analisi della varianza ad una via indipendenza dei campioni e delle osservazioni normalità dei dati varianze all interno dei k gruppi uguali (test F/test di Levene) Varianza entro gruppi Varianza tra gruppi $ 2 w $ 2 B F = $ 2 B / $2 w ~ F k-1, n-k Statistica multivariata! Analisi fattoriale analisi (prevalentemente) simmetrica rappresentare un numero elevato di variabili per mezzo di un numero inferiore di variabili ipotetiche (o latenti), i cosiddetti fattori! Regressione multipla analisi asimmetrica formulare opportuni modelli descrittivi/interpretativi
7 Metodi multivariati - 1 Riduzione di dimensione! componenti principali (PCA)! multidimensional scaling (MDS) Analisi fattoriale Analisi di raggruppamento tecnica descrittiva - analisi di segmentazione/cluster - analisi interna (unsupervised learning) Analisi discriminante tecnica predittiva - classificazione (machine/supervised learning) Ross et al. (2000) Nature Gen. 24:
8 Alizadeh et al. (2000) Nature 403: Metodi multivariati - 2 Regressione lineare - risposta continua - predittori continui/categoriali Regressione multipla Regressione logistica - risposta binaria - predittori continui/categoriali Dati di sopravvivenza - dati di durata - predittori continui/categoriali
9 Modello di regressione Quando ho una variabile risposta Y e tante variabili esplicative X i, si può ipotizzare di spiegare la relazione tra Y e le X i attraverso un modello lineare (nei parametri). Caso univariato semplice Y = % 0 + % 1 X 1 + & Caso multivariato Y = % 0 + % 1 X 1 + % 2 X 2 + " + % k X k + & Qui & è la componente casuale che si suppone abbia media nulla e varianza costante pari a $ 2. Minimi quadrati Come stimare i parametri? Metodo dei minimi quadrati (MMQ) Nel caso univariato semplice lavoriamo in un piano; man mano che aumentano le X i aumentano le dimensioni dello spazio. Esempio: y = % 0 + % 1 x 1 + % 2 x 2 + & Lavoriamo in 3 dimensioni. Logica Rendiamo minima la differenza tra i valori osservati (blu) e quelli predetti dal modello (rossi): min ' i [ y i (% 0 + % 1 X 1i + % 2 X 2i + " + % k X ki )] 2
10 Minimi quadrati Come stimare i parametri? Metodo dei minimi quadrati (MMQ) Minimi quadrati Caso monovariato (una sola variabile esplicativa): Allora, in base al MMQ: Y = % 0 + % 1 X 1 + & b 0 = y b 1 X 1 b 1 = Cov(X,Y) Var(X) Caso multivariato: b = (X!X) -1 X!y Var. 1 Var. 2 Var. m dove X è la matrice dei dati. 1 x 11 x 12 x 1m 2 x 21 x 22 x 2m n x n1 x n2 x nm
11 Analisi di regressione Il mio modello è un buon modello? R 2 È la percentuale della variabilità spiegata dal modello rispetto alla variabilità totale. Più tende a 1 più il modello è buono. Test sui parametri Può essere utile fare delle verifiche di ipotesi sul valore dei singoli parametri. Se H 0 : % i = 0 non è rifiutata allora la variabile può essere eliminata senza perdita di informazione. Analisi grafica dei residui I residui ottenuti dal modello, in base al modello che abbiamo utilizzato, dovrebbero essere quantità con media nulla e varianza costante. Quindi, ci aspettiamo che siano omogeneamente distribuiti intorno allo zero. Residui vs. valori predetti Analisi dei residui Deviazioni dalla casualità indicano una specificazione errata del modello. Residui vs. x i
12 Analisi dei residui Una terza condizione necessaria per poter fare inferenza sul modello (parametri e R 2 ) è la NORMALITÀ del termine d'errore. Q-Q plot Confondente vs Modificatore d'effetto (interazione) M M F F
13 Confondente vs Modificatore d'effetto (interazione) F M M F Scelta del modello Quante e quali variabili inserire nel modello quando se ne hanno a disposizione molte? Y = % 0 + % 1 X 1 + % 2 X % k X k + & Regressione step-wise 1. Parto dal modello con una variabile: Y = % 0 + % 1 X 1 + & forward e man mano ne aggiungo un'altra. Se l inclusione della variabile è significativa, la tengo; altrimenti, la scarto. 2. Parto dal modello completo: backward Y = % 0 + % 1 X 1 + % 2 X % k X k + & e man mano ne levo una. Se l esclusione della variabile è significativa, la tengo; altrimenti, la scarto.
14 Modello di regressione casi particolari E se la variabile (o le variabili) X sono delle variabili categoriali (fattori)? Il modello lineare non è altro che un'analisi della varianza ad una o a più vie. Y ij = % 0 + ( i + % j + & ij In questo caso la matrice X è una matrice di dummies (cioè di zeri e uno).
15 Modello di regressione logistico Le analisi fatte finora sono valide se Y è una variabile numerica. E se non lo fosse? Età e sintomi di malattia coronarica (CHD) Età CHD Età CHD Età CHD Modello di regressione logistico Modello di regressione logistico grafico di dispersione / a punti
16 Modello di regressione logistico tabella della prevalenza % Malati Gruppo d età # in gruppo # % Divido in classi d età. 0 con probabilità ) Y = 1 con probabilità 1-) Utilizzo le percentuali all interno delle classi. Malati % Età (anni) Modello di regressione logistico Probabilità di malattia P # y$x%= e! + " x 1 +e! + " x 0.0 x P# y$x % ln[ %] 1 &P# y$x =! + " x logit of P(y x)
17 Vantaggi del logit " Transformazione semplice di P(y x) " Relazione lineare con x... "... e continua (logit tra - ' to + ') " Distribuzione nota: binomiale (P tra 0 ed 1) " Diretto legame con la nozione di odds di malattia [ P # y$x% %] ln 1&P # y$x =! + " x Interpretazione di % Esposizione (x) Malati (y) Si No Si P # y$x=1 % P # y$x=0 % No 1& P # y$x=1 % 1& P # y$x= 0 % odds d$e = e! + " odds d$ (e = e! OR = e! + " = e " e! ln #OR % = "
18 Esempio Rischio di sviluppare malattia delle arterie coronarie in accordo con età (< 55 e 55+ anni) CHD 55+ (1) < 55 (0) Present (1) Absent (0) 6 51 Odds of disease among exposed = 21/6 Odds of disease among unexposed = 22/51 Odds ratio = 8.1 Modello di regressione logistico ln# P 1 -P % =! + " Age = & Age Coefficient SE Coeff/SE Age Constant Log-odds = OR = e = 8.1 Regressione logistica multipla ) Più di una variabile indipendente dicotomica, ordinale, nominale, continua, ) Interpretazione di % i incremento del log odds per un incremento unitario di x i con tutte le altre x j constanti
Statistica multivariata. Statistica multivariata. Analisi multivariata. Dati multivariati. x 11 x 21. x 12 x 22. x 1m x 2m. x nm. x n2.
Analisi multivariata Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Cercare di capire le relazioni
ANALISI MULTIVARIATA
ANALISI MULTIVARIATA Marcella Montico Servizio di epidemiologia e biostatistica... ancora sulla relazione tra due variabili: la regressione lineare semplice VD: quantitativa VI: quantitativa Misura la
Analisi della varianza
1. 2. univariata ad un solo fattore tra i soggetti (between subjects) 3. univariata: disegni fattoriali 4. univariata entro i soggetti (within subjects) 5. : disegni fattoriali «misti» L analisi della
Esercitazioni di statistica
Esercitazioni di statistica Misure di associazione: Indipendenza assoluta e in media Stefania Spina Universitá di Napoli Federico II [email protected] 22 ottobre 2014 Stefania Spina Esercitazioni
Regressione Logistica: un Modello per Variabili Risposta Categoriali
: un Modello per Variabili Risposta Categoriali Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 1 / 54 Introduzione Premessa I modelli di regressione
Metodologie Quantitative
Metodologie Quantitative Regressione Logistica II M Q Marco Perugini Milano-Bicocca 1 La regressione logistica La regressione logistica si propone di studiare e quantificare le relazioni tra una o più
Statistica. Esercitazione 16. Alfonso Iodice D Enza [email protected]. Università degli studi di Cassino. Statistica. A. Iodice
Esercitazione 16 Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () 1 / 24 Studio della relazione tra due variabili Commonly Asked Questions Qual è la relazione tra la spesa
I metodi per la misura della prognosi
C.I. di Metodologia clinica I metodi per la misura della prognosi Obiettivo Conoscere ed utilizzare i principali strumenti per identificare i fattori di rischio e i fattori prognostici 1 Gallo C. Gallo_
Generazione di Numeri Casuali- Parte 2
Esercitazione con generatori di numeri casuali Seconda parte Sommario Trasformazioni di Variabili Aleatorie Trasformazione non lineare: numeri casuali di tipo Lognormale Trasformazioni affini Numeri casuali
Regressione Mario Guarracino Data Mining a.a. 2010/2011
Regressione Esempio Un azienda manifatturiera vuole analizzare il legame che intercorre tra il volume produttivo X per uno dei propri stabilimenti e il corrispondente costo mensile Y di produzione. Volume
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5 Dott.ssa Antonella Costanzo [email protected] Esercizio 1. Misura dell associazione tra due caratteri Uno store manager è interessato a studiare la relazione
Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali [email protected]
Dip. di Scienze Umane e Sociali [email protected] Introduzione : analisi delle relazioni tra due caratteristiche osservate sulle stesse unità statistiche studio del comportamento di due caratteri
Regressione Logistica
Regressione Logistica Esercizio Data set: Nel data set heart.txt (o heart.sav) sono contenute informazioni riguardo 302 pazienti che hanno avuto infarto e 60 che non hanno avuto infarto in uno studio retrospettivo
Regressione logistica
Regressione logistica Strumenti quantitativi per la gestione Emanuele Taufer Metodi di classificazione Tecniche principali Alcuni esempi Data set Default I dati La regressione logistica Esempio Il modello
(a cura di Francesca Godioli)
lezione n. 12 (a cura di Francesca Godioli) Ad ogni categoria della variabile qualitativa si può assegnare un valore numerico che viene chiamato SCORE. Passare dalla variabile qualitativa X2 a dei valori
Analisi Univariata e Multivariata dei Dati Economici Bruno Ricca (Dipartimento di studi su risorse, impresa, ambiente e metodologie quantitative)
Programma di studio AA 2008-2009 Analisi Univariata e Multivariata dei Dati Economici Bruno Ricca (Dipartimento di studi su risorse, impresa, ambiente e metodologie quantitative) Modulo unico 10 cfu corso
Test di restrizioni lineari nel MRLM: Esempi
Test di restrizioni lineari nel MRLM: Esempi Eduardo Rossi Università degli Studi di Pavia Corso di Econometria Marzo 2012 Rossi Test F: esempi 2012 1 / 23 Funzione di produzione Cobb-Douglas Esempio GDP
Quantificare la variabilità dei processi ecologici
Scopo ecologia Quantificare la variabilità dei processi ecologici Comprensione dei meccanismi fondamentale per identificare gli effetti del disturbo antropico e per prevenire alterazioni su scala globale
Statistica (Prof. Capitanio) Slide n. 1. Materiale di supporto per le lezioni. Non sostituisce il libro di testo
Statistica (Prof. Capitanio) Slide n. 1 Materiale di supporto per le lezioni. Non sostituisce il libro di testo MEDIA GEOMETRICA M g = x g = n n x i i=1 1 PROPRIETA 1) Identità di prodotto ( ) n n M =
Regressione logistica. Strumenti quantitativi per la gestione
Regressione logistica Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/4a_rlg.html#(1) 1/25 Metodi di classificazione I metodi usati per analizzare
Elementi di Psicometria
Elementi di Psicometria 12-Correlazione vers. 1.1 (27 novembre 2012) Germano Rossi 1 [email protected] 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2011-2012 G. Rossi (Dip. Psicologia)
Interpretare i modelli prognostici multivariati: il modello logistico
Interpretare GIAC i modelli Volume prognostici 5 Numero multivariati: 4 Dicembre il modello 2002logistico L ANGOLO DELLA STATISTICA Interpretare i modelli prognostici multivariati: il modello logistico
Dott.ssa Caterina Gurrieri
Dott.ssa Caterina Gurrieri Le relazioni tra caratteri Data una tabella a doppia entrata, grande importanza riveste il misurare se e in che misura le variabili in essa riportata sono in qualche modo
Elementi di Statistica
Elementi di Statistica Contenuti Contenuti di Statistica nel corso di Data Base Elementi di statistica descrittiva: media, moda, mediana, indici di dispersione Introduzione alle variabili casuali e alle
ESERCIZI SVOLTI PER LA PROVA DI STATISTICA
ESERCIZI SVOLTI PER LA PROVA DI STATISTICA Stefania Naddeo (anno accademico 4/5) INDICE PARTE PRIMA: STATISTICA DESCRITTIVA. DISTRIBUZIONI DI FREQUENZA E FUNZIONE DI RIPARTIZIONE. VALORI CARATTERISTICI
Prof.ssa Paola Vicard
Questa nota consiste perlopiù nella traduzione (con alcune integrazioni) da Descriptive statistics di J. Shalliker e C. Ricketts, 2000, University of Plymouth Consideriamo i dati nel file esercizio10_dati.xls.
Carta di credito standard. Carta di credito business. Esercitazione 12 maggio 2016
Esercitazione 12 maggio 2016 ESERCIZIO 1 Si supponga che in un sondaggio di opinione su un campione di clienti, che utilizzano una carta di credito di tipo standard (Std) o di tipo business (Bsn), si siano
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8 Dott.ssa Antonella Costanzo [email protected] Esercizio 1. Test delle ipotesi sulla varianza In un azienda che produce componenti meccaniche, è stato
7 Disegni sperimentali ad un solo fattore. Giulio Vidotto Raffaele Cioffi
7 Disegni sperimentali ad un solo fattore Giulio Vidotto Raffaele Cioffi Indice: 7.1 Veri esperimenti 7.2 Fattori livelli condizioni e trattamenti 7.3 Alcuni disegni sperimentali da evitare 7.4 Elementi
2. Variabilità mediante il confronto di valori caratteristici della
2. Variabilità mediante il confronto di valori caratteristici della distribuzione Un approccio alternativo, e spesso utile, alla misura della variabilità è quello basato sul confronto di valori caratteristici
MODELLO DI REGRESSIONE PER DATI DI PANEL
MODELLO DI REGRESSIONE PER DAI DI PANEL 5. Introduzione Storicamente l analisi econometrica ha proceduto in due distinte direzioni: lo studio di modelli macroeconomici, sulla base di serie temporali di
Statistica Inferenziale
Statistica Inferenziale Prof. Raffaella Folgieri Email: [email protected] aa 2009/2010 Esercizio 1 (stima puntuale) In un processo di controllo di qualità, siamo interessati al numero mensile di guasti
RELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della
RELAZIONE TRA VARIABILI QUANTITATIVE Lezione 7 a Accade spesso nella ricerca in campo biomedico, così come in altri campi della scienza, di voler studiare come il variare di una o più variabili (variabili
3. Piano di lavoro: - applicazione di alcune semplici procedure, con il confronto tra le diverse soluzioni possibili nell ambito del programma SPSS
Per utilizzare SPSS sui PC dell aula informatica occorre accedere come: ID: SPSS Password: winidams Testo rapido di consultazione: Fideli R. Come analizzare i dati al computer. ed. Carocci, Urbino, 2002.
Metodi di Distanza. G.Allegrucci riproduzione vietata
Metodi di Distanza La misura più semplice della distanza tra due sequenze nucleotidiche è contare il numero di siti nucleotidici che differiscono tra le due sequenze Quando confrontiamo siti omologhi in
STATISTICA GIUSEPPE DE NICOLAO. Dipartimento di Informatica e Sistemistica Università di Pavia
STATISTICA GIUSEPPE DE NICOLAO Dipartimento di Informatica e Sistemistica Università di Pavia SOMMARIO V.C. vettoriali Media e varianza campionarie Proprietà degli stimatori Intervalli di confidenza Statistica
FONDAMENTI DI PSICOMETRIA - 8 CFU
Ψ FONDAMENTI DI PSICOMETRIA - 8 CFU STIMA DELL ATTENDIBILITA STIMA DELL ATTENDIBILITA DEFINIZIONE DI ATTENDIBILITA (affidabilità, fedeltà) Grado di accordo tra diversi tentativi di misurare uno stesso
LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010
LEZIONE 3 "Educare significa aiutare l'animo dell'uomo ad entrare nella totalità della realtà. Non si può però educare se non rivolgendosi alla libertà, la quale definisce il singolo, l'io. Quando uno
Il modello di regressione lineare multivariata
Il modello di regressione lineare multivariata Eduardo Rossi 2 2 Università di Pavia (Italy) Aprile 2013 Rossi MRLM Econometria - 2013 1 / 39 Outline 1 Notazione 2 il MRLM 3 Il modello partizionato 4 Collinearità
STUDIO DI SETTORE VG73B
ALLEGATO 12 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE VG73B SPEDIZIONIERI, INTERMEDIARI DEI TRASPORTI E CORRIERI CRITERI PER L EVOLUZIONE DELLO STUDIO DI SETTORE L'applicazione dello studio di settore
4. Confronto tra medie di tre o più campioni indipendenti
BIOSTATISTICA 4. Confronto tra medie di tre o più campioni indipendenti Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health [email protected] MARTA BLANGIARDO
2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale
BIOSTATISTICA 2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health [email protected]
Laboratorio di Analisi ed Esplorazione Dati A.A. 2008/09 Secondo foglio di esercizi per l esame.
Laboratorio di Analisi ed Esplorazione Dati A.A. 2008/09 Secondo foglio di esercizi per l esame. Ognuno deve svolgere ambedue gli esercizi (a) e (b) del numero (da 1 a 9) assegnato. Bisogna scrivere un
Limited Dependent Variable Models
Limited Dependent Variable Models Logit Tobit Probit Modelli Logit e Probit Latent variable models for binary choice Models for descrete dependent variable Traducendo Spesso vogliamo studiare (le determinanti
Gestione ed Analisi Statistica dei dati
Master in Evidence Based Practice e Metodologia della Ricerca clinico-assistenziale assistenziale Gestione ed Analisi Statistica dei dati Daniela Fortuna 13 giugno 2014 Argomenti Parte teorica Relazioni
Riassunto 24 Parole chiave 24 Commenti e curiosità 25 Esercizi 27 Appendice
cap 0 Romane - def_layout 1 12/06/12 07.51 Pagina V Prefazione xiii Capitolo 1 Nozioni introduttive 1 1.1 Introduzione 1 1.2 Cenni storici sullo sviluppo della Statistica 2 1.3 La Statistica nelle scienze
3) ANALISI DEI RESIDUI
3) ANALISI DEI RESIDUI Dopo l analisi di regressione si eseguono alcuni test sui residui per avere una ulteriore conferma della validità del modello e delle assunzioni (distribuzione normale degli errori,
CENNI DI METODI STATISTICI
Corso di Laurea in Ingegneria Aerospaziale CENNI DI METODI STATISTICI Docente: Page 1 Page 2 Page 3 Due eventi si dicono indipendenti quando il verificarsi di uno non influisce sulla probabilità di accadimento
1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:
Esempi di domande risposta multipla (Modulo II) 1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: 1) ha un numero di elementi pari a 5; 2) ha un numero di elementi
ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE
ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE e-mail: [email protected] web: www.dm.unipi.it/ tommei Ricevimento: su appuntamento Dipartimento di Matematica, piano terra, studio 114
6. Modelli statistici: analisi della regressione lineare
BIOSTATISTICA 6. Modelli statistici: analisi della regressione lineare Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health [email protected] MARTA BLANGIARDO
rendimento PROGRAMMA 0. Introduzione 1. Valore. 2. Valutazione del rischio: Introduzione a rischio e rendimento; Teoria del portafoglio e CAPM;
PROGRAMMA 0. Introduzione 1. Valore.. Valutazione del rischio: Introduzione a rischio e rendimento; Teoria del portafoglio e CAPM; Rischio e capital budgeting Introduzione a rischio e rendimento 3. Decisioni
Excel Terza parte. Excel 2003
Excel Terza parte Excel 2003 TABELLA PIVOT Selezioniamo tutti i dati (con le relative etichette) Dati Rapporto tabella pivot e grafico pivot Fine 2 La tabella pivot viene messa di default in una pagina
1 Associazione tra variabili quantitative COVARIANZA E CORRELAZIONE
1 Associazione tra variabili quantitative ASSOCIAZIONE FRA CARATTERI QUANTITATIVI: COVARIANZA E CORRELAZIONE 2 Associazione tra variabili quantitative Un esempio Prezzo medio per Nr. Albergo cliente (Euro)
Metodologia per l analisi dei dati sperimentali L analisi di studi con variabili di risposta multiple: Regressione multipla
Il metodo della regressione può essere esteso dal caso in cui si considera la variabilità della risposta della y in relazione ad una sola variabile indipendente X ad una situazione più generale in cui
STUDIO DI SETTORE WG87U
ALLEGATO 21 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE WG87U CONSULENZA FINANZIARIA, AMMINISTRATIVO-GESTIONALE E AGENZIE DI INFORMAZIONI COMMERCIALI CRITERI PER L EVOLUZIONE DELLO STUDIO DI SETTORE
Introduzione alle relazioni multivariate. Introduzione alle relazioni multivariate
Introduzione alle relazioni multivariate Associazione e causalità Associazione e causalità Nell analisi dei dati notevole importanza è rivestita dalle relazioni causali tra variabili Date due variabili
Misura e Valutazione del A. Rischio
- 7 Teoria della Finanza Aziendale Prof. Arturo Capasso A.A. 007-008 Misura e Valutazione del A. Rischio - Argomenti Il rischio Il rischio negli investimenti finanziari La misurazione del rischio Varianza
RELAZIONE TRA DUE VARIABILI QUANTITATIVE
RELAZIONE TRA DUE VARIABILI QUANTITATIVE Quando si considerano due o più caratteri (variabili) si possono esaminare anche il tipo e l'intensità delle relazioni che sussistono tra loro. Nel caso in cui
STIMARE valori ed eseguire ANALISI DI REGRESSIONE
STIMARE valori ed eseguire ANALISI DI REGRESSIONE È possibile impostare una serie di valori che seguono una tendenza lineare semplice oppure una tendenza con crescita esponenziale. I valori stimati vengono
I ESERCITAZIONE. Gruppo I 100 individui. Trattamento I Nuovo Farmaco. Osservazione degli effetti sul raffreddore. Assegnazione casuale
I ESERCITAZIONE ESERCIZIO 1 Si vuole testare un nuovo farmaco contro il raffreddore. Allo studio partecipano 200 soggetti sani della stessa età e dello stesso sesso e con caratteristiche simili. i) Che
ITCS Erasmo da Rotterdam. Anno Scolastico 2014/2015. CLASSE 4^ M Costruzioni, ambiente e territorio
ITCS Erasmo da Rotterdam Anno Scolastico 014/015 CLASSE 4^ M Costruzioni, ambiente e territorio INDICAZIONI PER IL LAVORO ESTIVO DI MATEMATICA e COMPLEMENTI di MATEMATICA GLI STUDENTI CON IL DEBITO FORMATIVO
STATISTICA DESCRITTIVA SCHEDA N. 5: REGRESSIONE LINEARE
STATISTICA DESCRITTIVA SCHEDA N. : REGRESSIONE LINEARE Nella Scheda precedente abbiamo visto che il coefficiente di correlazione fra due variabili quantitative X e Y fornisce informazioni sull esistenza
Relazioni statistiche: regressione e correlazione
Relazioni statistiche: regressione e correlazione È detto studio della connessione lo studio si occupa della ricerca di relazioni fra due variabili statistiche o fra una mutabile e una variabile statistica
1. Richiami di Statistica. Stefano Di Colli
1. Richiami di Statistica Metodi Statistici per il Credito e la Finanza Stefano Di Colli Dati: Fonti e Tipi I dati sperimentali sono provenienti da un contesto delimitato, definito per rispettare le caratteristiche
Probabilità II Variabili casuali discrete
Probabilità II Variabili casuali discrete Definizioni principali. Valore atteso e Varianza. Teorema di Bienaymé - Čebičev. V.C. Notevoli: Bernoulli e Binomiale. Concetto di variabile casuale Cos'è una
Analisi di dati di frequenza
Analisi di dati di frequenza Fase di raccolta dei dati Fase di memorizzazione dei dati in un foglio elettronico 0 1 1 1 Frequenze attese uguali Si assuma che dalle risposte al questionario sullo stato
LEZIONE n. 5 (a cura di Antonio Di Marco)
LEZIONE n. 5 (a cura di Antonio Di Marco) IL P-VALUE (α) Data un ipotesi nulla (H 0 ), questa la si può accettare o rifiutare in base al valore del p- value. In genere il suo valore è un numero molto piccolo,
Elementi di Psicometria
Elementi di Psicometria E2-Riepilogo finale vers. 1.2 Germano Rossi 1 [email protected] 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2010-2011 G. Rossi (Dip. Psicologia) ElemPsico 2010-2011
ANALISI DELLE FREQUENZE: IL TEST CHI 2
ANALISI DELLE FREQUENZE: IL TEST CHI 2 Quando si hanno scale nominali o ordinali, non è possibile calcolare il t, poiché non abbiamo medie, ma solo frequenze. In questi casi, per verificare se un evento
Un po di statistica. Christian Ferrari. Laboratorio di Matematica
Un po di statistica Christian Ferrari Laboratorio di Matematica 1 Introduzione La statistica è una parte della matematica applicata che si occupa della raccolta, dell analisi e dell interpretazione di
Valenza predittiva dei test di ammissione al corso di laurea in Medicina e Chirurgia
Valenza predittiva dei test di ammissione al corso di laurea in Medicina e Chirurgia a cura di Augusto Garuccio ISBN 978-88-88793-87-0 Questo volume raccoglie i risultati della ricerca condotta nell ambito
STUDIO DI SETTORE VG88U
ALLEGATO 22 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE VG88U AUTOSCUOLE, SCUOLE NAUTICHE E AGENZIE DI DISBRIGO PRATICHE 1096 CRITERI PER L EVOLUZIONE DELLO STUDIO DI SETTORE L'applicazione dello studio
PSICOMETRIA. Esercitazione n.1. C.d.L. Comunicazione e Psicologia a.a. 2012/13
PSICOMETRIA Esercitazione n.1 C.d.L. Comunicazione e Psicologia a.a. 2012/13 ESERCITAZIONE 1: INDICE 1. Informazioni di carattere generale sulle esercitazioni 2. Il foglio di calcolo (Excel) 3. Avviare
p k q n k = p n (k) = n 12 = 1 = 12 1 12 11 10 9 1 0,1208. q = 1 2 e si ha: p 12 (8) = 12 8 4
CAPITOLO QUARTO DISTRIBUZIONE BINOMIALE (O DI BERNOULLI) Molti degli esempi che abbiamo presentato nei capitoli precedenti possono essere pensati come casi particolari di uno schema generale di prove ripetute,
Indice Aspetti generali sul campionamento da popolazioni finite Campionamento probabilistico Disegno campionario semplice
Indice 1 Aspetti generali sul campionamento da popolazioni finite.. 1 1.1 Rilevazionicensuarieerilevazionicampionarie... 1 1.2 Lineemetodologichediunarilevazionestatistica... 3 1.3 Popolazioni, etichette,
VALUTAZIONE D IMPATTO DELLE POLITICHE REGIONALI PER LA PROMOZIONE DELL APPROPRIATEZZA ORGANIZZATIVA
Mattone Misura dell appropriatezza GdLA 26 Settembre 2006 VALUTAZIONE D IMPATTO DELLE POLITICHE REGIONALI PER LA PROMOZIONE DELL APPROPRIATEZZA ORGANIZZATIVA QUESITI DELLA RICERCA Qual è stato l impatto
Esercizi su lineare indipendenza e generatori
Esercizi su lineare indipendenza e generatori Per tutto il seguito, se non specificato esplicitamente K indicherà un campo e V uno spazio vettoriale su K Cose da ricordare Definizione Dei vettori v,,v
CORSO DI LAUREA IN OTTICA E OPTOMETRIA CORSO DI INFORMATICA E STATISTICA [email protected]
CORSO DI LAUREA IN OTTICA E OPTOMETRIA CORSO DI INFORMATICA E STATISTICA [email protected] CONVENZIONE SULLE CIFRE SIGNIFICATIVE La convenzione usata sul troncamento delle cifre è troncare
LEZIONI DI STATISTICA
ez10 l GIOVANNI GIRONE Ordinario nell'università di Bari TOMMASO SALVEMINI Ordinario nel!' Università di Roma LEZIONI DI STATISTICA Volume Secondo CACUCCI EDITORE - BARI - 1992 CENTRO " G. ASTENGO» INVENTARIO
1) A partire dalla seguente tabella a doppia entrata per le variabili QUALIFICA FUNZIONALE e STIPENDIO PERCEPITO (3 classi): STIPENDIO PERCEPITO
ESERCIZIO La tabella littlecompany,disponibile sul sito (in formato pdf e xls) riporta i dati relativi a 40 dipendenti dell'azienda Little Company S.r.l. su cui sono state rilevate le seguenti variabili:
LEZIONI DI STATISTCA APPLICATA. Parte 2. Statistica inferenziale. Variabili continue per continue. Alessandro Valbonesi. SARRF di Scienze ambientali
LEZIONI DI STATISTCA APPLICATA Parte 2 Statistica inferenziale Variabili continue per continue Alessandro Valbonesi SARRF di Scienze ambientali Anno accademico 2010-11 CAPITOLO 7 - RELAZIONI TRA DUE O
Lezione n. 2 (a cura di Chiara Rossi)
Lezione n. 2 (a cura di Chiara Rossi) QUANTILE Data una variabile casuale X, si definisce Quantile superiore x p : X P (X x p ) = p Quantile inferiore x p : X P (X x p ) = p p p=0.05 x p x p Graficamente,
1 Valore atteso o media
1 Valore atteso o media Definizione 1.1. Sia X una v.a., si chiama valore atteso (o media o speranza matematica) il numero, che indicheremo con E[X] o con µ X, definito come E[X] = i x i f(x i ) se X è
2 CERTAMEN NAZIONALE DI PROBABILITA E STATISTICA FELICE FUSATO Fase di Istituto 15 febbraio 2011
2 CERTAMEN NAZIONALE DI PROBABILITA E STATISTICA FELICE FUSATO Fase di Istituto 15 febbraio 2011 1) Non sfogliare questo fascicolo finché l insegnante non ti dice di farlo. 2) E ammesso l utilizzo di calcolatrici
Il modello media-varianza con N titoli rischiosi. Una derivazione formale. Enrico Saltari
Il modello media-varianza con N titoli rischiosi. Una derivazione formale Enrico Saltari La frontiera efficiente con N titoli rischiosi Nel caso esistano N titoli rischiosi, con N 2, il problema della
Esercizi riassuntivi di probabilità
Esercizi riassuntivi di probabilità Esercizio 1 Una ditta produttrice di fotocopiatrici sa che la durata di una macchina (in migliaia di copie) si distribuisce come una normale con µ = 1600 e 2 = 3600.
Statistica. Alfonso Iodice D Enza [email protected]
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 2 Outline 1 2 3 4 () Statistica 2 / 2 Misura del legame Data una variabile doppia (X, Y ), la misura
Il Metodo Scientifico
Unita Naturali Il Metodo Scientifico La Fisica si occupa di descrivere ed interpretare i fenomeni naturali usando il metodo scientifico. Passi del metodo scientifico: Schematizzazione: modello semplificato
STATISTICA DESCRITTIVA BIVARIATA
STATISTICA DESCRITTIVA BIVARIATA Si parla di Analisi Multivariata quando su ogni unità statistica, appartenente ad una determinata popolazione, si rileva un certo numero s di caratteri X 1, X 2,,X s. Si
Statistica. Esercitazione 15. Alfonso Iodice D Enza [email protected]. Università degli studi di Cassino. Statistica. A. Iodice
Esercitazione 15 Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () 1 / 18 L importanza del gruppo di controllo In tutti i casi in cui si voglia studiare l effetto di un certo
Relazioni tra variabili
Università degli Studi di Padova Facoltà di Medicina e Chirurgia Corso di Laurea in Medicina e Chirurgia - A.A. 009-10 Scuole di specializzazione in: Medicina Legale, Medicina del Lavoro, Igiene e Medicina
Il programma OCTAVE per l insegnamento dell algebra lineare nella Scuola Secondaria p. 1
Il programma OCTAVE per l insegnamento dell algebra lineare nella Scuola Secondaria R. Vitolo Dipartimento di Matematica Università di Lecce SaLUG! - Salento Linux User Group Il programma OCTAVE per l
UNIVERSITÀ DEGLI STUDI DI FERRARA
UNIVERSITÀ DEGLI STUDI DI FERRARA Anno Accademico 2012/2013 REGISTRO DELL ATTIVITÀ DIDATTICA Docente: ANDREOTTI MIRCO Titolo del corso: MATEMATICA ED ELEMENTI DI STATISTICA Corso: CORSO UFFICIALE Corso
Capitolo 2 Distribuzioni di frequenza
Edizioni Simone - Vol. 43/1 Compendio di statistica Capitolo 2 Distribuzioni di frequenza Sommario 1. Distribuzioni semplici. - 2. Distribuzioni doppie. - 3. Distribuzioni parziali: condizionate e marginali.
Elementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 5-Indici di variabilità (vers. 1.0c, 20 ottobre 2015) Germano Rossi 1 [email protected] 1 Dipartimento di Psicologia, Università di Milano-Bicocca
