Analisi Multivariata dei Dati
|
|
- Virginio Di Gregorio
- 6 anni fa
- Visualizzazioni
Transcript
1 Analisi Multivariata dei Dati Introduzione al corso e al modello statistico A M D Marcello Gallucci Milano-Bicocca Lezione: I
2 Programma Odierno I numeri del corso Programma del corso Concetti Statistici Introduttivi Lezione: I
3 Numeri del Corso 48 lezioni, 2 ore l una (a parte le pause) 16 ore di esercitazioni 2 appelli a sessione + recuperi 8 CFU Lezione: I
4 Stile del Corso Enfasi sui concetti Enfasi sul ragionamento statistico Minimo utilizzo di formule Utilizzo di software per i calcoli Enfasi sulla interpretazione dei risultati Lezione: I
5 Software Statistico Il programma SPSS (V21) verra usato per condurre i calcoli necessari alle analisi L utilizzo di SPSS verra insegnato nelle esercitazioni Varie fonti offrono guide pratiche a SPSS Vari testi in biblioteca Lezione: I
6 Esercitazioni Il corso si completa di 16 ore di esercitazione da tenersi nelle aule informatiche Lo scopo delle esercitazioni e di imparare ad eseguire ed interpretare praticamente le analisi statistiche studiate a lezione Le esercitazione inizieranno la settimana prossima. I gruppi verranno fatti dopo l'iscrizione al gruppo via pagina web del corso Lezione: I
7 Libri di Testo Il libro di testo è Gallucci, Leone (2012). Modelli statistici nelle scienze sociali Le lezioni possono essere scaricate dalla pagina del corso I capitoli da studiare sono elencati nel materiale del corso Lezione: I
8 Esami L esame e scritto e si svolge nei laboratori informatici dove lo studente potrà utilizzare il software statistico per rispondere alle domande Si chiedera allo studente di rispondere a domande riguardanti una ricerca empirica su cui lo studente condurrà le analisi usando SPSS. Tutti possono integrare il voto con l esame orale L esame orale potrebbe abbassare il voto!! Lezione: I
9 Scopi del Corso Lo studio approfondito di alcune importanti Tecniche Statistiche Univariate Analisi della varianza Regressione lineare e logistica Modelli lineari generalizzati Inteso come ripasso di corsi precedendi Studio di tecniche multivariate per l analisi di grandezze psicologiche osservate ripetutamente nel tempo o in modalità ripetute Analisi della Varianza a misure ripetute Modelli misti Focus centrale del corso Analisi fattoriale Lezione: I
10 Tecniche Multivariate Cosa sono? Per capire le tecniche multivariate dobbiamo ricordare cosa sono le tecniche univariate Per ricordare le tecniche univariate dobbiamo ricordare la logica delle tipo tecniche statistiche che andremo a studiare Tecniche volte allo studio delle relazioni tra variabili Lezione: I
11 Tecniche Univariate Techniche volte a studiare e quantificare gli effetti di una o più variabili indipendenti (variabili esplicative o predittori) su una variabile dipendente (variabile di interesse) Cosa intendiamo per effetti Cosa intendiamo per variabile dipendente Cosa intendiamo per variabili indipendenti Lezione: I
12 Relazioni statistiche La maggior parte delle tecniche statistiche che conosciamo (e incontreremo) definiscono un modello statistico delle relazioni fra variabili di interesse Y X Differenze medie scatterplot X Path Diagram Y
13 Modello Statistico Un semplice modello statistico è una rappresentazione efficiente e compatta dei dati raccolti per descrivere un fenomeno empirico Y X Differenze medie scatterplot X Path Diagram Y
14 Esempio: la media Q: Come vanno gli studenti al mio corso? R: Hanno una media del i X i N = X
15 Introduzione Il modello statistico e la rappresentazione che ne facciamo serve (tra l'altro) a tre scopi: Descrizione efficiente e compatta Predizione del futuro 28.4 Inferenza sulla popolazione Cioè: comprensione del fenomeno
16 Errore di approssimazione Come tutte le rappresentazioni compatte ed efficienti, anche quella statistica è una approssimazione dei dati rappresentati Se, per semplificare, diremo che la performance è di 28.4, misrappresenteremo alcuni dei voti effettivi 28.4
17 Errore di approssimazione Calcolando questo errore per ogni caso (ogni studente), elevandolo al quadrato (sbagliare in più o in meno è uguale) e facendo la media per ogni caso, quantifichiamo l'errore medie associato alla media i X i X 2 N 1 =Var X 28.4
18 Inferenza statistica Il modello statistico è associato ad una serie di test inferenziali che ci consentono di trarre conclusioni sulla popolazione di riferimento Var X μ ( X ) N =ttest 28.4
19 Modello statistico se: Il modello statistico sarà una buona rappresentazione dei dati I parametri sono modellati correttamente Gli errori sono modellati correttamente Media La struttura dei dati è rispettata
20 Scegliere un modello statistico Per costruire un corretto modello statistico dei nostri dati dobbiamo sapere una serie di cose: Cosa ci serve il modello (lo scopo dell'analisi) Che tipo di variabili abbiamo Che tipo di relazioni vogliamo studiare Quali sono le unità di misurazioni dei dati Come sono strutturati i nostri dati
21 Il modello di regressione (Capitolo 2 e 3)
22 Concentti fondamentali Consideriamo ora questa ipotetica ricerca: siamo andati in un pub ed abbiamo contato quanti sorrisi le persone ai tavoli producevano (ogni 10 minuti) e quante birre avevano bevuto fino a quel momento Birre Sorrisi SMILES NBEERS
23 Concentti fondamentali Lo scopo della retta di regressione è di rappresentare la relazione lineare tra la variabile indipendente e la dipendente Nel caso più semplice, abbiamo una retta senplice y i =a+ b y i + e i ŷ i =a+ b x i
24 Concetti fondamentali La retta può essere descritta mediante due coefficienti: il termine costante ed il coefficiente angolare Coefficients a ŷ i =a+ b x i Model 1 (Constant) NBEERS Unstandardized Coefficients a. Dependent Variable: SMILES Standardized Coefficients B Std. Error Beta t Sig Termine constante (o intercetta) Coefficiente di regressione (angolare)
25 Coefficiente costante a l'intercetta della linea: indica il valore atteso (medio) della VD per la VI=0 ŷ=a+ b 0 Y Y Quando un partecipante ha bevuto zero birre, mostra (in media) 2.09 sorrisi
26 Coefficiente di regressione B è il coefficiente angolare della retta: indica il cambiamento atteso nella VD al variare di una unità della VI I sorrisi aumentano di B unità Per ogni birra che si beve, i sorrisi aumentano in media di.709 unità Per una unità in più della VI: una birra in più
27 Coefficienti standardizzati Il coefficiente Beta equivale al coefficiente di regressione calcolato dopo aver standardizzato tutte le variabili Model 1 (Constant) NBEERS Coefficients a Unstandardized Coefficients a. Dependent Variable: SMILES Standardized Coefficients B Std. Error Beta t Sig Il coefficiente standardizzato è uguale al coefficiente r di Pearson
28 Correlazione: Interpretazione La correlazione indica il cambiamento atteso in v, al variare di x di una deviazione standard dettaglio Legge di relazione r=0.78 vˆ r z xv x z.78 Mi aspetto una scostamento pari a 78% della dev.std di v 1 Mi muovo di una dev.std. Lezione: I
29 Test inferenziale I coefficenti vengono testati per la loro significatività statistica mediante il t-test t test Model 1 (Constant) NBEERS Coefficients a Unstandardized Coefficients a. Dependent Variable: SMILES Standardized Coefficients B Std. Error Beta t Sig Se Sig. < 0.05, diremo che B (e ) sono significativamente diversi da zero
30 Bonta di adattamento Non tutte le rette di regressione hanno lo stesso potere predittivo, cioè la stessa capacità di adattarsi ai dati osservati bassa alta
31 Errore di regressione Notiamo che la predizione non corrisponde di norma ai valori osservati yˆ i a b yx x i predetti Discrepanza osservatipredetti y i yˆ i y i ( a b yx x i ) errore Dunque i valori osservati di Y possono essere espressi come somma dei valori predetti e l errore y i ( a b ) ( ˆ yxxi yi yi ) retta errore
32 Quanto e grande l errore di regressione Calcoliamoci la distanza media tra i punti osservati e la retta Le distanze si calcolano mediante le differenze al quadrato Discrepanza osservatipredetti n i 1 ( y ˆ i yi n 1 ) 2 s 2 e Notiamo che questa e una varianza, che chiameremo varianza di errore
33 Proporzione riduzione errore Il modello si adatterà ai dati tanto più riduce l'errore di predizione rispetto a non usare tale modello La logica è di confrontare due casi: L'errore calcolato per la regressione data L'errore associato alla media, cioè errore associato a non utilizzare la regressione
34 Proporzione riduzione errore Senza regressione l unica predizione plausibile di Y e la media di Y Predizione senza regressione Errore senza regressione yˆ M i y s 2 y ( yi n M 1 ) 2 Le deviazioni dalla media (la varianza) non siamo in grado di spiegarle YY2 s y
35 Proporzione riduzione errore Con la regressione faremo una certa predizione Predizione con regressione Errore con regressione yˆ i a b yx x i s 2 e ( y n i 1 yˆ i ) 2 X Le deviazioni dalla regressione (varianza di errore) non siamo in grado di spiegarle YY s 2 e
36 R-quadro Dunque il fit della regressione è tanto buono quanto riesce a migliorare la predizione, cioè a diminuire l'errore Errore senza regressione 2 sy Y 2 s reg X s 2 y s 2 y s 2 e s 2 reg s 2 y R 2 yx Errore con regressione Cioe : Quanto si riduce l errore di predizione grazie al fatto che usiamo la regressione
37 Effetti multipli Consideriamo ora il caso in cui la variabile dipendente possa essere spiegata da più di una variabile Parleremo di Regressione Multipla x b yx. w w y b yw. x
38 Esempio Effetti multipli Vogliamo predire il numero di sorrisi sia con il numero di birre che con il tratto estroversione del soggetto Regressione Multipla Birre b yx. w Estrovers. Sorrisi b yw. x
39 Effetti multipli La regressione multipla aggiunge termini lineari (altre VI) alla retta di regressione Legge di relazione della Regressione Multipla x w y Standardizzata ˆ y x z yx. w z yw. x w z Non Standardizzata yˆ a b x b yx. w yw. x w
40 Interpretazione Il coefficiente di regressione esprime l effetto diretto di x su y, togliendo l effetto che passa indirettamente per w Effetto diretto b yx. w byx byw. x b wx Effetto indiretto x b yx. w b wx w b yw. x y
41 Effetti Parziali Togliere l effetto indiretto è equivalente a bloccare la possibilità che x vada su y mediante w: Il coefficiente viene dunque detto coefficiente parziale, cioè l effetto di x parzializzando l effetto di w Effetto diretto Effetto indiretto b wx x w b yx. w b yw. x y
42 Rappresentazione geometrica yˆ a B y1 x 1 B y2 x 2
43 Interpretazione geometrica Effetto Unico of X 2 for X 1 =-10 Effetto unico di X 2 per X 1 =0 Effetto unico di X 2 per X 1 =10
44 Intercetta (o costante) L'intercetta indica il valore atteso della VD per tutte le VI uguali a 0 Y =a B y B y2.1 0 Yˆ a
45 Esempio Un ricercatore ha misurato la capacita di lettura e la produzione linguistica con due test in bimbi da 5 e 8 anni Si propone di studiare se la capacità di lettura è influenzata dalla produzione linguistica eta Validi Totale Percentuale Percentuale Frequenza Percentuale valida cumulata Statistiche descrittive lettura lingua Validi (listwise) Deviazione N Minimo Massimo Media std
46 Esempio Incominciamo con una regressione semplice Riepilogo del modello lettura b yx lingua Modello 1 R-quadrato Errore std. R R-quadrato corretto della stima.178 a a. Stimatori: (Costante), lingua ANOVA b Varianza spiegata Coefficienti a Modello 1 Regressione Residuo Totale a. Stimatori: (Costante), lingua b. Variabile dipendente: lettura Somma dei Media dei quadrati df quadrati F Sig a Modello 1 (Costante) lingua a. Variabile dipendente: lettura Coefficienti non Coefficienti standardizzati standardizzati Coefficienti di regressione B Errore std. Beta t Sig
47 Esempio Aggiungiamo l età Riepilogo del modello lettura=b yx.w lingua b yw. x eta Modello 1 R-quadrato Errore std. R R-quadrato corretto della stima.641 a a. Stimatori: (Costante), eta, lingua Varianza spiegata Modello 1 Regressione Residuo Totale a. Stimatori: (Costante), eta, lingua b. Variabile dipendente: lettura ANOVA b Somma dei Media dei quadrati df quadrati F Sig a Coefficienti a Modello 1 (Costante) lingua eta a. Variabile dipendente: lettura Coefficienti non standardizzati Coefficienti standardizzati B Errore std. Beta t Sig Notiamo come è cambiato l effetto della lettura Coefficienti di regressione
48 Esempio Concluderemo che la produzione linguistica è debolmente associata alla capacità di lettura Coefficienti a Regressione semplice Modello 1 (Costante) lingua a. Variabile dipendente: lettura Coefficienti non standardizzati Coefficienti standardizzati B Errore std. Beta t Sig Coefficienti a Regressione multipla Modello 1 (Costante) lingua eta Coefficienti non standardizzati Coefficienti standardizzati B Errore std. Beta t Sig a. Variabile dipendente: lettura Ma questa associazione dipende dalle differenze dovute all età A parità di età, non vi è una relazione tra produzione linguistica e capacità di lettura
49 Effetti Statistici Per effetto statistico si intende quanto il cambiamento di una o più variabili ha effetto sul cambiamento di un altra variabile Quando possiamo quantificare il cambiamento in termini di variabilità, possiamo interpretare gli effetti statistici come segue: Interpretazione esplicativa: quanto siamo in grado di spiegare della variabilità di una variabile sulla base della variabilità delle altre Interpretazione predittiva: quanto siamo in grado di predirre della variabilità di una variabile basandoci sulla variabilità delle altre Lezione: I
50 Fine Fine della Lezione I Lezione: I
Il modello di regressione
Il modello di regressione Capitolo e 3 A M D Marcello Gallucci Milano-Bicocca Lezione: II Concentti fondamentali Consideriamo ora questa ipotetica ricerca: siamo andati in un pub ed abbiamo contato quanti
DettagliMetodologie Quantitative
Metodologie Quantitative Regressione Lineare Multipla Mediazione e Path analysis I M Q Marco Perugini Milano-Bicocca 1 Regressione Multipla: utilizzo avanzato A seconda dello status delle variabili indipendenti,
DettagliAnalisi avanzate basate sulla regressione (Cap. 7)
Analisi avanzate basate sulla regressione (Cap. 7) AMD Marcello Gallucci marcello.gallucci@unimib.it Regressione Multipla A seconda dello status delle variabili indipendenti, possiamo differenziare diversi
DettagliIl modello lineare misto
Il modello lineare misto (capitolo 9) A M D Marcello Gallucci Univerisità Milano-Bicocca Lezione: 15 GLM Modello Lineare Generale vantaggi Consente di stimare le relazioni fra due o più variabili Si applica
DettagliIntroduzione all Analisi della Varianza (ANOVA)
Introduzione all Analisi della Varianza (ANOVA) AMD Marcello Gallucci marcello.gallucci@unimib.it Variabili nella Regressione Nella regressione, la viariabile dipendente è sempre quantitativa e, per quello
DettagliMetodologie Quantitative
Metodologie Quantitative Regressione Lineare Multipla Mediazione e Path analysis I M Q Marco Perugini Milano-Bicocca 1 Regressione Multipla: utilizzo avanzato A seconda dello status delle variabili indipendenti,
DettagliPresentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii
Sommario Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii xv Parte I Statistica descrittiva 1 Capitolo 1 Introduzione 3 Perché studiare statistica? 4
DettagliStatistica multivariata 27/09/2016. D.Rodi, 2016
Statistica multivariata 27/09/2016 Metodi Statistici Statistica Descrittiva Studio di uno o più fenomeni osservati sull INTERA popolazione di interesse (rilevazione esaustiva) Descrizione delle caratteristiche
DettagliMetodologie Quantitative
Metodologie Quantitative Introduzione al Corso M Q Cristina Zogmaister Milano-Bicocca cristina.zogmaister@unimib.it 1 Programma Odierno Struttura, argomenti, e stile del corso Esami Panoramica dei temi
DettagliStatistica multivariata Donata Rodi 17/10/2016
Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare
DettagliΣ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica
13. Regressione lineare parametrica Esistono numerose occasioni nelle quali quello che interessa è ricostruire la relazione di funzione che lega due variabili, la variabile y (variabile dipendente, in
DettagliUniversità del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica
Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Regressione Lineare e Correlazione Argomenti della lezione Determinismo e variabilità Correlazione Regressione Lineare
Dettagli3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17
C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica
DettagliAnalisi della Varianza Fattoriale
Analisi della Varianza Fattoriale AMD Marcello Gallucci marcello.gallucci@unimib.it Ripasso dell ANOVA Lo studio degli effetti di una serie di variabili indipendenti nominale (gruppi) su un variabile dipendente
Dettagliviii Indice generale
Indice generale 1 Introduzione al processo di ricerca 1 Sommario 1 Il processo di ricerca 3 Concetti e variabili 5 Scale di misura 8 Test di ipotesi 10 Evidenza empirica 10 Disegni di ricerca 11 Sintesi
DettagliMisure Ripetute. Partizione della Varianza. Marcello Gallucci
Misure Ripetute Partizione della Varianza Marcello Gallucci GLM l ANOVA a misure ripetute rappresenta un caso del modello lineare generale in cui la variabilità non è valutata tra gruppi ma tra misure
DettagliSTATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo
STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)
DettagliMetodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo
Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è
DettagliCorso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII
Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Un breve richiamo sul test t-student Siano A exp (a 1, a 2.a n ) e B exp (b 1, b 2.b m ) due set di dati i cui
DettagliUniversità del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare
Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione
Dettaglilezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1
lezione n. 6 (a cura di Gaia Montanucci) METODO MASSIMA VEROSIMIGLIANZA PER STIMARE β 0 E β 1 Distribuzione sui termini di errore ε i ε i ~ N (0, σ 2 ) ne consegue : ogni y i ha ancora distribuzione normale,
DettagliMetodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale
DIPARTIMENTO DI SCIENZE AGRARIE E AMBIENTALI PRODUZIONE, TERRITORIO, AGROENERGIA Marco Acutis marco.acutis@unimi.it www.acutis.it CdS Scienze della Produzione e Protezione delle Piante (g59) CdS Biotecnologie
DettagliMisure Ripetute. Analisi dei dati in disegni di ricerca con misure ripetute. Marcello Gallucci
Misure Ripetute Analisi dei dati in disegni di ricerca con misure ripetute Marcello Gallucci Introduzione Consideriamo una ricerca in cui un gruppo di pazienti è sottoposto ad un trattamento terapeutico
DettagliStatistica di base per l analisi socio-economica
Laurea Magistrale in Management e comunicazione d impresa Statistica di base per l analisi socio-economica Giovanni Di Bartolomeo gdibartolomeo@unite.it Definizioni di base Una popolazione è l insieme
DettagliANALISI MULTIVARIATA
ANALISI MULTIVARIATA Marcella Montico Servizio di epidemiologia e biostatistica... ancora sulla relazione tra due variabili: la regressione lineare semplice VD: quantitativa VI: quantitativa Misura la
DettagliAssociazione tra caratteri quantitativi: gli indici di correlazione
Associazione tra caratteri quantitativi: gli indici di correlazione Per correlazione si intende una relazione tra due variabili tale che a ciascun valore della prima variabile corrisponda con una certa
DettagliREGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori
REGRESSIONE lineare e CORRELAZIONE Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori Y X La NATURA e la FORZA della relazione tra variabili si studiano con la REGRESSIONE
DettagliEsercitazione del
Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36
DettagliModelli Lineari Generalizzati. (Cap. 10) Marcello Gallucci Univerisità Milano-Bicocca
Modelli Lineari Generalizzati (Cap. 0) Marcello Gallucci Univerisità Milano-Bicocca Preludio La maggior parte delle comuni tecniche statistiche volte ad individuare le relazioni fra variabili, quali Correlazioni,
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri
DettagliMetodologie Quantitative
Metodologie Quantitative Regressione Logistica II M Q Marco Perugini Milano-Bicocca 1 La regressione logistica La regressione logistica si propone di studiare e quantificare le relazioni tra una o più
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative
DettagliStatistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill
Statistica - metodologie per le scienze economiche e sociali /e S Borra, A Di Ciaccio - McGraw Hill Es 6 Soluzione degli esercizi del capitolo 6 In base agli arrotondamenti effettuati nei calcoli, si possono
DettagliLezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria
Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata Prof. Massimo Aria aria@unina.it Il concetto di interpolazione In matematica, e in particolare in
DettagliAnalisi della varianza a una via
Analisi della varianza a una via Statistica descrittiva e Analisi multivariata Prof. Giulio Vidotto PSY-NET: Corso di laurea online in Discipline della ricerca psicologico-sociale SOMMARIO Modelli statistici
DettagliI TEST STATISTICI. dott.ssa Gabriella Agrusti
I TEST STATISTICI dott.ssa Gabriella Agrusti Dulcis in fundo.. come scegliere un test statistico in base all ipotesi come stabilire se due variabili sono associate (correlazione di Pearson) come stabilire
DettagliTeoria e tecniche dei test. Concetti di base
Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi
DettagliTecniche statistiche di analisi del cambiamento
Tecniche statistiche di analisi del cambiamento 07-Anova con covariata (vers. 1.0, 3 dicembre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2015-16
DettagliRegressione Semplice. Correlazioni. sconto leverage. sconto Correlazione di Pearson 1,275. Sign. (a due code),141
Regressione Semplice Analisi Per avere una prima idea della struttura di dipendenza fra le variabili in esame, possiamo cominciare col costruire la matrice di correlazione delle variabili presenti nel
DettagliLezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo
UIVERSITA DEGLI STUDI DI BASILICATA FACOLTA DI ECOOMIA Corso di laurea in Economia Aziendale anno accademico 2012/2013 Lezioni di Statistica del 15 e 18 aprile 2013 Docente: Massimo Cristallo LA RELAZIOE
DettagliVariabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.
Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:
DettagliAcquisizione, rappresentazione e analisi di dati sperimentali Aurelio Agliolo Gallitto
Acquisizione, rappresentazione e analisi di dati sperimentali Aurelio Agliolo Gallitto Dipartimento di Scienze Fisiche ed Astronomiche Introduzione Esperimenti illustrativi, per visualizzare un determinato
DettagliAcquisizione, rappresentazione e analisi di dati sperimentali
Acquisizione, rappresentazione e analisi di dati sperimentali Aurelio Agliolo Gallitto Dipartimento di Fisica, Università di Palermo Introduzione Esperimenti illustrativi, per visualizzare un determinato
DettagliLa statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci
La statistica Elaborazione e rappresentazione dei dati Gli indicatori statistici Introduzione La statistica raccoglie ed analizza gruppi di dati (su cose o persone) per trarne conclusioni e fare previsioni
DettagliDistribuzioni e inferenza statistica
Distribuzioni e inferenza statistica Distribuzioni di probabilità L analisi statistica spesso studia i fenomeni collettivi confrontandoli con modelli teorici di riferimento. Tra di essi, vedremo: la distribuzione
DettagliPROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA
PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURA/TECNICA DI ANALISI DEI DATI SPECIFICAMENTE DESTINATA A STUDIARE LA RELAZIONE TRA UNA VARIABILE NOMINALE (ASSUNTA
DettagliSommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25
Sommario Presentazione dell edizione italiana Prefazione xv xiii Capitolo 1 I dati e la statistica 1 Statistica in pratica: BusinessWeek 1 1.1 Le applicazioni in ambito aziendale ed economico 3 Contabilità
DettagliIL CRITERIO DELLA MASSIMA VEROSIMIGLIANZA
Metodi per l Analisi dei Dati Sperimentali AA009/010 IL CRITERIO DELLA MASSIMA VEROSIMIGLIANZA Sommario Massima Verosimiglianza Introduzione La Massima Verosimiglianza Esempio 1: una sola misura sperimentale
DettagliStatistica. Esercitazione 16. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice
Esercitazione 16 Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () 1 / 24 Studio della relazione tra due variabili Commonly Asked Questions Qual è la relazione tra la spesa
Dettaglilezione 7 AA Paolo Brunori
AA 2016-2017 Paolo Brunori dove siamo arrivati? - se siamo interessati a studiare l andamento congiunto di due fenomeni economici - possiamo provare a misurare i due fenomeni e poi usare la lineare semplice
DettagliTest per la correlazione lineare
10 Test per la correlazione lineare Istituzioni di Matematica e Statistica 2015/16 E. Priola 1 Introduzione alla correlazione lineare Problema: In base ai dati che abbiamo possiamo dire che c è una qualche
DettagliTest F per la significatività del modello
Test F per la significatività del modello Per verificare la significatività dell intero modello si utilizza il test F Si vuole verificare l ipotesi H 0 : β 1 = 0,, β k = 0 contro l alternativa che almeno
DettagliCAPITOLO 11 ANALISI DI REGRESSIONE
VERO FALSO CAPITOLO 11 ANALISI DI REGRESSIONE 1. V F Se c è una relazione deterministica tra due variabili,x e y, ogni valore dato di x,determinerà un unico valore di y. 2. V F Quando si cerca di scoprire
DettagliIL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI
IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI Perchè confrontare le varianze stimate in due campioni? Torniamo all'esempio dei frinosomi Per poter applicare il test t avevamo detto che le varianze, e
DettagliScheda Corso di STATISTICA (D.M. 270 per 9 CFU) Anno Accademico 2014/2015 (versione in Italiano)
Scheda Corso di STATISTICA (D.M. 270 per 9 CFU) Anno Accademico 2014/2015 (versione in Italiano) FACOLTA :ECONOMIA CORSI DI LAUREA: Economia e Commercio, Psicoeconomia e Scienze Bancarie ed Assicurative
DettagliStrumenti informatici Calcolare il coefficiente di correlazione di Pearson con Excel e SPSS
Strumenti informatici 7.3 - Calcolare il coefficiente di correlazione di Pearson con Excel e SPSS Il coefficiente di correlazione di Pearson può essere calcolato con la funzione di Excel =CORRELAZIONE(Matrice1;Matrice2),
DettagliStrumenti di indagine per la valutazione psicologica
Strumenti di indagine per la valutazione psicologica 1.5 Correlazione e causazione Davide Massidda davide.massidda@gmail.com Metodi simmetrici vs asimmetrici Relazioni tra variabili Nei metodi di studio
Dettagli0.1 Percorrenza e Cilindrata
0.1 Percorrenza e Cilindrata Iniziamo ora un analisi leggermente più complessa basata sempre sui concetti appena introdotti. Innanzi tutto possiamo osservare, dal grafico ottenuto con il comando pairs,
DettagliEs. la performance all esame in relazione alle ore di studio a casa e alle abilità cognitive
Regressione Tale tecnica esamina e studia la relazione tra una o più variabili indipendenti e una variabile dipendente. L insieme dei parametri riassumono la relazione tra VD e VI, sotto le ipotesi che
DettagliPrefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura
INDICE GENERALE Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura XI XIV XV XVII XVIII 1 LA RILEVAZIONE DEI FENOMENI
DettagliEsercitazione. 24 Aprile 2012
Esercitazione 24 Aprile 2012 Il modello di regressione logistica viene utilizzato quando si è interessati a studiare o analizzare la relazione causale tra una variabile dipendente dicotomica e una o più
DettagliSTATISTICA: esercizi svolti sulla DIPENDENZA IN MEDIA
STATISTICA: esercizi svolti sulla DIPEDEZA I MEDIA 1 1 LA DIPEDEZA I MEDIA 2 1 LA DIPEDEZA I MEDIA 1. La popolazione in migliaia di unità occupata in Piemonte nel 1985 per reddito annuo Y (migliaia di
DettagliIntervallo di fiducia del coefficiente angolare e dell intercetta L intervallo di fiducia del coefficiente angolare (b 1 ) è dato da:
Analisi chimica strumentale Intervallo di fiducia del coefficiente angolare e dell intercetta L intervallo di fiducia del coefficiente angolare (b 1 ) è dato da: (31.4) dove s y è la varianza dei valori
DettagliAnalisi descrittiva: calcolando medie campionarie, varianze campionarie e deviazioni standard campionarie otteniamo i dati:
Obiettivi: Esplicitare la correlazione esistente tra l altezza di un individuo adulto e la lunghezza del suo piede e del suo avambraccio. Idea del progetto: Il progetto nasce dall idea di acquistare scarpe
DettagliESERCIZI SVOLTI Giuliano Bonollo - Michele Bonollo
ESERCIZI SVOLTI Giuliano Bonollo - Michele Bonollo 1 La seguente tabella riporta le frequenze relative riguardanti gli studenti di un università e gli esiti dell esame da essi sostenuto. Qual è la percentuale
DettagliIl modello di regressione lineare multipla. Il modello di regressione lineare multipla
Introduzione E la generalizzazione del modello di regressione lineare semplice: per spiegare il fenomeno d interesse Y vengono introdotte p, con p > 1, variabili esplicative. Tale generalizzazione diventa
DettagliElementi di Psicometria
Elementi di Psicometria 7-Punti z e punti T vers. 1.0a (21 marzo 2011) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2010-2011 G. Rossi (Dip. Psicologia)
Dettagli11.2. Introduzione alla statistica 2/ed. Marilyn K. Pelosi, Theresa M. Sandifer, Paola Cerchiello, Paolo Giudici
CAPITOLO 11 L ANALISI DI REGRESSIONE SOLUZIONI 11.1 a) una relazione lineare potrebbe essere appropriata b)l equazione di regressione è y cappello=0,96+0,00006 x c)olanda: y cappello=0,96+0,00006 (53560)=4,57
DettagliPsicometria. 9-Analisi fattoriale confermativa vers. 1.0
Psicometria 9-Analisi fattoriale confermativa vers. 1.0 Germano Rossi 1 germano.rossi@unimib.it Giovanni Battista Flebus 1 giovannibattista.flebus@unimib.it 1 Dipartimento di Psicologia, Università di
DettagliIl processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni
La statistica inferenziale Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni E necessario però anche aggiungere con
DettagliESERCIZI. Regressione lineare semplice CAPITOLO 12 Levine, Krehbiel, Berenson, Statistica II ed., 2006 Apogeo
Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università di Padova Docenti: Prof. L. Salmaso, Dott. L. Corain ESERCIZI Regressione lineare semplice
DettagliProf. Anna Paola Ercolani (Università di Roma) Lez Indicatori di dispersione
Consentono di descrivere la variabilità all interno della distribuzione di requenza tramite un unico valore che ne sintetizza le caratteristiche CAMPO DI VARIAZIONE DIFFERENZA INTERQUARTILE SCOSTAMENTO
DettagliREGRESSIONE E CORRELAZIONE
REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.
DettagliDESCRITTIVE, TEST T PER IL CONFRONTO DELLE MEDIE DI CAMPIONI INDIPENDENTI.
Corso di Laurea Specialistica in Biologia Sanitaria, Universita' di Padova C.I. di Metodi statistici per la Biologia, Informatica e Laboratorio di Informatica (Mod. B) Docente: Dr. Stefania Bortoluzzi
DettagliOgni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza.
Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza. Misure ripetute forniscono dati numerici distribuiti attorno ad un valore centrale indicabile con un indice (indice
DettagliEsame di Statistica del 14 dicembre 2007 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola
Esame di Statistica del dicembre 2007 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola Es. Es. 2 Es. 3 Es. Somma Voto finale Attenzione: si consegnano
Dettaglile scale di misura scala nominale scala ordinale DIAGNOSTICA PSICOLOGICA lezione si basano su tre elementi:
DIAGNOSTICA PSICOLOGICA lezione! Paola Magnano paola.magnano@unikore.it si basano su tre elementi: le scale di misura sistema empirico: un insieme di entità non numeriche (es. insieme di persone; insieme
DettagliSTATISTICA. Esercizi vari
STATISTICA Esercizi vari Esercizio 5.6 p. 205 Variabile Coeff. Dev. std. Statistica t p-value Intercetta 23.384 1.592 14.691 0 Profondità -1.435 0.213-6.726 0 = 0.850 Esercizio 5.6 p. 205 Variabile Coeff.
DettagliCorso di Psicometria Progredito
Corso di Psicometria Progredito 5. La correlazione lineare Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014 Sommario 1 Tipi di relazione
DettagliRELAZIONE FINALE DEL DOCENTE. Materia: MATEMATICA E COMPLEMENTI DI MATEMATICA Classe 3PTVE A. S. 2015/2016
RELAZIONE FINALE DEL DOCENTE Materia: MATEMATICA E COMPLEMENTI DI MATEMATICA Classe 3PTVE A. S. 2015/2016 In relazione alla programmazione curricolare sono stati conseguiti, in termini di livello medio,
DettagliMETODO DEI MINIMI QUADRATI
METODO DEI MINIMI QUADRATI Torniamo al problema della crescita della radice di mais in funzione del contenuto di saccarosio nel terreno di coltura. Ripetendo varie volte l esperimento con diverse quantità
DettagliAnalisi della Varianza - II
Analisi della Varianza - II ANOVA tra i soggetti M Q Cristina Zogmaister Milano-Bicocca 1 Lez: XXIX Analisi della Varianza (ANOVA, Analysis of Variance) Obiettivo - Confrontare due o più gruppi per stabilire
DettagliESERCIZIO 1. Di seguito vengono riportati i risultati di un modello fattoriale di analisi della varianza con 3 fattori tra i soggetti.
ESERCIZIO. Di seguito vengono riportati i risultati di un modello fattoriale di analisi della varianza con fattori tra i soggetti. Variabile dipendente: PERF Sorgente Modello corretto Intercept SEX_96
DettagliCovarianza, correlazione e retta di regressione. Paola Lecca, CIBIO UNITN Corso di Matematica e Statistica 2
Covarianza, correlazione e retta di regressione Paola Lecca, CIBIO UNITN Corso di Matematica e Statistica 2 Questa presentazione è stata preparata attingendo dai seguenti testi S. M. Iacus, Statistica,
DettagliCHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)
CHEMIOMETRIA Applicazione di metodi matematici e statistici per estrarre (massima) informazione chimica (affidabile) da dati chimici INCERTEZZA DI MISURA (intervallo di confidenza/fiducia) CONFRONTO CON
DettagliAnalisi della varianza
Analisi della varianza Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona ANALISI DELLA VARIANZA - 1 Abbiamo k gruppi, con un numero variabile di unità statistiche.
DettagliProprietà della varianza
Proprietà della varianza Proprietà della varianza Proprietà della varianza Proprietà della varianza Intermezzo: ma perché dovremmo darci la pena di studiare come calcolare la varianza nel caso di somme,
DettagliSTATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA
Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria Civile A.A. 2009-10 Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain 1 STATISTICHE, DISTRIBUZIONI CAMPIONARIE
Dettaglib) Calcolare la devianza tra i gruppi (devianza esterna), la devianza entro i gruppi (devianza interna) e la devianza totale
ESERCIZIO 1 La tendenza recente del mercato dell auto vede i veicoli SUV ed i fuoristrada sempre di più soppiantare le macchine tradizionali. Il loro utilizzo, soprattutto nei centri cittadini, viene criticato
DettagliPIANO DI LAVORO ANNUALE DEL DIPARTIMENTO DI MATERIA NUCLEI FONDAMENTALI DI CONOSCENZE
Pag. 1 di 7 ANNO SCOLASTICO 2014/2015 DIPARTIMENTO DI MATEMATICA INDIRIZZO AFM, RIM, SIA CLASSE BIENNIO TRIENNIO DOCENTI: Alemagna, Bartalotta, Bergamaschi, Mangione NUCLEI FONDAMENTALI DI CONOSCENZE I
Dettagli8. ANALISI DELLA COVARIANZA (ANCOVA)
8. ANALISI DELLA COVARIANZA (ANCOVA) L analisi della covarianza è un metodo statistico che risulta dalla combinazione dell analisi di regressione con l analisi della varianza. È utile quando all analisi
Dettaglii dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente
TEST DI AUTOVALUTAZIONE - SETTIMANA 6 I diritti d autore sono riservati. Ogni sfruttamento commerciale non autorizzato sarà perseguito. Metodi statistici per la biologia Parte A. La retta di regressione.2
DettagliVariabili tutte osservabili: regressione Si parla di regressione quando si ha a disposizione un campione sperimentale di numerosità n della forma X 1
Modelli lineari Come motivazione di ciò che stiamo per fare, pensiamo ai dati indicatori_benessere.txt. Quando li abbiamo esaminati nella lezione 1 tramite la rappresentazione nel piano delle componenti
DettagliRELAZIONE FINALE DEL DOCENTE. Materia: MATEMATICA E COMPLEMENTI DI MATEMATICA Classe 4BPT A. S. 2015/2016
RELAZIONE FINALE DEL DOCENTE Materia: MATEMATICA E COMPLEMENTI DI MATEMATICA Classe 4BPT A. S. 2015/2016 In relazione alla programmazione curricolare sono stati conseguiti, in termini di livello medio,
DettagliAnno Scolastico 2015/16 PROGRAMMAZIONE ANNUALE CLASSE PRIMA LICEO LINGUISTICO LICEO DELLE SCIENZE UMANE LICEO ECONOMICO-SOCIALE LICEO MUSICALE
LICEO LAURA BASSI - BOLOGNA Anno Scolastico 2015/16 PROGRAMMAZIONE ANNUALE CLASSE PRIMA LICEO LINGUISTICO LICEO DELLE SCIENZE UMANE LICEO ECONOMICO-SOCIALE LICEO MUSICALE MATEMATICA ARGOMENTI: GLI INSIEMI
DettagliStatistica per le ricerche di mercato
Università degli studi della Tuscia Dipartimento di Economia e Impresa Statistica per le ricerche di mercato a.a. 2012/13 Dr. Luca Secondi 01. Introduzione al corso 1 Statistica per le ricerche di mercato
DettagliEsame di Istituzioni di Matematiche II del 11 luglio 2001 (Corso di Laurea in Biotecnologie, Universitá degli Studi di Padova). Cognome Nome Matricola
Esame di Istituzioni di Matematiche II del 11 luglio 2001 (Corso di Laurea in Biotecnologie, Universitá degli Studi di Padova). Cognome Nome Matricola Es. 1 Es. 2 Es. 3 Es. 4 Somma Voto finale Attenzione:
DettagliLE DISTRIBUZIONI CAMPIONARIE
LE DISTRIBUZIONI CAMPIONARIE Argomenti Principi e metodi dell inferenza statistica Metodi di campionamento Campioni casuali Le distribuzioni campionarie notevoli: La distribuzione della media campionaria
DettagliLA RAPPRESENTAZIONE E LA SINTESI DEI DATI
Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria Civile A.A. 2009-10 Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain 1 LA RAPPRESENTAZIONE E LA SINTESI
Dettagli