Modelli Lineari Generalizzati. (Cap. 10) Marcello Gallucci Univerisità Milano-Bicocca
|
|
- Mariangela Pinto
- 7 anni fa
- Visualizzazioni
Transcript
1 Modelli Lineari Generalizzati (Cap. 0) Marcello Gallucci Univerisità Milano-Bicocca
2 Preludio La maggior parte delle comuni tecniche statistiche volte ad individuare le relazioni fra variabili, quali Correlazioni, Regressione, ANOVA, ANCOVA, sono riconducibili al Modello Lineare Generale (GLM) Il GLM ci permette di studia gli effetti di variabili indipendenti di vario tipo su variabili quantitative (variabili dipendenti continue) La ricerca empirica è disseminata di variabili dipendenti qualitative (scelte dicotomiche, scelte multiple, frequenze di eventi, classificazioni, etc) I Modelli Lineari Generalizzati ci consentono di studiare gli effetti di variabili indipendenti su variabili dipendenti qualitative
3 Modello Lineare Generale Variabili Indipendenti quantitative Regressione Correlazione Path Analysis Variabili Dipendenti quantitative Variabili Indipendenti Nominali t-test ANOVA ANCOVA ANOVA Misure Ripetute
4 Modello Lineare Generalizzato Modello Lineare Generale Variabili dipendenti Dicotomiche Chi-quadro Regressione logistica ANOVA logistica Variabili dipendenti Multinomiali Regressione logistica multinomiale ANOVA logistica multinomiale Analisi di tabelle multidimensionali Variabili dipendenti basate su frequenze Variabili dipendenti ripetute Regressione Poisson ANOVA Poisson Equazioni di stima generalizzate
5 MLGZ Techniche volte a studiare e quantificare gli effetti di una o più variabili indipendenti continue o nominali su una variabile dipendente nominale (qualitativa) Tecniche statistiche: La regressione logistica: Variabile dipendente dicotomica La regressione ordinale: Variabile dipendente ordinabile La regressione multinomiale: Variabile dipendente multinomica La regressione di Poisson: Variabile dipendente basata su frequenze Tutto ciò, anche a misure ripetute
6 Violazioni assunzioni Quando le assunzioni non sono soddisfatte, i risultati sono da considerarsi dubbi Se la violazione delle assunzioni è grave, la regressione/anova non può essere applicata Nella pratica, con variabili dipendenti continue normalmente distribuite, queste assunzioni sono abbastanza semplici da soddisfare Ma cosa succede se volessimo usare una variabile dipendente dicotomica?
7 La regressione logistica La regressione logistica si propone di studiare e quantificare le relazioni tra una o più variabili indipendenti quantitative (es. età, salario, atteggiamento verso la birra, birre bevute) e una variabile dipendente dicotomica (es. stato civile, voto al referendum, appartenenza ad un gruppo, etc.)
8 Assunzioni e Dicotomiche Le assunzione della regressione lineare non possono essere soddisfatte nel caso di VD dicotomiche Assunzione Se VD dicotomica Linearità Non può essere lineare Omoschedasticità Sicuramente la varianza dipende dal valore predetto Normalità errori Gli errori saranno sempre distribuiti con due gobbe
9 Assunzioni regressione lineare Come si può intuire dal fatto che la regressione interpola una retta tra i punti, la relazione che stima è una relazione lineare, omoschedastica e 0 normale SORRISI BIRRE
10 Violazioni assunzioni Quando queste assunzioni non sono soddisfatte, i risultati sono da considerarsi dubbi Se la violazione delle assunzioni è grave, la regressione non può essere applicata Nella pratica, con variabili dipendenti continue normalmente distribuite, queste assunzioni sono abbastanza semplici da soddisfare Ma cosa succede se volessimo usare una variabile dipendente dicotomica?
11 VD dicotomica voto attepol
12 VD dicotomica La relazione non protrà mai essere lineare Gran parte della varianza non è spiegata I punteggi saranno necessariamente raggruppati in due rette piatte voto La retta di regressione avrà moltissimo 0.00 margine di errore attepol
13 VD Categorica Quando abbiamo una variabile dipendente dicotomca, ogni soggetto ha o o 0 come valore della variabile dipendente VD=sesso (Maschi=0, Femmine=), VD=acquisto (Si=, No=0), voto al referendum (Si=, No=0) La media della variabile dipendente è la probabilità di ottenere il valore n Y ntot Ciò che prediciamo è la probabilità p di appartenere al gruppo con valore (e -p sarà la probabilità di appartenere al gruppo 0).
14 Soluzione Necessitiamo dunque di un tipo di regressione che: Risolva il problema della omoschedasticità, linearità e normalità degli errori Ammetta valori non assurdi Ci esprima le relazioni sulla base di probabilità o qualcosa di comparabile Cioè dobbiamo usare un modello che trasformi la variabile dipendente tale da linearizzare la relazione, rendere la variabile dipendente continua, e farla variare su tutto l asse (valori positivi e negativi)
15 Soluzione: parte Intanto decidiamo di non cercare di predire la probabilità, ma il rapporto tra probabilità Tale rapporto è detto odd (rapporto di probabilita ) Pi =a b yx x i Pi P i =a b yx x i
16 Odd L odd è il rapporto tra la probabilità di un evento (appartenere ad un gruppo) rispetto alla probabilità del non evento (appartenere all altro gruppo) Odd= Pi P i Esempi: se la probabilità di avere una figlia femmina è.50.5 Odd= =.5 se la probabilità di votare Si ad un referendum è.70.7 Odd= =
17 Odd L odd indica quanto più probabile è un evento rispetto al suo complemento Pi P i Esempi: Una figlia femmina è tanto probabile quanto un maschio.5 Odd= =.5 Il voto Si è 2.33 volte più probabile del No.7 Odd= =
18 Odd: Interpretazione L odd consente di esprimere la probabilità mediante valori che variano da 0 ad infinito 000 Odd da 0 ad infinito Odd= Pi P i odd ratio Probabilità da 0 a p
19 Odd: Interpretazione L odd varia da 0 ad infinito Se gli eventi sono equiprobabili.5 p=. 5 odd = =.5 É maggiore di se l evento è più probabile del contrario.7 p=. 7 odd= = É minore di se l evento è meno probabile del contrario.2 p=. 2 odd = =.25. 2
20 Problema con odd Se usassimo gli odd come variabile dipendente, potremmo ottenere predizioni impossibili, come predizioni di valori negativi Pi P i =a b yx x i Se a=, b=3 e x=-2 Pi P i = 3 x i Pi P i = 3 2 = 5
21 Soluzione: parte 2 Decidiamo di non cercare di predire l odd, ma il logaritmo dell odd Pi P i =a b yx x i ln Pi Pi =a b yx x i La trasformazione con il logaritmo si chiama logit log it =ln Pi Pi La regressione che cerca di predire il logit si chiama regressione logistica
22 Logaritmo Il logaritmo in base A di B è quel numero a cui dobbiamo elevare A per ottenere B. Log0 00=2 0 2 =00 Spesso si usa il logaritmo naturale, cioè il logaritmo con base e o numero neperiano (da Napier che lo scoprì) o di Eulerio (che lo formulò nei termini che lo conosciamo) Ln 00 =4.605 e =00
23 Vantaggi del Logaritmo La logistica usa il logaritmo in quanto: Trasforma una variabile positiva (odd) in negativi e positivi É positivo se l argomento è maggiore di É negativo se l argomento è minore di É zero se l argomento è uguale ad
24 Perché il logaritmo? Il logaritmo di una variabile che varia da 0 ad infinito (come gli odd), varia per tutti i valori possibili, da negativi a positivi 8.00 Il logaritmo dell Odd permette di esprimere la probabilità mediante valori sia positivi che negativi 6.00 logit 4.00 p log it =ln p p
25 Trasformazione Logit Per ovviare a ciò, la regressione logistica non predice la variabile dipendente così come è, ma la trasforma Variabile Originale Odd Logit Probabilità Rapporto di probabilità Logaritmo del Odd Pi Y= P i Y =0 Appartenenza ad un gruppo Odd= Pi P i Quanto è più (o meno) probabile un gruppo rispetto all altro ln Pi Pi Variabile continua definita su tutto l asse delle Y
26 Regressione logistica La regressione logistica è una regressione in cui la variabile dipendente è dicotomica, e dunque si predice mediante una regressione lineare il logaritmo del rapporto tra la probabilità di essere in un gruppo piuttosto che l altro ln Pi Pi =a b yx x i
27 Logistica in pratica Ci proponiamo di studiare in un campione di 33 soggetti, le relazioni tra atteggiamento politico (conserv, positivo= conservatore, 0=incerto, negativo=liberal) e voto alle elezioni presidenziali americane La variabile dipendente è: 0 se ha votato Kerry se ha votato Bush Validi Totale Frequenza votobush Percentuale Percentuale valida Percentuale cumulata
28 Logistica in pratica SPSS
29 Logistica in pratica SPSS Variabile Dipendente Variabile Indipendente
30 Output: Risultati Essendo una regressione, ci aspettiamo di trovare un coefficiente B, un coefficiente costante, e un test di significatività del coefficiente Variabili nell'equazione Passo a conserv Costante B E.S a. Variabili immesse al passo : conserv. Wald df Sig Exp(B)
31 Output: Risultati Essendo una regressione, ci aspettiamo di trovare un coefficiente B, un coefficiente costante, e un test di significatività del coefficiente Test di significatività Effetto della VI Variabili nell'equazione Passo a conserv Costante B E.S Wald df Sig Exp(B) a. Variabili immesse al passo : conserv. Costante Errore standard Significatività (valore-p) Non c è il coefficiente standardizzato, ma c è exp(b)
32 Intepretazione Essendo una regressione, possiamo interpretare i coefficiente come al solito Cambiamento atteso nel logaritmo di Odd, per uno spostamento nella di una unità nella VI Variabili nell'equazione Passo a conserv Costante B E.S Wald df Sig Exp(B) a. Variabili immesse al passo : conserv. Valore atteso nel logaritmo di Odd, quando la VI è zero Significatività (valore-p): se minore di 0.05, rifiutiamo l ipotesi nulla di B=0
33 Intepretazione: Problema Il problema sta nel fatto che tutte le informazioni (come in ogni regressione) sono espresse nell unità di misura della VD Nel caso del logaritmo di Odd, questa unità è non intuitiva e poco informativa Passo a conserv Costante Variabili nell'equazione B E.S Wald df Sig Exp(B) a. Variabili immesse al passo : conserv. Per ogni unità in più di conserv, ci aspettiamo un aumento del logaritmo di Odd di.907! Ma è tanto o poco?
34 4. = Svantaggi del Logaritmo Il problema del logaritmo è che la sua unità di misura non è intuitivamente interpretabile Una differenza di.903 nella scala logaritmica è tanto o poco in termini di probabilità? Per ovviare a ciò, le quantità espresse su scala logaritmiche possono essere riportate all unità originale mediate la funzione esponenziale ln (00)=4.605 exp (4.605)=00
35 Unità più comprensibili Dato che nella logistica le informazioni sono ottenute sulla base di una VD logartmica, la funzione esponenziale le riporta all unità precedente L unità precedente è l odd ratio Odd ratio Logit Ln Pi P i In generale exp Ln exp Ln q =q Pi P i = Pi P i
36 L esponenziale La funzione esponenziale di un logaritmo ci da l argomento orginale del logaritmo X Ln(X) Exp(Ln(X))
37 Relazioni tra unità di misure Al fine interpretativo è importante ricordare che: La somma tra due logaritmi, equivale al prodotto tra gli argomenti Logit Odd ratio q= Ln a Ln b exp q =a b Ln 2 Ln 3 =. 79 exp. 79 =6 B Ln(Odd ) Ln(Odd 2 ) exp( B ) Odd * Odd 2
38 B espresso come OR Per facilitare l interpretazione, il legame tra VD e VI si esprime mediante l esponenziale di B Variabili nell'equazione Passo a conserv Costante B E.S Wald df Sig Exp(B) a. Variabili immesse al passo : conserv. Exp(B) trasforma il B espresso in scala logaritmica in un B expresso in termini di odd ratio
39 Interpretazione di exp(b) Exp(B) è il tasso con cui aumenta Odd per ogni unità della VI Cioè il tasso con cui cambia il rapporto di probabilità al variare della VI Per ogni unità in più di conserv, il rapporto di probabilità tra votare Bush e votare Kerry aumenta di 2.47 volte
40 Interpretazione di exp(costante) Exp(Costante) è l Odd atteso quanto la VI è zero Se conservatorismo è uguale a zero, ci aspettiamo un odd ratio di.4, cioè votare Bush è.42 volte più probabile che votare Kerry P votarebush =. 4 P votarekerry Se conservatorismo è uguale a zero (soggetto incerto), votare Bush o Votare Kerry sono equiprobabili
41 Interpretazione di exp(b) Exp(B) è quanto aumenta l Odd per ogni unità in più della VI Se passiamo da conservatorismo=0 a conservatorismo= (aumentiamo x di una unità), ci aspettiamo che l odd ratio aumenti di Odd x= =Odd x=0 Exp B = =2.825 Odd se X= Odd se X=0 Tasso di cambio Odd per X=
42 Ricordiamo dalla lineare Nella regressione lineare y =a b x a è il valore atteso di y per x=0 y x=0=a b è quanto dobbiamo aggiungere ad a passando da X=0 a X= y x==a b In generale, b è quanto dobbiamo aggiungere ad a passando da X a X+ y x = y x b
43 Se la scala è logaritmica Con la scala logaritmica, la sostanza è la stessa ln Odd =a b x a è il valore atteso di y per x=0 b è quanto dobbiamo aggiungere ad a passando da X=0 a X= In generale, b è quanto dobbiamo aggiungere ad a passando da X a X+ ln Odd x=0 =a ln Odd x = =a b ln Odd x =ln Odd x b
44 Relazioni tra unità di misure Ma la somma di due logaritmi equivale alla esponenziale dei prodotti degli argomenti Logit q= Ln a Ln b Odd ratio exp q =a b
45 Se la scala è riportata in OR Con la scala riportata in Odd Logit a è il valore atteso di y per x=0 Odd ratio Exp(a) è il valore atteso di Odd per x=0 ln Odd x=0 =a exp a =Odd x=0 b è quanto dobbiamo aggiungere ad a passando da X=0 a X= b è quanto dobbiamo moltiplicare a passando da X=0 a X= ln Odd x= =a b Odd x= =Odd x=0 b
46 Interpretazione di exp(b) Paragone con la regressione linerare Regressione lineare y =a b x a è il valore atteso di y per x=0 b è quanto dobbiamo aggiungere ad a passando da X=0 a X= Regressione logistica ln Odd =a b x Exp(a) è il valore atteso di Odd per x=0 Exp(b) è quanto dobbiamo moltiplicare Exp(a) passando da X=0 a X=
47 Interpretazione di exp(b) Aumentando X di, aumento in termini di logaritmo di.907 L esponenziale di.907 è Variabili nell'equazione Passo a conserv Costante B E.S Wald df Sig Exp(B) a. Variabili immesse al passo : conserv. Dunque in termini di Odd aumento di Cioè se un soggetto ha conservatorismo uguale ad, il suo Odd di votare Bush sarà volte più grande del soggetto che ha conservatorismo uguale a 0
48 Logistica in pratica (2) Ci proponiamo di studiare in un campione di 33 soggetti, le relazioni tra voto precendente (prevbush, 0=Gore, =Bush) e voto alle elezioni 2004 (votobush, 0=Kerry, =Bush) Tavola di contingenza votobush * prevbush votobush Totale voto alle elezioni 2004 Conteggio % entro prevbush Conteggio % entro prevbush Conteggio % entro prevbush prevbush % 30.0% % 70.0% % 00.0% x voto alle precendenti elezioni Totale % % %
49 Logistica in pratica (2) Concentriamoci su coloro che non hanno votato Bush alle precedenti elezioni, cioè x=0 Tavola di contingenza votobush * prevbush votobush Totale Conteggio % entro prevbush Conteggio % entro prevbush Conteggio % entro prevbush prevbush % 30.0% % 70.0% % 00.0% Totale % % % Se x=0, il 38. % vota Bush e 6.9 % vota Kerry nel Odd 0 = = Se x=0, l Odd di votare Bush è:
50 Logistica in pratica (2) Passiamo ora a coloro che hanno votaro Bush alle precendenti elezioni, cioè x= Tavola di contingenza votobush * prevbush votobush Totale Conteggio % entro prevbush Conteggio % entro prevbush Conteggio % entro prevbush prevbush % 30.0% % 70.0% % 00.0% Totale % % % Se x=, il 70.0 % vota Bush e il 30.0 % vota Kerry nel 2004 Se x=, l Odd di votare Bush è: Odd =. 70 =
51 Logistica in pratica (2) Dunque, passando da X=0 a X=, Odd di votare Bush è aumentato di 3.79 volte Tavola di contingenza votobush * prevbush votobush Totale Conteggio % entro prevbush Conteggio % entro prevbush Conteggio % entro prevbush prevbush % 30.0% % 70.0% % 00.0% Odd exp( B ) Odd 0 Totale % % %
52 Logistica in pratica (2) Dunque, grazie alle differenze in X, possiamo predire un cambiamento in Odd di 3.79 Tavola di contingenza votobush * prevbush votobush Totale Conteggio % entro prevbush Conteggio % entro prevbush Conteggio % entro prevbush prevbush % 30.0% % 70.0% % 00.0% Odd 0 =. 66 Odd =2. 33 Odd =Odd Totale % % %
53 Exp(B) La regressione logistica calcola esattamente questa predizione Variabili nell'equazione Passo a prevbush Costante B E.S Wald df Sig Exp(B) a. Variabili immesse al passo : prevbush. Se x=0, l Odd di votare Bush è: Odd 0 =. 66 Se x=, l Odd di votare Bush è: Odd =Odd 0 * Cambiamento in Odd dovuto a X
54 Quando exp(b) è minore di Proviamo ora ad invertire i gruppi e calcolare la regressione con VotoKerry come VD, cioè la medesima variabile ma con 0=vot a Bush, =voto a Kerry Variabili nell'equazione Passo a prevbush Costante B E.S Wald df a. Variabili immesse al passo : prevbush. Se x=0, l Odd di votare Kerry è: Se x=, l Odd di votare Kerry è: Odd 0 =. 625 Odd =Odd 0 *.264 Al cambiare di X, la propensione a votare Kerry diminuisce Sig Exp(B)
55 Inversione della VD Ovviamente, se prediciamo Odd di votare Bush, o Odd di votare Kerry, i risultati sono equivalenti Qui Bush= Passo a prevbush Costante Variabili nell'equazione B E.S Wald df Sig Exp(B) a. Variabili immesse al passo : prevbush. Exp B bush = = = Exp B ker ry. 264 Qui Kerry= Variabili nell'equazione Passo a prevbush Costante B E.S a. Variabili immesse al passo : prevbush. Wald df Sig Exp(B)
56 Fine Fine della lezione
Metodologie Quantitative
Metodologie Quantitative Regressione Logistica II M Q Marco Perugini Milano-Bicocca 1 La regressione logistica La regressione logistica si propone di studiare e quantificare le relazioni tra una o più
DettagliAssunzioni (Parte I)
Assunzioni (Parte I) A M D Marcello Gallucci marcello.gallucci@unimib.it Lezione 10 Modello Lineare Generale La regressione semplice e multipla e l'anova sono sottocasi del modello lineare generale (GLM)
DettagliTest non parametrici (cap. 6)
Test non parametrici (cap. 6) A M D Marcello Gallucci marcello.gallucci@unimib.it Lezione 11 Modello Lineare Generale La regressione semplice e multipla e l'anova sono sottocasi del modello lineare generale
DettagliIntroduzione all Analisi della Varianza (ANOVA)
Introduzione all Analisi della Varianza (ANOVA) Marcello Gallucci P S I C O M E T R I A marcello.gallucci@unimib.it Variabili nella Regressione Nella regressione, la viariabile dipendente è sempre quantitativa
DettagliIntroduzione all Analisi della Varianza (ANOVA)
Introduzione all Analisi della Varianza (ANOVA) AMD Marcello Gallucci marcello.gallucci@unimib.it Variabili nella Regressione Nella regressione, la viariabile dipendente è sempre quantitativa e, per quello
DettagliIl modello di regressione
Il modello di regressione Capitolo e 3 A M D Marcello Gallucci Milano-Bicocca Lezione: II Concentti fondamentali Consideriamo ora questa ipotetica ricerca: siamo andati in un pub ed abbiamo contato quanti
DettagliAssunzioni (cap. 6) Marcello Gallucci
Assunzioni (cap. 6) A M D Marcello Gallucci marcello.gallucci@unimib.it Lezione 10 Modello Lineare Generale La regressione semplice e multipla e l'anova sono sottocasi del modello lineare generale (GLM)
DettagliIl modello di regressione
Il modello di regressione Capitolo e 3 A M D Marcello Gallucci Milano-Bicocca Lezione: II Concentti fondamentali Consideriamo ora questa ipotetica ricerca: siamo andati in un pub ed abbiamo contato quanti
DettagliIl modello lineare misto
Il modello lineare misto (capitolo 9) A M D Marcello Gallucci Univerisità Milano-Bicocca Lezione: 15 GLM Modello Lineare Generale vantaggi Consente di stimare le relazioni fra due o più variabili Si applica
DettagliMISURA DELLA VARIAZIONE CONCOMITANTE (COVARIAZIONE/ CONTROVARIAZIONE) DI VARIABILI CARDINALI O QUASI- CARDINALI
ANALISI DELLA CORRELAZIONE MISURA DELLA VARIAZIONE CONCOMITANTE (COVARIAZIONE/ CONTROVARIAZIONE) DI VARIABILI CARDINALI O QUASI- CARDINALI VINCOLI CHE SI IMPONGONO ALLA SUA UTILIZZAZIONE: LA RELAZIONE
DettagliMetodologie Quantitative
Metodologie Quantitative Regressione Lineare Nozioni di base M Q Marco Perugini Milano-Bicocca 1 I COMUNICAZIONE MERCOLEDI 11 NOVEMBRE NON CI SARA LEZIONE DI MQ Concetti base Con l analisi di regressione
DettagliAnalisi Multivariata dei Dati. Regressione Multipla
Analisi Multivariata dei Dati Regressione Multipla A M D Marcello Gallucci Milano-Bicocca Lezione: III Effetti multipli Consideriamo ora il caso in cui la variabile dipendente possa essere spiegata da
DettagliAnalisi Multivariata dei Dati
Analisi Multivariata dei Dati Introduzione al corso e al modello statistico A M D Marcello Gallucci Milano-Bicocca Lezione: I Programma Odierno I numeri del corso Programma del corso Concetti Statistici
DettagliInferenza statistica II parte
Inferenza statistica II parte Marcella Montico Servizio di epidemiologia e biostatistica Test statistici II parte Variabili quantitative Caso 1 Variabile Dipendente = quantitativa Variabile Indipendente
DettagliEsercitazione. 24 Aprile 2012
Esercitazione 24 Aprile 2012 Il modello di regressione logistica viene utilizzato quando si è interessati a studiare o analizzare la relazione causale tra una variabile dipendente dicotomica e una o più
Dettagliviii Indice generale
Indice generale 1 Introduzione al processo di ricerca 1 Sommario 1 Il processo di ricerca 3 Concetti e variabili 5 Scale di misura 8 Test di ipotesi 10 Evidenza empirica 10 Disegni di ricerca 11 Sintesi
DettagliStatistica multivariata Donata Rodi 17/10/2016
Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare
DettagliRegressione Lineare Semplice e Correlazione
Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)
DettagliArgomenti della lezione:
Lezione 7 Argomenti della lezione: La regressione semplice Il modello teorico Il calcolo dei parametri Regressione lineare Esamina la relazione lineare tra una o più variabili esplicative (o indipendenti,
DettagliUniversità del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare
Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione
DettagliStatistica multivariata! Analisi fattoriale
Parte 3 : Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Statistica multivariata! Analisi
DettagliEsercizi. 1. Disegnare il grafico qualitativo della seguente funzione:
Esercizi. Disegnare il grafico qualitativo della seguente funzione: f(x) = x 2 per x 0 x per x > 0 e determinarne gli eventuali punti di massimo e minimo assoluti e relativi nell intervallo (,4]. Esercizi
DettagliL'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale
L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile Corso di Metodologia della ricerca sociale L analisi della varianza (ANOVA) La tecnica con cui si esplorano le relazioni
DettagliPsicometria con Laboratorio di SPSS 1
Psicometria con Laboratorio di SPSS 1 1-Panoramica delle tecniche: Spiegazione intuitiva vers. 1.1 (vers. 1.1, 14 marzo 2018) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università
DettagliCapitolo 12 La regressione lineare semplice
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università
DettagliPsicometria con Laboratorio di SPSS 2
Psicometria con Laboratorio di SPSS 2 Regressione lineare semplice (vers. 1.2, 20 marzo 2018) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2017-18
DettagliUniversità del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare
Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione
DettagliINDICE PARTE METODOLOGICA
INDICE PARTE METODOLOGICA 1. Il processo di ricerca 1.1.Individuazione di un problema e formulazione delle ipotesi 1.2.Individuazione e definizione operativa delle variabili 1.2.1. Le variabili definite
DettagliRegressione lineare semplice
Regressione lineare semplice Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Statistica con due variabili var. nominale, var. nominale: gruppo sanguigno - cancro
DettagliIl modello lineare misto
Il modello lineare misto (capitolo 9) A M D Marcello Gallucci Univerisità Milano-Bicocca Lezione: 11 GLM Modello Lineare Generale vantaggi Consente di stimare le relazioni fra due o più variabili Si applica
DettagliAnalisi della Varianza Fattoriale. (Cap. 8)
Analisi della Varianza Fattoriale AMD (Cap. 8) Marcello Gallucci marcello.gallucci@unimib.it Ripasso dell ANOVA Lo studio degli effetti di una serie di variabili indipendenti nominale (gruppi) su un variabile
Dettagli0 altimenti 1 soggetto trova lavoroentro 6 mesi}
Lezione n. 16 (a cura di Peluso Filomena Francesca) Oltre alle normali variabili risposta che presentano una continuità almeno all'interno di un certo intervallo di valori, esistono variabili risposta
DettagliArgomenti della lezione:
Lezione 9 Argomenti della lezione: La regressione multipla: Approcci analitici Regressione standard Regressione gerarchica Regressione statistica Strategie Analitiche per la regressione Tre principali
DettagliAnalisi avanzate della regressione: la moderazione (Cap. 5 )
Analisi avanzate della regressione: la moderazione (Cap. 5 ) AMD Marcello Gallucci marcello.gallucci@unimib.it Lezione: V Struttura delle relazioni Le relazioni possibili diventano più interessanti strutturalmente
Dettagliper togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione
Rapporti statistici di composizione la parte rispetto al tutto percentuali di derivazione per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione di frequenza (tassi) rapporti
DettagliTeoria e tecniche dei test. Concetti di base
Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi
DettagliTest non parametrici
Test non parametrici Marcello Gallucci P S I C O M E T R I A marcello.gallucci@unimib.it Modello Lineare Generale La regressione semplice e multipla e l'anova sono sottocasi del modello lineare generale
DettagliStatistica multivariata
Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Analisi multivariata Cercare di capire le relazioni
DettagliStatistica multivariata
Parte 3 : Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Analisi multivariata Cercare di capire
DettagliSTATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo
STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)
DettagliMisure Ripetute. Analisi dei dati in disegni di ricerca con misure ripetute. Marcello Gallucci
Misure Ripetute Analisi dei dati in disegni di ricerca con misure ripetute Marcello Gallucci Introduzione Consideriamo una ricerca in cui un gruppo di pazienti è sottoposto ad un trattamento terapeutico
DettagliANALISI MULTIVARIATA
ANALISI MULTIVARIATA Marcella Montico Servizio di epidemiologia e biostatistica... ancora sulla relazione tra due variabili: la regressione lineare semplice VD: quantitativa VI: quantitativa Misura la
DettagliCorrelazione e regressione
Correlazione e regressione Il termine associazione è largamente usato nella letteratura scientifica ed esprime la relazione che esiste tra due variabili Per studiare l associazione tra due variabili bisogna
DettagliTecniche statistiche di analisi del cambiamento
Tecniche statistiche di analisi del cambiamento 08-Anova con covariata (vers. 1.2, 6 dicembre 2017) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2017-18
DettagliScale Logaritmiche. Matematica con Elementi di Statistica, Anna Torre a.a
Scale Logaritmiche SCALA LOGARITMICA: sull asse prescelto (ad esempio, l asse x) si rappresenta il punto di ascissa = 0 0 nella direzione positiva si rappresentano, a distanze uguali fra di loro, i punti
DettagliUniversità del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica
Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Regressione Lineare e Correlazione Argomenti della lezione Determinismo e variabilità Correlazione Regressione Lineare
DettagliSTATISTICA. Regressione-4 ovvero Macron!
STATISTICA Regressione-4 ovvero Macron! Eravamo partiti da qui Stipendio medio orario 2013 Voto per Le Pen Stipendio medio orario (2013) [11,12) [12,13) [13,14) [14,15) [15,23] Eravamo partiti da qui Stipendio
DettagliRegressione logistica
SMID a.a. 2004/2005 Corso di Metodi Statistici in Biomedicina Regressione logistica 31/1/2005 Regressione categoriale Una delle applicazioni più utili della regressione multipla potrebbe essere quella
DettagliStatistica multivariata
Parte 3 : Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Analisi multivariata Cercare di capire
DettagliIntroduzione alla regressione multipla. Giovanni Battista Flebus Lezioni di psicometria
Introduzione alla regressione multipla Giovanni Battista Flebus Lezioni di psicometria 1 Che cos è la regressione multipla A differenza della regressione semplice, utilizza più variabili indipendenti Usa
DettagliObiettivo: confrontare due proporzioni, studiare il legame in presenza di un fattore di stratificazione
Prof.ssa G. Serio, Prof. P. Trerotoli, Cattedra di Statistica Medica, Università di Bari 1/13 Il chi-quadro di Mantel-Haenszel Obiettivo: confrontare due proporzioni, studiare il legame in presenza di
DettagliStatistica multivariata Donata Rodi 08/11/2016
Statistica multivariata Donata Rodi 08/11/2016 MANOVA: Multivariate Analysis of Variance Due o più variabili dipendenti quantitative Una o più variabili indipendenti categoriali (con più livelli) Residui
DettagliUniversità del Piemonte Orientale Corso di Laurea specialistica in Biotecnologie mediche. Corso di Statistica Medica. Correlazione
Università del Piemonte Orientale Corso di Laurea specialistica in Biotecnologie mediche Corso di Statistica Medica Correlazione Regressione Lineare Statistica Medica Correlazione e Regressione lineare
DettagliSommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25
Sommario Presentazione dell edizione italiana Prefazione xv xiii Capitolo 1 I dati e la statistica 1 Statistica in pratica: BusinessWeek 1 1.1 Le applicazioni in ambito aziendale ed economico 3 Contabilità
DettagliMetodi statistici per la ricerca sociale Capitolo 13. Combinare regressione e ANOVA: predittori categoriali e quantitativi Esercitazione
Metodi statistici per la ricerca sociale Capitolo 13. Combinare regressione e ANOVA: predittori categoriali e quantitativi Esercitazione Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni
DettagliUniversità degli Studi di Padova Facoltà di Scienze Statistiche, CL. in Astronomia
Università degli Studi di Padova Facoltà di Scienze Statistiche, CL. in Astronomia Esame di Statistica Descrittiva mod. B, Appello del 4/7/2007 CORREZIONE 1) Un azienda produce bulloni di diametro pari
DettagliElementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 13-Il t-test per campioni indipendenti vers. 1.1 (12 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di
DettagliTecniche statistiche di analisi del cambiamento
Tecniche statistiche di analisi del cambiamento 11-Anova con covariata (v. 1.3, 5 dicembre 2018) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2018-19
DettagliESERCITAZIONE: ESPONENZIALI E LOGARITMI
ESERCITAZIONE: ESPONENZIALI E LOGARITMI e-mail: tommei@dm.unipi.it web: www.dm.unipi.it/ tommei Esercizio 1 In una coltura batterica, il numero di batteri triplica ogni ora. Se all inizio dell osservazione
DettagliStrumenti di indagine per la valutazione psicologica
Strumenti di indagine per la valutazione psicologica 1.5 Correlazione e causazione Davide Massidda davide.massidda@gmail.com Metodi simmetrici vs asimmetrici Relazioni tra variabili Nei metodi di studio
Dettaglilezione 12 AA Paolo Brunori
AA 2016-2017 Paolo Brunori Interazione di - potrebbe essere che l effetto dell esperienza dipenda dal livello di istruzione stime su dati Canadesi: www.statcan.gc.ca Interazione di - in questo caso vorremmo
DettagliAnalisi della varianza
Università degli Studi di Padova Facoltà di Medicina e Chirurgia Facoltà di Medicina e Chirurgia - A.A. 2009-10 Scuole di specializzazione Lezioni comuni Disciplina: Statistica Docente: dott.ssa Egle PERISSINOTTO
DettagliPresentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii
Sommario Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii xv Parte I Statistica descrittiva 1 Capitolo 1 Introduzione 3 Perché studiare statistica? 4
DettagliPROBABILITÀ ELEMENTARE
Prefazione alla seconda edizione XI Capitolo 1 PROBABILITÀ ELEMENTARE 1 Esperimenti casuali 1 Spazi dei campioni 1 Eventi 2 Il concetto di probabilità 3 Gli assiomi della probabilità 3 Alcuni importanti
DettagliIndice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza
XIII Presentazione del volume XV L Editore ringrazia 3 1. Introduzione alla Statistica 5 1.1 Definizione di Statistica 6 1.2 I Rami della Statistica Statistica Descrittiva, 6 Statistica Inferenziale, 6
DettagliSommario. 2 I grafici Il sistema di coordinate cartesiane Gli istogrammi I diagrammi a torta...51
Sommario 1 I dati...15 1.1 Classificazione delle rilevazioni...17 1.1.1 Esperimenti ripetibili (controllabili)...17 1.1.2 Rilevazioni su fenomeni non ripetibili...18 1.1.3 Censimenti...19 1.1.4 Campioni...19
DettagliCorso di Laurea: Numero di Matricola: Esame del 31 maggio 2018 Tempo consentito: 120 minuti
Corso di Laurea: Numero di Matricola: Esame del 31 maggio 2018 Tempo consentito: 120 minuti Professor Paolo Vitale Anno Accademico 2017-8 UdA, Scuola d Economia Domanda 1 [6 punti]. (a) La multi-collineartità
DettagliLa regressione lineare semplice
La regressione lineare semplice Il modello di regressione lineare semplice - 1 y = β 0 + βx + ε 10 8 Una retta nel piano Variabile Y 6 4 2 0 0 1 2 3 4 Variabile X 1 Il modello di regressione lineare semplice
DettagliTecniche statistiche di analisi del cambiamento
Tecniche statistiche di analisi del cambiamento 07-Anova con covariata (vers. 1.0, 3 dicembre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2015-16
DettagliL A B C di R. Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010
L A B C di R 0 20 40 60 80 100 2 3 4 5 6 7 8 Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010 La scelta del test statistico giusto La scelta della analisi
DettagliAnalisi della Varianza Fattoriale
Analisi della Varianza Fattoriale AMD Marcello Gallucci marcello.gallucci@unimib.it Ripasso dell ANOVA Lo studio degli effetti di una serie di variabili indipendenti nominale (gruppi) su un variabile dipendente
DettagliRegressione Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007
Regressione Esempio Un azienda manifatturiera vuole analizzare il legame che intercorre tra il costo mensile Y di produzione e il corrispondente volume produttivo X per uno dei propri stabilimenti. Volume
DettagliSTATISTICA. Regressione-3 L inferenza per il modello lineare semplice
STATISTICA Regressione-3 L inferenza per il modello lineare semplice Regressione lineare: GRAFICO DI DISPERSIONE & & analisi residui A. Valutazione preliminare se una retta possa essere una buona approssimazione
DettagliMetodi Quantitativi per Economia, Finanza e Management. Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello
Metodi Quantitativi per Economia, Finanza e Management Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello 1. Introduzione ai modelli di regressione 2. Obiettivi 3. Le
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2017-2018 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
Dettaglilezione 4 AA Paolo Brunori
AA 2016-2017 Paolo Brunori dove eravamo arrivati - abbiamo individuato la regressione lineare semplice (OLS) come modo immediato per sintetizzare una relazione fra una variabile dipendente (Y) e una indipendente
DettagliIndice. Parte I. 2.4 Confrontare variabili numeriche tra gruppi 23 Confronto di istogrammi tra gruppi 23 Confronto delle frequenze cumulative 23
Indice Parte I Capitolo 1 Statistica e campioni 1.1 Che cos è la statistica? 2 1.2 Campionare le popolazioni 3 Popolazioni e campioni 4 Proprietà dei buoni campioni 4 Il campionamento casuale 5 Come ottenere
DettagliIndice. Parte I. 2.4 Confrontare variabili numeriche tra gruppi 23 Confronto di istogrammi tra gruppi 23 Confronto delle frequenze cumulative 23
Indice Parte I Capitolo 1 Statistica e campioni 1.1 Che cos è la statistica? 2 1.2 Campionare le popolazioni 3 Popolazioni e campioni 4 Proprietà dei buoni campioni 4 Il campionamento casuale 5 Come ottenere
DettagliComprendere i fenomeni vuol dire studiare le relazioni tra 2 o più variabili. Esiste un legame tra le variabili?
Comprendere i fenomeni vuol dire studiare le relazioni tra 2 o più variabili. Esiste un legame tra le variabili? Quale tipo di legame? Quanto forte? Siamo sicuri che non sia dovuto al caso? Tutti i modelli
DettagliAnalisi Multivariata dei Dati. Regressione Multipla (cap. 3)
Analisi Multivariata dei Dati Regressione Multipla (cap. 3) A M D Marcello Gallucci Milano-Bicocca Lezione: III Effetti multipli Il caso in cui la variabile dipendente possa essere spiegata da più di una
DettagliEsercizi di statistica
Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..
DettagliElementi di Psicometria
Elementi di Psicometria 7-Punti z e punti T vers. 1.0a (21 marzo 2011) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2010-2011 G. Rossi (Dip. Psicologia)
DettagliScale Logaritmiche. Matematica con Elementi di Statistica a.a. 2015/16
Scale Logaritmiche Scala Logaritmica: sull asse prescelto (ad esempio, l asse x) si rappresenta il punto di ascissa = 0 0 nella direzione positiva si rappresentano, a distanze uguali fra di loro, i punti
Dettagli3 5 x 25 5 x = 1 5 x (3 25) = x = 1. 5 x = x 8x 8 = 0 2 x (23 ) x. = x (2x ) 3. = x (2 x ) 3 = 0.
Anno Scolastico 014/15 - Classe 3B Soluzioni della verifica di matematica del 9 Maggio 015 Risolvere le seguenti equazioni esponenziali o logaritmiche. Dove è necessario, scrivere le condizioni di esistenza
DettagliTecniche statistiche di analisi del cambiamento
Tecniche statistiche di analisi del cambiamento 08-Analisi non parametrica (vers. 1.2, 18 dicembre 2016) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca
DettagliStatistica Applicata Corso di Laurea in Scienze Naturali a. a. 2018/2019
Statistica Applicata Corso di Laurea in Scienze Naturali a. a. 2018/2019 prof. Federico Plazzi 28 Giugno 2019 Nome: Cognome: Matricola: Alcune indicazioni: La prova è costituita da cinque esercizi; dopo
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2015-2016 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliPresentazione dell edizione italiana
Presentazione dell edizione italiana Prefazione xiii xvii 1 Introduzione 1 1.1 Statistica e medicina.......................... 1 1.2 Statistica e matematica........................ 2 1.3 Statistica ed
DettagliModelli per variabili dipendenti limitate. Amedeo Argentiero.
Modelli per variabili dipendenti limitate Amedeo Argentiero amedeo.argentiero@unipg.it Problema 1. Si desidera stimare la probabilità di accadimento di un evento (essere disoccupato, probabilità di sposarsi,
DettagliAnalisi della regressione multipla
Analisi della regressione multipla y = β 0 + β 1 x 1 + β 2 x 2 +... β k x k + u 2. Inferenza Assunzione del Modello Classico di Regressione Lineare (CLM) Sappiamo che, date le assunzioni Gauss- Markov,
Dettagli1. variabili dicotomiche: 2 sole categorie A e B
Variabile X su scala qualitativa (due categorie) modello di regressione: variabili quantitative misurate almeno su scala intervallo (meglio se Y è di questo tipo e preferibilmente anche le X i ) variabili
DettagliCORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Associazione, correlazione e dipendenza tra caratteri In un collettivo di 11 famiglie è stata
DettagliAnalisi Fattoriale Concetti introduttivi Marcello Gallucci Milano-Bicocca
Analisi Fattoriale Concetti introduttivi A M D Marcello Gallucci Milano-Bicocca Scopi generali L Analisi Fattoriale (e varianti) si propone di estrarre un numero limitato di fattori (variabili latenti
DettagliIntroduzione alla Regressione Logistica
Introduzione alla Regressione Logistica Contenuto regressione lineare semplice e multipla regressione logistica lineare semplice La funzione logistica Stima dei parametri Interpretazione dei coefficienti
DettagliTecniche statistiche di analisi del cambiamento
Tecniche statistiche di analisi del cambiamento 07-Anova con covariata (vers. 1.2, 20 marzo 2017) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2016-17
DettagliCorso di STATISTICA EGA - Classe 1 aa Docenti: Luca Frigau, Claudio Conversano
Corso di STATISTICA EGA - Classe 1 aa 2017-2018 Docenti: Luca Frigau, Claudio Conversano Il corso è organizzato in 36 incontri, per un totale di 72 ore di lezione. Sono previste 18 ore di esercitazione
DettagliTrasformazioni Logaritmiche
Trasformazioni Logaritmiche Una funzione y = f(x) può essere rappresentata in scala logaritmica ponendo Si noti che y = f(x) diventa ossia Quando mi conviene? X = log α x, Y = log α y. log α (x) = log
Dettagli