Correlazione e regressione
|
|
|
- Muzio Nigro
- 8 anni fa
- Visualizzazioni
Transcript
1 SMID a.a. 2004/2005 Corso di Metodi Statistici in Biomedicina Correlazione e regressione 28/1/2005
2 Relazioni Che rapporto c'è tra la pressione arteriosa e il peso corporeo? relazione tra due variabili continue C'è un legame tra peso corporeo e complicanze cardiovascolari? una variabile continua (il peso) e una variabile nominale (incidente cerebro-vascolare: si/no) Che rapporto c'è tra sesso e rischio cardiovascolare? due variabili nominali (sesso: maschio/femmina, complicanza cardiovascolare: si/no)
3 y Variabili continue rapporto tra x e y descritto dall equazione y = a + bx la retta che x meglio interpola i a è l'intercetta (y per x = 0) dati (best fit) b la pendenza (slope) della retta operazione su un campione di dati della popolazione
4 Interpolazione Il campione fornisce una stima (non una certezza) dei parametri della popolazione per ogni valore della x esistono molti possibili valori della y che hanno una distribuzione Gaussiana il problema è trovare una intercetta e una pendenza della retta tali da minimizzare la distanza di ciascuno dei punti dalla retta Come per la varianza è conveniente elevare al quadrato le deviazioni dei punti rispetto alla retta e minimizzare la somma dei quadrati delle deviazioni metodo dei minimi quadrati o least squares method
5 y Residui Sono le deviazioni dei singoli punti dalla retta y x le deviazioni dovute alla regressione distanza delle singole y i dalla y media (cioè dalla linea orizzontale) x
6 Stima variabilità dei dati residui residui 2 dev. regr. (dev. regr.) 2-1,5 2,25-3,2 10,24 1,3 1,69 0,0 0,00-0,7 0,49-1,3 1,69 0,8 0,64 1,5 2,25-0,8 0,64 0,5 0,25 1,3 1,69 3,0 9,00 i punti possono essere più o meno distanti dalla retta residui2 = 7,40 regressione2 = 23,43 se i punti sono molto vicini esiste un rapporto stretto
7 Coefficiente di correlazione r = regressione 2 residui2 + regressione 2 detto anche coefficiente di Pearson residui = 7,40 regressione = 23,43 r = 23,24 / 30,83 = 0,76 I rapporti tra due variabili possono essere, oltre che consensuali e ascendenti rapporto diretto oppure discordanti e discendenti rapporto inverso
8 Relazione funzionale y = ,3 x peso (Kg) peso = ,3 altezza r = 0,9750 R 2 = 0,9507 altezza (cm) Utilizzo di pacchetti statistici!
9 Minimi quadrati Peso (kg) Altezze (cm) valore che minimizza la distanza (al quadrato) tra il valore y i sperimentale ed il valore y i teorico r = y = 1,1039 x R 2 =
10 Variabili ordinali Stadi di malattia, numero di individui affetti, ecc.) uso approccio diverso dal metodo dei minimi quadrati le variabili x e y vengono ordinate in serie crescenti per testare il loro accordo gerarchico (ranghi) L accordo è ideale quando al più basso valore di x corrisponde il più basso valore di y e così via fino ad arrivare ai valori massimi Coefficiente di correlazione di Spearman coincide con il coefficiente di correlazione per serie di dati >20
11 Esempio ambiguo Date le altezze (cm) di studenti verso il tipo di diploma acquisito qual è il tipo di correlazione? Altezza (cm) Correlazione nulla?! Tipo di diploma Tipo di calcolo identico sia per effettuare un'analisi di correlazione o un'analisi di regressione dei dati
12 Altra espressione Coefficiente di Pearson indica grado di correlazione r = (x i m x )(y i m y ) / (x i m x ) 2 (y i m y ) 2 Il valore di r assume tutti i numeri reali tra -1 r 1 Valori positivi di r indicano correlazione positiva Valori negativi di r indicano correlazione negativa r = 0 indica assenza di correlazione r = 1 si ha correlazione diretta completa (funzionale) r = 1 correlazione inversa completa (funzionale) Correlazione non implica relazione causale!
13 Covarianza Come si è definita la varianza di una variabile x Var(x) = (x i m x ) 2 / N si definisce covarianza di due variabili x ed y come: Cov(x, y) = (x i m x )(y i m y ) / N Varianza non è altro che la covarianza di x con x stesso Il coefficiente di correlazione r = (x i m x )(y i m y ) / (x i m x ) 2 (y i m y ) 2 Può essere quindi visto come r(x,y) = Cov(x, y) / Var(x) Var(y)
14 Validità della correlazione Pensione annua ( ) rispetto agli anni di contributi r = 0, R = 0, R buono e valido cresce costantemente all aumentare degli anni di contributi R buono ma ingannevole cresce rapidamente, ha un massimo e poi tende a decrescere
15 Correlazione Si calcola quando siamo interessati a quantificare la forza dell'associazione tra due variabili continue e la direzione del loro accordo R 2 detto coefficiente di determinazione, esprime in che misura la variabilità di una certa variabile y si associa a quella di un'altra variabile x Se r = 0.70 R 2 = = 0.49 Questo vuol dire che il 49% della variabilità di y è spiegato dalla concomitante variabilità di x stime valide solo se i valori di x sono casuali
16 Regressione In un problema di regressione le due variabili non svolgono più un ruolo simmetrico (associazione) Nella regressione lo studio consiste nella ricerca della relazione funzionale tra i valori della variabile x ed i valori medi della variabile y non è tanto la forza dell'associazione tra le due variabili quanto la stima di una variabile essendo nota l'altra che sarà ovviamente più o meno precisa in dipendenza della forza della loro correlazione
17 Uso della regressione peso = ,3 altezza peso [Kg] = 10 [Kg] + 0,3 [Kg/cm] altezza [cm] possiamo stimare che un soggetto alto 150 cm ha un peso di 55 kg e uno alto 200 cm pesi 70 Kg ci fideremo poco di questa stima se il coefficiente di correlazione è basso (ad esempio se r = 0.3) R 2 = 0.09 indica che solo il 9% della variabilità del peso è spiegata dalla variabilità dell'altezza Viceversa daremmo valore alla stima se r = 0.80 (R 2 = 0.64) o r = 0.90 (R 2 = 0.81)
18 Conclusione Correlazione e regressione non sono la stessa cosa Si può trovare un identica correlazione tra due serie di valori senza che questo implichi che le due serie di valori siano descritte da rette identiche cioè con la stessa intercetta e la stessa pendenza Viceversa noi possiamo comunque essere interessati a stimare un certo valore di y a partire da un valore dato di x ossia la regressione di y su x anche se la forza dell associazione non è elevata
19 Regressione multipla Possiamo stimare la pressione arteriosa media a partire dal peso dei pazienti e stabilire la forza di questa associazione (correlazione) Tuttavia oltre al peso corporeo, molti altri fattori possono influenzare la pressione arteriosa, ad es. il numero di sigarette fumate, l'apporto di sale, ecc Tutte queste informazioni aggiuntive indubbiamente potrebbero arricchire la precisione della stima e pertanto sarebbe riduttivo escluderle dall'analisi Se la variabile è influenzata da più variabili essa può essere stimata con la regressione multipla
20 Parametri Possiamo immaginare un'equazione analoga alla regressione lineare ma fondata su più variabili la pressione arteriosa media (PAM) può essere stimata in base al peso e al fumo Tutte queste informazioni aggiuntive indubbiamente potrebbero arricchire la precisione della stima e pertanto sarebbe riduttivo escluderle dall'analisi PAM = a + b peso + c n_sigarette a è l'intercetta della regressione multipla b e c sono i coefficienti del peso corporeo e del numero di sigarette
21 Correlazione multipla PAM a = 90 mmhg, b = 0.6 Kg, c = 0.5 sigarette peso numero sigarette un uomo che pesa 100 Kg e fuma 20 sigarette al giorno PAM = = 160 mmhg Le equazioni multiple possono avere molte variabili indipendenti e altrettanti coefficienti (b, c, d, e,.) coefficienti di regressione indicati con la lettera B i
22 Componenti multiple Nella regressione multipla la forza dell'associazione tra la variabile dipendente e le variabili indipendenti è espressa dal coefficiente di regressione multipla (R) e dal relativo coefficiente di determinazione (R 2 ) Ai singoli coefficienti di regressione che compongono l'equazione si può attribuire una significatività basta paragonare di volta in volta il coefficiente di determinazione (R 2 ) del modello (full model) con un secondo coefficiente di determinazione (R 2 ) calcolato escludendo la variabile corrispondente cioè con un modello ridotto (reduced model)
23 Verifica dei modelli Se l'r 2 non si modifica vuol dire che il coefficiente non è significativo viceversa sarà tanto più significativo quanto più si abbassa l'r 2 I valori espressi nei coefficienti di regressione consentono di predire la variabile dipendente ma non ci danno alcuna informazione sul loro peso relativo Per predire la pressione è più importante il peso o il fumo? I coefficienti di regressione sono espressi in unità di misura differenti e i loro valori non possono essere paragonati
24 Standardizzazione Per rendere paragonabili i valori dei coefficienti di regressione possiamo standardizzarli Una volta trasformati i coefficienti di regressione in coefficienti di regressione standardizzati (o beta) possiamo metterli a confronto e stabilire l'importanza relativa di ciascuna variabile indipendente Se il coefficiente standardizzato del peso corporeo è 0.2 e quello del fumo è 0.1 il peso è un determinante per la pressione arteriosa media 2 volte più importante del fumo!
25 Scelta delle variabili Un modello statistico è tanto più efficiente quanto minore è il numero di variabili indipendenti (explanatory variables) che utilizza per predire) la variabile dipendente con adeguata accuratezza Se, ad esempio, abbiamo 7 variabili indipendenti ci possiamo chiedere quali di queste 7 vale la pena introdurre nell'equazione Una variabile indipendente con una coefficiente standardizzato basso contribuisce poco alla stima della variabile dipendente e complica inutilmente l'equazione multipla
26 Costruzione dei modelli Per costruire un modello multiplo possiamo partire da una sola variabile indipendente quindi aggiungerne una seconda Se il coefficiente di determinazione (R 2 ) aumenta possiamo giudicare opportuno utilizzare anche la seconda variabile indipendente Procediamo quindi con una terza variabile e ripetiamo la stessa verifica e così via Questo modo di procedere introducendo una variabile per volta è la tecnica stepwise I dati vengono in genere presentati in tabelle
27 step variabile peso fumo sale - Tabelle di scelta R 2 0,32 0,48 0,49 - variazione 16 % 1 % - probabilità <0,01 < 0,01 n.s. Introducendo la seconda variabile l'r 2 passa da 0.32 a 0.48 (cioè l'equazione predice con accuratezza del 16% più alta la variabile dipendente) questo aumento di R 2 è significativo stop quando non c'è più guadagno in significatività -
28 Sequenza variabili Utilizzare una gerarchia predeterminata in base alla nostra conoscenza dei fenomeni oppure lasciarci guidare dal computer la forza dell'associazione espressa da un certo coefficiente standardizzato è influenzata dalle oscillazioni casuali dei dati Decidiamo di introdurre prima il peso perché il rapporto tra peso e pressione è stato largamente confermato mentre il rapporto fumo/pressione è meno certo fumatori abituali non più ipertesi dei non fumatori
29 Multicollinearità Una variabile indipendente che molto correlata alla variabile dipendente delude quando viene inserita nella regressione multipla essa si correla anche alle variabili precedentemente introdotte (multicollinearità) e per questo aggiunge poche informazioni all'equazione Se l'apporto alimentare di sale e la pressione arteriosa sono correlati tra loro l'r risulta elevato (0.5) introducendolo nel modello multiplo l'r 2 varia 1% i pazienti che introducono più sale sono anche più grassi e fumano molto e viceversa
Regressione Lineare Semplice e Correlazione
Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)
Regressione lineare semplice
Regressione lineare semplice Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Statistica con due variabili var. nominale, var. nominale: gruppo sanguigno - cancro
Statistica multivariata Donata Rodi 17/10/2016
Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare
Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica
Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Regressione Lineare e Correlazione Argomenti della lezione Determinismo e variabilità Correlazione Regressione Lineare
ANALISI MULTIVARIATA
ANALISI MULTIVARIATA Marcella Montico Servizio di epidemiologia e biostatistica... ancora sulla relazione tra due variabili: la regressione lineare semplice VD: quantitativa VI: quantitativa Misura la
Dispensa di Statistica
Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza
REGRESSIONE E CORRELAZIONE
REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.
La regressione lineare. Rappresentazione analitica delle distribuzioni
La regressione lineare Rappresentazione analitica delle distribuzioni Richiamiamo il concetto di dipendenza tra le distribuzioni di due caratteri X e Y. Ricordiamo che abbiamo definito dipendenza perfetta
Σ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica
13. Regressione lineare parametrica Esistono numerose occasioni nelle quali quello che interessa è ricostruire la relazione di funzione che lega due variabili, la variabile y (variabile dipendente, in
PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA
PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURA/TECNICA DI ANALISI DEI DATI SPECIFICAMENTE DESTINATA A STUDIARE LA RELAZIONE TRA UNA VARIABILE NOMINALE (ASSUNTA
Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII
Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Un breve richiamo sul test t-student Siano A exp (a 1, a 2.a n ) e B exp (b 1, b 2.b m ) due set di dati i cui
Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale
DIPARTIMENTO DI SCIENZE AGRARIE E AMBIENTALI PRODUZIONE, TERRITORIO, AGROENERGIA Marco Acutis [email protected] www.acutis.it CdS Scienze della Produzione e Protezione delle Piante (g59) CdS Biotecnologie
Tipi di variabili. Indici di tendenza centrale e di dispersione
Tipi di variabili. Indici di tendenza centrale e di dispersione L. Boni Variabile casuale In teoria della probabilità, una variabile casuale (o variabile aleatoria o variabile stocastica o random variable)
le scale di misura scala nominale scala ordinale DIAGNOSTICA PSICOLOGICA lezione si basano su tre elementi:
DIAGNOSTICA PSICOLOGICA lezione! Paola Magnano [email protected] si basano su tre elementi: le scale di misura sistema empirico: un insieme di entità non numeriche (es. insieme di persone; insieme
Regressione lineare. Lo studio della relazione lineare tra due variabili. X e Y caratteri entrambi quantitativi. variabile dipendente
Regressione lineare Se la correlazione misura l intensità e il segno del legame lineare tra due variabili, l obiettivo delle tecniche di regressione è, invece, quello di individuare il tipo di relazione
Statistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 1 Outline 1 () Statistica 2 / 1 Outline 1 2 () Statistica 2 / 1 Outline 1 2 3 () Statistica 2 / 1
STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo
STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)
Il modello di regressione lineare multipla. Il modello di regressione lineare multipla
Introduzione E la generalizzazione del modello di regressione lineare semplice: per spiegare il fenomeno d interesse Y vengono introdotte p, con p > 1, variabili esplicative. Tale generalizzazione diventa
La media e la mediana sono indicatori di centralità, che indicano un centro dei dati.
La media e la mediana sono indicatori di centralità, che indicano un centro dei dati. Un indicatore che sintetizza in un unico numero tutti i dati, nascondendo quindi la molteplicità dei dati. Per esempio,
R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre
R - Esercitazione 6 Andrea Fasulo [email protected] Università Roma Tre Venerdì 22 Dicembre 2017 Il modello di regressione lineare semplice (I) Esempi tratti da: Stock, Watson Introduzione all econometria
Statistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri
GENETICA QUANTITATIVA
GENETICA QUANTITATIVA Caratteri quantitativi e qualitativi I caratteri discontinui o qualitativi esibiscono un numero ridotto di fenotipi e mostrano una relazione genotipo-fenotipo semplice I caratteri
LA REGRESSIONE LINEARE NELLA RICERCA CLINICA
G Ital Nefrol 2011; 28 (1): 80-84 MASTER in epidemiologia clinica LA REGRESSIONE LINEARE NELLA RICERCA CLINICA Fabio Provenzano, Carmine Zoccali, Giovanni Tripepi CNR-IBIM, Unità di Ricerca di Epidemiologia
BLAND-ALTMAN PLOT. + X 2i 2 la differenza ( d ) tra le due misure per ognuno degli n campioni; d i. X i. = X 1i. X 2i
BLAND-ALTMAN PLOT Il metodo di J. M. Bland e D. G. Altman è finalizzato alla verifica se due tecniche di misura sono comparabili. Resta da comprendere cosa si intenda con il termine metodi comparabili
Statistica di base per l analisi socio-economica
Laurea Magistrale in Management e comunicazione d impresa Statistica di base per l analisi socio-economica Giovanni Di Bartolomeo [email protected] Definizioni di base Una popolazione è l insieme
Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria
Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata Prof. Massimo Aria [email protected] Il concetto di interpolazione In matematica, e in particolare in
Esercitazione del
Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36
Analisi Multivariata dei Dati. Regressione Multipla
Analisi Multivariata dei Dati Regressione Multipla A M D Marcello Gallucci Milano-Bicocca Lezione: III Effetti multipli Consideriamo ora il caso in cui la variabile dipendente possa essere spiegata da
Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)
Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Quesito: Posso stimare il numero di ore passate a studiare statistica sul voto conseguito all esame? Potrei calcolare il coefficiente di correlazione.
LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell
LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Strumenti statistici in Excell Pacchetto Analisi di dati Strumenti di analisi: Analisi varianza: ad un fattore Analisi
x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y )
Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 0/03 lezioni di statistica del 5 e 8 aprile 03 - di Massimo Cristallo - A. Le relazioni tra i fenomeni
REGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori
REGRESSIONE lineare e CORRELAZIONE Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori Y X La NATURA e la FORZA della relazione tra variabili si studiano con la REGRESSIONE
Test per la correlazione lineare
10 Test per la correlazione lineare Istituzioni di Matematica e Statistica 2015/16 E. Priola 1 Introduzione alla correlazione lineare Problema: In base ai dati che abbiamo possiamo dire che c è una qualche
Tra i non fumatori qual è la percentuale di non utilizzatori di sostanze stupefacenti? Scegli un'alternativa: a. 86% b. 10% c. 50% d. 25% e.
Domanda 1 Una misura di sintesi di una distribuzione si dice robusta se... a. Risulta particolarmente sensibile ai valori anomali (valori molto piccoli o molto grandi) c. Non risulta particolarmente sensibile
LA RETTA. La retta è un insieme illimitato di punti che non ha inizio, né fine.
LA RETTA La retta è un insieme illimitato di punti che non ha inizio, né fine. Proprietà: Per due punti del piano passa una ed una sola retta. Nel precedente modulo abbiamo visto che ad ogni punto del
Statistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative
STATISTICA A K (60 ore)
STATISTICA A K (60 ore) Marco Riani [email protected] http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta
Lezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo
UIVERSITA DEGLI STUDI DI BASILICATA FACOLTA DI ECOOMIA Corso di laurea in Economia Aziendale anno accademico 2012/2013 Lezioni di Statistica del 15 e 18 aprile 2013 Docente: Massimo Cristallo LA RELAZIOE
Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill
Statistica - metodologie per le scienze economiche e sociali /e S Borra, A Di Ciaccio - McGraw Hill Es 6 Soluzione degli esercizi del capitolo 6 In base agli arrotondamenti effettuati nei calcoli, si possono
Teoria e tecniche dei test
Teoria e tecniche dei test Lezione 9 LA STANDARDIZZAZIONE DEI TEST. IL PROCESSO DI TARATURA: IL CAMPIONAMENTO. Costruire delle norme di riferimento per un test comporta delle ipotesi di fondo che è necessario
Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo
Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è
Strumenti di indagine per la valutazione psicologica
Strumenti di indagine per la valutazione psicologica 1.5 Correlazione e causazione Davide Massidda [email protected] Metodi simmetrici vs asimmetrici Relazioni tra variabili Nei metodi di studio
i dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente
TEST DI AUTOVALUTAZIONE - SETTIMANA 6 I diritti d autore sono riservati. Ogni sfruttamento commerciale non autorizzato sarà perseguito. Metodi statistici per la biologia Parte A. La retta di regressione.2
SCOPO DELL ANALISI DI CORRELAZIONE
CORRELAZIONE 1 SCOPO DELL ANALISI DI CORRELAZIONE STUDIARE LA RELAZIONE TRA DUE VARIABILI X E Y 2 diagrammi di dispersione un diagramma di dispersione (o grafico di dispersione) èuna rappresentazione grafica
Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza.
Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza. Misure ripetute forniscono dati numerici distribuiti attorno ad un valore centrale indicabile con un indice (indice
PROBABILITÀ ELEMENTARE
Prefazione alla seconda edizione XI Capitolo 1 PROBABILITÀ ELEMENTARE 1 Esperimenti casuali 1 Spazi dei campioni 1 Eventi 2 Il concetto di probabilità 3 Gli assiomi della probabilità 3 Alcuni importanti
Esercizi di Ricapitolazione
Esercizio 1. Sono dati 150g di una soluzione S 1 concentrata al 12%. (a) Determinare quanti grammi di soluto occorre aggiungere a S 1 per ottenere una nuova soluzione S 2 concentrata al 20%. (b) Determinare
Statistica Descrittiva Soluzioni 7. Interpolazione: minimi quadrati
ISTITUZIONI DI STATISTICA A. A. 2007/2008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona
CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)
CHEMIOMETRIA Applicazione di metodi matematici e statistici per estrarre (massima) informazione chimica (affidabile) da dati chimici INCERTEZZA DI MISURA (intervallo di confidenza/fiducia) CONFRONTO CON
Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale)
Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale) Esercizio 1: Un indagine su 10.000 famiglie ha dato luogo, fra le altre, alle osservazioni riportate nella
Esercizi di statistica
Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..
Introduzione all Analisi della Varianza (ANOVA)
Introduzione all Analisi della Varianza (ANOVA) AMD Marcello Gallucci [email protected] Variabili nella Regressione Nella regressione, la viariabile dipendente è sempre quantitativa e, per quello
Laboratorio di Statistica 1 con R Esercizi per la Relazione. I testi e/o i dati degli esercizi contassegnati da sono tratti dai libri consigliati
Laboratorio di Statistica 1 con R Esercizi per la Relazione I testi e/o i dati degli esercizi contassegnati da sono tratti dai libri consigliati nel corso. Esercizio 1. 1. Facendo uso dei comandi
Il confronto fra medie
L. Boni Obiettivo Verificare l'ipotesi che regimi alimentari differenti non producano mediamente lo stesso effetto sulla gittata cardiaca Ipotesi nulla IPOTESI NULLA La dieta non dovrebbe modificare in
Esercitazioni di statistica
Esercitazioni di statistica Intervalli di confidenza Stefania Spina Universitá di Napoli Federico II [email protected] 10 Dicembre 2014 Stefania Spina Esercitazioni di statistica 1/43 Stefania Spina
CAPITOLO 11 ANALISI DI REGRESSIONE
VERO FALSO CAPITOLO 11 ANALISI DI REGRESSIONE 1. V F Se c è una relazione deterministica tra due variabili,x e y, ogni valore dato di x,determinerà un unico valore di y. 2. V F Quando si cerca di scoprire
Statistica multivariata
Parte 3 : Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Analisi multivariata Cercare di capire
standardizzazione dei punteggi di un test
DIAGNOSTICA PSICOLOGICA lezione! Paola Magnano [email protected] standardizzazione dei punteggi di un test serve a dare significato ai punteggi che una persona ottiene ad un test, confrontando la
Compiti tematici dai capitoli 2,3,4
Compiti tematici dai capitoli 2,3,4 a cura di Giovanni M. Marchetti 2016 ver. 0.8 1. In un indagine recente, i rispondenti sono stati classificati rispetto al sesso, lo stato civile e l area geografica
L A B C di R. Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010
L A B C di R 0 20 40 60 80 100 2 3 4 5 6 7 8 Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010 La scelta del test statistico giusto La scelta della analisi
STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE
STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 2 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1.1
Distribuzione normale
Distribuzione normale istogramma delle frequenze di un insieme di misure relative a una grandezza che varia con continuità popolazione molto numerosa, costituita da una quantità praticamente illimitata
Associazione tra caratteri quantitativi: gli indici di correlazione
Associazione tra caratteri quantitativi: gli indici di correlazione Per correlazione si intende una relazione tra due variabili tale che a ciascun valore della prima variabile corrisponda con una certa
Il modello lineare misto
Il modello lineare misto (capitolo 9) A M D Marcello Gallucci Univerisità Milano-Bicocca Lezione: 15 GLM Modello Lineare Generale vantaggi Consente di stimare le relazioni fra due o più variabili Si applica
La multicollinearità sorge quando c è un elevata correlazione tra due o più variabili esplicative.
Lezione 14 (a cura di Ludovica Peccia) MULTICOLLINEARITA La multicollinearità sorge quando c è un elevata correlazione tra due o più variabili esplicative. In un modello di regressione Y= X 1, X 2, X 3
TRACCIA DI STUDIO. Test di confronto per misure qualitative. Verifica di ipotesi
TRACCIA DI STUDIO Verifica di ipotesi Nelle analisi statistiche di dati sperimentali riguardanti più gruppi di studio (talvolta più variabili) si pone come ipotesi da verificare la cosiddetta ipotesi zero:
Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1
Statistica Capitolo 1 Regressione Lineare Semplice Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Spiegare il significato del coefficiente di correlazione lineare
Statistica Inferenziale
Statistica Inferenziale a) L Intervallo di Confidenza b) La distribuzione t di Student c) La differenza delle medie d) L intervallo di confidenza della differenza Prof Paolo Chiodini Dalla Popolazione
Covarianza, correlazione e retta di regressione. Paola Lecca, CIBIO UNITN Corso di Matematica e Statistica 2
Covarianza, correlazione e retta di regressione Paola Lecca, CIBIO UNITN Corso di Matematica e Statistica 2 Questa presentazione è stata preparata attingendo dai seguenti testi S. M. Iacus, Statistica,
Test delle Ipotesi Parte I
Test delle Ipotesi Parte I Test delle Ipotesi sulla media Introduzione Definizioni basilari Teoria per il caso di varianza nota Rischi nel test delle ipotesi Teoria per il caso di varianza non nota Test
DISTRIBUZIONE CAMPIONARIA CONGIUNTA
DISTRIBUZIONE CAMPIONARIA CONGIUNTA Finora ci siamo occupati di medie e scarti ma dobbiamo anche affrontare il problema di studiare le relazioni tra insiemi di dati. La media e la deviazione standard possono
Giorno n. clienti di attesa
Esercizio 1 Un aspetto cruciale per la qualità del servizio ai clienti in un supermercato è il cosiddetto checkout (ovvero il tempo che il cliente impiega dal momento in cui si mette in fila alla cassa
LA DISTRIBUZIONE NORMALE (Vittorio Colagrande)
LA DISTRIBUZIONE NORMALE (Vittorio Colagrande) Allo scopo di interpolare un istogramma di un carattere statistico X con una funzione continua (di densità), si può far ricorso nell analisi statistica alla
PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE
Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) PROBABILITÀ SCHEDA
Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni
La statistica inferenziale Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni E necessario però anche aggiungere con
0 altimenti 1 soggetto trova lavoroentro 6 mesi}
Lezione n. 16 (a cura di Peluso Filomena Francesca) Oltre alle normali variabili risposta che presentano una continuità almeno all'interno di un certo intervallo di valori, esistono variabili risposta
Intervallo di fiducia del coefficiente angolare e dell intercetta L intervallo di fiducia del coefficiente angolare (b 1 ) è dato da:
Analisi chimica strumentale Intervallo di fiducia del coefficiente angolare e dell intercetta L intervallo di fiducia del coefficiente angolare (b 1 ) è dato da: (31.4) dove s y è la varianza dei valori
Questo calcolo richiede che si conoscano media e deviazione standard della popolazione.
Università del Piemonte Orientale Corso di laurea in biotecnologie Corso di Statistica Medica La distribuzione t - student 1 Abbiamo visto nelle lezioni precedenti come il calcolo del valore Z, riferito
Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva
Fondamenti di Informatica Ester Zumpano Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva Lezione 5 Statistica descrittiva La statistica descrittiva mette a disposizione il calcolo di
Esercitazioni di statistica
Esercitazioni di statistica Misure di associazione: Indipendenza assoluta e in media Stefania Spina Universitá di Napoli Federico II [email protected] 22 ottobre 2014 Stefania Spina Esercitazioni
Lezione n. 1 (a cura di Irene Tibidò)
Lezione n. 1 (a cura di Irene Tibidò) Richiami di statistica Variabile aleatoria (casuale) Dato uno spazio campionario Ω che contiene tutti i possibili esiti di un esperimento casuale, la variabile aleatoria
METODO DEI MINIMI QUADRATI
METODO DEI MINIMI QUADRATI Torniamo al problema della crescita della radice di mais in funzione del contenuto di saccarosio nel terreno di coltura. Ripetendo varie volte l esperimento con diverse quantità
