Test per la correlazione lineare
|
|
- Bruno Casati
- 7 anni fa
- Visualizzazioni
Transcript
1 10 Test per la correlazione lineare Istituzioni di Matematica e Statistica 2015/16 E. Priola 1
2 Introduzione alla correlazione lineare Problema: In base ai dati che abbiamo possiamo dire che c è una qualche relazione tra una variabile (per esempio i valori pressori) e un altra (per esempio il consumo di frutta e verdura) Il quesito riguarda due variabili quantitative (o numeriche). Evidenziamo solo due aspetti della domanda: (i) C è un grado di associazione lineare o una correlazione lineare tra il consumo di verdura e i valori pressori (correlazione lineare) (ii) All aumentare del consumo di verdura, è possibile dire come variano i livelli pressori (regressione lineare) In (i) non esiste una priorità di una variabile rispetto all altra. Invece in (ii) si dà a priori un valore di dipendenza: i livelli pressori y dipendono dal consumo di frutta e verdura x (e non viceversa). Analizziamo quindi la dipendenza di una variabile (dipendente, y) da un altra (indipendente, x). Nel seguito ci concentriamo su (i). 2
3 Campioni bivariati di dati (statistica descrittiva) Spesso ci si aspetta che due variabili numeriche abbiano una qualche correlazione lineare una con l altra. Ad esempio, ci si può aspettare (almeno approssimativamente) che il peso di un individuo abbia una correlazione lineare con la sua altezza. I dati delle due variabili che consideriamo sono sotto forma di coppie di numeri (x 1, y 1 ), (x 2, y 2 ),..., (x n, y n ) (campione bivariato di dimensione n). Ogni coppia di numeri è relativa ad un individuo. Un indice della forza dell associazione o correlazione lineare fra le due variabili è dato dal coefficiente (indice) di correlazione di Pearson: r = r XY = 1 n 1 = n xi x yi y i=1 s X s Y = cov(x, Y ) s X s Y n i=1 (x i x)(y i y) n i=1 (x n, i x) 2 i=1 (y i y) 2 3
4 Coefficiente di correlazione r (statistica descrittiva) n i=1 cov(x, Y ) = s XY = (x i x)(y i y) n 1 è detta covarianza campionaria; s X e s Y sono le dev. stand. campionarie dei campioni (x i ) e (y i ) rispettivamente, s X = n i=1 (x i x) 2, s Y = n 1 n i=1 (y i y) 2. n 1 Inoltre Quindi n i=1 x = x n i i=1, y = y i. n n n i=1 r = (x i x)(y i y) n i=1 (x n. i x) 2 i=1 (y i y) 2 Il quadrato di r si dice coefficiente di determinazione. 4
5 Coefficiente di correlazione e retta di regressione lineare Si verifica che vale sempre 1 r 1 Vale r = ±1 quando tutti i dati osservati (x i, y i ) sono allineati su una retta (perfetta correlazione lineare). Se r = ±1 i dati stanno esattamente sulla retta y = a + bx detta retta di regressione lineare. Accenniamo che risulta n i=1 b = i x)(y i y) n i=1 (x i x) 2 e a = y bx. (in particolare, r = 1 se b > 0, mentre r = 1 se b < 0). Se r è vicino a 0 i dati sono dispersi e non tendono a disporsi vicino alla retta di regressione (i dati sono approssimativamente scorrelati). Se r = 0 i dati sono scorrelati. 5
6 Osservazioni importanti su r ( 1 r 1) SCHEMA 1 0 r 0.25: debole o nessuna correlazione lineare (positiva) < r < 0.75: correlazione lineare (positiva) discreta o moderata 3 r 0.75: correlazione lineare (positiva) tra molto buono ed eccellente Stesso schema per valori di r negativi. 1 Se r > 0 si ha correlazione lineare positiva; in media al crescere del valore x i (rispetto a x) cresce anche y i (rispetto a y) 2 Se r < 0 si ha correlazione lineare negativa; in media al crescere del valore x i (rispetto a x) decresce anche y i (rispetto a y). Si noti che se r = 0 allora al crescere del valore x i (rispetto a x) può corrispondere y i che decresce (rispetto a y) oppure y i che cresce (rispetto a y). 6
7 Diagrammi per la correlazione (statistica descrittiva) Possiamo visualizzare la possibile correlazione tra 2 variabili usando i grafici o diagrammi di dispersione (detti di scatterplot) I dati sotto forma di coppie (x 1, y 1 ), (x 2, y 2 ),..., (x n, y n ) sono rappresentati con punti sul piano xy; la prima coordinata rappresenta il primo dato x i e la seconda coordinata il secondo dato y i. Possono esserci più coppie coincidenti. Si disegnano sul piano tutti i punti (x i, y i ) per vedere se essi tendono a disporsi secondo un andamento regolare. 7
8 Diagrammi I 8
9 Diagrammi II Consideriamo il consumo medio di frutta e verdura (grammi per giorno) e i valori di pressione diastolica; r = 0.01 il campione mostra che esiste una debolissima correlazione lineare positiva tra la pressione diastolica e il consumo medio di frutta e verdura. 9
10 Diagrammi III Consideriamo i valori di pressione arteriosa sistolica e diastolica; r = 0.75 il campione mostra che esiste una correlazione lineare positiva molto buona tra le variabili pressione sistolica e diastolica. 10
11 Coefficiente di correlazione in statistica inferenziale Il coefficiente di correlazione di Pearson nel caso di variabili casuali X e Y che intervengono in statistica inferenziale è indicato con ρ. Stiamo considerando due caratteri di una popolazione: un carattere della popolazione è rappresentato dalla variabile casuale X e l altro dalla variabile casuale Y. X µx ρ = ρ XY = E σ X Y µ Y σ Y dove E indica l attesa, µ X e µ Y sono le medie e σ X e σ Y sono le deviazioni standard (risp. di X e Y ). Vogliamo analizzare la relazione fra le due variabili. Non ci chiediamo se X influenzi Y o se Y influenzi X (relazione causa/effetto) ma se esiste una correlazione lineare tra le due variabili. Utilizzeremo un test di ipotesi opportuno. 11
12 Test di ipotesi Osserviamo che se X e Y sono indipendenti allora non vi e correlazione lineare tra di loro; in generale però non vale il viceversa. Il test statistico che faremo su ρ incognito (partendo da un r calcolato sul nostro campione (x 1, y 1 ), (x 2, y 2 ),..., (x n, y n )) ci permetterà di verificare se vi è una correlazione lineare fra le variabili. L ipotesi nulla H 0 è che non ci sia alcuna correlazione lineare fra X e Y (osserviamo che ciò non esclude la possibilità che ci sia una relazione di altro tipo). Quindi H 0 : ρ = 0 mentre H A : ρ = 0 (test bilaterale). Sotto la condizione di normalità per (X,Y ) (o se n è sufficientemente grande) si prova che l ipotesi nulla H 0 implica che la variabile casuale n 2 r 1 r 2. è una variabile t n 2 di Student con n 2 gradi di libertà. 12
13 Regione di accettazione Quindi se vale H 0 si ha: t n 2 = r n 2 1 r 2. dove n i=1 r = (X i X )(Y i Y ) n i=1 (X n, i X ) 2 i=1 (Y i Y ) 2 indica la variabile aleatoria che assume valori n i=1 r = (x i x)(y i y) n i=1 (x n i x) 2 i=1 (y i y) 2 x = c ( x1, x2, x3, x4, x5 ) y = c ( y1, y2, y3, y4, y5 ) r = cor ( x, y) al variare del campione casuale estratto (x 1, y 1 ), (x 2, y 2 ),..., (x n, y n ). Fissato il livello di significatività α la regione di accettazione RA del test è RA = ( t n 2, α, t 2 n 2, α ). 2 dove P(t T n 2 > t n 2, α ) = α/
14 Intervallo di confidenza Se dal nostro campione risulta che ( ) t c = r 1 r 2 n 2 = r n 2 1 r 2 ( t n 2, α 2, t n 2, α 2 ) diciamo che non possiamo rifiutare H 0 al livello di significatività α ovvero che NON c è una correlazione lineare tra X e Y. n 2 Se r 1 r ( t 2 n 2, α, t 2 n 2, α ) rifiutiamo H 2 0. Non è difficile verificare che ( ) vale se e solo se 0 IC(ρ) = 1 r r t n 2, α ES(r), r+t 2 n 2,, α ES(r) 2 ES(r) = 2 n 2. ovvero se e solo se 0 appartiene all intervallo di confidenza del coefficiente ρ. 14
15 p-value (t n 2 è variabile di Student) Possiamo anche introdurre il p-value (usando la variabile di Student t n 2 ): n 2 P Tt n 2 r 1 r 2 = p 2, r > 0, n 2 mentre P Tt n 2 r 1 r 2 = p 2, r 0. se p α rifiutiamo H 0 se p > α non rifiutiamo H 0 Se p è molto piccolo (ovvero r n 2 1 r 2 è grande in valore assoluto, ovvero r 2 è vicino a 1) abbiamo una forte evidenza contro l ipotesi H 0 ovvero una forte evidenza a favore di una correlazione lineare tra X e Y. Un p-value vicino a 1 (che comporta un r vicino a 0) indica una forte evidenza a favore del fatto che X e Y NON sono correlate (ρ = 0). 15
16 Osservazioni finali sul coefficiente di correlazione Il coefficiente di correlazione quantifica solo la relazione lineare tra X e Y ; se X e Y hanno una relazione non lineare esso non fornisce una misura valida di questa relazione. Un alta correlazione tra due variabili non implica una relazione causa-effetto. Una variabile può influenzare o essere causa delle variazioni dell altra, ma è anche possibile che qualche altra variabile o un intera moltitudine di altre variabili possa influenzare le due che sono tra loro correlate. Pertanto X e Y possono essere correlate, ma semplicemente perchè ciascuna di esse è fortemente influenzata da una terza variabile Z. 16
17 Esempio (trigliceridi e colesterolo) Esempio I E stata calcolata un alta correlazione positiva tra il numero di nidi di cicogna ed il numero di nascite nell Europa nord occidentale. Le osservazioni sono state rilevate al variare del tempo ( ). L interpretazione più sensata che si può dare è che gli aumenti di popolazione comportano un aumento nel numero delle costruzioni che quindi forniscono più spazio per la nidificazione delle cicogne. Esempio II In uno studio condotto in Italia, 10 pazienti affetti da ipertrigliceridemia sono stati sottoposti ad una dieta povera di grassi e ricca di carboidrati. Prima della dieta, sono state registrate per ciascun soggetto le misurazioni di colesterolo e di trigliceridi. 17
18 Esempio (cont.) x = c ( 5.12, 6.18, 6.77, 6.65, 6.36, 5.90, 5.48, 6.02, 10.34, 8.51 ) y = c ( 2.30, 2.54, 2.95, 3.77, 4.18, 5.31, 5.53, 8.83, 9.48, ) Calcolare il coefficiente di correlazione di Pearson r del campione ed effettuare un test per la correlazione lineare con α =
19 SOLUZIONE (I parte) Sia X la variabile casuale relativa al livello di colesterolo e Y la variabile casuale relativa al livello di trigliceridi, le medie campionarie sono: x = = 10 = y = = 10 = Allora: x i x y i y
20 SOLUZIONE (II parte) 10 i=1 10 i=1 10 i=1 (x i x) 2 = (y i y) 2 = (x i x)(y i y) = Possiamo calcolare il coefficiente di correlazione del campione: r = i=1 (x i x) 2 i=1 (x i x)(y i y) 10 i=1 (y i y) 2 = = r = cor ( x, y ) 20
21 SOLUZIONE (III parte) L ipotesi nulla è H 0 : ρ = 0 ovvvero non esiste una correlazione lineare tra le due variabili (livello di colesterolo e livello di trigliceridi). Mentre l ipotesi alternativa è H A : ρ = 0. Usiamo un t-test con 10 2 = 8 gradi di libertà. Prima calcoliamo t c = r t = r * sqrt ( 8 / (1 - r^2) ) n 2 1 r 2 = = Analizzando la tabella della distribuzione di Student osserviamo che il valore critico di t per un test bilaterale con α = 0.05 e 8 gradi di libertà è t 8,0.025 =
22 SOLUZIONE (IV parte) p-val = 2 * ( 1 - pt (t, df = 8 ) ) = α/2 α/2 p/2 p/2 t t α t α =2.306 t=3.49 Conclusione. Osserviamo che t c = 3.49 RA = ( 2.306, 2.306) dunque possiamo rifiutare H 0. In modo equivalente, il valore del p-value è inferiore ad α = 0.05: p < α. Rifiutiamo l ipotesi nulla e concludiamo che esiste una correlazione lineare tra le due variabili (livello di colesterolo e livello di trigliceridi). 22
23 Scorciatoia x = c ( 5.12, 6.18, 6.77, 6.65, 6.36, 5.90, 5.48, 6.02, 10.34, 8.51 ) y = c ( 2.30, 2.54, 2.95, 3.77, 4.18, 5.31, 5.53, 8.83, 9.48, ) cor.test( x, y ) Out[1] Pearson's product-moment correlation data: x and y t = 2.417, df = 8, p-value = alternative hypothesis: true correlation is not equal to 0 95 percent confidence interval: sample estimates: cor
24 I Esempio di prova d esame Il coefficiente di correlazione di Pearson risultante dall analisi delle variabili Età e Pulsazioni del cuore al minuto per un campione di riferimento è pari a r = 0.16 con un p-value corrispondente pari a Come si interpreta questo risultato Nell analisi statistica si utilizza un t-test oppure uno z-test SOLUZIONE In base al nostro schema il coefficiente r = 0.16 indica una debole correlazione lineare positiva tra le variabili. L ipotesi nulla H 0 del test è che la variabile Età e la variabile Pulsazioni al minuto non siano correlate. Se fissiamo il livello di significatività α = 0.05 essendo il p-value (pari a 0.13) maggiore di α NON possiamo rifiutare l ipotesi nulla; quindi in base al test non esiste una correlazione lineare tra le due variabili. Nell analisi si utilizza il t-test (precisamente, se abbiamo un campione di n individui utilizziamo la variabile di Student t n 2 con n 2 gradi di libertà). 23
25 II Esempio di prova d esame Il coefficiente di correlazione di Pearson risultante dall analisi statistica di un campione per le variabili Età in cui il soggetto ha iniziato a fumare e Durata media di una sigaretta è pari a r = 0.76, con un p-value corrispondente pari a Come si interpreta questo risultato SOLUZIONE Il coefficiente r = 0.76 indica una correlazione lineare negativa molto buona tra le variabili. L ipotesi nulla H 0 è che la variabile Età in cui il soggetto ha iniziato a fumare e la variabile Durata media di una sigaretta non siano correlate. Se fissiamo il livello di significatività α = 0.05 essendo il p-value pari a 0.03 minore di 0.05 possiamo rifiutare l ipotesi nulla e dire che esiste una correlazione lineare tra le due variabili. 24
3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17
C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica
DettagliStatistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2010/2011 Statistica Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza
DettagliEsercitazione del
Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36
DettagliSCOPO DELL ANALISI DI CORRELAZIONE
CORRELAZIONE 1 SCOPO DELL ANALISI DI CORRELAZIONE STUDIARE LA RELAZIONE TRA DUE VARIABILI X E Y 2 diagrammi di dispersione un diagramma di dispersione (o grafico di dispersione) èuna rappresentazione grafica
DettagliREGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori
REGRESSIONE lineare e CORRELAZIONE Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori Y X La NATURA e la FORZA della relazione tra variabili si studiano con la REGRESSIONE
DettagliAssociazione tra caratteri quantitativi: gli indici di correlazione
Associazione tra caratteri quantitativi: gli indici di correlazione Per correlazione si intende una relazione tra due variabili tale che a ciascun valore della prima variabile corrisponda con una certa
DettagliREGRESSIONE E CORRELAZIONE
REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri
DettagliStatistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2011/2012 Statistica Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate.
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative
DettagliCorso di Psicometria Progredito
Corso di Psicometria Progredito 5. La correlazione lineare Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014 Sommario 1 Tipi di relazione
DettagliZ-test, T-test, χ 2 -test
Z-test, T-test, χ 2 -test Francesco Corrias Chiara Todaro DIMA 13 febbraio 2012 Francesco Corrias Chiara Todaro (DIMA) Z-test, T-test, χ 2 -test 13 febbraio 2012 1 / 19 Verifica d ipotesi Definizione (Test
Dettaglii dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente
TEST DI AUTOVALUTAZIONE - SETTIMANA 6 I diritti d autore sono riservati. Ogni sfruttamento commerciale non autorizzato sarà perseguito. Metodi statistici per la biologia Parte A. La retta di regressione.2
DettagliStatistica di base per l analisi socio-economica
Laurea Magistrale in Management e comunicazione d impresa Statistica di base per l analisi socio-economica Giovanni Di Bartolomeo gdibartolomeo@unite.it Definizioni di base Una popolazione è l insieme
DettagliTest di ipotesi su due campioni
2/0/20 Test di ipotesi su due campioni Confronto tra due popolazioni Popolazioni effettive: unità statistiche realmente esistenti. Esempio: Confronto tra forze lavoro di due regioni. Popolazioni ipotetiche:
DettagliUniversità del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica
Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Regressione Lineare e Correlazione Argomenti della lezione Determinismo e variabilità Correlazione Regressione Lineare
DettagliLezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo
UIVERSITA DEGLI STUDI DI BASILICATA FACOLTA DI ECOOMIA Corso di laurea in Economia Aziendale anno accademico 2012/2013 Lezioni di Statistica del 15 e 18 aprile 2013 Docente: Massimo Cristallo LA RELAZIOE
DettagliAnalisi descrittiva: calcolando medie campionarie, varianze campionarie e deviazioni standard campionarie otteniamo i dati:
Obiettivi: Esplicitare la correlazione esistente tra l altezza di un individuo adulto e la lunghezza del suo piede e del suo avambraccio. Idea del progetto: Il progetto nasce dall idea di acquistare scarpe
DettagliLa statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci
La statistica Elaborazione e rappresentazione dei dati Gli indicatori statistici Introduzione La statistica raccoglie ed analizza gruppi di dati (su cose o persone) per trarne conclusioni e fare previsioni
DettagliEsame di Istituzioni di Matematiche II del 20 giugno 2001 (Corso di Laurea in Biotecnologie, Universitá degli Studi di Padova). Cognome Nome Matricola
Esame di Istituzioni di Matematiche II del 20 giugno 2001 (Corso di Laurea in Biotecnologie, Universitá degli Studi di Padova). Cognome Nome Matricola Es. 1 Es. 2 Es. 3 Es. 4 Somma Voto finale Attenzione:
DettagliApprossimazione normale alla distribuzione binomiale
Approssimazione normale alla distribuzione binomiale P b (X r) costoso P b (X r) P(X r) per N grande Teorema: Se la variabile casuale X ha una distribuzione binomiale con parametri N e p, allora, per N
DettagliCorso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII
Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Un breve richiamo sul test t-student Siano A exp (a 1, a 2.a n ) e B exp (b 1, b 2.b m ) due set di dati i cui
DettagliEsercitazioni di statistica
Esercitazioni di statistica Misure di associazione: Indipendenza assoluta e in media Stefania Spina Universitá di Napoli Federico II stefania.spina@unina.it 22 ottobre 2014 Stefania Spina Esercitazioni
DettagliTest d ipotesi sulla media
Test d ipotesi sulla media Silvia Parolo 12 December 2014 Riassumendo l esercitazione precedente Nella lezione precedente abbiamo visto che la media campionaria può essere un buon stimatore del valore
DettagliΣ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica
13. Regressione lineare parametrica Esistono numerose occasioni nelle quali quello che interessa è ricostruire la relazione di funzione che lega due variabili, la variabile y (variabile dipendente, in
DettagliEsercizi di Probabilità e Statistica
Esercizi di Probabilità e Statistica Samuel Rota Bulò 6 giugno 26 Statistica Esercizio Sia {X n } n una famiglia di v.a. di media µ e varianza σ 2. Verificare che X = n n X i σ 2 = n (X i µ) 2 S 2 = n
DettagliCapitolo 12. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 12.1: Suggerimento
Capitolo Suggerimenti agli esercizi a cura di Elena Siletti Esercizio.: Suggerimento Per verificare se due fenomeni sono dipendenti in media sarebbe necessario confrontare le medie condizionate, in questo
DettagliMETODO DEI MINIMI QUADRATI
METODO DEI MINIMI QUADRATI Torniamo al problema della crescita della radice di mais in funzione del contenuto di saccarosio nel terreno di coltura. Ripetendo varie volte l esperimento con diverse quantità
DettagliPROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA
PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURA/TECNICA DI ANALISI DEI DATI SPECIFICAMENTE DESTINATA A STUDIARE LA RELAZIONE TRA UNA VARIABILE NOMINALE (ASSUNTA
DettagliUniversità del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare
Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione
DettagliCorso di Laurea in Ingegneria Informatica e Automatica (M-Z) Università di Roma La Sapienza
Corso di Laurea in Ingegneria Informatica e Automatica (M-Z) Università di Roma La Sapienza CALCOLO DELLE PROBABILITÀ E STATISTICA ESAME DEL 16/06/2016 NOME: COGNOME: MATRICOLA: Esercizio 1 Cinque lettere
DettagliCORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Misura dell associazione tra due caratteri Uno store manager è interessato a studiare la relazione
DettagliSTATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo
STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)
DettagliSTATISTICA AZIENDALE Modulo Controllo di Qualità
STATISTICA AZIENDALE Modulo Controllo di Qualità A.A. 009/10 - Sottoperiodo PROA DEL 14 MAGGIO 010 Cognome:.. Nome: Matricola:.. AERTENZE: Negli esercizi in cui sono richiesti calcoli riportare tutte la
DettagliCasa dello Studente. Casa dello Studente
Esercitazione - 14 aprile 2016 ESERCIZIO 1 Di seguito si riporta il giudizio (punteggio da 0 a 5) espresso da un gruppo di studenti rispetto alle diverse residenze studentesche di un Ateneo: a) Si calcolino
DettagliCHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)
CHEMIOMETRIA Applicazione di metodi matematici e statistici per estrarre (massima) informazione chimica (affidabile) da dati chimici INCERTEZZA DI MISURA (intervallo di confidenza/fiducia) CONFRONTO CON
DettagliEsame di Statistica A-Di Prof. M. Romanazzi
1 Università di Venezia Esame di Statistica A-Di Prof. M. Romanazzi 22 Gennaio 2016 Cognome e Nome..................................... N. Matricola.......... Valutazione Il punteggio massimo teorico di
DettagliEsercitazione di Statistica Indici di associazione
Esercitazione di Statistica Indici di associazione 28/10/2015 La relazione tra caratteri Indipendenza logica Quando si suppone che tra due caratteri non ci sia alcuna relazione di causa-effetto. Indipendenza
Dettagli1.4. Siano X B(1, 1/2) e Y B(1, 1/2) variabili aleatorie indipendenti. Quale delle seguenti affermazioni é falsa? E(X + Y ) = 1 V ar(x + Y ) = 1/2
Statistica N. Crediti: Cognome: Laurea Triennale in Biologia Nome: 4 settembre 2012 Matricola: 1. Parte A 1.1. Siano x 1, x 2,..., x 10 i dati relativi al peso di 10 neonati espressi in chilogrammi e y
DettagliRingraziamenti dell Editore
Indice Elenco dei simboli e delle abbreviazioni in ordine di apparizione Ringraziamenti dell Editore XI XVII 1 Introduzione FAQ e qualcos altro, da leggere prima 1 1.1 QuestoèunlibrodiStatistica....................
DettagliIl processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni
La statistica inferenziale Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni E necessario però anche aggiungere con
DettagliCovarianza, correlazione e retta di regressione. Paola Lecca, CIBIO UNITN Corso di Matematica e Statistica 2
Covarianza, correlazione e retta di regressione Paola Lecca, CIBIO UNITN Corso di Matematica e Statistica 2 Questa presentazione è stata preparata attingendo dai seguenti testi S. M. Iacus, Statistica,
DettagliEsercizio 1 GRAFICO 1. X e Y sono indipendenti. X e Y non sono correlate. La correlazione tra X e Y è <1. X e Y sono perfettamente correlate
Esercizio 1 Osservare il grafico 1 riportato in figura che mette in relazione una variabile dipendente Y ed una variabile indipendente X e rispondere alle seguenti domande. 400 300 200 GRAFICO 1 100 0
DettagliCapitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica
Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università
DettagliEsercitazione 8 maggio 2014
Esercitazione 8 maggio 2014 Esercizio 2 dal tema d esame del 13.01.2014 (parte II). L età media di n gruppo di 10 studenti che hanno appena conseguito la laurea triennale è di 22 anni. a) Costruire un
DettagliLA RAPPRESENTAZIONE E LA SINTESI DEI DATI
Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria Civile A.A. 2009-10 Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain 1 LA RAPPRESENTAZIONE E LA SINTESI
DettagliLAUREA SPECIALISTICA IN FARMACIA - Prova scritta di MATEMATICA - 24/01/03 ANNI PRECEDENTI. 1. (Punti 10) Si consideri la funzione
MATEMATICA - 4//3 ANNI PRECEDENTI (Punti ) Si consideri la funzione ( ) f() = ln Si studi f, determinando in particolare dominio, limiti, intervalli di crescenza, decrescenza, concavità, convessità di
DettagliEsercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale)
Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale) Esercizio 1: Un indagine su 10.000 famiglie ha dato luogo, fra le altre, alle osservazioni riportate nella
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 41 Outline 1 2 3 4 5 () Statistica 2 / 41 Misura del legame Data una variabile doppia (X, Y ), la
DettagliDISTRIBUZIONE CAMPIONARIA CONGIUNTA
DISTRIBUZIONE CAMPIONARIA CONGIUNTA Finora ci siamo occupati di medie e scarti ma dobbiamo anche affrontare il problema di studiare le relazioni tra insiemi di dati. La media e la deviazione standard possono
DettagliDati campionari:media, varianza, bruchi
Dati campionari:media, varianza, bruchi Un entomologo sta studiando un bruco divoratore di foglie; esaminando 300 foglie ha trovato presenti dei bruchi, secondo i numeri riportati nella seguente tabella:
DettagliUNIVERSITÀ di ROMA TOR VERGATA
UNIVERSITÀ di ROMA TOR VERGATA Corso di Statistica, anno 2010-11 P.Baldi Lista di esercizi 3. Corso di Laurea in Biotecnologie Esercizio 1 Una v.a. X segue una legge N(2, ). Calcolare a1) P(X 1) a2) P(2
DettagliMetodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo
Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è
DettagliCapitolo 3 Sintesi e descrizione dei dati quantitativi
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 3 Sintesi e descrizione dei dati quantitativi Insegnamento: Statistica Applicata Corso di Laurea in "Scienze e tecnologie Alimentari" Unità
DettagliN.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.
N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle abelle riportate alla fine del documento. Esercizio 1 La concentrazione media di sostanze inquinanti osservata nelle acque di un fiume
DettagliEsame di Istituzioni di Matematiche II del 11 luglio 2001 (Corso di Laurea in Biotecnologie, Universitá degli Studi di Padova). Cognome Nome Matricola
Esame di Istituzioni di Matematiche II del 11 luglio 2001 (Corso di Laurea in Biotecnologie, Universitá degli Studi di Padova). Cognome Nome Matricola Es. 1 Es. 2 Es. 3 Es. 4 Somma Voto finale Attenzione:
DettagliSTATISTICHE DESCRITTIVE Parte II
STATISTICHE DESCRITTIVE Parte II INDICI DI DISPERSIONE Introduzione agli Indici di Dispersione Gamma Differenza Interquartilica Varianza Deviazione Standard Coefficiente di Variazione introduzione Una
DettagliStatistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill
Statistica - metodologie per le scienze economiche e sociali /e S Borra, A Di Ciaccio - McGraw Hill Es 6 Soluzione degli esercizi del capitolo 6 In base agli arrotondamenti effettuati nei calcoli, si possono
DettagliFACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 21/09/2011
FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 1/9/11 ESERCIZIO 1 (+3++3) La seguente tabella riporta la distribuzione di frequenza dei valori di emoglobina nel sangue (espressi
DettagliEsercitazione 4 Distribuzioni campionarie e introduzione ai metodi Monte Carlo
Esercitazione 4 Distribuzioni campionarie e introduzione ai metodi Monte Carlo 1. Gli studi di simulazione possono permetterci di apprezzare alcune delle proprietà di distribuzioni campionarie ricavate
DettagliDistribuzioni campionarie
1 Inferenza Statistica Descrittiva Distribuzioni campionarie Statistica Inferenziale: affronta problemi di decisione in condizioni di incertezza basandosi sia su informazioni a priori sia sui dati campionari
DettagliTeorema del limite centrale TCL
Teorema del limite centrale TCL Questo importante teorema della statistica inferenziale si applica a qualsiasi variabile aleatoria che sia combinazione lineare di N variabili aleatorie le cui funzioni
DettagliPROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE
PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE 1. Distribuzione congiunta Ci sono situazioni in cui un esperimento casuale non si può modellare con una sola variabile casuale,
DettagliSTATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE
STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 2 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1.1
DettagliSTATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA
Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria Civile A.A. 2009-10 Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain 1 STATISTICHE, DISTRIBUZIONI CAMPIONARIE
DettagliUNIVERSITÀ DEGLI STUDI DI PERUGIA
SIGI, Statistica II, esercitazione n. 3 1 UNIVERSITÀ DEGLI STUDI DI PERUGIA FACOLTÀ DI ECONOMIA CORSO DI LAUREA S.I.G.I. STATISTICA II Esercitazione n. 3 Esercizio 1 Una v.c. X si dice v.c. esponenziale
DettagliMatematica II: Calcolo delle Probabilità e Statistica Matematica
Matematica II: Calcolo delle Probabilità e Statistica Matematica ELT A-Z Docente: dott. F. Zucca Esercitazione # 6 1 Test ed intervalli di confidenza per una popolazione Esercizio n. 1 Il calore (in calorie
DettagliProprietà della varianza
Proprietà della varianza Proprietà della varianza Proprietà della varianza Proprietà della varianza Intermezzo: ma perché dovremmo darci la pena di studiare come calcolare la varianza nel caso di somme,
DettagliGli errori nella verifica delle ipotesi
Gli errori nella verifica delle ipotesi Nella statistica inferenziale si cerca di dire qualcosa di valido in generale, per la popolazione o le popolazioni, attraverso l analisi di uno o più campioni E
DettagliDistribuzione Normale
Distribuzione Normale istogramma delle frequenze di un insieme di misure di una grandezza che può variare con continuità popolazione molto numerosa, costituita da una quantità praticamente illimitata di
DettagliESERCIZI. Regressione lineare semplice CAPITOLO 12 Levine, Krehbiel, Berenson, Statistica II ed., 2006 Apogeo
Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università di Padova Docenti: Prof. L. Salmaso, Dott. L. Corain ESERCIZI Regressione lineare semplice
Dettaglisi tratta del test del chi-quadro di adattamento e di quello di indipendenza. 1 l ipotesi che la popolazione segua una legge fissata;
di : dado : normale Finora abbiamo visto test d ipotesi per testare ipotesi differenti, ma tutte concernenti il valore atteso di una o due popolazioni. In questo capitolo vediamo come testare 1 l ipotesi
DettagliStatistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi
Esercitazione 14 Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () 1 / 14 Ex.1: Verifica Ipotesi sulla media (varianza nota) Le funi prodotte da un certo macchinario hanno una
DettagliVariabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.
Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:
DettagliLaboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n.
5 STIMA PUNTUALE DEI PARAMETRI [Adattato dal libro Excel per la statistica di Enzo Belluco] Sia θ un parametro incognito della distribuzione di un carattere in una determinata popolazione. Il problema
DettagliStatistica Inferenziale
Statistica Inferenziale a) L Intervallo di Confidenza b) La distribuzione t di Student c) La differenza delle medie d) L intervallo di confidenza della differenza Prof Paolo Chiodini Dalla Popolazione
DettagliStatistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill
Statistica - metodologie per le scienze economiche e sociali /e S. Borra, A. Di Ciaccio - McGraw Hill Es.. Soluzione degli esercizi del capitolo 4 4. Il sistema d ipotesi è: μ 7, H : μ 7, Essendo 0 : t,
DettagliSommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25
Sommario Presentazione dell edizione italiana Prefazione xv xiii Capitolo 1 I dati e la statistica 1 Statistica in pratica: BusinessWeek 1 1.1 Le applicazioni in ambito aziendale ed economico 3 Contabilità
DettagliStatistica descrittiva: misure di associazione
Statistica descrittiva: misure di associazione L analisi di regressione permette di esplorare le relazioni tra due insiemi di valori (p.e. i valori di due attributi di un campione) alla ricerca di associazioni.
DettagliIl campionamento e l inferenza. Il campionamento e l inferenza
Il campionamento e l inferenza Popolazione Campione Dai dati osservati mediante scelta campionaria si giunge ad affermazioni che riguardano la popolazione da cui essi sono stati prescelti Il campionamento
DettagliDISTRIBUZIONE NORMALE (1)
DISTRIBUZIONE NORMALE (1) Nella popolazione generale molte variabili presentano una distribuzione a forma di campana, bene caratterizzata da un punto di vista matematico, chiamata distribuzione normale
DettagliCapitolo 6 La distribuzione normale
Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 6 La distribuzione normale Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università
DettagliDistribuzioni e inferenza statistica
Distribuzioni e inferenza statistica Distribuzioni di probabilità L analisi statistica spesso studia i fenomeni collettivi confrontandoli con modelli teorici di riferimento. Tra di essi, vedremo: la distribuzione
DettagliDISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a Prerequisiti Popolazione, unità, carattere Come nascono i dati:
DISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a. 2007-2008 Prerequisiti Popolazione, unità, carattere Come nascono i dati: osservazione e sperimentazione Popolazione: reale e virtuale Classificazione
DettagliELEMENTI DI STATISTICA
Dipartimento di Matematica U. Dini, Università di Firenze Viale Morgagni 67/A, 50134 - Firenze, Italy, vlacci@math.unifi.it A.A. 2015-16 Terminologia In un esperimento ogni risultato delle caratteristiche
DettagliProgrammazione con Foglio di Calcolo Cenni di Statistica Descrittiva
Fondamenti di Informatica Ester Zumpano Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva Lezione 5 Statistica descrittiva La statistica descrittiva mette a disposizione il calcolo di
DettagliEsercitazione 8 del corso di Statistica 2
Esercitazione 8 del corso di Statistica Prof. Domenico Vistocco Dott.ssa Paola Costantini 6 Giugno 8 Decisione vera falsa è respinta Errore di I tipo Decisione corretta non è respinta Probabilità α Decisione
DettagliStatistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione
Statistica Esercitazione alessandro polli facoltà di scienze politiche, sociologia, comunicazione Obiettivo Questa esercitazione ha l obiettivo di consolidare ulteriormente gli strumenti di analisi bivariata
DettagliLEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell
LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Strumenti statistici in Excell Pacchetto Analisi di dati Strumenti di analisi: Analisi varianza: ad un fattore Analisi
DettagliEsercitazioni di Statistica Matematica A Esercitatori: Dott. Fabio Zucca - Dott. Maurizio U. Dini Lezioni del 7/1/2003 e del 14/1/2003
Esercitazioni di Statistica Matematica A Esercitatori: Dott. Fabio Zucca - Dott. Maurizio U. Dini Lezioni del 7/1/003 e del 14/1/003 1 Esercizi 1.1 Test su media (con varianza nota) Esercizio n. 1 Il calore
DettagliCAPITOLO 11 ANALISI DI REGRESSIONE
VERO FALSO CAPITOLO 11 ANALISI DI REGRESSIONE 1. V F Se c è una relazione deterministica tra due variabili,x e y, ogni valore dato di x,determinerà un unico valore di y. 2. V F Quando si cerca di scoprire
DettagliStatistica Descrittiva III
Serie Bi-variate Statistica Descrittiva III Definizioni Serie statistiche bi-variate Rappresentazioni tabellari e grafiche Indici di posizione e di variabilità Dipendenza lineare: retta di regressione
DettagliIntervalli di confidenza
Probabilità e Statistica Esercitazioni a.a. 2006/2007 C.d.L.: Ingegneria per l Ambiente ed il Territorio, Ingegneria Civile, Ingegneria Gestionale, Ingegneria dell Informazione C.d.L.S.: Ingegneria Civile
DettagliEsame di Statistica del 14 dicembre 2007 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola
Esame di Statistica del dicembre 2007 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola Es. Es. 2 Es. 3 Es. Somma Voto finale Attenzione: si consegnano
DettagliGiorno n. clienti di attesa
Esercizio 1 Un aspetto cruciale per la qualità del servizio ai clienti in un supermercato è il cosiddetto checkout (ovvero il tempo che il cliente impiega dal momento in cui si mette in fila alla cassa
DettagliESERCITAZIONE IV - Soluzioni
umero di omicidi ESERCITAZIOE IV - Soluzioni Esercizio I. a),00 12,00 10,00 8,00 6,00 4,00 2,00 0,00 0 5 10 15 20 25 Popolazione povera (%) b) Poiché i due caratteri in analisi sono quantitativi per calcolare
DettagliStatistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill
- metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill Es. Soluzione degli esercizi del capitolo 8 home - indice In base agli arrotondamenti effettuati nei calcoli, si
DettagliTest delle ipotesi sulla media.
. Caso di un singolo campione. Varianza nota.. Ipotesi alternativa bilaterale Test delle ipotesi sulla media. Valore medio η e deviazione standard σ della popolazione note. η è il valore stimato dal nostro
DettagliGENETICA QUANTITATIVA
GENETICA QUANTITATIVA Caratteri quantitativi e qualitativi I caratteri discontinui o qualitativi esibiscono un numero ridotto di fenotipi e mostrano una relazione genotipo-fenotipo semplice I caratteri
Dettagli