STATISTICA BIVARIATA: ALCUNI STIMOLI DI APPROFONDIMENTO (Tecn. Lab. Biomedico e Tecn. Fisiop. e Perfus. Cardiovascolare 3 Anno)

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "STATISTICA BIVARIATA: ALCUNI STIMOLI DI APPROFONDIMENTO (Tecn. Lab. Biomedico e Tecn. Fisiop. e Perfus. Cardiovascolare 3 Anno)"

Transcript

1 STATISTICA BIVARIATA: ALCUNI STIMOLI DI APPROFONDIMENTO (Tecn. Lab. Biomedico e Tecn. Fisiop. e Perfus. Cardiovascolare 3 Anno) 1) ASSOCIAZIONE TRA DUE CARATTERI RISCHIO RELATIVO E ODDS RATIO In uno studio retrospettivo 1, mirato a verificare se il consumo di caffè influenzi il rischio di infarto del miocardio, sono stati raccolti i dati su pazienti residenti in una cittadina. Il consumo di caffè è stato classificato come basso ( 3 tazzine al giorno) o alto (> 3 tazzine al giorno). I risultati sono mostrati in tabella. infarto si infarto no consumo di caffè consumo di caffè basso alto basso alto Si vuole valutare l incidenza di infarto nei consumatori di caffè (alto/basso) e se l alto consumo di caffè aumenti il rischio di infarto rispetto al basso consumo. Si costruisce anzitutto la tabella x: caffè alto caffè basso totale Si possono condurre, quindi, i seguenti passi di analisi. A) Esame delle proporzioni di infarto nei due gruppi (alto/basso): p a = 78/1400 = 5.6% p b = 48/135 = 3.4%. Differenza = p a p b =.% : nel gruppo caffè alto c è il.% in più di eventi rispetto al gruppo caffè basso. Rischio relativo = RR = p a /p b = 1.65: nel gruppo caffè alto c è un rischio di circa 1.6 volte superiore di avere l infarto rispetto all altro gruppo; il rischio relativo è una misura del grado di associazione tra evento e gruppo e risulta tanto più elevato (superiore a 1) quanto più l evento è associato al gruppo. Variazione percentuale = RR 1 = (p a p b )/p b = 65%: nel gruppo caffè alto si rileva un 65% in più di rischio di infarto rispetto all altro gruppo. B) Test χ per l analisi di associazione tra infarto e consumo caffè: si sottopone a verifica l'ipotesi che non esista associazione tra consumo di caffè ed insorgenza dell infarto. 1 In questi tipi di studio lo sperimentatore inizia raccogliendo i cosiddetti casi, ossia gli individui che presentano la malattia in studio, e sceglie un adatto gruppo di paragone o di controllo che comprenderà individui sani. 1

2 H 0 : non esiste associazione (la proporzione di persone che si sono ammalate nel gruppo caffè alto è uguale alla proporzione di coloro che si sono ammalati nel gruppo caffè basso). H 1 : esiste un'associazione (la proporzione di persone che si sono ammalate nel gruppo caffè alto è diverso da quella di coloro che si sono ammalati nell altro gruppo). La tabella delle frequenze teoriche è la seguente: Si ottiene: caffè alto caffè basso totale χ = (78 63) /63 + ( ) / (48 63) /63 + ( ) /1337 = 7.48 p-value = <0.01. Si rifiuta allora l ipotesi H 0 che le proporzioni di persone che hanno avuto l infarto sono uguali nei due gruppi caffè alto e caffè basso e si è portati a concludere per un associazione statisticamente significativa tra infarto e consumo di caffè. C) Odds Ratio Considerato un evento di probabilità p, l Odds dell evento è definito dalla quantità: Nel caso di tabelle x: Odds = p/(1 p). si definisce l Odds Ratio come: evento si evento no totale gruppo 1 a b a+b gruppo c d c+d totale a+c b+d n Poiché il rischio relativo RR è dato da: p1 (1 p1) p1(1 p ) ad OR = = =. p (1 p ) p (1 p ) bc 1 P robab(even to nel gruppo RR = P robab(even to nel gruppo Risulta (nel caso di evento raro): 1) ) a (a + b) = c (c + d a b ad Probab(eve nto nel gruppo 1) OR = =. c d bc Probab(eve nto nel gruppo )

3 L OR è una misura di associazione tra caratteri qualitativi dicotomici e si usa negli studi retrospettivi (caso-controllo) per una stima del rischio di evento tra due gruppi. Così, in situazioni reali, si è spesso in presenza di un evento (ad es. malattia) e di un fattore di rischio (o un trattamento) dicotomizzato in gruppi e si intende misurare il rischio di evento di uno dei due gruppi rispetto all altro. Una valore dell OR maggiore di 1 indica un aumento di rischio, un valore vicino a 1 si riferisce a nessuna differenza, mentre per un valore inferiore a 1 c è diminuzione di rischio. Si può determinare anche l intervallo di confidenza (IC) per l OR (ad es. al livello di confidenza del 95%), partendo dal fatto che il suo errore standard è dato da: SE(ln(OR)) = Calcolate le quantità : a b c d inf = ln(or) 1.96 SE(ln(OR)) e sup = ln(or)+1.96 SE(ln(OR)), l estremo inferiore e quello superiore dell intervallo di confidenza sono dati da: estremo inferiore IC 95% = exp(inf) e estremo superiore IC 95% = exp(sup) Nel problema inizialmente posto: caffè alto caffè basso totale OR = (78 135)/(48 13) = E si determina, poi, l intervallo di confidenza al 95%: ln(or)=ln(1.66)=0.508 SE(ln(OR))= 1 / /13 + 1/ /135 = inf = ln(or) 1.96 SE(ln(OR)= =0.140 sup = ln(or)+1.96 SE(ln(=R)= =0.875 estremo inferiore IC = exp(inf) = exp(0.140)=1.15 estremo superiore IC = exp(sup) = exp(0.875)=.40 OR=1.66, IC 95%: [1.15;.40]. Pertanto il consumo di caffè risulta associato con il rischio di sviluppare infarto del miocardio; l OR=1.66 indica che chi fa un alto consumo di caffè ha un rischio 1.66 volte più alto di avere l infarto rispetto a chi fa un basso consumo di caffè. L intervallo di confidenza [1.15;.40] non contiene l unità e quindi, anche con l analisi dell OR, si può dire che l associazione risulta statisticamente significativa. Il simbolo ln che compare nelle formule indica il logaritmo in base il numero di Nepero. 3

4 ) ASSOCIAZIONE TRA DUE CARATTERI FATTORI CONFONDENTI Quando si analizza la relazione tra un fattore di esposizione (o un trattamento) ed una malattia, un fattore confondente è un terzo carattere che è indipendentemente associato all esposizione ed è anche un fattore di rischio per la malattia. La presenza di un fattore confondente può alterare l associazione osservata tra esposizione ed evento. Ad esempio, nel caso del problema analizzato in 1), si supponga che il ricercatore abbia stratificato i soggetti in fumatori e non fumatori, ottenendo i seguenti risultati: infarto si infarto no consumo caffè consumo caffè basso alto basso alto fumatori non fumatori Calcolando l incidenza di infarto e l OR nei i gruppi (fumatori e non) per valutare l impatto dell alto consumo di caffè sul rischio di infarto, si ottiene: fumatori caffè alto caffè basso totale incidenza infarto = 98/1400 = 7% OR F = 1 IC 95%: [0.63; 1.58] non fumatori caffè alto caffè basso totale incidenza infarto = 8/1400 = % OR NF = 1 IC 95%: [0.43;.9] Pertanto, il fumo è un fattore confondente per l infarto in relazione al consumo di caffè: chi fuma tende anche a bere più caffè di chi non fuma e il fumo è un fattore di rischio per l infarto. Il caffè non ha influenza sull infarto e l associazione che si osserva è solo dovuta al confondimento del fumo. Tale conclusione viene rafforzata attraverso l analisi di associazione tra infarto e fumo: fumatori non fumatori totale χ = 40.7 p= (altamente significativo) OR = 3.69 IC 95%: [.41; 5.65]. 4

5 3) SIGNIFICATIVITÀ DELLA RETTA DI REGRESSIONE Esempio 1 In tabella sono riportati i valori assunti dai due caratteri quantitativi età (ETÀ) e pressione sistolica (PAS) misurati in un campione di 8 soggetti: soggetto ETÀ (anni) PAS (mmhg) La semplice rappresentazione grafica dei valori osservati e della retta di regressione fornisce alcune indicazioni importanti per l'interpretazione delle relazioni esistenti tra i due caratteri PAS (variabile Y) ed ETÀ (variabile X). I parametri a e b della retta di regressione Y = b X + a si stimano attraverso il principio dei minimi quadrati e risulta: b = CODEV(X, Y) DEV(X) DEV(X)= (x i x) n i= 1 i= 1 e a = y b x, CODEV(X,Y) = (x i x)(yi y). Pertanto: Interpretando i valori dei coefficienti della retta di regressione si può dire: n b= 1.54 e a = l aumento medio della pressione è di circa b=1.5 mmhg per l aumento di un anno di età. alla nascita il valore della pressione sarebbe (!) di a=68.75 mmhg, ma questa è una indicazione teorica perché non è possibile stimare il valore della pressione arteriosa per età fuori del range considerato ( 81 aa). Il valore del coefficiente di regressione b indica di quanto aumenta in media la variabile dipendente Y all'aumento di una unità della variabile indipendente X. Con il metodo dei minimi quadrati è sempre possibile ottenere la retta che meglio si adatta ai dati rilevati, indipendentemente dalla dispersione dei punti intorno alla retta. Tuttavia il semplice calcolo della retta non è affatto sufficiente ai fini dell analisi statistica. 5

6 La retta potrebbe indicare: una relazione reale tra le due variabili, se il valore di b è alto e la dispersione dei punti intorno alla retta è ridotta; relazione casuale o non significativa, quando la dispersione dei punti intorno alla retta è aprossimativamente uguale a quella intorno alla media. La figura che segue esprime alcune situazioni di dipendenza o meno. Il coefficiente b della retta di regressione, che determina appunto la quantità di variazione di Y per ogni unità aggiuntiva di X, è calcolato da osservazioni sperimentali. Ciò che tuttavia interessa al ricercatore è la relazione esistente nella popolazione, e sebbene il valore di b sia differente da zero, non è detto che nella popolazione al variare di X si abbia una variazione di Y. La significatività del coefficiente di regressione nella popolazione (β) può essere saggiata mediante la verifica dell ipotesi nulla: H 0 : β= 0. Accettando H 0 si assume che il valore reale del coefficiente angolare sia β= 0, dunque al variare di X, Y resta costante e uguale al valore dell'intercetta a, pertanto non esiste alcun legame tra X e Y. Rifiutando H 0, si accetta l ipotesi alternativa H 1 : β 0. Dunque al variare di X si ha una corrispondente variazione sistematica di Y. Un metodo per la verifica della significatività della retta calcolata è il test F di Fisher-Snedecor, che si basa sulla scomposizione delle devianze. La somma dei quadrati delle distanze tra i tre punti y i, ŷ i e y definiscono le tre devianze: devianza totale, devianza della regressione o devianza dovuta alla regressione, devianza d'errore o devianza residua: n devianza totale = (y y) i= 1 i n devianza di regressione = ( ŷ y) i= 1 i n devianza residua = (y i= 1 i ŷ ) i devianza totale = devianza di regressione + devianza residua 6

7 Dividendo la devianza di regressione e quella residua per i relativi gradi di libertà (1 ed n 1 gdl rispettivamente) si stimano la varianza di regressione e la varianza residua. Il rapporto: Varianza di Regression e Varianza Residua determina il valore del test F di Fisher con 1 e n gdl (indicato con F (1,n-) ). Senza entrare nel merito della trattazione della distribuzione di tale statistica, si tenga semplicemente presente che per applicare la metodologia del test F si può far riferimento alle Tavole della F : Se l F calcolato sui dati campionari è inferiore a quello tabulato (per il prefissato valore di probabilità e i gradi di libertà corrispondenti) l ipotesi nulla H 0 non può essere rifiutata (non esiste regressione lineare statisticamente significativa). Se l F calcolato supera quello tabulato si rifiuta l'h 0 e si accetta H 1 (la regressione lineare tra le due variabili è significativa). Se β=0, la varianza dovuta alla regressione e quella residua sono stime indipendenti e non viziate della variabilità dei dati. Se β 0, la varianza residua è una stima non viziata della variabilità dei dati, mentre la varianza dovuta alla regressione è stima di una grandezza maggiore della varianza residua. Di conseguenza. il rapporto tra le due varianze è da ritenersi utile alla verifica dell'ipotesi β=0. Si tenga comunque presente che rifiutare H 0 : non significa che non esiste relazione tra le due variabili, ma solamente che non esiste una relazione di tipo lineare; significa che potrebbe esistere una relazione di tipo differente, come quella curvilinea di secondo grado o di grado superiore. La trasformazione di uno o di entrambi gli assi è spesso sufficiente per ricondurre una relazione di tipo curvilineo a quella lineare: la crescita esponenziale di una popolazione nel tempo, generata da tassi costanti, diviene lineare con la trasformazione logaritmica del tempo, usualmente riportato sull'asse delle ascisse; la relazione curvilinea tra lunghezza e peso di individui della stessa specie diviene lineare con la trasformazione mediante radice cubica del peso, correlato linearmente al volume; l'analisi statistica permette qualsiasi tipo di trasformazione che determini una relazione lineare tra due variabili Tornando all esempio 1, supposto che il campione estratto dalla popolazione oggetto di studio sia significativo, con le tecniche dell inferenza statistica occorre verificare: se la retta può essere assunta come rappresentativa di una relazione lineare tre le due variabili; se è corretto affermare che, nella popolazione di riferimento, ad una variazione di età corrisponde un cambiamento lineare della pressione sistolica; se, mediante il test F, β=0 (ipotesi H 0 ) oppure β 0 (ipotesi H 1 ). Si calcola la seguente tabella: Devianza gdl Varianza Regressione Residua Totale

8 F (1,6) = In merito alla valutazione del risultato si può dire: = il valore critico riportato nelle tavole di F per 1 e 6 gdl e per un livello di significatività α=0.01 è pari a 13.75; il valore calcolato di F è superiore a quello critico; si rifiuta H 0 : si può supporre un rapporto lineare tra le variazioni di età e pressione sistolica. La stima della significatività della retta (verifica dell'esistenza di una relazione lineare tra le variabili) può essere condotta anche con il test t di Student, con risultati equivalenti al test F. Il test t è : fondato su calcoli didatticamente meno evidenti di quelli del test F, ma offre il vantaggio di poter essere applicato sia in test unilaterali (β>0 oppure β<0) che in test bilaterali (β 0); basato sul rapporto tra il valore del coefficiente di regressione b (che rappresenta la risposta media di Y ai diversi valori di X entro il suo intervallo di variazione) ed il suo errore standard SE(b) dato da: SE(b) = Varianza Residua DEV(X) e utilizza la statistica: b β t (n-) = = F (1,n ) SE(b) dove β è il valore atteso e i gdl sono n. Coefficiente Errore Standard t Significatività Constante ETÀ Si evidenzia anche in tal modo un rapporto lineare significativo tra le variazioni di età e pressione sistolica. Utilizzando il software R, dopo aver introdotto i caratteri ETA e PAS e costruito il modello lineare: > ETA=c(,8,35,47,51,56,67,81) > PAS=c(131,114,11,111,130,145,176,17) > mod=lm(pas~eta) attraverso il comando: anova(mod) si ottiene: Df Sum Sq Mean Sq F value Pr(>F) ETA ** Residuals dove Df indica i gdl, Sum Sq le devianze, Mean Sq le varianze e Pr(>F) il p-value, essendo quest ultimo minore di 0.01 si rifiuta l H 0. Col comando summary(mod) si ottengono i coefficienti del modello regressivo ma anche valori del coefficiente di determinazione R-squared, che, per i dati in esame, permette di propendere per la bontà del modello. 8

9 Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) * ETA ** Multiple R-squared: , Adjusted R-squared: In ogni caso va osservato che l esempio proposto ha una funzione esclusivamente didattica e che senza dubbio una inferenza con un numero di dati così eseguo ha scarso significato applicativo. Di seguito sono proposte altre due applicazioni della regressione, con alcuni risultati, lasciando al lettore l opportunità di commentare i risultati. Esercizio n. X = Consumo pro-capite di tabacco per sigarette (kg/anno), Y = Quoziente di mortalità per tumore maligno della laringe, trachea, bronchi e polmoni (per abitanti) Anni X Y Sempre attraverso l utilizzo di R si ottengono i risultati del test F ed i coefficienti b ed a: Df Sum Sq Mean Sq F value Pr(>F) X e-05 *** Residuals Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) * X e-05 *** Multiple R-squared: 0.885, Adjusted R-squared: Si può dire che qualora il consumo annuo di tabacco pro-capite aumenti di 1 kg si avrà, mediamente, un aumento di circa 9/ della mortalità nella popolazione analizzata. 10 Analisi dei residui 9, Decessi per ab ,1, Y = X,3,4,5,6 R = 0.94 Rsq = 0.88,7,8 Residui relativi (residui/decessi osservati),1 0,0 -,1 -, Consumo tabacco (kg/anno) Decessi stimati dal modello 9

10 Esempio 3 Studio della relazione tra Capacità Vitale CV (=volume massimo di aria che è possibile contenere nei polmoni dopo un inspirazione profonda) di un campione di fumatori rispetto al numero di sigarette fumate giornalmente dagli stessi. Soggetto N Sigarette (X) CV (l aria) (Y) Ecco i risultati in R: Df Sum Sq Mean Sq F value Pr(>F) Sigarette e-09 *** Residuals Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e-15 *** Sigarette e-09 *** Multiple R-squared: , Adjusted R-squared: 0.93 Il valore b = 0.5 indica che ogni sigaretta in più fumata comporta in media una diminuzione di capacità vitale pari a 0.5 l. L intercetta a = 6.99 rappresenta il valore medio di CV per i non fumatori. 10

RELAZIONE TRA DUE VARIABILI QUANTITATIVE

RELAZIONE TRA DUE VARIABILI QUANTITATIVE Lezione IX: Regressione e Correlazione Cattedra di Biostatistica Dipartimento di Scienze Biomediche, Università degli Studi G. d Annunzio di Chieti Pescara Prof. Enzo Ballone RELAZIONE TRA DUE VARIABILI

Dettagli

RELAZIONE TRA DUE VARIABILI QUANTITATIVE

RELAZIONE TRA DUE VARIABILI QUANTITATIVE RELAZIONE TRA DUE VARIABILI QUANTITATIVE Quando si considerano due o più caratteri (variabili) si possono esaminare anche il tipo e l'intensità delle relazioni che sussistono tra loro. Nel caso in cui

Dettagli

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli. Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:

Dettagli

Test F per la significatività del modello

Test F per la significatività del modello Test F per la significatività del modello Per verificare la significatività dell intero modello si utilizza il test F Si vuole verificare l ipotesi H 0 : β 1 = 0,, β k = 0 contro l alternativa che almeno

Dettagli

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Regressione Lineare e Correlazione Argomenti della lezione Determinismo e variabilità Correlazione Regressione Lineare

Dettagli

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE La presentazione dei dati per molte ricerche mediche fa comunemente riferimento a frequenze, assolute o percentuali. Osservazioni cliniche conducono sovente

Dettagli

Statistica. Lezione 8

Statistica. Lezione 8 Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 8 a.a 2011-2012 Dott.ssa Daniela

Dettagli

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è

Dettagli

Statistica multivariata Donata Rodi 17/10/2016

Statistica multivariata Donata Rodi 17/10/2016 Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare

Dettagli

Prova Scritta di METODI STATISTICI PER L AMMINISTRAZIONE DELLE IMPRESE (Milano, )

Prova Scritta di METODI STATISTICI PER L AMMINISTRAZIONE DELLE IMPRESE (Milano, ) Università degli Studi di Milano Bicocca Scuola di Economia e Statistica Corso di Laurea in Economia e Amministrazione delle Imprese (ECOAMM) Prova Scritta di METODI STATISTICI PER L AMMINISTRAZIONE DELLE

Dettagli

Prof.ssa G. Serio, Prof. P. Trerotoli, Cattedra di Statistica Medica, Università di Bari 1/16. Malato vs non malato. Esposto vs non esposto

Prof.ssa G. Serio, Prof. P. Trerotoli, Cattedra di Statistica Medica, Università di Bari 1/16. Malato vs non malato. Esposto vs non esposto Prof.ssa G. Serio, Prof. P. Trerotoli, Cattedra di Statistica Medica, Università di Bari 1/16 Malato vs non malato Esposto vs non esposto Quanti sono stati esposti? Quanti si ammalano? Prof.ssa G. Serio,

Dettagli

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17 C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica

Dettagli

Σ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica

Σ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica 13. Regressione lineare parametrica Esistono numerose occasioni nelle quali quello che interessa è ricostruire la relazione di funzione che lega due variabili, la variabile y (variabile dipendente, in

Dettagli

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE 1 STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE La presentazione dei dati per molte ricerche mediche fa comunemente riferimento a frequenze, assolute o percentuali. Osservazioni cliniche conducono

Dettagli

Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale

Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale DIPARTIMENTO DI SCIENZE AGRARIE E AMBIENTALI PRODUZIONE, TERRITORIO, AGROENERGIA Marco Acutis marco.acutis@unimi.it www.acutis.it CdS Scienze della Produzione e Protezione delle Piante (g59) CdS Biotecnologie

Dettagli

Errori (o bias) negli studi epidemiologici

Errori (o bias) negli studi epidemiologici Errori (o bias) negli studi epidemiologici Errore casuale o random: sono i più pericolosi perché i più difficili da individuare e per questo motivo non è possibile tenerne conto in fase di analisi Variazione

Dettagli

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi) CHEMIOMETRIA Applicazione di metodi matematici e statistici per estrarre (massima) informazione chimica (affidabile) da dati chimici INCERTEZZA DI MISURA (intervallo di confidenza/fiducia) CONFRONTO CON

Dettagli

Statistica Applicata all edilizia: il modello di regressione

Statistica Applicata all edilizia: il modello di regressione Statistica Applicata all edilizia: il modello di regressione E-mail: orietta.nicolis@unibg.it 27 aprile 2009 Indice Il modello di Regressione Lineare 1 Il modello di Regressione Lineare Analisi di regressione

Dettagli

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill Statistica - metodologie per le scienze economiche e sociali /e S. Borra, A. Di Ciaccio - McGraw Hill Es.. Soluzione degli esercizi del capitolo 4 4. Il sistema d ipotesi è: μ 7, H : μ 7, Essendo 0 : t,

Dettagli

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione

Dettagli

p = p q OR = p q Misura l esistenza di una malattia. E legato alla incidenza in quanto - Prevalenza = Incidenza x tempo medio di durata della malattia

p = p q OR = p q Misura l esistenza di una malattia. E legato alla incidenza in quanto - Prevalenza = Incidenza x tempo medio di durata della malattia - Prevalenza (prevalence) è una misura della proporzione di persone ammalate in un certo periodo. Può essere misurata in modo puntiforme (point prevalence) oppure su un periodo (period prevalence). - Prevalenza

Dettagli

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Un breve richiamo sul test t-student Siano A exp (a 1, a 2.a n ) e B exp (b 1, b 2.b m ) due set di dati i cui

Dettagli

ANALISI MULTIVARIATA

ANALISI MULTIVARIATA ANALISI MULTIVARIATA Marcella Montico Servizio di epidemiologia e biostatistica... ancora sulla relazione tra due variabili: la regressione lineare semplice VD: quantitativa VI: quantitativa Misura la

Dettagli

i dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente

i dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente TEST DI AUTOVALUTAZIONE - SETTIMANA 6 I diritti d autore sono riservati. Ogni sfruttamento commerciale non autorizzato sarà perseguito. Metodi statistici per la biologia Parte A. La retta di regressione.2

Dettagli

Casa dello Studente. Casa dello Studente

Casa dello Studente. Casa dello Studente Esercitazione - 14 aprile 2016 ESERCIZIO 1 Di seguito si riporta il giudizio (punteggio da 0 a 5) espresso da un gruppo di studenti rispetto alle diverse residenze studentesche di un Ateneo: a) Si calcolino

Dettagli

Esempio di calcolo di rischio relativo

Esempio di calcolo di rischio relativo Esempio di calcolo di rischio relativo B. Cenci Goga Università degli Studi di Perugia, Dipartimento di Scienze Biopatologiche e Igiene delle Produzioni Animali e Alimentari, Sezione di Ispezione degli

Dettagli

0 altimenti 1 soggetto trova lavoroentro 6 mesi}

0 altimenti 1 soggetto trova lavoroentro 6 mesi} Lezione n. 16 (a cura di Peluso Filomena Francesca) Oltre alle normali variabili risposta che presentano una continuità almeno all'interno di un certo intervallo di valori, esistono variabili risposta

Dettagli

Il confronto fra medie

Il confronto fra medie L. Boni Obiettivo Verificare l'ipotesi che regimi alimentari differenti non producano mediamente lo stesso effetto sulla gittata cardiaca Ipotesi nulla IPOTESI NULLA La dieta non dovrebbe modificare in

Dettagli

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento. N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle abelle riportate alla fine del documento. Esercizio 1 La concentrazione media di sostanze inquinanti osservata nelle acque di un fiume

Dettagli

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 21/09/2011

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 21/09/2011 FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 1/9/11 ESERCIZIO 1 (+3++3) La seguente tabella riporta la distribuzione di frequenza dei valori di emoglobina nel sangue (espressi

Dettagli

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1 lezione n. 6 (a cura di Gaia Montanucci) METODO MASSIMA VEROSIMIGLIANZA PER STIMARE β 0 E β 1 Distribuzione sui termini di errore ε i ε i ~ N (0, σ 2 ) ne consegue : ogni y i ha ancora distribuzione normale,

Dettagli

Esercitazione del

Esercitazione del Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36

Dettagli

16/04/2015. L epidemiologia osservazionale può essere classifica anche in base al tipo di dati che raccoglie. Studi osservazionali: studi analitici

16/04/2015. L epidemiologia osservazionale può essere classifica anche in base al tipo di dati che raccoglie. Studi osservazionali: studi analitici Le inchieste epidemiologiche, a seconda della posizione assunta dal ricercatore nei confronti della realtà allo studio, possono essere distinte in osservazionali e sperimentali EPIDEMIOLOGIA Studi osservazionali:

Dettagli

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURA/TECNICA DI ANALISI DEI DATI SPECIFICAMENTE DESTINATA A STUDIARE LA RELAZIONE TRA UNA VARIABILE NOMINALE (ASSUNTA

Dettagli

Classe di fosfatasemia 16 25 26 30 31 35 36 41 Totale Numero soggetti 3 20 18 9 50

Classe di fosfatasemia 16 25 26 30 31 35 36 41 Totale Numero soggetti 3 20 18 9 50 Esercizi di Statistica 1) Su un gruppo di 49 pazienti diabetici, trattati con farmaci ipoglicemizzanti, sono stati rilevati i seguenti valori (mg/100ml) della glicemia a digiuno: 138, 164, 150, 132, 144,

Dettagli

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)

Dettagli

Giorno n. clienti di attesa

Giorno n. clienti di attesa Esercizio 1 Un aspetto cruciale per la qualità del servizio ai clienti in un supermercato è il cosiddetto checkout (ovvero il tempo che il cliente impiega dal momento in cui si mette in fila alla cassa

Dettagli

Esercitazioni di statistica

Esercitazioni di statistica Esercitazioni di statistica Intervalli di confidenza Stefania Spina Universitá di Napoli Federico II stefania.spina@unina.it 10 Dicembre 2014 Stefania Spina Esercitazioni di statistica 1/43 Stefania Spina

Dettagli

IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI

IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI Perchè confrontare le varianze stimate in due campioni? Torniamo all'esempio dei frinosomi Per poter applicare il test t avevamo detto che le varianze, e

Dettagli

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25 Sommario Presentazione dell edizione italiana Prefazione xv xiii Capitolo 1 I dati e la statistica 1 Statistica in pratica: BusinessWeek 1 1.1 Le applicazioni in ambito aziendale ed economico 3 Contabilità

Dettagli

Schema lezione 5 Intervalli di confidenza

Schema lezione 5 Intervalli di confidenza Schema lezione 5 Intervalli di confidenza Non centrerò quella barca, ne sono convinto al 95% COMPRENDERE: Significato di intervallo di confidenza Uso degli stimatori come quantità di pivot per stime intervallari

Dettagli

Premessa: la dipendenza in media

Premessa: la dipendenza in media Premessa: la dipendenza in media Supponiamo di avere K diversi livelli di un fattore che potrebbero influire su una determinata variabile. Per esempio supponiamo di domandarci se la diversificazione (intesa

Dettagli

Analisi della varianza

Analisi della varianza 1. 2. univariata ad un solo fattore tra i soggetti (between subjects) 3. univariata: disegni fattoriali 4. univariata entro i soggetti (within subjects) 5. : disegni fattoriali «misti» L analisi della

Dettagli

ˆp(1 ˆp) n 1 +n 2 totale di successi considerando i due gruppi come fossero uno solo e si costruisce z come segue ˆp 1 ˆp 2. n 1

ˆp(1 ˆp) n 1 +n 2 totale di successi considerando i due gruppi come fossero uno solo e si costruisce z come segue ˆp 1 ˆp 2. n 1 . Verifica di ipotesi: parte seconda.. Verifica di ipotesi per due campioni. Quando abbiamo due insiemi di dati possiamo chiederci, a seconda della loro natura, se i campioni sono simili oppure no. Ci

Dettagli

Statistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi

Statistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi Esercitazione 14 Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () 1 / 14 Ex.1: Verifica Ipotesi sulla media (varianza nota) Le funi prodotte da un certo macchinario hanno una

Dettagli

0.1 Percorrenza e Cilindrata

0.1 Percorrenza e Cilindrata 0.1 Percorrenza e Cilindrata Iniziamo ora un analisi leggermente più complessa basata sempre sui concetti appena introdotti. Innanzi tutto possiamo osservare, dal grafico ottenuto con il comando pairs,

Dettagli

Il χ 2 (Pearson, 1900)

Il χ 2 (Pearson, 1900) Il χ 2 (Pearson, 1900) Relazioni tra variabili: le tabelle di contingenza "The Physicians' Health Study" è uno studio clinico randomizzato condotto allo scopo di valutare il possibile eetto di riduzione

Dettagli

ESERCIZI. Regressione lineare semplice CAPITOLO 12 Levine, Krehbiel, Berenson, Statistica II ed., 2006 Apogeo

ESERCIZI. Regressione lineare semplice CAPITOLO 12 Levine, Krehbiel, Berenson, Statistica II ed., 2006 Apogeo Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università di Padova Docenti: Prof. L. Salmaso, Dott. L. Corain ESERCIZI Regressione lineare semplice

Dettagli

Statistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione.

Statistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione. Statistica inferenziale La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione. Verifica delle ipotesi sulla medie Quando si conduce una

Dettagli

STATISTICA AZIENDALE Modulo Controllo di Qualità

STATISTICA AZIENDALE Modulo Controllo di Qualità STATISTICA AZIENDALE Modulo Controllo di Qualità A.A. 009/10 - Sottoperiodo PROA DEL 14 MAGGIO 010 Cognome:.. Nome: Matricola:.. AERTENZE: Negli esercizi in cui sono richiesti calcoli riportare tutte la

Dettagli

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative

Dettagli

Intervalli di confidenza

Intervalli di confidenza Probabilità e Statistica Esercitazioni a.a. 2006/2007 C.d.L.: Ingegneria per l Ambiente ed il Territorio, Ingegneria Civile, Ingegneria Gestionale, Ingegneria dell Informazione C.d.L.S.: Ingegneria Civile

Dettagli

Facoltà di Economia - Università di Pavia Simulazione Prova Scritta di Statistica Sociale 19 dicembre 2012

Facoltà di Economia - Università di Pavia Simulazione Prova Scritta di Statistica Sociale 19 dicembre 2012 Facoltà di Economia - Università di Pavia Simulazione Prova Scritta di Statistica Sociale 19 dicembre 01 Esercizio 1. Con riferimento a due variabili dicotomiche X e Y (con valori possibili 0 o 1) si definisca

Dettagli

Intervallo di fiducia del coefficiente angolare e dell intercetta L intervallo di fiducia del coefficiente angolare (b 1 ) è dato da:

Intervallo di fiducia del coefficiente angolare e dell intercetta L intervallo di fiducia del coefficiente angolare (b 1 ) è dato da: Analisi chimica strumentale Intervallo di fiducia del coefficiente angolare e dell intercetta L intervallo di fiducia del coefficiente angolare (b 1 ) è dato da: (31.4) dove s y è la varianza dei valori

Dettagli

Istituzioni di Statistica e Statistica Economica

Istituzioni di Statistica e Statistica Economica Istituzioni di Statistica e Statistica Economica Università degli Studi di Perugia Facoltà di Economia, Assisi, a.a. 2013/14 Esercitazione n. 1 A. I dati riportati nella seguente tabella si riferiscono

Dettagli

Scuola di specializzazione In Fisica Sanitaria a.a. 2005/2006 Epidemiologia Prof. Maria Antonietta Penco

Scuola di specializzazione In Fisica Sanitaria a.a. 2005/2006 Epidemiologia Prof. Maria Antonietta Penco Scuola di specializzazione In Fisica Sanitaria a.a. 2005/2006 Epidemiologia Prof. Maria Antonietta Penco penco@fisica.unige.it 20/03/2006 Sensibilità e specificità di un test Consideriamo la seguente tabella:

Dettagli

Ringraziamenti dell Editore

Ringraziamenti dell Editore Indice Elenco dei simboli e delle abbreviazioni in ordine di apparizione Ringraziamenti dell Editore XI XVII 1 Introduzione FAQ e qualcos altro, da leggere prima 1 1.1 QuestoèunlibrodiStatistica....................

Dettagli

Distribuzione Gaussiana - Facciamo un riassunto -

Distribuzione Gaussiana - Facciamo un riassunto - Distribuzione Gaussiana - Facciamo un riassunto - Nell ipotesi che i dati si distribuiscano seguendo una curva Gaussiana è possibile dare un carattere predittivo alla deviazione standard La prossima misura

Dettagli

Analisi descrittiva: calcolando medie campionarie, varianze campionarie e deviazioni standard campionarie otteniamo i dati:

Analisi descrittiva: calcolando medie campionarie, varianze campionarie e deviazioni standard campionarie otteniamo i dati: Obiettivi: Esplicitare la correlazione esistente tra l altezza di un individuo adulto e la lunghezza del suo piede e del suo avambraccio. Idea del progetto: Il progetto nasce dall idea di acquistare scarpe

Dettagli

Esercizio 1 GRAFICO 1. X e Y sono indipendenti. X e Y non sono correlate. La correlazione tra X e Y è <1. X e Y sono perfettamente correlate

Esercizio 1 GRAFICO 1. X e Y sono indipendenti. X e Y non sono correlate. La correlazione tra X e Y è <1. X e Y sono perfettamente correlate Esercizio 1 Osservare il grafico 1 riportato in figura che mette in relazione una variabile dipendente Y ed una variabile indipendente X e rispondere alle seguenti domande. 400 300 200 GRAFICO 1 100 0

Dettagli

Distribuzioni campionarie

Distribuzioni campionarie 1 Inferenza Statistica Descrittiva Distribuzioni campionarie Statistica Inferenziale: affronta problemi di decisione in condizioni di incertezza basandosi sia su informazioni a priori sia sui dati campionari

Dettagli

a.a Esercitazioni di Statistica Medica e Biometria Corsi di Laurea triennali Ostetricia / Infermieristica Pediatrica I anno

a.a Esercitazioni di Statistica Medica e Biometria Corsi di Laurea triennali Ostetricia / Infermieristica Pediatrica I anno a.a. 2007-2008 Esercitazioni di Statistica Medica e Biometria Corsi di Laurea triennali Ostetricia / Infermieristica Pediatrica I anno Dott.ssa Daniela Alessi daniela.alessi@med.unipmn.it 1 Argomenti:

Dettagli

Esercizio 1. Stima intervallare: IC per la media incognita (varianza ignota)

Esercizio 1. Stima intervallare: IC per la media incognita (varianza ignota) STATISTICA (2) ESERCITAZIONE 5 26.02.2014 Dott.ssa Antonella Costanzo Esercizio 1. Stima intervallare: IC per la media incognita (varianza ignota) Il responsabile del controllo qualità di un azienda che

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri

Dettagli

Caratterizzazione dei consumi energetici (parte 3)

Caratterizzazione dei consumi energetici (parte 3) ESERCITAZIONE 4 Caratterizzazione dei consumi energetici (parte 3) 4.1 CuSum: elementi di analisi statistica Il diagramma delle somme cumulate dei residui in funzione del tempo (CuSum) può essere in generale

Dettagli

Esercitazione 8 maggio 2014

Esercitazione 8 maggio 2014 Esercitazione 8 maggio 2014 Esercizio 2 dal tema d esame del 13.01.2014 (parte II). L età media di n gruppo di 10 studenti che hanno appena conseguito la laurea triennale è di 22 anni. a) Costruire un

Dettagli

Test di ipotesi su due campioni

Test di ipotesi su due campioni 2/0/20 Test di ipotesi su due campioni Confronto tra due popolazioni Popolazioni effettive: unità statistiche realmente esistenti. Esempio: Confronto tra forze lavoro di due regioni. Popolazioni ipotetiche:

Dettagli

REGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori

REGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori REGRESSIONE lineare e CORRELAZIONE Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori Y X La NATURA e la FORZA della relazione tra variabili si studiano con la REGRESSIONE

Dettagli

Il numero di gradi di libertà del quantile di riferimento è uguale al numero di elementi del campione meno uno;

Il numero di gradi di libertà del quantile di riferimento è uguale al numero di elementi del campione meno uno; TEST DI AUTOVALUTAZIONE TEST CHI-QUADRO E REGRESSIONE LINEARE I diritti d autore sono riservati. Ogni sfruttamento commerciale non autorizzato sarà perseguito. Metodi statistici per la biologia 1 Parte

Dettagli

LABORATORIO 5. ANALISI DELLA VARIANZA AD UN CRITERIO DI CLASSIFICAZIONE

LABORATORIO 5. ANALISI DELLA VARIANZA AD UN CRITERIO DI CLASSIFICAZIONE LABORATORIO 5. ANALISI DELLA VARIANZA AD UN CRITERIO DI CLASSIFICAZIONE 5.1 ESEMPIO DI ANOVA AD UNA VIA In un esperimento un gruppo di bambini è stato assegnato a caso a 3 trattamenti, allo scopo di determinare

Dettagli

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla Introduzione E la generalizzazione del modello di regressione lineare semplice: per spiegare il fenomeno d interesse Y vengono introdotte p, con p > 1, variabili esplicative. Tale generalizzazione diventa

Dettagli

Analisi della varianza a una via

Analisi della varianza a una via Analisi della varianza a una via Statistica descrittiva e Analisi multivariata Prof. Giulio Vidotto PSY-NET: Corso di laurea online in Discipline della ricerca psicologico-sociale SOMMARIO Modelli statistici

Dettagli

Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza.

Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza. Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza. Misure ripetute forniscono dati numerici distribuiti attorno ad un valore centrale indicabile con un indice (indice

Dettagli

Analisi della varianza

Analisi della varianza Analisi della varianza Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona ANALISI DELLA VARIANZA - 1 Abbiamo k gruppi, con un numero variabile di unità statistiche.

Dettagli

Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico 2011-12)

Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico 2011-12) Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico 011-1) REGRESSIONE LINEARE SEMPLICE OPEN STATISTICA 8.44 Per 8 settimanali, appartenenti alla medesima fascia di prezzo e presenti in edicola

Dettagli

REGRESSIONE E CORRELAZIONE

REGRESSIONE E CORRELAZIONE REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.

Dettagli

Test per la correlazione lineare

Test per la correlazione lineare 10 Test per la correlazione lineare Istituzioni di Matematica e Statistica 2015/16 E. Priola 1 Introduzione alla correlazione lineare Problema: In base ai dati che abbiamo possiamo dire che c è una qualche

Dettagli

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI VERIFICA DI IPOTESI PER IL CONFRONTO TRA DUE PROPORZIONI

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI VERIFICA DI IPOTESI PER IL CONFRONTO TRA DUE PROPORZIONI NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI VERIFICA DI IPOTESI PER IL CONFRONTO TRA DUE PROPORZIONI IL PROBLEMA Si vuole verificare se un nuovo trattamento per la cura dell otite è più efficace

Dettagli

Approssimazione normale alla distribuzione binomiale

Approssimazione normale alla distribuzione binomiale Approssimazione normale alla distribuzione binomiale P b (X r) costoso P b (X r) P(X r) per N grande Teorema: Se la variabile casuale X ha una distribuzione binomiale con parametri N e p, allora, per N

Dettagli

Corso di Psicometria Progredito

Corso di Psicometria Progredito Corso di Psicometria Progredito 5. La correlazione lineare Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014 Sommario 1 Tipi di relazione

Dettagli

8. ANALISI DELLA COVARIANZA (ANCOVA)

8. ANALISI DELLA COVARIANZA (ANCOVA) 8. ANALISI DELLA COVARIANZA (ANCOVA) L analisi della covarianza è un metodo statistico che risulta dalla combinazione dell analisi di regressione con l analisi della varianza. È utile quando all analisi

Dettagli

PSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI

PSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI PSICOMETRIA Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI CAMPIONI INDIPENDENTI Campioni estratti casualmente dalla popolazione con caratteristiche omogenee Assegnazione

Dettagli

Lezione 4 a - Misure di dispersione o di variabilità

Lezione 4 a - Misure di dispersione o di variabilità Lezione 4 a - Misure di dispersione o di variabilità Abbiamo visto che la media è una misura della localizzazione centrale della distribuzione (il centro di gravità). Popolazioni con la stessa media possono

Dettagli

Regressione multipla

Regressione multipla Regressione multipla L obiettivo è costruire un modello probabilistico per spiegare la variabile y tramite più di una variabile indipendente x 1, x 2,..., x k. Esempio: Per un efficiente progettazione

Dettagli

Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill

Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill Es. Soluzione degli esercizi del capitolo 8 home - indice In base agli arrotondamenti effettuati nei calcoli, si

Dettagli

STATISTICA. Esercizi vari

STATISTICA. Esercizi vari STATISTICA Esercizi vari Esercizio 5.6 p. 205 Variabile Coeff. Dev. std. Statistica t p-value Intercetta 23.384 1.592 14.691 0 Profondità -1.435 0.213-6.726 0 = 0.850 Esercizio 5.6 p. 205 Variabile Coeff.

Dettagli

VALUTAZIONE EPIDEMIOLOGICA DELLO STATO DI SALUTE DELLA POPOLAZIONE RESIDENTE NEL COMUNE DI ANAGNI

VALUTAZIONE EPIDEMIOLOGICA DELLO STATO DI SALUTE DELLA POPOLAZIONE RESIDENTE NEL COMUNE DI ANAGNI Roma, 20 aprile 2010 VALUTAZIONE EPIDEMIOLOGICA DELLO STATO DI SALUTE DELLA POPOLAZIONE RESIDENTE NEL COMUNE DI ANAGNI Obiettivo Valutare le condizioni di salute della popolazione residente nel comune

Dettagli

CAMPIONAMENTO - ALCUNI TERMINI CHIAVE

CAMPIONAMENTO - ALCUNI TERMINI CHIAVE CAMPIONAMENTO - ALCUNI TERMINI CHIAVE POPOLAZIONE = qualsiasi insieme di oggetti (unità di analisi) di ricerca N = ampiezza della popolazione PARAMETRI = caratteristiche della popolazione [media, proporzione

Dettagli

Introduzione alla Regressione Logistica

Introduzione alla Regressione Logistica Introduzione alla Regressione Logistica Contenuto regressione lineare semplice e multipla regressione logistica lineare semplice La funzione logistica Stima dei parametri Interpretazione dei coefficienti

Dettagli

Ulteriori applicazioni del test del Chi-quadrato (χ 2 )

Ulteriori applicazioni del test del Chi-quadrato (χ 2 ) Ulteriori applicazioni del test del Chi-quadrato (χ 2 ) Finora abbiamo confrontato con il χ 2 le numerosità osservate in diverse categorie in un campione con le numerosità previste da un certo modello

Dettagli

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura INDICE GENERALE Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura XI XIV XV XVII XVIII 1 LA RILEVAZIONE DEI FENOMENI

Dettagli

ANALISI DELLA VARIANZA

ANALISI DELLA VARIANZA ANALISI DELLA VARIANZA Il data set coagulation contenuto nella libreria faraway contiene i tempi di coagulazione del sangue (misurato in secondi) di 24 animali sottoposti casualmente a quattro tipi di

Dettagli

Regressione lineare multipla CORSO DI ANALISI DEI DATI Anno Accademico 2009/2010, I ciclo

Regressione lineare multipla CORSO DI ANALISI DEI DATI Anno Accademico 2009/2010, I ciclo Regressione lineare multipla CORSO DI ANALISI DEI DATI Anno Accademico 2009/2010, I ciclo 1 Controllo di ipotesi sui parametri In questo contesto risulta necessario avvalersi dell assunzione di normalita

Dettagli

b) E necessario formulare delle ipotesi per calcolare l intervallo di confidenza ottenuto al punto a? (motivare brevemente la risposta):

b) E necessario formulare delle ipotesi per calcolare l intervallo di confidenza ottenuto al punto a? (motivare brevemente la risposta): ESERCIZIO 1 Una grande banca vuole stimare l ammontare medio di denaro che deve essere corrisposto dai correntisti che hanno il conto scoperto. Si seleziona un campione di 100 clienti su cui si osserva

Dettagli

Concetti principale della lezione precedente

Concetti principale della lezione precedente Corso di Statistica medica e applicata 9 a Lezione Dott.ssa Donatella Cocca Concetti principale della lezione precedente I concetti principali che sono stati presentati sono: Variabili su scala nominale

Dettagli

Esercizi riassuntivi di Inferenza

Esercizi riassuntivi di Inferenza Esercizi riassuntivi di Inferenza Esercizio 1 Un economista vuole stimare il reddito medio degli abitanti di una cittadina mediante un intervallo al livello di confidenza del 95%. La distribuzione del

Dettagli

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria Civile A.A. 2009-10 Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain 1 STATISTICHE, DISTRIBUZIONI CAMPIONARIE

Dettagli

Note sulla probabilità

Note sulla probabilità Note sulla probabilità Maurizio Loreti Dipartimento di Fisica Università degli Studi di Padova Anno Accademico 2002 03 1 La distribuzione del χ 2 0.6 0.5 N=1 N=2 N=3 N=5 N=10 0.4 0.3 0.2 0.1 0 0 5 10 15

Dettagli

TOPOGRAFIA 2013/2014. Prof. Francesco-Gaspare Caputo

TOPOGRAFIA 2013/2014. Prof. Francesco-Gaspare Caputo TOPOGRAFIA 2013/2014 L operazione di misura di una grandezza produce un numero reale che esprime il rapporto della grandezza stessa rispetto a un altra, a essa omogenea, assunta come unità di misura. L

Dettagli