Esercizi di statistica
|
|
- Damiano Orsini
- 6 anni fa
- Visualizzazioni
Transcript
1 Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -.. L intervallo di confidenza al 95% per la media è circa (1).34 < µ < 4.11 () 1.69 < µ < 3.47 (3) 8.3 < µ < 10 (4) 6.4 < µ < 8.19 [] Sia X N(15, 5) una variabile aleatoria normale di media 15 e varianza 5. Allora P (X < 7.5) vale circa (1) () (3) (4) 0.38 [3] Si ha la seguente tabella di frequenze: n j Si effettua un test del Chi-quadrato per stabilire se tali frequenze sono compatibili col fatto che gli eventi sono equiprobabili. Allora il p-value del test soddisfa: (1) 0.01 < p < 0.05 () p < 0.01 (3) 0.05 < p < 0.05 (4) p > 0.05 Esercizi da svolgere [E.1] Abbiamo 3 campioni indipendenti estratti casualmente da popolazioni normali aventi la stessa varianza. Le osservazioni sono riassunte nella seguente tabella: Gruppo 1 Gruppo Gruppo 3 n j x j s j Stabilire se esistono differenze significative fra le medie ai livelli di significatività dell 1% e del 5%. [E.] Abbiamo campioni indipendenti estratti casualmente da popolazioni normali aventi la stessa varianza. Le osservazioni sono riassunte nella seguente tabella: Gruppo 1 Gruppo n j 10 9 x j s j Stabilire se si può concludere che la media del primo gruppo è inferiore a quella del secondo, ai livelli di significatività dell 1% e del 5%. Determinare l intervallo di confidenza al 95% e 99% per la differenza delle medie. [E.3] È data la seguente tabella di contingenza: Tipo di effetto Trattamento Eff.1 Eff. Eff.3 Totale Trattamento Trattamento Trattamento Totale Stabilire se il tipo di effetto dipende dal trattamento somministrato, ai livelli di significatività dell 1% e del 5%. [E.4] Le seguenti misure sono state rilevate su due campioni indipendenti di ampiezza 7 e 8: x i : 69, 60, 8, 57, 6, 7, 79 y i : 114, 91, 100, 66, 74, 98, 78, 95 Lo sperimentatore ritiene che non si possa assumere che i campioni provengano da popolazioni distribuite normalmente. Stabilire, ai livelli di significatività dell 1% e del 5%, se si può concludere che la media del primo gruppo è inferiore a quella del secondo. [E.5] Le seguenti misure sono state rilevate, su uno stesso campione di ampiezza 10, prima e dopo un trattamento: x i : 108, 84, 100, 11, 98, 150, 13, 94, 90, 134 y i : 150, 14, 99, 118, 108, 15, 04, 134, 106, 16 Lo sperimentatore ritiene che non si possa assumere che i campioni provengano da popolazioni distribuite normalmente. Stabilire, ai livelli di significatività dell 1% e del 5%, se esistono differenze significative fra le medie. [E.6] Sono date le seguenti osservazioni: x y
2 Determinare la retta di regressione y = a + b x e il coefficiente di correlazione fra x e y. Stabilire, ai livelli di significatività dell 1% e del 5%, se esiste una relazione lineare fra x e y. Calcolare l intervallo di confidenza per b al 95% e 99%. Soluzioni Test a scelta multipla [1] Se X 1,..., X n è un campione di ampiezza n estratto da una popolazione normale, la variabile t = X µ S si distribuisce come la variabile aleatoria t di Student con ν = n 1 gradi di libertà. Indichiamo con t il valore critico della distribuzione t di Student con n 1 gradi di libertà tale che P ( t < t ) = L intervallo di confidenza al 95% per la media µ è dato da n X t S n < µ < X + t S n. (1) Nel nostro caso si ha ν = 8 1 = 7; sulla tabella dei quantili della distribuzione t, per il test a due code (si veda Glantz p. 79 oppure dispense) si trova t =.365. Usando la calcolatrice otteniamo X = , S = Sostituendo i valori nella formula (1) si ottiene.34 < µ < [] Se X N(µ, σ ) è una variabile aleatoria normale di media µ e varianza σ, allora Z = X µ σ N(0, 1) è una variabile aleatoria normale standard, quindi P (X < a) = P (Z < (a µ)/σ), dove a è un qualsiasi numero reale. Nel nostro caso si ha P (X < 7.5) = P (Z < (7.5 15)/5) = P (Z < 1.5) = 1 P (Z < 1.5). Sulla tabella della distribuzione normale standard si trova P (Z < 1.5) = Di conseguenza, P (X < 7.5) = [3] Se i k = 7 eventi sono equiprobabili, le frequenze attese sono tutte uguali e valgono n = ( n j )/k = 117/7. Possiamo calcolare X (n j n) = = n Questo consuntivo si distribuisce approssimativamente come la variabile aleatoria χ 6 (chi-quadrato con ν = k 1 = 6 gradi di libertà). Sulla tabella del chi-quadrato troviamo P (χ 6 < 14.45) = 0.975, P (χ 6 < 16.81) = 0.99, e il valore di X è compreso fra i due valori e Di conseguenza, il p-value del test (che è quel numero p tale che P (χ 6 < X ) = 1 p) sarà compreso fra = 0.01 e = Esercizi da svolgere [E.1] Per stabilire se esistono differenze significative fra le medie dei k = 3 gruppi utilizziamo il test F di Fisher. Dai dati tabulati abbiamo che N = n j = 1, x = 1 n j x j = N Calcoliamo poi SS tra = n j (x j x) =.83, S tra = SS tra k 1 = 1.4, SS entro = (n j 1)s j = 47.35, Sentro = SS entro N k =.63. Il consuntivo F vale quindi F = S tra S entro Riassumiamo i calcoli nella tabella dell analisi della varianza: d.f. SS S F Trattamenti Errore =
3 Nella tabella relativa alla distribuzione di Fisher con ν n = k 1 = gradi di libertà al numeratore e ν d = N k = 18 gradi di libertà al denominatore troviamo i valori critici F 0.05 = , F 0.01 = Poiché il valore calcolato di F è più piccolo di entrambi questi valori, concludiamo che non c è evidenza per affermare che esistono differenze significative fra le medie (ai livelli di significatività dell 1% e del 5%). In altri termini, l ipotesi nulla H 0 che le medie dei gruppi sono uguali non può essere rifiutata. [E.] Dal momento che i campioni sono estratti da popolazioni normali aventi la stessa varianza, possiamo utilizzare il test t di Student per il confronto delle medie. Iniziamo a calcolare la stima combinata per la varianza: S = (n 1 1)S 1 + (n 1)S n 1 + n = Calcoliamo a questo punto il consuntivo t = X 1 X ( ) S = n n Sappiamo che questa variabile aleatoria si distribuisce come una t di Student con ν = n 1 + n = 17 gradi di libertà. Osserviamo che il test è a una coda, e che l ipotesi nulla è H 0 : µ 1 µ, cioè µ 1 µ 0. I valori critici per il test a una coda che si trovano sulla tabella sono t 0.05 = 1.740, t 0.01 =.567. Le regioni di rifiuto sono dunque RR 0.05 = {t < 1.740}, RR 0.01 = {t <.567}. Poiché t 0.01 < t < t 0.05 possiamo concludere che 0.01 < p-value < Di conseguenza, possiamo rifiutare H 0 e concludere che µ 1 < µ al livello di significatività α = 0.05, mentre non possiamo rifiutare H 0 al livello di significatività α = Gli intervalli di confidenza per la differenza delle medie possono essere calcolati attraverso la formula 1 µ 1 µ < (X 1 X ) + t S + 1, n 1 n dove t è l appropriato quantile della distribuzione t di Student con ν = 17 gradi di libertà. Abbiamo dunque α = 0.05 : µ 1 µ < = = (, ), α = 0.01 : µ 1 µ < = = (, 0.705). Osserviamo che l intervallo di confidenza al 95% (α = 0.05) non contiene lo zero, dunque possiamo concludere (come già detto) che si può rifiutare H 0 a questo livello di confidenza. Viceversa, l intervallo di confidenza al 99% (α = 0.01) contiene lo zero, quindi non si può rifiutare H 0 a questo livello di confidenza. [E.3] Iniziamo a calcolare le frequenze attese: Tipo di effetto Trattamento Eff.1 Eff. Eff.3 Totale Trattamento Trattamento Trattamento Totale (Ricordiamo che il valore di ciascuna cella è ottenuto moltiplicando il totale di riga per il totale di colonna e dividendo il risultato per il totale complessivo 661.) L ipotesi nulla del test è H 0 : il tipo di effetto è indipendente dal tipo di trattamento. A questo punto calcoliamo il consuntivo X = (freq.attese freq.osservate) f req.attese = 9.896, che si distribuisce, se H 0 è vera, come la variabile chi-quadro con ν = (3 1) (3 1) = 4 gradi di libertà. Sulla tabella della distribuzione chi-quadro, in corrispondenza di ν = 4, troviamo i quantili X 0.95 = 9.49, X = 11.14, quindi 0.05 < p-value < Di conseguenza, possiamo rifiutare l ipotesi nulla al livello di significatività α = 0.05, mentre non la possiamo rifiutare al livello α = 0.05, e dunque nemmeno al livello α =
4 [E.4] Poiché il testo dell esercizio dichiara esplicitamente che i campioni non provengono da popolazioni distribuite normalmente, non possiamo applicare il test t per il confronto delle medie di due campioni. È dunque opportuno utilizzare un test non parametrico come quello di Mann-Whitney. Poiché il testo richiede di stabilire se la media del primo gruppo è inferiore a quella del secondo, il test è a una coda e l ipotesi nulla è H 0 : µ 1 µ, cioè µ 1 µ 0. Iniziamo con l assegnare il rango (cioè il numero d ordine, scritto tra parentesi) alle letture: x i y i 69 (5) 114 (15) 60 () 91 (11) 8 (10) 100 (14) 57 (1) 66 (4) 6 (3) 74 (7) 7 (6) 98 (13) 79 (9) 78 (8) 95 (1) Il gruppo meno numeroso è il primo, che contiene n P = 7 elementi, mentre il secondo ne contiene n G = 8. La somma dei ranghi del gruppo meno numeroso è T = = 36. Nella tabella relativa al test di Mann-Whitney troviamo la riga n P = 7, n G = 8, T 1 = 36, T = 69, P = Questo significa che P (T T 1 ) + P (T T ) = Nel nostro caso il test è a una coda, dunque la regione di rifiuto è del tipo {T T 1 }, da cui otteniamo p-value = P (T 36) = 0.005/ = Possiamo dunque concludere che l ipotesi nulla può essere rifiutata al livello di significatività α = 0.05, mentre non può essere rifiutata al livello α = (Osserviamo comunque che il p-value è molto vicino a 0.01.) [E.5] In questo caso abbiamo uno stesso gruppo sottoposto a più di un trattamento (o meglio, un gruppo osservato prima e dopo un trattamento). Da quanto specificato nel testo, non possiamo assumere che le differenze prima dopo siano distribuite normalmente. Di conseguenza, non si può usare il test t di Student per i dati appaiati. È opportuno quindi usare un test non parametrico come quello di Wilcoxon. Osserviamo che il test è a due code, e che l ipotesi nulla è H 0 : µ 1 = µ. Calcoliamo le differenze x i y i e assegnamo i ranghi ai loro valori assoluti (scritti tra parentesi): x i y i x i y i (8) (9) (1) (3) (4) () (10) (7) (5) (6) Le somme dei ranghi relativi alle differenze positive e a quelle negative sono date rispettivamente da W + = = 4, W = = 51, quindi otteniamo W = W + W = 47. Nella tabella relativa al test di Wilcoxon troviamo la riga dalla quale si deduce (test a due code) n = 10, W = 47, P = , p-value = P ( W 47) = Concludiamo dunque che l ipotesi nulla può essere rifiutata al livello di significatività α = 0.05, mentre non può essere rifiutata al livello α =
5 [E.6] Utilizzando la calcolatrice scientifica, introduciamo dapprima tutti gli n = 10 dati x, ottenendo ΣX = 57.1, X = 57.1, S X = 16.9, SX = 86.7, ΣX = , e poi tutti i dati y, ottenendo ΣY = 63., Y = 6.3, S Y = 3.64, SY = , ΣY = A questo punto calcoliamo, sempre utilizzando la calcolatrice, la somma dei prodotti x y, ottenendo ΣXY = A partire da questi dati aggregati possiamo ora calcolare tutte le quantità elencate di seguito: covarianza campionaria: cov(x, Y ) = 1 [ΣXY 1n ] n 1 (ΣX)(ΣY ) = coefficiente di correlazione di Pearson: r = cov(x, Y ) S X S Y = coefficienti della retta di regressione y = a + b x: b = cov(x, Y ) S X = 0.117, a = Y b X = 55.6 stimatore corretto di σ : S = n 1 [ S n Y b SX ] = 7.58 (S =.75) stimatore corretto di σ β : S Sb = (n 1)SX = (S b = 0.054) Eseguiamo ora il test di ipotesi per stabilire se esiste una relazione lineare fra le variabili x e y. Tale test può essere basato sul fatto che la variabile aleatoria t = b β S b si distribuisce come una t di Student con ν = n = 8 gradi di libertà. L ipotesi nulla per questo test è H 0 : β = 0, cioè non esiste una relazione lineare tra le due variabili. Assumendo vera H 0 possiamo dunque calcolare il consuntivo t = b S b =.158, che va confrontato con i quantili della distribuzione t di Student con ν = 8 gradi di libertà (test a due code): t 0.95 =.306, t 0.99 = Poiché il valore calcolato di t è (in valore assoluto) inferiore a ciascuno di questi due quantili, concludiamo che l ipotesi nulla non può essere rifiutata né al livello di significatività α = 0.05 né al livello α = (In altre parole, a questi livelli di significatività non c è evidenza che esista una relazione lineare fra le due variabili.) Gli intervalli di confidenza per β possono essere calcolati mediante la formula b t S b < β < b + t S b, dove t è l opportuno quantile della distribuzione t di Student. Otteniamo dunque α = 0.05 : t = t 0.95 =.306, < β < 0.4, α = 0.01 : t = t 0.99 = 3.355, < β < Osserviamo che, in entrambi i casi, l intervallo di confidenza contiene lo zero, dunque l ipotesi nulla non può essere rifiutata. 5
Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.
Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:
DettagliAnalisi della regressione multipla
Analisi della regressione multipla y = β 0 + β 1 x 1 + β 2 x 2 +... β k x k + u 2. Inferenza Assunzione del Modello Classico di Regressione Lineare (CLM) Sappiamo che, date le assunzioni Gauss- Markov,
DettagliContenuti: Capitolo 14 del libro di testo
Test d Ipotesi / TIPICI PROBLEMI DI VERIFICA DI IPOTESI SONO Test per la media Test per una proporzione Test per la varianza Test per due campioni indipendenti Test di indipendenza Contenuti Capitolo 4
DettagliN.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.
N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle abelle riportate alla fine del documento. Esercizio 1 La concentrazione media di sostanze inquinanti osservata nelle acque di un fiume
DettagliTest d ipotesi: confronto fra medie
Test d ipotesi: confronto fra medie Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona CONFRONTO FRA MEDIE 1) confronto fra una media campionaria e una media di popolazione
DettagliI appello di calcolo delle probabilità e statistica
I appello di calcolo delle probabilità e statistica A.Barchielli, L. Ladelli, G. Posta 8 Febbraio 13 Nome: Cognome: Matricola: Docente: I diritti d autore sono riservati. Ogni sfruttamento commerciale
DettagliLa verifica delle ipotesi
La verifica delle ipotesi Se abbiamo un idea di quale possa essere il valore di un parametro incognito possiamo sottoporlo ad una verifica, che sulla base di un risultato campionario, ci permetta di decidere
DettagliTest F per la significatività del modello
Test F per la significatività del modello Per verificare la significatività dell intero modello si utilizza il test F Si vuole verificare l ipotesi H 0 : β 1 = 0,, β k = 0 contro l alternativa che almeno
DettagliTest per una media - varianza nota
Situazione Test per una media - varianza nota Popolazione N(µ,σ 2 ); varianza σ 2 nota. µ 0 numero reale fissato. Test di livello α per µ Statistica: Z n = X n µ 0 σ/ n. H 0 H 1 Rifiutiamo H 0 se p-value
DettagliEsercitazione 8 maggio 2014
Esercitazione 8 maggio 2014 Esercizio 2 dal tema d esame del 13.01.2014 (parte II). L età media di n gruppo di 10 studenti che hanno appena conseguito la laurea triennale è di 22 anni. a) Costruire un
DettagliConfronto tra due popolazioni Lezione 6
Last updated May 9, 06 Confronto tra due popolazioni Lezione 6 G. Bacaro Statistica CdL in Scienze e Tecnologie per l'ambiente e la Natura I anno, II semestre Concetti visti nell ultima lezione Le media
DettagliSTATISTICA ESERCITAZIONE 13
STATISTICA ESERCITAZIONE 13 Dott. Giuseppe Pandolfo 9 Marzo 2015 Errore di I tipo: si commette se l'ipotesi nulla H 0 viene rifiutata quando essa è vera Errore di II tipo: si commette se l'ipotesi nulla
DettagliElementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 10-Significatività statistica per la correlazione vers. 1.0 (5 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università
DettagliSTATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo
STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)
DettagliDispensa di Statistica
Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza
DettagliUniversità degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1
Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1 Lezione 1 - Mercoledì 28 Settembre 2016 Introduzione al corso. Richiami di probabilità: spazi di probabilità, variabili aleatorie,
DettagliCorso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII
Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Un breve richiamo sul test t-student Siano A exp (a 1, a 2.a n ) e B exp (b 1, b 2.b m ) due set di dati i cui
DettagliINFERENZA STATISTICA I (CANALE B)
INFERENZA STATISTICA I (CANALE B) FORMULE E TAVOLE a.a. 2005/06 Indice A. Formule 2 B. Quantili di una distribuzione normale standard 4 C. Quantili di una distribuzione t di Student 5 D. Quantili di una
DettagliSTATISTICA A K (60 ore)
STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta
DettagliCorso di Psicometria Progredito
Corso di Psicometria Progredito 4.1 I principali test statistici per la verifica di ipotesi: Il test t Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico
DettagliCognome e Nome:... Corso di laurea:...
Statistica - corso base Prof. B. Liseo Prova di esame dell 8 gennaio 201 Cognome e Nome:................................................................... Corso di laurea:.......................................................................
DettagliIL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI
IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI Perchè confrontare le varianze stimate in due campioni? Torniamo all'esempio dei frinosomi Per poter applicare il test t avevamo detto che le varianze, e
Dettaglii dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente
TEST DI AUTOVALUTAZIONE - SETTIMANA 6 I diritti d autore sono riservati. Ogni sfruttamento commerciale non autorizzato sarà perseguito. Metodi statistici per la biologia Parte A. La retta di regressione.2
DettagliRegressione lineare semplice
Regressione lineare semplice Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Statistica con due variabili var. nominale, var. nominale: gruppo sanguigno - cancro
DettagliEsercitazione del
Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36
DettagliAnalisi della varianza
Analisi della varianza Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona ANALISI DELLA VARIANZA - 1 Abbiamo k gruppi, con un numero variabile di unità statistiche.
DettagliINFERENZA STATISTICA I (CANALE B)
INFERENZA STATISTICA I (CANALE B) FORMULE E TAVOLE PER L ESAME a.a. 2003/04 Indice A. Formule 2 B. Quantili di una distribuzione normale standard 4 C. Quantili di una distribuzione t di Student 5 D. Quantili
DettagliFondamenti di statistica per il miglioramento genetico delle piante. Antonio Di Matteo Università Federico II
Fondamenti di statistica per il miglioramento genetico delle piante Antonio Di Matteo Università Federico II Modulo 2 Variabili continue e Metodi parametrici Distribuzione Un insieme di misure è detto
DettagliEsercitazione 8 del corso di Statistica 2
Esercitazione 8 del corso di Statistica Prof. Domenico Vistocco Dott.ssa Paola Costantini 6 Giugno 8 Decisione vera falsa è respinta Errore di I tipo Decisione corretta non è respinta Probabilità α Decisione
DettagliVerifica di ipotesi: approfondimenti
1. Il -value Verifica di iotesi: arofondimenti Il test si uò effettuare: Determinando reventivamente le regioni di accettazione di H 0 e H 1 er lo stimatore considerato (sulla base del livello α e osservando
DettagliAnalisi della varianza
Università degli Studi di Padova Facoltà di Medicina e Chirurgia Facoltà di Medicina e Chirurgia - A.A. 2009-10 Scuole di specializzazione Lezioni comuni Disciplina: Statistica Docente: dott.ssa Egle PERISSINOTTO
DettagliStatistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill
Statistica - metodologie per le scienze economiche e sociali /e S. Borra, A. Di Ciaccio - McGraw Hill Es.. Soluzione degli esercizi del capitolo 4 4. Il sistema d ipotesi è: μ 7, H : μ 7, Essendo 0 : t,
DettagliCHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)
CHEMIOMETRIA Applicazione di metodi matematici e statistici per estrarre (massima) informazione chimica (affidabile) da dati chimici INCERTEZZA DI MISURA (intervallo di confidenza/fiducia) CONFRONTO CON
Dettaglidistribuzione normale
distribuzione normale Si tratta della più importante distribuzione di variabili continue, in quanto: 1. si può assumere come comportamento di molti fenomeni casuali, tra cui gli errori accidentali; 2.
DettagliR - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre
R - Esercitazione 6 Andrea Fasulo fasulo.andrea@yahoo.it Università Roma Tre Venerdì 22 Dicembre 2017 Il modello di regressione lineare semplice (I) Esempi tratti da: Stock, Watson Introduzione all econometria
DettagliCasa dello Studente. Casa dello Studente
Esercitazione - 14 aprile 2016 ESERCIZIO 1 Di seguito si riporta il giudizio (punteggio da 0 a 5) espresso da un gruppo di studenti rispetto alle diverse residenze studentesche di un Ateneo: a) Si calcolino
DettagliUniversità degli Studi di Padova. Corso di Laurea in Medicina e Chirurgia - A.A
Università degli Studi di Padova Corso di Laurea in Medicina e Chirurgia - A.A. 015-16 Corso Integrato: Statistica e Metodologia Epidemiologica Disciplina: Statistica e Metodologia Epidemiologica Docenti:
DettagliTest di ipotesi su due campioni
2/0/20 Test di ipotesi su due campioni Confronto tra due popolazioni Popolazioni effettive: unità statistiche realmente esistenti. Esempio: Confronto tra forze lavoro di due regioni. Popolazioni ipotetiche:
Dettaglisi tratta del test del chi-quadro di adattamento e di quello di indipendenza. 1 l ipotesi che la popolazione segua una legge fissata;
di : dado : normale Finora abbiamo visto test d ipotesi per testare ipotesi differenti, ma tutte concernenti il valore atteso di una o due popolazioni. In questo capitolo vediamo come testare 1 l ipotesi
DettagliEsercizi di Probabilità e Statistica
Esercizi di Probabilità e Statistica Samuel Rota Bulò 6 giugno 26 Statistica Esercizio Sia {X n } n una famiglia di v.a. di media µ e varianza σ 2. Verificare che X = n n X i σ 2 = n (X i µ) 2 S 2 = n
DettagliStatistica Applicata all edilizia: il modello di regressione
Statistica Applicata all edilizia: il modello di regressione E-mail: orietta.nicolis@unibg.it 27 aprile 2009 Indice Il modello di Regressione Lineare 1 Il modello di Regressione Lineare Analisi di regressione
DettagliLezione 16. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 16. A. Iodice. Ipotesi statistiche
Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 23 Outline 1 2 3 4 5 6 () Statistica 2 / 23 La verifica delle ipotesi Definizione Un ipotesi statistica
DettagliΣ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica
13. Regressione lineare parametrica Esistono numerose occasioni nelle quali quello che interessa è ricostruire la relazione di funzione che lega due variabili, la variabile y (variabile dipendente, in
DettagliESAME. 9 Gennaio 2017 COMPITO B
ESAME 9 Gennaio 2017 COMPITO B Cognome Nome Numero di matricola 1) Approssimare tutti i calcoli alla quarta cifra decimale. 2) Ai fini della valutazione si terrà conto solo ed esclusivamente di quanto
DettagliUNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA.
Lezione 4 DISTRIBUZIONE DI FREQUENZA 1 DISTRIBUZIONE DI PROBABILITA Una variabile i cui differenti valori seguono una distribuzione di probabilità si chiama variabile aleatoria. Es:il numero di figli maschi
DettagliTEST NON PARAMETRICO DI MANN-WHITNEY
TEST NON PARAMETRICO DI MANN-WHITNEY Questo test viene può essere utilizzato come test di confronto tra due campioni in maniera analoga ai test ipotesi parametrici di confronto medie (test Z se la varianza
DettagliStatistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1
Statistica Capitolo 1 Regressione Lineare Semplice Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Spiegare il significato del coefficiente di correlazione lineare
DettagliCorso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010.
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010 Statistica Esercitazione 4 12 maggio 2010 Dipendenza in media. Covarianza e
DettagliEsame di Statistica del 19 settembre 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova).
Esame di Statistica del 19 settembre 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola Es. 1 Es. 2 Es. 3 Es. 4 Somma Voto finale Attenzione: si
DettagliStatistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2010/2011 Statistica Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza
DettagliMETODO DEI MINIMI QUADRATI
METODO DEI MINIMI QUADRATI Torniamo al problema della crescita della radice di mais in funzione del contenuto di saccarosio nel terreno di coltura. Ripetendo varie volte l esperimento con diverse quantità
DettagliStatistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione.
Statistica inferenziale La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione. Verifica delle ipotesi sulla medie Quando si conduce una
DettagliIntervalli di confidenza
Probabilità e Statistica Esercitazioni a.a. 2006/2007 C.d.L.: Ingegneria per l Ambiente ed il Territorio, Ingegneria Civile, Ingegneria Gestionale, Ingegneria dell Informazione C.d.L.S.: Ingegneria Civile
DettagliTest per la correlazione lineare
10 Test per la correlazione lineare Istituzioni di Matematica e Statistica 2015/16 E. Priola 1 Introduzione alla correlazione lineare Problema: In base ai dati che abbiamo possiamo dire che c è una qualche
DettagliSommario. 2 I grafici Il sistema di coordinate cartesiane Gli istogrammi I diagrammi a torta...51
Sommario 1 I dati...15 1.1 Classificazione delle rilevazioni...17 1.1.1 Esperimenti ripetibili (controllabili)...17 1.1.2 Rilevazioni su fenomeni non ripetibili...18 1.1.3 Censimenti...19 1.1.4 Campioni...19
DettagliPROBABILITÀ ELEMENTARE
Prefazione alla seconda edizione XI Capitolo 1 PROBABILITÀ ELEMENTARE 1 Esperimenti casuali 1 Spazi dei campioni 1 Eventi 2 Il concetto di probabilità 3 Gli assiomi della probabilità 3 Alcuni importanti
DettagliApprossimazione normale alla distribuzione binomiale
Approssimazione normale alla distribuzione binomiale P b (X r) costoso P b (X r) P(X r) per N grande Teorema: Se la variabile casuale X ha una distribuzione binomiale con parametri N e p, allora, per N
Dettaglilezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1
lezione n. 6 (a cura di Gaia Montanucci) METODO MASSIMA VEROSIMIGLIANZA PER STIMARE β 0 E β 1 Distribuzione sui termini di errore ε i ε i ~ N (0, σ 2 ) ne consegue : ogni y i ha ancora distribuzione normale,
Dettagli1.4. Siano X B(1, 1/2) e Y B(1, 1/2) variabili aleatorie indipendenti. Quale delle seguenti affermazioni é falsa? E(X + Y ) = 1 V ar(x + Y ) = 1/2
Statistica N. Crediti: Cognome: Laurea Triennale in Biologia Nome: 4 settembre 2012 Matricola: 1. Parte A 1.1. Siano x 1, x 2,..., x 10 i dati relativi al peso di 10 neonati espressi in chilogrammi e y
DettagliStatistica per le le ricerche ricerche di mercato 9.b 9.b Analisi Analisi preliminari preliminari Verifica di ipotesi: test test di indipendenza
Statistica per le ricerche di mercato a.a. 014/15 9.b Analisi preliminari Verifica di ipotesi: test di indipendenza Test di indipendenza Permette di verificare se tra due variabili X e Y esiste o meno
DettagliMatematica II: Calcolo delle Probabilità e Statistica Matematica
Matematica II: Calcolo delle Probabilità e Statistica Matematica ELT A-Z Docente: dott. F. Zucca Esercitazione # 6 1 Test ed intervalli di confidenza per una popolazione Esercizio n. 1 Il calore (in calorie
DettagliCapitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson. Casa editrice: Pearson
Levine, Krehbiel, Berenson Statistica II ed. Casa editrice: Pearson Capitolo 10 Test basati su due campioni e ANOVA a una via Insegnamento: Statistica Corsi di Laurea Triennale in Economia Dipartimento
DettagliEsercitazioni di Statistica Matematica A Esercitatori: Dott. Fabio Zucca - Dott. Maurizio U. Dini Lezioni del 7/1/2003 e del 14/1/2003
Esercitazioni di Statistica Matematica A Esercitatori: Dott. Fabio Zucca - Dott. Maurizio U. Dini Lezioni del 7/1/003 e del 14/1/003 1 Esercizi 1.1 Test su media (con varianza nota) Esercizio n. 1 Il calore
DettagliSTATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE
STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 2 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1.1
DettagliIpotesi statistiche (caso uno-dimensionale) Ipotesi poste sulla (distribuzione di) popolazione per raggiungere una decisione sulla popolazione stessa
Ipotesi statistiche (caso uno-dimensionale) Ipotesi poste sulla (distribuzione di) popolazione per raggiungere una decisione sulla popolazione stessa L ipotesi che si vuole testare: H 0 (ipotesi nulla)
DettagliCorso di Psicometria Progredito
Corso di Psicometria Progredito 5. La correlazione lineare Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014 Sommario 1 Tipi di relazione
DettagliEsame di Statistica del 16 aprile 2007 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola
Esame di Statistica del 16 aprile 2007 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola Es. 1 Es. 2 Es. 3 Es. 4 Somma Voto finale Attenzione: si consegnano
DettagliTest delle Ipotesi Parte I
Test delle Ipotesi Parte I Test delle Ipotesi sulla media Introduzione Definizioni basilari Teoria per il caso di varianza nota Rischi nel test delle ipotesi Teoria per il caso di varianza non nota Test
DettagliSchema lezione 5 Intervalli di confidenza
Schema lezione 5 Intervalli di confidenza Non centrerò quella barca, ne sono convinto al 95% COMPRENDERE: Significato di intervallo di confidenza Uso degli stimatori come quantità di pivot per stime intervallari
DettagliCaratterizzazione dei consumi energetici (parte 3)
ESERCITAZIONE 4 Caratterizzazione dei consumi energetici (parte 3) 4.1 CuSum: elementi di analisi statistica Il diagramma delle somme cumulate dei residui in funzione del tempo (CuSum) può essere in generale
DettagliCapitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson Apogeo
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 10 Test basati su due campioni e ANOVA a una via Insegnamento: Statistica Applicata Corsi di Laurea in "Scienze e tecnologie Alimentari"
DettagliLEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell
LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Strumenti statistici in Excell Pacchetto Analisi di dati Strumenti di analisi: Analisi varianza: ad un fattore Analisi
DettagliREGRESSIONE E CORRELAZIONE
REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.
DettagliStatistica Inferenziale
Statistica Inferenziale a) L Intervallo di Confidenza b) La distribuzione t di Student c) La differenza delle medie d) L intervallo di confidenza della differenza Prof Paolo Chiodini Dalla Popolazione
DettagliANALISI DELLE SERIE STORICHE
ANALISI DELLE SERIE STORICHE De Iaco S. s.deiaco@economia.unile.it UNIVERSITÀ del SALENTO DIP.TO DI SCIENZE ECONOMICHE E MATEMATICO-STATISTICHE FACOLTÀ DI ECONOMIA 24 settembre 2012 Indice 1 Funzione di
DettagliPresentazione dell edizione italiana
1 Indice generale Presentazione dell edizione italiana Prefazione xi xiii Capitolo 1 Una introduzione alla statistica 1 1.1 Raccolta dei dati e statistica descrittiva... 1 1.2 Inferenza statistica e modelli
DettagliGli errori nella verifica delle ipotesi
Gli errori nella verifica delle ipotesi Nella statistica inferenziale si cerca di dire qualcosa di valido in generale, per la popolazione o le popolazioni, attraverso l analisi di uno o più campioni E
DettagliPROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE
PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE 1. Distribuzione congiunta Ci sono situazioni in cui un esperimento casuale non si può modellare con una sola variabile casuale,
DettagliUNIVERSITÀ DEGLI STUDI DI PERUGIA
SIGI, Statistica II, esercitazione n. 3 1 UNIVERSITÀ DEGLI STUDI DI PERUGIA FACOLTÀ DI ECONOMIA CORSO DI LAUREA S.I.G.I. STATISTICA II Esercitazione n. 3 Esercizio 1 Una v.c. X si dice v.c. esponenziale
DettagliEsercitazione 5 - Statistica (parte II) Davide Passaretti 9/3/2017
Esercitazione 5 - Statistica (parte II) Davide Passaretti 9/3/2017 Contents 1 Inferenza sulla regressione semplice 1 1.1 Test sulla pendenza della retta................................... 1 1.2 Test sull
DettagliTest per l omogeneità delle varianze
Test per l omogeneità delle varianze Le carte di controllo hanno lo scopo di verificare se i campioni estratti provengono da un processo produttivo caratterizzato da un unico valore dello s.q.m. σ. Una
DettagliL Analisi della Varianza ANOVA (ANalysis Of VAriance)
L Analisi della Varianza ANOVA (ANalysis Of VAriance) 1 Concetti generali: Confronto simultaneo tra più di due popolazioni, esempi... La analisi della varianza estende il confronto a p gruppi con p>2.
DettagliArgomenti della lezione:
Lezione 13 L analisi della Varianza (ANOVA): il modello lineare Argomenti della lezione: Modello lineare Disegni a una via L Analisi della Varianza (ANOVA): Esamina differenze tra le medie di due o più
Dettaglix ;x Soluzione Gli intervalli di confidenza possono essere ottenuti a partire dalla seguente identità: da cui si ricava: IC x ;x = +
ESERCIZIO 6.1 Si considerino i 0 campioni di ampiezza n = estratti da una popolazione X di N = 5 elementi distribuiti normalmente, con media µ = 13,6 e σ = 8,33. A partire dalle 0 determinazioni della
DettagliProprietà della varianza
Proprietà della varianza Proprietà della varianza Proprietà della varianza Proprietà della varianza Intermezzo: ma perché dovremmo darci la pena di studiare come calcolare la varianza nel caso di somme,
DettagliCarta di credito standard. Carta di credito business. Esercitazione 12 maggio 2016
Esercitazione 12 maggio 2016 ESERCIZIO 1 Si supponga che in un sondaggio di opinione su un campione di clienti, che utilizzano una carta di credito di tipo standard (Std) o di tipo business (Bsn), si siano
DettagliFACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 21/09/2011
FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 1/9/11 ESERCIZIO 1 (+3++3) La seguente tabella riporta la distribuzione di frequenza dei valori di emoglobina nel sangue (espressi
DettagliEsercitazione 3 - Statistica II - Economia Aziendale Davide Passaretti 23/5/2017
Esercitazione 3 - Statistica II - Economia Aziendale Davide Passaretti 3/5/017 Contents 1 Intervalli di confidenza 1 Intervalli su un campione 1.1 Intervallo di confidenza per la media................................
DettagliTest delle ipotesi sulla media.
. Caso di un singolo campione. Varianza nota.. Ipotesi alternativa bilaterale Test delle ipotesi sulla media. Valore medio η e deviazione standard σ della popolazione note. η è il valore stimato dal nostro
DettagliMinimi quadrati vincolati e test F
Minimi quadrati vincolati e test F Impostazione del problema Spesso, i modelli econometrici che stimiamo hanno dei parametri che sono passibili di interpretazione diretta nella teoria economica. Consideriamo
DettagliCapitolo 5 Confidenza, significatività, test di Student e del χ 2
Capitolo 5 Confidenza, significatività, test di Student e del χ 5.1 L inferenza Se conosciamo la legge di probabilità di un evento (a priori o a posteriori) possiamo fare delle previsioni su come l evento
DettagliUlteriori applicazioni del test del Chi-quadrato (χ 2 )
Ulteriori applicazioni del test del Chi-quadrato (χ 2 ) Finora abbiamo confrontato con il χ 2 le numerosità osservate in diverse categorie in un campione con le numerosità previste da un certo modello
DettagliUlteriori Conoscenze di Informatica e Statistica
ndici di forma Ulteriori Conoscenze di nformatica e Statistica Descrivono le asimmetrie della distribuzione Carlo Meneghini Dip. di fisica via della Vasca Navale 84, st. 83 ( piano) tel.: 06 55 17 72 17
DettagliCorso di Statistica Esercitazione 1.8
Corso di Statistica Esercitazione.8 Test su medie e proporzioni Prof.ssa T. Laureti a.a. 202-203 Esercizio Un produttore vuole monitorare i valori dei livelli di impurità contenute nella merce che gli
DettagliModelli Log-lineari Bivariati
Modelli Log-lineari Bivariati Luca Stefanutti Università di Padova Dipartimento di Psicologia Applicata Via Venezia 8, 35131 Padova L.Stefanutti (Università di Padova) Modelli Log-lineari 1 / 71 Contenuti
DettagliConfronto fra gruppi: il metodo ANOVA. Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23
Confronto fra gruppi: il metodo ANOVA Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23 1 Nella popolazione, per ciascun gruppo la distribuzione della variabile risposta
DettagliSOLUZIONI ESERCITAZIONE NR. 8 Test statistici
SOLUZIONI ESERCITAZIONE NR. 8 Test statistici ESERCIZIO nr. 1 Un campione casuale di dieci pazienti di sesso maschile in cura per comportamenti aggressivi nell ambito del contesto familiare è stato classificato
DettagliCapitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica
Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università
DettagliStatistica Metodologica
Statistica Metodologica Esercizi di Probabilita e Inferenza Silvia Figini e-mail: silvia.figini@unipv.it Problema 1 Sia X una variabile aleatoria Bernoulliana con parametro p = 0.7. 1. Determinare la media
DettagliStatistica Inferenziale
Statistica Inferenziale Prof. Raffaella Folgieri Email: folgieri@mtcube.com aa 2009/2010 Riepilogo lezione 5 Abbiamo visto: Modelli probabilistici nel continuo Distribuzione uniforme continua Distribuzione
Dettagli