Popolazione. Campione. I risultati di un esperimento sono variabili aleatorie. I valori stimati sono variabili aleatorie. Teorema del limite centrale

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Popolazione. Campione. I risultati di un esperimento sono variabili aleatorie. I valori stimati sono variabili aleatorie. Teorema del limite centrale"

Transcript

1 I risultati di un esperimento sono variabili aleatorie. Un esperimento non consente di esaminare ogni elemento di una popolazione o di effettuare tutte le misure possibili. campione <x>, sx Stime Popolazion e parametri µ σ Dato un campione n estratto da una popolazione N è possibile fornire una stima (<x>, s) dei parametri reali della distribuzione (µ, σ). I risultati ottenuti su un campione rappresentano una stima dei valori "veri" I valori stimati sono variabili aleatorie Quanto sono accurate queste stime? Popolazione Valore atteso (media) Teorema del limite centrale La distribuzione delle medie campionari (<x> i ) segue una distribuzione normale indipendentemente dalla distribuzione della popolazione d origine Varianza Campione edia campionaria Il valor medio della distribuzione delle media campionarie è uguale alla media della popolazione d origine La deviazione standard dell insieme di tutte le medie campionarie (errore standard della media σ x ) è una funzione della deviazione standard della popolazione originaria e del numero di elementi del campione. nota: dev.st. della popolazione Varianza campionaria Proprietà della distribuzione di Gauss σ WH =.35σ σ σ Date due variabili aleatorie indipendenti X a, X b caratterizzate da µ a σ a, µ b σ b, la variabile Z= X a +X b è una variabile aleatoria con: µ z = µ a +µ b σ z = σ a +σ b

2 Stima della media La distribuzione reale confrontata con un ipotetico campione L errore standard della media indica il grado di incertezza da associare alla stima della media ottenuta utilizzando un campione dell intera popolazione Interpretazione: se effettuo diversi campionamenti (al limite tutti i possibili campionamenti) da una data popolazione le medie ottenute per i vari campionamenti si distribuiscono attorno al valore µ. La larghezza della distribuzione dei valori medi sarà tanto più stretta intorno al valore vero quanti più elementi scelgo per ogni campionamento (m). ATTENZIONE: l'errore standard sulla media è funzione della deviazione standard della distribuzione ma non è la deviazione standard della distribuzione. La distribuzione reale confrontata con più campioni La distribuzione reale confrontata la distribuzione delle medie Accuratezza delle stime Il valor medio ottenuto da un solo campione di m elementi è una stima del valore aspettato della popolazione. L'errore standard della media rappresenta una stima dell'errore fatto nella stima del valore atteso. Se non conosco la deviazione standard della popolazione utilizzo la stima della deviazione standard (s) per valutare l'errore sulla media Risultato di un'osservazione: Accuratezza delle stime Per migliorare la stima del valore atteso si puó ripetere l'esperimento utilizzando K campioni indipendenti In questo caso la migliore stima del valore atteso è la media delle medie campionarie: Utilizzando K campioni indipendenti l'errore standard della media si calcola (radice quadrata) dalla varianza della distribuzione delle medie campionarie: varianza: Stima della varianza: Nota: attenziona al significato di queste formule Standardizzazione e normalizzazione La distribuzione delle medie campionarie su campioni di m elementi segue una distribuzione normale indipendentemente dalla distribuzione della popolazione d origine Standardizzazione e normalizzazione La distribuzione delle medie campionarie su campioni di m elementi segue una distribuzione normale indipendentemente dalla distribuzione della popolazione d origine Distribuzione delle medie campionarie Distribuzione delle medie campionarie CASO : non conosco la varianza vera della distribuzione ma la devo stimare dai dati La variabile: CASO : conosco la varianza vera della distribuzione quindi: La variabile: è una variabile aleatoria (t-student) che, per m molto grande, ha una distribuzione Normale Standard (ha media nulla e varianza unitaria): è una variabile aleatoria che segue una distribuzione Normale Standard (ha media nulla e varianza unitaria): - t /

3 Intervalli di Confidenza ovvero quale è la probabilità di sbagliare la stima? Pb.: un'osservazione su un campione di m elementi fornisce come risultato il valor medio di una variabile aleatoria. ) costruisco una variabile aleatoria con distribuzione nota, es.: ) sulla base della g(z) determino i valori di z che hanno una bassa probabilità di essere osservati, cioè: g(t) α es.: α=5% Se z < z < z la probabilità di osservare il valore di t, calocolato in base ai dati, è (-α) Se z < z o z > z la probabilità di osservare il valore di z, calocolato in base ai dati, è α fisso un livello di confidenza α. z z determino un intervallo di valori z α z α (intervallo di confidenza) tale che la probabilità di osservare z all'esterno dell'intervallo dato sia minore di α probabilità che t appartenga all'intervallo z z dato il valore medio, osservato su un campione di m elementi, il valore aspettato della popolazione (µ) è contenuto nell'intervallo: dato il valore medio, osservato su un campione di m elementi, -α è la probabilità che questo sia compreso nell'intervallo con probabilità -α. che puó essere detto anche: α è la probabilità di fare un errore maggiore di utilizzando la media come stima del valore atteso (quantificare il rischio) funzione EXCEL: CONIDENZA(α, dev.st, m) Intervalli di confidenza: varianza nota Se le osservazioni sono distribuite con: funzione EXCEL: CONIDENZA(α, dev.st, m) CONIDENZA(0.05, 0.5, 5)=0.438 valor medio dev.st. La resistenza elettrica di un cavo viene misurata con uno strumento che ha un'incertezza σ=0.5 Ω. Vengono effettuate 5 misure, ne risulta un valor medio R=4.5 Ω La resistenza vera del cavo è nell'intervallo : R = 4.5 ± 0.44 Ω oppure: R = [4.08, 4.96] Intervalli di confidenza: varianza campionaria olto piú spesso non conosco la varianza della distribuzione. La migliore stima della varianza in un campione di m elementi è: posso definire una variabile aleatoria: la variabile t cosi definita ha una distribuzione nota (t-student) con ν = m- gradi di libertà. La t-student approssima una distribuzione Gaussiana per ν che tende a infinito Normale (Gauss) m= m=30 Nota: α rappresenta il rischio di sbagliare, cioè la probabilità che il valore vero della resistenza sia esterno all'intervallo dato 3

4 Una misura dell'altezza di un gruppo di 0 studenti fornisce il valore medio: H =.68 m con la deviazione standard stimata s = 9 cm. L'intervallo di confidenza rappresenta la regione in cui la probabilità che il valore osservato di t sia nell'intervallo t - t intorno al valore vero è -α: Determinare gli intervalli di confidenza con un incertezza minore di %, 0.5% e 0.05% intorno al valore vero. inv.t(α; m-) CONCATENA(TESTO(valore,"0.00"),"testo",...) funzione EXCEL: INV.T(α,m-) = t a Nota: Se conosco la varianza utilizzo la funzione "confidenza", se devo stimare la varianza utilizzo la funzione "inv.t" Una misura dell'altezza di un gruppo di 0 studenti fornisce il valore medio: H =.68 m con la deviazione standard stimata s = 9 cm. Determinare l'intervallo di confidenza dell'% Intervalli di confidenza: varianza campionaria olto piú spesso non conosco la varianza della distribuzione. La migliore stima della varianza in un campione di m elementi è: da cui: Dati numero di osservazioni: m valor medio dev. standard: s Confidenza α 0.0 inv.t(α; m-) probabilità che il valore vero (µ) sia nell'intervallo: t_a.86 µ.68 ± 0.06 funzione EXCEL: INV.T(a,m-) = valore medio Nota: la variabile t cosi definita ha una distribuzione nota (t-student) con ν = m- gradi di libertà. La t-student approssima una distribuzione Gaussiana per ν che tende a infinito Test statistici di reiezione delle ipotesi t>t ) ipotesi da verificare ipotesi nulla: H o ) costruisco una variabile aleatoria con distribuzione nota, es.: Es.: il valore misurato è compatibile con il valore vero? 3) sulla base della g(t) determino i valori di t che hanno una bassa probabilità di essere osservati, fissando il livello di confidenza α. Se, in base alla distribuzione scelta, il valore osservato fornisce un valore di t con bassa probabilità di essere osservato, l'ipotesi deve essere rifiutata. g(t) α es.: α=5% t t Se t < t < t il risultato (cui è associato il valore t) è compatibile l'ipotesi fatta con una probabilità del P = (-α) Se t < t o t > t il risultato (cui è associato il valore t) non è compatibile l'ipotesi fatta con una probabilità del P = (-α) Quale è il rischio di scartare un dato compatibile? α rappresenta la probabilità di sbagliare e scartare un'ipotesi corretta. 4

5 Confronto fra due popolazioni: t-test Problema: si vogliono confrontare se due popolazioni normali, X e X. Supponiamo per ora che queste abbiano la stessa varianza (omeoschedasticità). Ipotesi: (H o ) le due popolazioni hanno la stessa media Campioni omoschedastici (stessa varianza σ=σ =σ, incognita) m diverso da m t = differenza delle medie campionarie errore standard sulla differenza delle medie campionarie m = m = m ν = (m ) Campioni etero-schedastici (varianza diversa) (test di Welch) La variabile aleatoria t ν segue una distribuzione nota (t-student) con ν gradi di libertà Nota: se la numerosità dei campioni è elevata la variabile t Confronto fra due popolazioni: t-test approssima una distribuzione normale, quindi si può utilizzarare una variabile normale standard per il test: La distribuzione della variabile t, ha una forma nota come student s t distribution (tende alla distribuzione normale di Gauss per N ) La forma della distribuzione dipende da un solo parametro, legato alla numerosità del campione: il numero di gradi di libertà ν = m +m - Valori piccoli di t indicano che la differenza fra le medie dei due campioni non è significativa (i campioni sono consistenti), valori grandi indicano una differenza significativa Per formalizzare il concetto, si considera la probabilità che il valore di t sia maggiore (in valore assoluto) di un dato limite. I valori di cui t è maggiore con una data probabilità sono detti valori critici e si trovano tabulati ( ) t-test issato il numero di gradi di libertà, la tabella indica i valori di t tali per cui la probabilità di ottenere un valore maggiore (in modulo) di quello indicato sia pari ad α la probabilità che t 0 >.8 è <5% funzione EXCEL: TEST.T(X A, X B, coda, tipo) X A X A insiemi (matrici) dei dati corrispondenti ai due campionamenti coda: - test a una coda test a due code tipo: test accoppiato (stesso numero di valori) test omeoschedastico (stessa varianza) 3 test eteroschedastico (varianza diversa) Il risultato rappresenta l'indice di confidenza del test. Ad esempio, un valore TEST.T(...)=0.0 indica che, in base ai dati, la probabilità di sbagliare dicendo che le due medie sono diverse è il %. Non posso dire che al 98% sono eguali! E' sbagliato dire che le medie sono diverse con il % di probabilità 5

6 Tassi e proporzioni Classi nominali: non possono essere messe in relazione matematica quantitativa con una scala di riferimento. In Excel la funzione Test.T restituisce la probabilità di osservare casualmente la differenza riscontrata. Si distingue il caso in cui non si conosce il segno della differenza (test a due code) da quello in cui si conosce il segno della differenza (una coda) regione critica da una sola parte della distribuzione ( coda) Es.: maschi/femmine, bianco/nero, mancini/destrorsi,... 45% maschi, 55% femmine Processi Bernulliani: ammettono solo due possibilità Ogni esperimento puó avere solo due risultati V/, /0, si/no... ovvero: Ogni unità della popolazione appartiene solo a una delle due classi gli esperimenti sono indipendenti, ovvero ogni unità del campione è determinata indipendentemente dalle altre la probabilità p di un un certo risultato è costante durante l'esperimento ovvero la proporzione delle classi è costante durante l'esperimento Analisi di proporzioni p = probabilità di successi = N_successi/N_totale X(successo) = X(insuccesso) = 0 q = probabilità di insuccessi = -p Valore medio (proporzione): dev.st: Stime campionarie di proporzioni stima di p: stima di σ uso la stima di p per la stima della σ Test sulle frequenze di un "attributo" H o : f m = p o requenza osservata: Errore stimato sulla frequenza: errore sulla stima di p: In un esperimento di 0 lanci di una moneta si ottengono 6 teste p s = 0.6 s p = La variabile aleatoria: Es.: su un campione si 00 intervistati ha risposto Si il 58%. E' significativamente maggiore di 50%? ) Scelgo un livello di confidenza α=4% segue una distribuzione normale standard (N(0,)) il valore medio atteso (la probabilità di successo) è, con il 95% di probabilità, tra ) Inv.Norm.St(0.98) =.75 = z α 3) lo confronto con il valore della z m INV.NOR.ST(p) = valore di z α per cui l'integrale da - a z α è p α p-s p e p+s p z α Con un livello di confidenza di 4% la maggiornaza del Si ottenuta dal campione scelto non è significativa 6

7 Es.: su un campione si 00 intervistati ha risposto Si il 58%. Quale è il rischio di sbagliare affermando la vittoria del Si al referendum? Ho: P A =P B H : P A >P B La differenza osservata è significativa se: α ) Calcolo il valore della z m z α ) Calcolo la probabilità associata alla coda della distribuzione usando la funzione EXCEL: DISTRIB.NOR.ST(.6) = =0.947 DISTRIB.NOR.ST(z) = probabilità di ottenere un valore minore di z. = - DISTRIB.NOR.ST(.6) =0.05 -DISTRIB.NOR.ST(z) = probabilità di ottenere un valore maggiore di z. Il rischio di sbagliare affermando la vittoria del Si al referendum è di 5.% Attenzione: test a una o due code Es.: in un esperimento effettuato su un campione si 00 individui si osserva il 58% delle volte il carattere A e il 4% il carattere B. Quale è il rischio di sbagliare affermando che la popolazione non è equamente divisa? H o : P A =P B H : P A P B (maggiore o minore) t ν = Problema: si vogliono confrontare i risultati di due esperimenti in termini di frequenze relative Ipotesi: (H o ) i due esperimenti appartengono alla stessa popolazione (hanno lo stesso velore aspettato) differenza delle medie campionarie errore standard sulla differenza delle medie campionarie ) Calcolo il valore della z m DISTRIB.NOR.ST(.6) = =0.947 z = differenza delle frequenze campionarie errore standard sulla differenza delle frequenze campionarie = ( - DISTRIB.NOR.ST(.6)) =0.04 Il rischio di sbagliare affermando che la popolazione non è equamente divisa è di ~0% coda code Nell ipotesi (da verificare) che i due campioni provengono dalla stessa popolazione p m =p m la miglior stima della frequenza di successi ottenuta usando entrambi i campioni è: e la varianza calcolata sull intero campione è: Es.: in un sondaggio elettorale effettuato su un campione di 000 persone, il 4% degli intervistati ha affermato di preferire la coalizione A. In un secondo sondaggio effettuato su un egual numero di intervistati il 46 % ha affermato di preferire la coalizione A. Quale è il rischio che questa differenza sia dovuta al caso? Quale è il valore di Z per credere alla differenza con rischio di errore inferiore al 5% m = m = 000 f = 0.4 f = 0.46 <f> = 0.44 z =.8 s f = z cor =.76 Correzione per la continuità (Yates): Deriva dal fatto che la z può assumere solo valori discreti mentre la distribuzione normale è continua. La correzione diventa via via meno significativa man mano che aumenta il numero di prove m Rischio: 7.9% rischio = (- distrib.norm.st(z cor ) ) rischio: probabilità che, pur essendo valida l'ipotesi f =f, si osservi per caso un valore di z maggiore o uguale a quello trovato Per credere alla differenza con un rischio minore del 5% α = 5% z 5% = inv.norm.st(-α/) =.96 dal momento che z cor < z 5% la probabilità di sbagliare affermando che i due risultati sono diversi è maggiore del 5% 7

8 Tabelle di contingenza effetto sperimentale frequenze assolute effetto n n E n n E N = n +n N = n +n N T = N + N = = E + E sperimentale frequenze relative Distribuzione congiunta f f f E f f f E f ij = n ij /N T f T f T Ipotesi (H o ): valori trovati sono determinati da una distribuzione casuale. Se l'ipotesi è vera i risultati in tabella (n ij ) sono scorrelati e quindi le distribuzioni dei valori trovati nelle righe e nelle colonne sono scorrelate razioni con diverso trattamento razioni con diverso esito f T = N / N T f T = N / N T f E = E / N T f E = E / N T Distribuzione dei trattamenti Distribuzione degli effetti Se effetto e trattamento sono scorrelati la probabilità di avere l'effetto j con il trattamento i è il prodotto: p ij = p Ti p Ej ~ f Ti f Ej teorica teorica Ipotesi: i trattamenti hanno lo stesso effetto Ipotesi: i trattamenti hanno lo stesso effetto frequenze relative effetto f E f T f E f T f E effetto f E f T N T f E f T N T E f E f T f E f T f E I valori attesi nell'ipotesi di effetti indipendenti dal trattamento (p Ei p Tj ) sono diversi dal valore sperimentali p ij frequenze assolute f E f T N T f E f T N T E f T f T N N N T sperimentale teorica sperimentale teorica effetto n n E effetto n' n' E totali B frequenze relative oppure: f f f E n n E f f f E n' n' E frequenze assolute effetto effetto totali B f E f T f E f T f E f E f T f E f T f E f T f T f T f T N N N T N N N T sperimentale teorica Esempio effetto effetto Le differenze osservate sono sognificative? Tratt. Tratt. gradi di libertà ν = (n col. -)(n righe -) effetto exp La variabile χ frequenze osservate Tratt. Tratt Th effetto frequenze attese

9 Nota: ν α unzione EXCEL: INV.CHI(α,ν) Se i trattamenti non avessero un effetto diverso, un valore di χ con grado di libertà maggiore di 6.63 ha una probabilità di essere osservato minore del %. Possiamo quindi affermare che i due trattamenti hanno un diverso effetto sui due gruppi con una probabilità di errore minore dell'% Titanic Classe sopravvissuti deceduti I II III 8 58 I decessi sono correlati con la classe? unzione EXCEL: INV.CHI(α,ν) restituisce il valore associato ad un livello di confidenza α per una variabile χ con ν g.d.l. la funzione: DISTRIB.CHI(χ, ν) restituisce la probabilità associata al valore di χ con ν g.d.l. la funzione EXCEL: TEST.CHI( exp, th ) restituisce la probabilità associata al valore di ottenuto da una matrice di dati sperimentali exp e da una matrice di dati teorici th ottenuta nell'ipotesi di distribuzione casuale dei risultati. Risultati dei Test di ammissione Ammessi Respinti Ammessi Respinti Conclusione: Le donne sono discriminate nei test di ammissione! V/? 9

10 Amm. Resp. % Amm. Risultati dei Test di ammissione dettagli per dipartimento Dip. A Dip. A Dip. B Dip. B Dip. C Dip. C Dip. D Dip. D Dip. E Dip. E Dip. Dip. Le differenza tra ammessi o sono significative? No! Test: le iscrizioni ai vari dipartimenti sono casuali? La frazione di respinti per dipartimento è casuale? Ipotesi: Le donne tendono a far domanda nei dipartimenti dove è maggiore la probabilità di essere respinti. 0.8 Ammessi Respinti Totale (/) Totale % ammessi % respinti % donne A B C D E Uomini ammessi (%) Donne ammesse (%) Respinti (%) Donne iscritte (%) Il grafico mostra qualitativamente una correlazione positiva tra frazione di respinti e numero di donne iscritte. rischio (%) rischio (%) Test sulle frequenze 7.e Test χ tabelle di contingenza 3.e A B C D E A B C D E L'analisi qualitativa (visiva) può essere (e spesso è) fonte di errori soggettivi. Quantificare la correlazione y = f(x) i valori della variabile y sonno funzione dei valori assunti dalla variabile indipendente x (deterministico): = m. a ; x=v. t ; S = b. a ; V=I. R ;... odelli statistici e inferenza statistica Dati Definizione del odello legge fisica: x(t) = x o + vt + 0.5at Definizione dei parametri Ipotesi (teoria) odelli: relazione funzionale tra ciò che si vuole spiegare (effetto) e le cause. Un modello statistico è: Test delle ipotesi Verifica del modello Si No - una semplificazione della realtà (rasoio di Occam: scartare le ipotesi complesse se ne esistono di più semplici che portano allo stesso risultato) Impiego del modello - un'analogia del fenomeno reale: il modello riproduce solo alcuni aspetti della realtà ma non è la realtà Regressione (raffinamento, fitting, etc...): relazione funzionale tra variabili ottenuta con metodi statistici. Il metodo della regressione consente di derivare una relazione statistica tra una variabile dipendente (Y) e una o più variabili esplicative (X, X...X n ). Origine: Galton regression toward mediocrity y y y Usando le variabili standardizzate: x x x La retta di regressione diventa: Correlazione positiva Correlazione negativa Ipotesi: esiste una relazione lineare tra i valori della x e i valori della y Errori sulle osservazioni Varianza x Varianza y Retta di regressione: r = coefficiente di correlazione di Pearson covarianza xy 0

11 Varianza degli errori Nota: Stime campionarie L'incertezza sulle stime dei parametri della regressione decresce aumentanto la varianza campionaria di x Utilizzando si annulla la correlazion e tra β o e β Nell'ipotesi che la varianza sia la stessa per tutti i valori osservati y i, la stima campionaria della varianza sugli errori è s: errore standard della regressione: con Errori standard sui parametri t-test t ν = β i /es(β i ) ν = n- L'intervalli di confidenza Indice di determinazione multipla R è un indice della "bontà della retta di regressione nello spiegare la variabilità di Y mediante X calcolare: Covarianza Deviazione standard Covarianza(at.;at.) nel caso di regressione lineare semplice edia (a:a...) dev.st (a:a...) c_xy/s_x/s_y edia (b:b...) correlazione (at.; at.) dev.st (b:b...) Quanto è significativa la correlazione? T-test sulla correlazione Intervallo di confidenza per la correlazione

12 =INDICE(REGR.LIN(matr y ;matr x ;VERO;VERO);;) ; ; 3; 4; 5; ; ; 3; 4; 5; ; m ; s m ; b ; s b 3; r : coefficiente di d determinazione 4; osservato 5; somma della regressione dei quadrati help regr.lin 3; errore std per la stima di y 4; gradi di libertà 5; somma residua dei quadrati

Ulteriori Conoscenze di Informatica e Statistica

Ulteriori Conoscenze di Informatica e Statistica Ulteriori Conoscenze di Informatica e Statistica Carlo Meneghini Dip. di fisica via della Vasca Navale 84, st. 83 (I piano) tel.: 06 55 17 72 17 meneghini@fis.uniroma3.it Tassi e proporzioni Classi nominali:

Dettagli

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: Esempi di domande risposta multipla (Modulo II) 1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: 1) ha un numero di elementi pari a 5; 2) ha un numero di elementi

Dettagli

I risultati di un esperimento sono variabili aleatorie.

I risultati di un esperimento sono variabili aleatorie. I risultati di un esperimento sono variabili aleatorie. Un esperimento non consente di esaminare ogni elemento di una popolazione o di effettuare tutte le misure possibili. campione Popolazion e , xs

Dettagli

Statistica. Lezione 6

Statistica. Lezione 6 Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 6 a.a 011-01 Dott.ssa Daniela Ferrante

Dettagli

Stima per intervalli Nei metodi di stima puntuale è sempre presente un ^ errore θ θ dovuto al fatto che la stima di θ in genere non coincide con il parametro θ. Sorge quindi l esigenza di determinare una

Dettagli

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a) Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B Eventi indipendenti: un evento non influenza l altro Eventi disgiunti: il verificarsi di un evento esclude l altro Evento prodotto:

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2014-2015 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

3. Confronto tra medie di due campioni indipendenti o appaiati

3. Confronto tra medie di due campioni indipendenti o appaiati BIOSTATISTICA 3. Confronto tra medie di due campioni indipendenti o appaiati Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk MARTA BLANGIARDO

Dettagli

E naturale chiedersi alcune cose sulla media campionaria x n

E naturale chiedersi alcune cose sulla media campionaria x n Supponiamo che un fabbricante stia introducendo un nuovo tipo di batteria per un automobile elettrica. La durata osservata x i delle i-esima batteria è la realizzazione (valore assunto) di una variabile

Dettagli

STATISTICA IX lezione

STATISTICA IX lezione Anno Accademico 013-014 STATISTICA IX lezione 1 Il problema della verifica di un ipotesi statistica In termini generali, si studia la distribuzione T(X) di un opportuna grandezza X legata ai parametri

Dettagli

Statistiche campionarie

Statistiche campionarie Statistiche campionarie Sul campione si possono calcolare le statistiche campionarie (come media campionaria, mediana campionaria, varianza campionaria,.) Le statistiche campionarie sono stimatori delle

Dettagli

ANALISI DELLE FREQUENZE: IL TEST CHI 2

ANALISI DELLE FREQUENZE: IL TEST CHI 2 ANALISI DELLE FREQUENZE: IL TEST CHI 2 Quando si hanno scale nominali o ordinali, non è possibile calcolare il t, poiché non abbiamo medie, ma solo frequenze. In questi casi, per verificare se un evento

Dettagli

Regressione Mario Guarracino Data Mining a.a. 2010/2011

Regressione Mario Guarracino Data Mining a.a. 2010/2011 Regressione Esempio Un azienda manifatturiera vuole analizzare il legame che intercorre tra il volume produttivo X per uno dei propri stabilimenti e il corrispondente costo mensile Y di produzione. Volume

Dettagli

1. Distribuzioni campionarie

1. Distribuzioni campionarie Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 2012/2013 lezioni di statistica del 3 e 6 giugno 2013 - di Massimo Cristallo - 1. Distribuzioni campionarie

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 12-Il t-test per campioni appaiati vers. 1.2 (7 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

Inferenza statistica. Statistica medica 1

Inferenza statistica. Statistica medica 1 Inferenza statistica L inferenza statistica è un insieme di metodi con cui si cerca di trarre una conclusione sulla popolazione sulla base di alcune informazioni ricavate da un campione estratto da quella

Dettagli

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione)

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione) Esercitazione #5 di Statistica Test ed Intervalli di Confidenza (per una popolazione) Dicembre 00 1 Esercizi 1.1 Test su media (con varianza nota) Esercizio n. 1 Il calore (in calorie per grammo) emesso

Dettagli

VERIFICA DELLE IPOTESI

VERIFICA DELLE IPOTESI VERIFICA DELLE IPOTESI Nella verifica delle ipotesi è necessario fissare alcune fasi prima di iniziare ad analizzare i dati. a) Si deve stabilire quale deve essere l'ipotesi nulla (H0) e quale l'ipotesi

Dettagli

LA CORRELAZIONE LINEARE

LA CORRELAZIONE LINEARE LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad esempio, si può supporre che vi sia una relazione tra l insoddisfazione

Dettagli

LEZIONE n. 5 (a cura di Antonio Di Marco)

LEZIONE n. 5 (a cura di Antonio Di Marco) LEZIONE n. 5 (a cura di Antonio Di Marco) IL P-VALUE (α) Data un ipotesi nulla (H 0 ), questa la si può accettare o rifiutare in base al valore del p- value. In genere il suo valore è un numero molto piccolo,

Dettagli

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010 LEZIONE 3 "Educare significa aiutare l'animo dell'uomo ad entrare nella totalità della realtà. Non si può però educare se non rivolgendosi alla libertà, la quale definisce il singolo, l'io. Quando uno

Dettagli

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Introduzione : analisi delle relazioni tra due caratteristiche osservate sulle stesse unità statistiche studio del comportamento di due caratteri

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Test delle ipotesi sulla varianza In un azienda che produce componenti meccaniche, è stato

Dettagli

Il confronto fra proporzioni

Il confronto fra proporzioni L. Boni Il rapporto Un rapporto (ratio), attribuendo un ampio significato al termine, è il risultato della divisione di una certa quantità a per un altra quantità b Il rapporto Spesso, in maniera più specifica,

Dettagli

La variabile casuale Binomiale

La variabile casuale Binomiale La variabile casuale Binomiale Si costruisce a partire dalla nozione di esperimento casuale Bernoulliano che consiste in un insieme di prove ripetute con le seguenti caratteristiche: i) ad ogni singola

Dettagli

Analisi di dati di frequenza

Analisi di dati di frequenza Analisi di dati di frequenza Fase di raccolta dei dati Fase di memorizzazione dei dati in un foglio elettronico 0 1 1 1 Frequenze attese uguali Si assuma che dalle risposte al questionario sullo stato

Dettagli

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Intervalli di confidenza

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Intervalli di confidenza Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica

Dettagli

Relazioni statistiche: regressione e correlazione

Relazioni statistiche: regressione e correlazione Relazioni statistiche: regressione e correlazione È detto studio della connessione lo studio si occupa della ricerca di relazioni fra due variabili statistiche o fra una mutabile e una variabile statistica

Dettagli

Facoltà di Psicologia Università di Padova Anno Accademico 2010-2011

Facoltà di Psicologia Università di Padova Anno Accademico 2010-2011 Facoltà di Psicologia Università di Padova Anno Accademico 010-011 Corso di Psicometria - Modulo B Dott. Marco Vicentini marco.vicentini@unipd.it Rev. 10/01/011 La distribuzione F di Fisher - Snedecor

Dettagli

Facciamo qualche precisazione

Facciamo qualche precisazione Abbiamo introdotto alcuni indici statistici (di posizione, di variabilità e di forma) ottenibili da Excel con la funzione Riepilogo Statistiche Facciamo qualche precisazione Al fine della partecipazione

Dettagli

Università del Piemonte Orientale. Corsi di Laurea Triennale di area tecnica. Corso di Statistica Medica

Università del Piemonte Orientale. Corsi di Laurea Triennale di area tecnica. Corso di Statistica Medica Università del Piemonte Orientale Corsi di Laurea Triennale di area tecnica Corso di Statistica Medica Campionamento e distribuzione campionaria della media Corsi di laurea triennale di area tecnica -

Dettagli

La distribuzione Gaussiana

La distribuzione Gaussiana Università del Piemonte Orientale Corso di Laurea in Biotecnologie Corso di Statistica Medica La distribuzione Normale (o di Gauss) Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 10-Il test t per un campione e la stima intervallare (vers. 1.1, 25 ottobre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia,

Dettagli

Statistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice

Statistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice Esercitazione 15 Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () 1 / 18 L importanza del gruppo di controllo In tutti i casi in cui si voglia studiare l effetto di un certo

Dettagli

Statistica inferenziale

Statistica inferenziale Statistica inferenziale Popolazione e campione Molto spesso siamo interessati a trarre delle conclusioni su persone che hanno determinate caratteristiche (pazienti, atleti, bambini, gestanti, ) Osserveremo

Dettagli

Calcolo delle probabilità

Calcolo delle probabilità Calcolo delle probabilità Laboratorio di Bioinformatica Corso A aa 2005-2006 Statistica Dai risultati di un esperimento si determinano alcune caratteristiche della popolazione Calcolo delle probabilità

Dettagli

Prova di autovalutazione Prof. Roberta Siciliano

Prova di autovalutazione Prof. Roberta Siciliano Prova di autovalutazione Prof. Roberta Siciliano Esercizio 1 Nella seguente tabella è riportata la distribuzione di frequenza dei prezzi per camera di alcuni agriturismi, situati nella regione Basilicata.

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2013-2014 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

Corso di laurea in Scienze Motorie. Corso di Statistica. Docente: Dott.ssa Immacolata Scancarello Lezione 2: Misurazione, tabelle

Corso di laurea in Scienze Motorie. Corso di Statistica. Docente: Dott.ssa Immacolata Scancarello Lezione 2: Misurazione, tabelle Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione : Misurazione, tabelle 1 Misurazione Definizione: La misura è l attribuzione di un valore numerico

Dettagli

Esercizi test ipotesi. Prof. Raffaella Folgieri Email: folgieri@mtcube.com aa 2009/2010

Esercizi test ipotesi. Prof. Raffaella Folgieri Email: folgieri@mtcube.com aa 2009/2010 Esercizi test ipotesi Prof. Raffaella Folgieri Email: folgieri@mtcube.com aa 2009/2010 Verifica delle ipotesi - Esempio quelli di Striscia la Notizia" effettuano controlli casuali per vedere se le pompe

Dettagli

Capitolo 2 Distribuzioni di frequenza

Capitolo 2 Distribuzioni di frequenza Edizioni Simone - Vol. 43/1 Compendio di statistica Capitolo 2 Distribuzioni di frequenza Sommario 1. Distribuzioni semplici. - 2. Distribuzioni doppie. - 3. Distribuzioni parziali: condizionate e marginali.

Dettagli

Istituzioni di Statistica e Statistica Economica

Istituzioni di Statistica e Statistica Economica Istituzioni di Statistica e Statistica Economica Università degli Studi di Perugia Facoltà di Economia, Assisi, a.a. 2013/14 Esercitazione n. 4 A. Si supponga che la durata in giorni delle lampadine prodotte

Dettagli

Slide Cerbara parte1 5. Le distribuzioni teoriche

Slide Cerbara parte1 5. Le distribuzioni teoriche Slide Cerbara parte1 5 Le distribuzioni teoriche I fenomeni biologici, demografici, sociali ed economici, che sono il principale oggetto della statistica, non sono retti da leggi matematiche. Però dalle

Dettagli

Capitolo 12 La regressione lineare semplice

Capitolo 12 La regressione lineare semplice Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 1

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 1 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 1 Dott.ssa Antonella Costanzo a.costanzo@unicas.it A.Studio dell interdipendenza tra variabili: riepilogo Concetto relativo allo studio delle relazioni tra

Dettagli

Test statistici di verifica di ipotesi

Test statistici di verifica di ipotesi Test e verifica di ipotesi Test e verifica di ipotesi Il test delle ipotesi consente di verificare se, e quanto, una determinata ipotesi (di carattere biologico, medico, economico,...) è supportata dall

Dettagli

Lineamenti di econometria 2

Lineamenti di econometria 2 Lineamenti di econometria 2 Camilla Mastromarco Università di Lecce Master II Livello "Analisi dei Mercati e Sviluppo Locale" (PIT 9.4) Aspetti Statistici della Regressione Aspetti Statistici della Regressione

Dettagli

RELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della

RELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della RELAZIONE TRA VARIABILI QUANTITATIVE Lezione 7 a Accade spesso nella ricerca in campo biomedico, così come in altri campi della scienza, di voler studiare come il variare di una o più variabili (variabili

Dettagli

Analisi dei residui. Test Esatto di Fisher. Differenza fra proporzioni

Analisi dei residui. Test Esatto di Fisher. Differenza fra proporzioni Statistica Economica Materiale didattico a cura del docente Analisi dei residui Test Esatto di Fisher Differenza fra proporzioni 1 Analisi dei residui Il test statistico ed il suo p-valore riassumono la

Dettagli

RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL

RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL 1 RAPPRESENTAZIONE GRAFICA Per l analisi dati con Excel si fa riferimento alla versione 2007 di Office, le versioni successive non differiscono

Dettagli

Un po di statistica. Christian Ferrari. Laboratorio di Matematica

Un po di statistica. Christian Ferrari. Laboratorio di Matematica Un po di statistica Christian Ferrari Laboratorio di Matematica 1 Introduzione La statistica è una parte della matematica applicata che si occupa della raccolta, dell analisi e dell interpretazione di

Dettagli

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Analisi dei dati quantitativi :

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Analisi dei dati quantitativi : Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Analisi dei dati quantitativi : Confronto tra due medie Università del Piemonte Orientale Corso di laurea in

Dettagli

Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 14: Analisi della varianza (ANOVA)

Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 14: Analisi della varianza (ANOVA) Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 4: Analisi della varianza (ANOVA) Analisi della varianza Analisi della varianza (ANOVA) ANOVA ad

Dettagli

Esercitazione n.2 Inferenza su medie

Esercitazione n.2 Inferenza su medie Esercitazione n.2 Esercizio L ufficio del personale di una grande società intende stimare le spese mediche familiari dei suoi impiegati per valutare la possibilità di attuare un programma di assicurazione

Dettagli

Test d ipotesi. Statistica e biometria. D. Bertacchi. Test d ipotesi

Test d ipotesi. Statistica e biometria. D. Bertacchi. Test d ipotesi In molte situazioni una raccolta di dati (=esiti di esperimenti aleatori) viene fatta per prendere delle decisioni sulla base di quei dati. Ad esempio sperimentazioni su un nuovo farmaco per decidere se

Dettagli

Dott.ssa Caterina Gurrieri

Dott.ssa Caterina Gurrieri Dott.ssa Caterina Gurrieri Le relazioni tra caratteri Data una tabella a doppia entrata, grande importanza riveste il misurare se e in che misura le variabili in essa riportata sono in qualche modo

Dettagli

SPC e distribuzione normale con Access

SPC e distribuzione normale con Access SPC e distribuzione normale con Access In questo articolo esamineremo una applicazione Access per il calcolo e la rappresentazione grafica della distribuzione normale, collegata con tabelle di Clienti,

Dettagli

Il concetto di valore medio in generale

Il concetto di valore medio in generale Il concetto di valore medio in generale Nella statistica descrittiva si distinguono solitamente due tipi di medie: - le medie analitiche, che soddisfano ad una condizione di invarianza e si calcolano tenendo

Dettagli

DISTRIBUZIONI DI PROBABILITÀ

DISTRIBUZIONI DI PROBABILITÀ Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria Civile A.A. 2009-10 Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain 1 LE PRINCIPALI DISTRIBUZIONI

Dettagli

OSSERVAZIONI TEORICHE Lezione n. 4

OSSERVAZIONI TEORICHE Lezione n. 4 OSSERVAZIONI TEORICHE Lezione n. 4 Finalità: Sistematizzare concetti e definizioni. Verificare l apprendimento. Metodo: Lettura delle OSSERVAZIONI e risoluzione della scheda di verifica delle conoscenze

Dettagli

Statistica multivariata. Statistica multivariata. Analisi multivariata. Dati multivariati. x 11 x 21. x 12 x 22. x 1m x 2m. x nm. x n2.

Statistica multivariata. Statistica multivariata. Analisi multivariata. Dati multivariati. x 11 x 21. x 12 x 22. x 1m x 2m. x nm. x n2. Analisi multivariata Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Cercare di capire le relazioni

Dettagli

Test non parametrici. Test non parametrici. Test non parametrici. Test non parametrici

Test non parametrici. Test non parametrici. Test non parametrici. Test non parametrici Test non parametrici Test non parametrici Il test T di Student per uno o per due campioni, il test F di Fisher per l'analisi della varianza, la correlazione, la regressione, insieme ad altri test di statistica

Dettagli

La categoria «ES» presenta (di solito) gli stessi comandi

La categoria «ES» presenta (di solito) gli stessi comandi Utilizzo delle calcolatrici FX 991 ES+ Parte II PARMA, 11 Marzo 2014 Prof. Francesco Bologna bolfra@gmail.com ARGOMENTI DELLA LEZIONE 1. Richiami lezione precedente 2.Calcolo delle statistiche di regressione:

Dettagli

1a) Calcolare gli estremi dell intervallo di confidenza per µ al 90% in corrispondenza del campione osservato.

1a) Calcolare gli estremi dell intervallo di confidenza per µ al 90% in corrispondenza del campione osservato. Esercizio 1 Sia X 1,..., X un campione casuale estratto da una variabile aleatoria normale con media pari a µ e varianza pari a 1. Supponiamo che la media campionaria sia x = 2. 1a) Calcolare gli estremi

Dettagli

(accuratezza) ovvero (esattezza)

(accuratezza) ovvero (esattezza) Capitolo n 2 2.1 - Misure ed errori In un analisi chimica si misurano dei valori chimico-fisici di svariate grandezze; tuttavia ogni misura comporta sempre una incertezza, dovuta alla presenza non eliminabile

Dettagli

Corso di. Dott.ssa Donatella Cocca

Corso di. Dott.ssa Donatella Cocca Corso di Statistica medica e applicata Dott.ssa Donatella Cocca 1 a Lezione Cos'è la statistica? Come in tutta la ricerca scientifica sperimentale, anche nelle scienze mediche e biologiche è indispensabile

Dettagli

11. Analisi statistica degli eventi idrologici estremi

11. Analisi statistica degli eventi idrologici estremi . Analisi statistica degli eventi idrologici estremi I processi idrologici evolvono, nello spazio e nel tempo, secondo modalità che sono in parte predicibili (deterministiche) ed in parte casuali (stocastiche

Dettagli

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008 Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica 18 dicembre 008 Esame sull intero programma: esercizi da A a D Esame sulla seconda parte del programma: esercizi

Dettagli

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE La presentazione dei dati per molte ricerche mediche fa comunemente riferimento a frequenze, assolute o percentuali. Osservazioni cliniche conducono sovente

Dettagli

ESAME DI STATISTICA Nome: Cognome: Matricola:

ESAME DI STATISTICA Nome: Cognome: Matricola: ESAME DI STATISTICA Nome: Cognome: Matricola: ISTRUZIONI: Per la prova è consentito esclusivamente l uso di una calcolatrice tascabile, delle tavole della normale e della t di Student. I risultati degli

Dettagli

1. Richiami di Statistica. Stefano Di Colli

1. Richiami di Statistica. Stefano Di Colli 1. Richiami di Statistica Metodi Statistici per il Credito e la Finanza Stefano Di Colli Dati: Fonti e Tipi I dati sperimentali sono provenienti da un contesto delimitato, definito per rispettare le caratteristiche

Dettagli

Temi di Esame a.a. 2012-2013. Statistica - CLEF

Temi di Esame a.a. 2012-2013. Statistica - CLEF Temi di Esame a.a. 2012-2013 Statistica - CLEF I Prova Parziale di Statistica (CLEF) 11 aprile 2013 Esercizio 1 Un computer è collegato a due stampanti, A e B. La stampante A è difettosa ed il 25% dei

Dettagli

ANALISI DI CORRELAZIONE

ANALISI DI CORRELAZIONE ANALISI DI CORRELAZIONE Esempio: Dati raccolti da n = 129 studenti di Pavia (A.A. 21/2) Altezza (cm) Peso (Kg) Voto Algebra e Geometria Voto Fisica I Valutare la correlazione delle seguenti coppie: Peso

Dettagli

PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE

PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) PROBABILITÀ -

Dettagli

Corso di Psicometria Progredito

Corso di Psicometria Progredito Corso di Psicometria Progredito 3.1 Introduzione all inferenza statistica Prima Parte Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014

Dettagli

Rapporto dal Questionari Insegnanti

Rapporto dal Questionari Insegnanti Rapporto dal Questionari Insegnanti SCUOLA CHIC81400N N. Docenti che hanno compilato il questionario: 60 Anno Scolastico 2014/15 Le Aree Indagate Il Questionario Insegnanti ha l obiettivo di rilevare la

Dettagli

Metodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Metodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo Metodi statistici per l economia (Prof. Capitanio) Slide n. 9 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 TEST D IPOTESI Partiamo da un esempio presente sul libro di testo.

Dettagli

PROVE D'ESAME DI CPS A.A. 2009/2010. 0 altrimenti.

PROVE D'ESAME DI CPS A.A. 2009/2010. 0 altrimenti. PROVE D'ESAME DI CPS A.A. 009/00 0/06/00 () (4pt) Olimpiadi, nale dei 00m maschili, 8 nalisti. Si sa che i 4 atleti nelle corsie centrali hanno probabilità di correre in meno di 0 secondi. I 4 atleti delle

Dettagli

La distribuzione Normale. La distribuzione Normale

La distribuzione Normale. La distribuzione Normale La Distribuzione Normale o Gaussiana è la distribuzione più importante ed utilizzata in tutta la statistica La curva delle frequenze della distribuzione Normale ha una forma caratteristica, simile ad una

Dettagli

ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE

ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE e-mail: tommei@dm.unipi.it web: www.dm.unipi.it/ tommei Ricevimento: su appuntamento Dipartimento di Matematica, piano terra, studio 114

Dettagli

L Analisi della Varianza ANOVA (ANalysis Of VAriance)

L Analisi della Varianza ANOVA (ANalysis Of VAriance) L Analisi della Varianza ANOVA (ANalysis Of VAriance) 1 CONCETTI GENERALI Finora abbiamo descritto test di ipotesi finalizzati alla verifica di ipotesi sulla differenza tra parametri di due popolazioni

Dettagli

Ulteriori Conoscenze di Informatica e Statistica. Popolazione. Campione. I risultati di un esperimento sono variabili aleatorie.

Ulteriori Conoscenze di Informatica e Statistica. Popolazione. Campione. I risultati di un esperimento sono variabili aleatorie. Ulteriori Conoscenze di Informatica e Statistica Carlo Meneghini Dip. di fisica via della Vasca Navale 84, st. 83 (I piano) tel.: 06 55 17 72 17 meneghini@fis.uniroma3.it I risultati di un esperimento

Dettagli

Tema A. 1.2. Se due eventi A e B sono indipendenti e tali che P (A) = 1/2 e P (B) = 2/3, si può certamente concludere che

Tema A. 1.2. Se due eventi A e B sono indipendenti e tali che P (A) = 1/2 e P (B) = 2/3, si può certamente concludere che Statistica Cognome: Laurea Triennale in Biologia Nome: 26 luglio 2012 Matricola: Tema A 1. Parte A 1.1. Sia x 1, x 2,..., x n un campione di n dati con media campionaria x e varianza campionaria s 2 x

Dettagli

Il coefficiente di correlazione di Spearman per ranghi

Il coefficiente di correlazione di Spearman per ranghi Il coefficiente di correlazione di Spearman per ranghi Questo indice di correlazione non parametrico viene indicato con r s o Spearman rho e permette di valutare la forza del rapporto tra due variabili

Dettagli

Matematica Applicata. Probabilità e statistica

Matematica Applicata. Probabilità e statistica Matematica Applicata Probabilità e statistica Fenomeni casuali Fenomeni che si verificano in modi non prevedibili a priori 1. Lancio di una moneta: non sono in grado di prevedere con certezza se il risultato

Dettagli

Tabella per l'analisi dei risultati

Tabella per l'analisi dei risultati Vai a... UniCh Test V_Statistica_Eliminatorie Quiz V_Statistica_Eliminatorie Aggiorna Quiz Gruppi visibili Tutti i partecipanti Info Anteprima Modifica Risultati Riepilogo Rivalutazione Valutazione manuale

Dettagli

FONDAMENTI DI PSICOMETRIA - 8 CFU

FONDAMENTI DI PSICOMETRIA - 8 CFU Ψ FONDAMENTI DI PSICOMETRIA - 8 CFU STIMA DELL ATTENDIBILITA STIMA DELL ATTENDIBILITA DEFINIZIONE DI ATTENDIBILITA (affidabilità, fedeltà) Grado di accordo tra diversi tentativi di misurare uno stesso

Dettagli

Abbiamo costruito il grafico delle sst in funzione del tempo (dal 1880 al 1995).

Abbiamo costruito il grafico delle sst in funzione del tempo (dal 1880 al 1995). ANALISI DI UNA SERIE TEMPORALE Analisi statistica elementare Abbiamo costruito il grafico delle sst in funzione del tempo (dal 1880 al 1995). Si puo' osservare una media di circa 26 C e una deviazione

Dettagli

Applicazioni lineari

Applicazioni lineari Applicazioni lineari Esempi di applicazioni lineari Definizione. Se V e W sono spazi vettoriali, una applicazione lineare è una funzione f: V W tale che, per ogni v, w V e per ogni a, b R si abbia f(av

Dettagli

STATISTICA GIUSEPPE DE NICOLAO. Dipartimento di Informatica e Sistemistica Università di Pavia

STATISTICA GIUSEPPE DE NICOLAO. Dipartimento di Informatica e Sistemistica Università di Pavia STATISTICA GIUSEPPE DE NICOLAO Dipartimento di Informatica e Sistemistica Università di Pavia SOMMARIO V.C. vettoriali Media e varianza campionarie Proprietà degli stimatori Intervalli di confidenza Statistica

Dettagli

INDICE PREFAZIONE VII

INDICE PREFAZIONE VII INDICE PREFAZIONE VII CAPITOLO 1. LA STATISTICA E I CONCETTI FONDAMENTALI 1 1.1. Un po di storia 3 1.2. Fenomeno collettivo, popolazione, unità statistica 4 1.3. Caratteri e modalità 6 1.4. Classificazione

Dettagli

(a cura di Francesca Godioli)

(a cura di Francesca Godioli) lezione n. 12 (a cura di Francesca Godioli) Ad ogni categoria della variabile qualitativa si può assegnare un valore numerico che viene chiamato SCORE. Passare dalla variabile qualitativa X2 a dei valori

Dettagli

LA STATISTICA si interessa del rilevamento, dell elaborazione e dello studio dei dati; studia ciò che accade o come è fatto un gruppo numeroso di

LA STATISTICA si interessa del rilevamento, dell elaborazione e dello studio dei dati; studia ciò che accade o come è fatto un gruppo numeroso di STATISTICA LA STATISTICA si interessa del rilevamento, dell elaborazione e dello studio dei dati; studia ciò che accade o come è fatto un gruppo numeroso di oggetti; cerca, attraverso l uso della matematica

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Test delle ipotesi per la media (varianza nota), p-value del test Il manager di un fast-food

Dettagli

Esame di Statistica del 17 luglio 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova).

Esame di Statistica del 17 luglio 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Esame di Statistica del 17 luglio 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola Es. 1 Es. 2 Es. 3 Es. 4 Somma Voto finale Attenzione: si consegnano

Dettagli

Psicometria (8 CFU) Corso di Laurea triennale STANDARDIZZAZIONE

Psicometria (8 CFU) Corso di Laurea triennale STANDARDIZZAZIONE Psicometria (8 CFU) Corso di Laurea triennale Un punteggio all interno di una distribuzione è in realtà privo di significato se preso da solo. Sapere che un soggetto ha ottenuto un punteggio x=52 in una

Dettagli

ELEMENTI DI STATISTICA

ELEMENTI DI STATISTICA Dipartimento di Ingegneria Meccanica Chimica e dei Materiali PROGETTAZIONE E GESTIONE DEGLI IMPIANTI INDUSTRIALI Esercitazione 6 ORE ELEMENTI DI STATISTICA Prof. Ing. Maria Teresa Pilloni Anno Accademico

Dettagli

RAPPRESENTAZIONE DEI DATI

RAPPRESENTAZIONE DEI DATI Rappresentazione dei Dati RAPPRESENTAZIONE DEI DATI Quando si dispone di un alto numero di misure della stessa grandezza fisica è opportuno organizzarle in modo da rendere evidente Quandoil si loro dispone

Dettagli

METODOLOGIA CLINICA Necessita di: Quantificazione Formalizzazione matematica

METODOLOGIA CLINICA Necessita di: Quantificazione Formalizzazione matematica METODOLOGIA CLINICA Necessita di: Quantificazione Formalizzazione matematica EPIDEMIOLOGIA Ha come oggetto lo studio della distribuzione delle malattie in un popolazione e dei fattori che la influenzano

Dettagli

matematica probabilmente

matematica probabilmente IS science centre immaginario scientifico Laboratorio dell'immaginario Scientifico - Trieste tel. 040224424 - fax 040224439 - e-mail: lis@lis.trieste.it - www.immaginarioscientifico.it indice Altezze e

Dettagli