UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:
|
|
- Prospero Casadei
- 4 anni fa
- Visualizzazioni
Transcript
1 UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA Prof.ssa Donatella Siepi tel: novembre 2014
2 8 LEZIONE
3 Statistica inferenziale Probabilità Campione Popolazione Statistica inferenziale
4 Basi dei test statistici
5 LA VERIFICA DI IPOTESI: TEST BASATI SU UN CAMPIONE
6 La verifica di ipotesi Una fase dell inferenza è quella che consente di verificare delle ipotesi sui parametri Obiettivo primario: capire e ridurre l incertezza per prendere decisioni Obiettivo secondario: controllare il rischio del prendere decisioni sulla base delle statistiche campionarie
7 La verifica di ipotesi Verifica di ipotesi: metodologia per fare inferenza sui parametri della popolazione alla luce dell analisi delle differenze tra i risultati osservati (statistica campionaria) e quelli che ci aspetteremmo se una qualche ipotesi sulla popolazione fosse vera. La verifica di ipotesi ha inizio con la formulazione del sistema di ipotesi sottoposto a verifica. Il sistema di ipotesi fa sempre riferimento a qualche parametro della popolazione. Consiste sempre in due ipotesi contrapposte.
8 Ipotesi nulla L ipotesi nulla è, in generale, l ipotesi che si vorrebbe rifiutare. Essa afferma che gli effetti osservati nei campioni sono dovuti a fluttuazioni casuali, sempre possibili quando esiste variabilità tra gli individui; si tratta di variazioni che sono tanto più marcate quanto più ridotto è il numero di osservazioni. L ipotesi nulla H0 deve essere rifiutata solamente se esiste l evidenza che la contraddice. E importante comprendere che l ipotesi nulla non è necessariamente vera, quando i dati campionari (eventualmente pochi) non sono tali da contraddirla. L ipotesi nulla H0 non è mai provata o verificata; è solo possibile negarla o disapprovarla, sulla base di dati sperimentali
9 Con un test statistico si determina solamente una probabilità, che può essere differente ripetendo lo stesso esperimento, e inoltre la decisione che ne deriva può essere errata. Come primo caso, si supponga che un giocatore utilizzi una moneta perfettamente bilanciata, ma di cui egli non conosca le caratteristiche. Mediante alcuni lanci, egli deve decidere se la moneta è bilanciata (H0) oppure truccata (H1). Si supponga quindi che egli lanci questa moneta 6 volte e che ottenga croce tutte le volte. Se fosse uno statistico ragionerebbe in questo modo: "Avere 6 croci su 6 lanci è un evento raro; più esattamente ha una probabilità di (1/2 6 =0,5 6 ) 0,0156 o 1,56% di avvenire, se la moneta non fosse truccata (H0 vera).
10 Con una ipotesi bilaterale, quindi comprendendo anche la possibilità di avere 6 volte testa/croce, la probabilità è esattamente uguale a 3,12%. Di conseguenza, poiché 3,12% è una probabilità ritenuta bassa, ottenere 6 volte testa oppure 6 volte croce sono eventi complessivamente poco probabili, seppure possibili". Se egli avesse prefissato come valore soglia la probabilità del 5%, con questo test statistico rifiuterebbe l ipotesi nulla. Giungerebbe alla conclusione che tra atteso (3 volte teste e 3 volte croce su 6 lanci) ed osservato (6 volte croce oppure l'opposto) esiste una differenza significativa e che pertanto la moneta è truccata. Ma noi, sappiamo che in realtà essa non la è. E un errore, che in statistica si chiama errore di I tipo (scritto spesso con l'iniziale maiuscola Tipo=errore di prima specie). Consiste nel rifiutare l ipotesi nulla H0, quando in realtà essa è vera
11 Si supponga ora, come secondo caso, che sempre all insaputa del giocatore questa volta la moneta sia truccata e dia solo croce. Se questa volta egli la lancia solo 3 volte, ovviamente otterrebbe 3 volte croce. In questo caso, se fosse uno statistico seguirebbe questo ragionamento: "Se la moneta non fosse truccata (H0 vera), la probabilità di trovare per caso 3 volte croce è alta, più esattamente uguale a 0,5 3 =0,125 o 12,5%".Con un test bilaterale la probabilità è 0,25. Pertanto, egli non rifiuterebbe l ipotesi nulla. Errando, arriverebbe alla conclusione che la moneta non è truccata. In questo caso, si ha l errore di II tipo (o seconda specie). Consiste nel non rifiutare (o accettare) l'ipotesi nulla H0, quando in realtà essa è falsa. In statistica, non è possibile eliminare questi due tipi di errore.
12 La verifica di ipotesi Una fase dell inferenza è quella che consente di verificare delle ipotesi sui parametri Obiettivo primario: capire e ridurre l incertezza per prendere decisioni Obiettivo secondario: controllare il rischio del prendere decisioni sulla base delle statistiche campionarie Esempio: in una azienda che produce scatole metalliche si intende valutare se il processo produttivo opera in modo tale da garantire che la lunghezza del lato maggiore sia pari a 368 mm. Viene estratto un campione di 25 scatole. Se la lunghezza delle scatole risultasse diversa sarebbe necessario un intervento correttivo, altrimenti no.
13 La verifica di ipotesi Nell approccio classico alla verifica di ipotesi, si individuano i seguenti elementi chiave: 1. L ipotesi nulla H 0 si riferisce sempre a un valore specifico del parametro della popolazione (ad esempio m), e non a una statistica campionaria (ad esempio la media campionaria). 2. L ipotesi nulla contiene sempre un segno di eguale relativo al valore specificato del parametro della popolazione (ad esempio H 0 : m=368 mm). 3. L ipotesi alternativa non contiene mai un segno di eguale relativo al valore specificato del parametro della popolazione (ad esempio H 1 : m 368 mm).
14 La verifica di ipotesi Se la statistica campionaria prescelta si avvicina al valore ipotizzato nell ipotesi nulla accettiamo H 0, altrimenti rifiutiamo H 0 a favore dell ipotesi alternativa H 1. La teoria della verifica di ipotesi fornisce una regola su cui basare il processo decisionale. Tale regola si basa sul calcolo della probabilità di ottenere un dato risultato campionario nel caso in cui l ipotesi nulla sia vera. Questo risultato viene ricavato determinando prima la distribuzione campionaria della statistica di interesse (statistica test) e quindi calcolando il valore assunto per il particolare campione considerato. La distribuzione campionaria della statistica test spesso è una distribuzione statistica nota, come la Normale o la t di Student, e quindi possiamo ricorrere a queste distribuzioni per sottoporre a verifica un ipotesi nulla.
15 La verifica di ipotesi La distribuzione campionaria della statistica test è divisa in due regioni: una regione di rifiuto (o regione critica) una regione di accettazione Regione di rifiuto: insieme dei valori della statistica test che non è probabile si verifichino quando è vera H 0 ed è probabile si verifichino quando H 0 è falsa. La regola decisionale è: Valore della statistica test Cade nella regione di accettazione Cade nella regione di rifiuto L ipotesi nulla non può essere rifiutata L ipotesi nulla deve essere rifiutata
16 La verifica di ipotesi Per prendere una decisione sull ipotesi nulla, dobbiamo determinare il valore critico della statistica test. Tale valore separa la regione di accettazione dalla regione di rifiuto.
17 La verifica di ipotesi Decidere sulla base della statistica campionaria => rischio di errore. Si distinguono due tipi di errore: L errore di prima specie si verifica se si rifiuta l ipotesi nulla quando è vera e quindi non dovrebbe essere rifiutata. La Probabilità che si verifichi un errore di prima specie è indicata con (alfa). L errore di seconda specie si verifica se si accetta l ipotesi nulla quando è falsa e quindi dovrebbe essere rifiutata. La Probabilità che si verifichi un errore di seconda specie è indicata con (beta).
18 La verifica di ipotesi Livello di significatività del test: probabilità di commettere un errore di prima specie. In genere si controlla l errore di prima specie => viene specificato prima di condurre la verifica di ipotesi Il valore di esprime la probabilità che la statistica test cada nella regione di rifiuto quando è vera H 0 => il valore critico dipende da. Coefficiente di confidenza: (1- ) esprime la probabilità di accettare H 0 quando è vera. Espresso in percentuale mi fornisce il livello di confidenza per stime intervallari. Rischio : rischio del consumatore. Non è controllabile Potenza del test (1- ): probabilità di rigettare H 0 quando è falsa => è auspicabile che sia più grande possibile => indicatore della bontà di un test statistico.
19 La verifica di ipotesi Lo schema seguente riassume i rischi del processo decisionale: In genere viene fissato a 0,05. Se le conseguenze di un errore di I specie sono gravi potrei scegliere un valore pari a 0,01 => aumenta il rischio di errore di seconda specie ( ) Per ridurre a parità di posso aumentare la dimensione del campione
20 Test Z per la media (s noto) Per verificare l ipotesi che la media della popolazione sia uguale ad un certo valore m, contro l ipotesi alternativa che la media differisca da tale valore, conoscendo s, si ricorre alla statistica Z: X è distribuita come una normale => sotto H 0 Z è distribuita come una normale standardizzata Se Z assume valori vicini allo zero siamo portati ad accettare H 0, altrimenti si propende per rifiutare H 0 (test a due code).
21 Test Z per la media (s noto) Approccio del valore critico (livello di significatività di 0,05) Regola decisionale: Rifiuto H 0 se Z>+1,96 o se Z<-1,96 Accetto H 0 altrimenti
22 Test Z per la media (s noto) Esempio: l azienda che produce scatole metalliche intende valutare se il processo produttivo opera in modo tale da garantire che la lunghezza del lato maggiore sia pari a 368 mm. Viene estratto un campione di 25 scatole. Lo scarto quadratico medio della popolazione è pari a 15 mm e la media campionaria assume il valore 372,5 mm. H 0 : m = 368 H 1 : m 368 Il valore della statistica test mi porta ad accettare H 0.
23 Le fasi della verifica di ipotesi 1. Specificate l ipotesi nulla H 0 e esprimetela in termini statistici. Nel verificare se la lunghezza media delle scatole è 368 mm, l ipotesi nulla è: m = Specificate l ipotesi alternativa H 1 e esprimetela in termini statistici. Nel verificare se la lunghezza media delle scatole è 368 mm, l ipotesi alternativa è: m Scegliete il livello di significatività. Il livello di significatività viene fissato in base all importanza relativa che si accorda ai rischi derivanti dal commettere un errore di prima specie e dal commettere un errore di seconda specie. Nell esempio considerato, abbiamo posto = 0, Scegliete l ampiezza campionaria. L ampiezza campionaria viene fissata dopo aver considerato i rischi derivanti da un errore di prima specie e da un errore di seconda specie (vale a dire dopo aver specificato e ) e tenendo conto dei vincoli di bilancio a cui si è sottoposti nel condurre lo studio. Nell esempio considerato sono state campionate 25 scatole. 5. Individuate la tecnica statistica da utilizzare e calcolate la statistica test corrispondente. Nell esempio considerato, s era noto e quindi abbiamo usato il test Z.
24 Le fasi della verifica di ipotesi 6. Calcolate i valori critici che separano la regione di rifiuto da quella di accettazione. Una volta specificate l ipotesi nulla e quella alternativa e una volta fissati il livello di significatività e l ampiezza del campione, si possono calcolare i valori critici delle distribuzioni delle statistiche test di modo che la regione di rifiuto e quella di accettazione risultino ben individuate. Nell esempio considerato, sono stati usati i valori +1,96 e 1,96, perché la statistica test Z si distribuisce secondo una normale standardizzata. 7. Raccogliete i dati e calcolate il valore campionario della statistica test. Nell esempio considerato, la media campionaria è pari a 372,5 mm e quindi Z = 1, Stabilite se la statistica test cade nella regione di rifiuto o in quella di accettazione. A tale scopo, confrontate il valore della statistica con i valori critici individuati. Nell esempio considerato, Z = 1,50 cade nella regione di accettazione perché -1,96 < Z = +1,50 < +1,96.
25 Le fasi della verifica di ipotesi 9. Prendete la decisione statistica. Se la statistica test cade nella regione di accettazione, l ipotesi nulla H 0 non può essere rifiutata. Se la statistica test cade nella regione di rifiuto, l ipotesi nulla H 0 viene rifiutata. Nell esempio considerato, l ipotesi nulla H 0 non è rifiutata. 10. Esprimete la decisione statistica con riferimento a una data situazione. Nell esempio relativo alla produzione di scatole, concludiamo che dal campione non si possono trarre degli elementi di prova sufficienti per affermare che la lunghezza media delle scatole è diversa da 368 mm. Non si rende necessario nessun intervento correttivo.
26 PROCEDURA DECISIONALE La procedura decisionale per condurre una verificare di ipotesi consta dei seguenti passi: specificare l ipotesi nulla e l ipotesi alternativa diinteresse considerare l appropriata statistica (meglio detta statistica test ) in relazione alle ipotesi di cui sopra fissare l errore di I tipo α (detto anche livello di significatività del test ) ad un valore accettabile; questa operazione identifica nella distribuzione della statistica test due regioni: la regione di accettazione e la regione di rifiuto (detta anche regione critica ) in base ai dati campionari (ottenuti da un campione casuale IID dalla popolazione sotto indagine) calcolare il valore osservato della statistica test se tale valore appartiene alla regione critica si deve rifiutare l ipotesi nulla, altrimenti apparterrà alla regione di accettazione e non si può rifiutare l ipotesi nulla
27 IL P-VALUE NELLA PROCEDURA DECISIONALE In alternativa al considerare le due regioni di accettazione e rifiuto, è possibile prendere la decisione in base al p-value: Il p-value rappresenta la probabilità di osservare un valore della statistica test uguale o più estremo del valore che si calcola a partire dal campione, quando l ipotesi H0 è vera.
28 L approccio del p-value Negli ultimi anni, anche grazie all ampia diffusione di pacchetti statistici e fogli elettronici, si è affermato un altro approccio alla verifica di ipotesi: l approccio del p-value. Il p-value è anche chiamato livello di significatività osservato. Regola decisionale: se il p-value è maggiore o uguale ad, l ipotesi nulla viene accettata se il p-value è minore di, l ipotesi nulla è rifiutata
29 Come si utilizza il p-value associato a sn in pratica per decidere tra H0 e H1? Il vantaggio del p value è che non ci serve più andare a consultare le tavole della Normale, della t-student, del Chiquadrato o della F, ecc. per decidere. Tutto quello che dobbiamo fare è confrontare il p-value associato a sn con il livello di significatività α che abbiamo fissato in precedenza
30 L approccio del p-value Esempio: l azienda che produce scatole metalliche intende valutare se il processo produttivo opera in modo tale da garantire che la lunghezza del lato maggiore sia pari a 368 mm. Viene estratto un campione di 25 scatole. Lo scarto quadratico medio della popolazione è pari a 15 mm e la media campionaria assume il valore 372,5 mm. H 0 : m = 368 H 1 : m 368 Il valore della statistica test è pari a 1,5. La probabilità che Z assuma valori uguali o più estremi di 1,5 coincide con la probabilità che assuma valori maggiori di 1,5 o minori di -1,5 (test a due code). Le due probabilità sono pari a 0,0668 e la loro somma è perciò 0,1336. Tale valore è maggiore di =0,05 perciò accetto H 0.
31 L approccio del p-value 1. Specificate l ipotesi nulla H Specificate l ipotesi alternativa H Fissate il livello di significatività. 4. Scegliete la tecnica statistica appropriata e la statistica test da utilizzare. 5. Raccogliete i dati e calcolate il valore campionario della statistica test. 6. Calcolate il p-value. Per farlo: (a) determinate la distribuzione della statistica test sotto l ipotesi H 0 ; (b) ponete la statistica test sull asse delle ascisse; (c) ombreggiate l area corretta al di sotto della curva della distribuzione, sulla base dell ipotesi alternativa H Confrontate il p-value con. 8. Prendete la decisione statistica. Se il p-value è maggiore o uguale ad, ipotesi nulla non è rifiutata. Se il p-value è minore di, l ipotesi nulla è rifiutata. 9. Esprimete la decisione statistica con riferimento alla situazione considerata.
32 Intervalli di confidenza e verifiche d ipotesi Gli intervalli di confidenza vengono usati per stimare i parametri della popolazione mentre la verifica di ipotesi serve per prendere decisioni sul valore dei parametri. Alternativamente alla verifica di ipotesi possiamo costruire un intervallo di confidenza per la media m. Accettiamo l ipotesi nulla se il valore ipotizzato è compreso nell intervallo costruito. Rifiutiamo l ipotesi nulla se il valore cade fuori dell intervallo. Nell esempio dell azienda che costruisce scatole di metallo, l intervallo di confidenza al livello del 95% sarà: cioè 372,5 ± (1,96) 15/5. ( X Zs / n) Quindi 366,62 m 378,38. Il valore 368 è compreso nell intervallo, perciò accetto H 0.
33 Statistica Medica Confronto tra due medie
34
35 Campioni appaiati Ad ogni osservazione del primo gruppo corrisponde una osservazione del secondo gruppo (singolo soggetto in due tempi diversi, tipicamente prima e dopo il trattamento). L appaiamento rende il confronto più preciso, eliminando parte della variabilità biologica.
36 Prima: x1 x2 x3..xn Dopo: y1 y2 y3.yn Campioni appaiati Consideriamo le differenze all interno di ciascuna coppia: d1=x1 y1 d2=x2 - y2 dn=xn - yn
37 Campioni appaiati L ipotesi nulla è che la media sia la stessa prima e dopo la terapia. Quindi l ipotesi nulla è che la media delle differenze (d) sia zero!! Calcoliamo la media delle differenze d e la deviazione standard delle differenze s d
38 Campioni appaiati Secondo l ipotesi nulla, la variabile t è distribuita come una t-student con n-1 gradi di libertà t n d s d L ipotesi nulla quindi si potrà accettare con 5% di confidenza se t <1.96. Altrimenti l ipotesi nulla viene rigettata.
39 Campioni appaiati:esempio Prima dopo
40 Campioni appaiati: test unilaterale Supponiamo ora che l ipotesi nulla sia che la media dopo la terapia sia inferiore. Dobbiamo allora fare un test unilaterale sulla media delle differenze. Se t<-1.62 allora si sarebbe verificato un evento che, sotto l ipotesi nulla, ha meno del 5% di probabilità di verificarsi. Se t> accetteremo l ipotesi nulla.
41 Campioni appaiati: esempio Sia la media delle differenze pari a -6.63, e la deviazione standard delle differenze sia 20.29, su n=63 osservazioni. Calcoliamo la t: t=sqrt(63)*(-6.63)/20.29=-2.59 Possiamo rigettare l ipotesi nulla con la confidenza del 5%.
42 Campioni indipendenti Supponiamo di avere due gruppi indipendenti e di voler verificare l ipotesi nulla che la media sia la stessa nelle due popolazioni. Come si implementa il test t- student in questo caso?
43 Campioni indipendenti:varianze uguali Il primo gruppo sia composto da n1 campioni e sia µ1 la media. Il secondo gruppo sia composto da n2 campioni e sia µ2 la media. Supponiamo che la deviazione standard nei due gruppi sia uguale e pari a σ. Ipotesi nulla Ho: µ1 = µ2
44 Campioni indipendenti:varianze uguali t n d s d Sotto Ho: la differenza delle medie è distribuita come una gaussiana con media zero e deviazione standard: 2 s s 2 n 1 n 2
45 Campioni indipendenti:varianze uguali La variabile t in questo caso è: t x 1 2 x 2 s s 2 n 1 n 2
46 Prima popolazione Campioni indipendenti:varianze disuguali Seconda popolazione
47 Varianze disuguali t x x 2 s s 2 2 n 1 n 2
48 Statistica Medica 6. Analisi della varianza
49 One way ANOVA Facciamo un esempio: per lo studio degli effetti dell esposizione a monossido di carbonio in soggetti con patologie coronariche, le distribuzioni del volume espiratorio forzato in un secondo dei pazienti di ciascuno di tre centri medici: John Hopkins University School, Rancho Los Amigos Medical Center, e St. Louis University School in Medicine. Sono tre popolazioni distinte. Vogliamo testare l ipotesi che le medie delle tre popolazioni sono uguali: µ1=µ2=µ3
50 Esempio john Hopkins Rancho Los Amigos sant Louis 3,23 3,22 2,79 3,47 2,88 3,22 1,86 1,71 2,25 2,47 2,89 2,98 3,01 3,77 2,47 1,69 3,29 2,77 2,1 3,39 2,95 2,81 3,86 3,56 3,28 2,64 2,88 3,36 2,71 2,63 2,61 2,71 3,38 2,91 3,41 3,07 1,98 2,87 2,81 2,57 2,61 3,17 2,08 3,39 2,23 2,47 3,17 2,19 2,47 4,06 2,74 1,98 2,88 2,81 2,63 2,85 2,53 2,43 3,2 3,53 n1=21 n2=16 n3=23 x1medio=2,63 litri x2medio=3,03 litri x3medio=2,88 litri s1=0,496 litri s2=0,523 litri s3=0,498 litri
51 One way ANOVA Per testare l ipotesi che le tre medie siano uguali, potrei fare i confronti a due a due,e per ciascuna coppia fare il test t-student. Nel caso N=3 popolazioni devo fare 6 confronti. Nel caso generale può essere un numero proibitivo di coppie. Inoltre questa procedura può condurre ad errori. L ipotesi µ1=µ2=µ3 va testata con un singolo test, l analisi della varianza (ANOVA). Quando c è una sola caratteristica che distingue le varie popolazioni, si parla di one way anova (ad un criterio di classificazione).
52 One way ANOVA Misura della variabilità delle osservazioni rispetto alle medie delle singole osservazioni (stima pooled della varianza comune): ( n1 1) s1 ( n2 1) s2 ( nk 1) s sw n n n k 1 2 k 2 k Varianza campionaria between
53 One way ANOVA Misura della variazione delle medie delle popolazioni rispetto alla media generale: k k k n n x n x n x n x ) ( ) ( ) ( k n x x n x x n x x s k k B Varianza campionaria within
54 One way ANOVA Sotto l ipotesi nulla le due varianze dovrebbero essere simili. Calcoliamo il rapporto, detto F F s s 2 B 2 w
55 One way anova La distribuzione di probabilità di F è nota, sotto l ipotesi nulla, e dipende da k-1 (gradi di libertà del numeratore) e dal numero di dati (n-k=gradi di libertà del denominatore). Questo permette di valutare la probabilità, sotto l ipotesi nulla, che si verifichi un evento almeno estremo come quello che si è verificato, che sarà consistente se tale probabilità sarà maggiore di 0.05.
56 One way ANOVA Torniamo al nostro esempio e calcoliamo la F, otteniamo F= La distribuzione è la F con gradi di libertà 2 e 57. La probabilità che F sia risulta uguale a , quindi non possiamo rifiutare l ipotesi nulla al 5% di confidenza.
57 One way ANOVA Se il risultato dell F test è 1, significa che le medie non sono tutte uguali. A questo punto possiamo cercare le popolazioni che si distinguono dalle altre mediante test specifici che indicano quali tra i gruppi sono differenti. Questo si ottiene con il test di Tukey quando si fanno i confronti multipli.
58
59 ANALISI UNIVARIATE e dati non parametrici 1) raccolta e codifica dei dati (valori osservati) 2) inserimento dei dati in una matrice. 3) definizione ipotesi nulla e ipotesi alternativa 4) calcolo dei ranghi 5) calcolo del valore Wx e zwx 6) si verifica l ipotesi in base alla distribuzione teorica normale 7) si interpretano i risultati IL TEST DI WILCOXON-MANN-WHITNEY
60 VERIFICA DELLE IPOTESI SU DUE CAMPIONI disegni TRA GRUPPI (BETWEEN) (n<30) Se la variabile è misurata su scala Ordinale la statistica più adatta per confrontare due gruppi (due misurazioni indipendenti) è l applicazione del test di Wilcoxon-Mann-Whitney. Questo è uno dei test non parametrici più potenti e rappresenta un alternativa molto valida al test parametrico t.
61 LA VERIFICA DELLE IPOTESI SU DUE CAMPIONI disegni TRA GRUPPI (BETWEEN) (n<30) IL TEST DI WILCOXON-MANN-WHITNEY Mediante questo test, usando come parametro il rango (o la mediana), è possibile verificare se due campioni x e y provengono dalla medesima popolazione. H0= x e y hanno la stessa distribuzione H1= x y x > y x < y
62 Test U di Mann-Whitney Due campioni indipendenti, dati ordinali Il test U di Mann-Whitney dovrebbe essere usato come alternativa non-parametrica ad un test t di Student su campioni indipendenti, se una qualsiasi delle assunzioni necessarie è violata.
63 Test di Wilcoxon Due campioni non indipendenti, dati ordinali Il test di Wilcoxon dovrebbe essere usato come alternativa non-parametrica al t di Student per campioni non indipendenti se una qualsiasi delle assunzioni necessarie per quest ultimo è violata.
64 KRUSKAL-WALLIS Analogo alla ANOVA viene utilizzato incaso di comparazione tra 3 o più gruppi di dati non parametrici
65 Test non parametrici
66
67 Chi-QUADRO
68
69
70 I TESTS del CHI-QUADRATO sono utilizzati per valutare l omogeneità, la casualità, l associazione, l indipendenza e la bontà di adattamento
71 Test Chi-quadrato per la differenza tra due proporzioni Il problema della verifica di ipotesi sulla differenza tra due proporzioni può essere affrontato anche con una procedura basata su una statistica test la cui distribuzione tende ad approssimarsi con una distribuzione chi-quadrato (χ2). Se siamo interessati a confrontare le proporzioni di casi che presentano una certa caratteristica in due gruppi indipendenti possiamo costruire una tabella a doppia entrata (o di contingenza) di dimensioni 2 2 nella quale sono riportati il numero (o le percentuali) di successi e insuccessi nei due gruppi
72 Test Chi-quadrato per la differenza tra due proporzioni
73 Test Chi-quadrato per la differenza tra due proporzioni Per verifica l ipotesi nulla secondo cui non c è differenza tra le due proporzioni H0: π1 = π2 contro l alternativa H1: π1 π2 si può considerare la statistica χ2 La statistica χ2 si ottiene calcolando per ogni cella della tabella di contingenza la differenza al quadrato fra la frequenza osservata (f0) e quella attesa (fe), divisa per fe, e sommando quindi il risultato ottenuto per ogni cella
74 Test Chi-quadrato per la differenza tra due proporzioni Per calcolare la frequenza attesa si deve tener conto del fatto che se l ipotesi nulla è vera la proporzione di successi e insuccessi è la stessa nei due gruppi e le proporzioni campionarie dovrebbero differire solo per effetto del caso. In questo caso per stimare il parametro π conviene utilizzare una combinazione delle due frequenze campionarie indicate con p Per calcolare la frequenza attesa fe per le celle relative al successo (prima riga) si dovrà moltiplicare l ampiezza campionaria n1 e n2 (totali di colonna) per p
75 Test Chi-quadrato per la differenza tra due proporzioni Analogamente, per calcolare la frequenza attesa fe per le celle relative all insuccesso (seconda riga) si dovrà moltiplicare l ampiezza campionaria n1 e n2 di ciascuno dei due gruppi per (1 p ) La statistica test introdotta nell equazione (11.1) si distribuisce approssimativamente secondo una distribuzione chi-quadrato con 1 grado di libertà Fissato α, l ipotesi nulla dovrà essere rifiutata se il valore osservato della statistica χ2 è maggiore del valore critico χ2 U di una distribuzione χ2 con 1 grado di libertà
76 Test Chi-quadrato per la differenza tra due proporzioni
77 Test Chi-quadrato per la differenza tra due proporzioni
78 Test Chi-quadrato per la differenza tra due proporzioni
79 Test Chi-quadrato per la differenza tra due proporzioni Il test χ2 opportunamente generalizzato può essere utilizzato per confrontare le proporzioni di più popolazioni indipendenti. Supponiamo di voler verificare l ipotesi nulla secondo cui le proporzioni di c popolazioni sono uguali H0: π1 = π2 = = πc contro l alternativa H1: non tutte le πj sono uguali tra loro (con j=1,,c) Per risolvere questo problema dovremo costruire una tabella di contingenza di due righe (successo e insuccesso) che avrà un numero di colonne pari a c La statistica test sarà la stessa dell equazione (11.1), dove la frequenza attesa viene calcolata dalla stima p di π = π1 = π2 = = πc che in questo caso si ottiene come
80 Test Chi-quadrato per la differenza tra due proporzioni La statistica test dell equazione (11.1) si distribuisce approssimativamente secondo una distribuzione chiquadrato con (2 1) (c 1)=(c 1) gradi di libertà Fissato α, l ipotesi nulla dovrà essere rifiutata se il valore osservato della statistica χ2 è maggiore del valore critico χ2 U di una distribuzione χ2 con (c 1) gradi di libertà
81 Test Chi-quadrato per la differenza tra due proporzioni
82 Test Chi-quadrato per la differenza tra due proporzioni Calcolo della statistica test χ2 per l esempio relativo alla soddisfazione dei clienti di 3 alberghi Regione di rifiuto e di accettazione del test χ2 (2 gradi di libertà) per la differenza tra tre proporzioni al livello di significatività α=0.05
83 Test Chi-quadrato per la differenza tra due proporzioni Foglio di Microsoft Excel con i calcoli necessari per calcolare valore critico e p-value (test chi-quadro, 3 gruppi)
84 Test Chi-quadrato per la differenza tra due proporzioni
85 Test Chi-quadrato per l indipendenza Se si considera una tabella di contingenza con r righe c colonne il procedimento del test χ2 può esser generalizzato per verificare l indipendenza tra due variabili categoriali X e Y In questo contesto le ipotesi nulla e alternativa sono H0: le due variabili categoriali sono indipendenti (X Y)(non sussistono relazioni tra le due variabili) H1: le due variabili categoriali sono dipendenti (X Y)(sussiste una relazione tra le due variabili) Il test si basa ancora una volta sull equazione (11.1) La regola decisionale consiste nel rifiutare H0 se il valore osservato della statistica 2 è maggiore del valore critico 2 U della distribuzione 2 con (r-1)x(c-1) gdl
86 Test Chi-quadrato per l indipendenza Pure se presentano delle analogie, la differenza fondamentale tra il test chi-quadrato per le proporzioni e per l indipendenza riguarda lo schema di campionamento: Nel confronto tra proporzioni siamo di fronte a campioni estratti da popolazioni indipendenti Nel test di indipendenza abbiamo un solo campione su cui rileviamo due variabili qualitative che possono assumere r e c modalità distinte Nel caso di test chi-quadrato per l indipendenza è possibile semplificare il calcolo delle frequenze attesa applicando la seguente regola:
87 Test Chi-quadrato per l indipendenza
88 Test Chi-quadrato per l indipendenza
89 Test Chi-quadrato per l indipendenza Regione di rifiuto e di accettazione del test 2 per l indipendenza nell esempio sulla soddisfazione dei clienti (al livello di significatività 0.05 con 6 gradi di libertà)
90 Test Chi-quadrato per l indipendenza Foglio di Microsoft Excel con i calcoli necessari per la verifica dell ipotesi di indipendenza tra motivo di insoddisfazione e albergo
91 Procedure per dati categorici Tipi di test Tabelle di contingenza Tabelle 2x2 Tabelle 2xc Tabelle rxc 1 3 o più N di campio ni Test su proporzione 2 Test X 2 per π c Test Z per π 1 = π 2 Test X 2 per π 1 = π 2
92 avanzi
93
94 poiché la distribuzione delle medie campionarie è una distribuzione normale, siamo in grado di calcolare l area sotto la curva utilizzando il rapporto critico e la statistica z Ad esempio: qual è la probabilità di estrarre un campione di 10 individui con altezza media 175 da una popolazione che ha media 170 cm e d.s. 5? Z = ( ) /(5/ 10) = 6.33 Utilizzando le tavole la probabilità è < 0.001
95
96 Introduzione Una volta effettuata una simulazione, è necessario stimare la precisione e l affidabilità dei risultati. Si supponga ad esempio di voler valutare il valore medio di un certo indice di prestazione x. x è una variabile aleatoria con valore medio m e varianza s 2. Ripetendo n esperimenti di simulazione, per ipotesi statisticamente indipendenti tra loro, si ottengono n osservazioni indipendenti X1, X2,..., Xn.
97 Valore medio di una grandezza Una stima di m è data dalla media campionaria X(n) 1 n Questo stimatore è anch esso una variabile aleatoria: ripetendo più volte la simulazione X(n) assume valori diversi n i 1 In generale X(n) m : è necessario valutare l affidabilità della stima. Il metodo dell intervallo di confidenza consiste nel determinare un intervallo attorno al valore X(n), in modo da prevedere con una certa probabilità (detta confidenza) che m cada in questo intervallo. Si noti che X(n) è uno stimatore non polarizzato di m, cioè E{X(n)} = m. X i
98 Livello di confidenza dello stimatore In formule si esprime nel modo seguente P X (n) m 1 dove è la semiampiezza dell intervallo di confidenza: [ X ( n) ; X ( n) ] Tipicamente 1 - vale 0,9 0,95 o 0,99 cioè affidabilità del 90, 95 o 99% rispettivamente.
99 Varianza campionaria Varianza di X(n): Var {X(n)} = s 2 /n da cui si vede che all aumentare del numero di campioni la stima della media migliora La varianza si può stimare mediante la varianza campionaria S 2 (n): S 2 (n) 1 n 2 [X i X(n)] n 1 i 1 Anch essa è uno stimatore non polarizzato cioè E{S 2 (n)}= s 2 sostituendo quindi s 2 con S 2 (n) si ha 1 Var[X(n)] S 2 (n)/n n [X i X(n)] 2 n(n 1) i 1
100 Calcolo di Se il numero di osservazioni è elevato (n > 30) si può assumere che X(n) abbia distribuzione gaussiana (Teo. Limite centrale) Si introduce la variabile aleatoria Z n : Z n [X(n) m] s 2 n La variabile Z n ha valor medio nullo e varianza unitaria con distribuzione gaussiana (variabile normale standard).
101 Calcolo di Si riporta di seguito la distribuzione di Z n /2 /2 -Z 1- /2 Z 1- /2 Il valore z 1- /2 è tale per cui l integrale della curva fra -z 1- /2 e z 1- /2 vale 1-. Ossia: P{ -z 1- /2 z z 1- /2 } = 1-
102 Calcolo di Poiché si suppone n abbastanza grande, si può sostituire nell espressione di Z n S 2 (n) al posto di s 2 : P z 1 2 X(n) m S 2 (n)/n z 1 2 P X(n) z 1 2 S 2 (n)/n m X(n) z 1 2 S 2 (n)/n 1 Il simbolo indica che questa è un approssimazione. Si ricava quindi la semiampiezza dell intervallo di confidenza: z 1 2 S 2 (n)/n
103 T-student Se i campioni Xi hanno distribuzione normale la variabile t n [X(n) m] S 2 (n) n ha una distribuzione detta t di Student a n-1 gradi di libertà e l intervallo di confidenza è in questo caso esattamente espresso da t n 1,1 2 S 2 (n)/n e prende il nome di intervallo di confidenza t. i valori della distribuzione t si trovano tabulati per i diversi valori di n in pratica raramente i campioni X i hanno distribuzione normale per cui l uso dell intervallo di confidenza t è ancora una approssimazione per n tendente all infinito i valori ottenuti con i due metodi coincidono
104 Tabella t-student Si riporta qui a fianco i valori tabulati della distribuzione t-student in funzione del numero di gradi di libertà per un valore 1- =0.95 n - 1 t n 1,
105 Esempio Si supponga di aver effettuato 9 esperimenti di simulazione indipendenti da cui si sono misurate 9 stime della variabile casuale X: X1, X2,., Xn. n Sia: S 2 (n) 1 n 1 X(n) 1 X i 65 n Si può determinare S 2 (n): 9 i 1 n i 1 X i X(n) ) i [X i X(n)]
106 Esempio Scegliendo di determinale l intervallo di confidenza con livello di confidenza del 95%, cioè 1- =0.95 si ha: t n 1,1 2 t 8, t n 1,1 2 S 2 (n)/n / [X(n) ;X(n) ] ; ;81.12 L intervallo di confidenza risulta quindi: P E X cioè
Capitolo 11 Test chi-quadro
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 11 Test chi-quadro Insegnamento: Statistica Corsi di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara Docenti: Dott.
DettagliEsercizi di statistica
Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..
DettagliCapitolo 9 Verifica di ipotesi: test basati su un campione
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 9 Verifica di ipotesi: test basati su un campione Insegnamento: Statistica Corsi di Laurea Triennale in Economia Facoltà di Economia, Università
DettagliCapitolo 9 Verifica di ipotesi: test basati su un campione
Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 9 Verifica di ipotesi: test basati su un campione Insegnamento: Statistica Corsi di Laurea Triennale in Economia Dipartimento di Economia
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2016-2017 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliStatistica Inferenziale
Statistica Inferenziale a) L Intervallo di Confidenza b) La distribuzione t di Student c) La differenza delle medie d) L intervallo di confidenza della differenza Prof Paolo Chiodini Dalla Popolazione
DettagliStatistica. Capitolo 10. Verifica di Ipotesi su una Singola Popolazione. Cap. 10-1
Statistica Capitolo 1 Verifica di Ipotesi su una Singola Popolazione Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Formulare ipotesi nulla ed ipotesi alternativa
DettagliContenuti: Capitolo 14 del libro di testo
Test d Ipotesi / TIPICI PROBLEMI DI VERIFICA DI IPOTESI SONO Test per la media Test per una proporzione Test per la varianza Test per due campioni indipendenti Test di indipendenza Contenuti Capitolo 4
DettagliStatistica (parte II) Esercitazione 4
Statistica (parte II) Esercitazione 4 Davide Passaretti 03/03/016 Test sulla differenza tra medie (varianze note) Un negozio di scarpe è interessato a capire se le misure delle scarpe acquistate da adulti
Dettagliper togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione
Rapporti statistici di composizione la parte rispetto al tutto percentuali di derivazione per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione di frequenza (tassi) rapporti
DettagliSTATISTICA MULTIVARIATA SSD MAT/06
Università degli studi di Ferrara Dipartimento di Matematica A.A. 2018/2019 I semestre STATISTICA MULTIVARIATA SSD MAT/06 LEZIONE 4 - Questioni di analisi e applicazione della regressione lineare Pratica
DettagliSTATISTICA. Federico M. Stefanini. e.mail: a.a (3 CFU)
STATISTICA a.a. 2001-2002 (3 CFU) Federico M. Stefanini Dipartimento di Statistica G.Parenti viale Morgagni 59, 50134 Firenze, tel. 055-4237211 PARTE 5-3.12.2001 e.mail: stefanin@ds.unifi.it http://www.ds.unifi.it/ricerca/pagperson/docenti/stefanini.htm
DettagliModelli descrittivi, statistica e simulazione
Modelli descrittivi, statistica e simulazione Master per Smart Logistics specialist Roberto Cordone (roberto.cordone@unimi.it) Statistica inferenziale Cernusco S.N., giovedì 25 febbraio 2016 (9.00/13.00)
DettagliContenuto del capitolo
Capitolo 8 Stima 1 Contenuto del capitolo Proprietà degli stimatori Correttezza: E(Stimatore) = parametro da stimare Efficienza Consistenza Intervalli di confidenza Per la media - per una proporzione Come
DettagliCapitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica
Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2018-2019 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
Dettagli10 TEST STATISTICI PER LA VERIFICA DI IPOTESI
10 TEST STATISTICI PER LA VERIFICA DI IPOTESI Un test statistico è una procedura che permette di decidere tra l ipotesi sperimentale H1 e l ipotesi nulla H0, quantificando la divergenza delle osservazioni
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2017-2018 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliLa verifica delle ipotesi
La verifica delle ipotesi Se abbiamo un idea di quale possa essere il valore di un parametro incognito possiamo sottoporlo ad una verifica, che sulla base di un risultato campionario, ci permetta di decidere
DettagliStatistica. Capitolo 13. Test sulla Bontà di Adattamento e Tabelle di Contingenza. Cap. 16-1
Statistica Capitolo 13 Test sulla Bontà di Adattamento e Tabelle di Contingenza Cap. 16-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Usare il test sulla bontà di adattamento
DettagliSoluzione Esercizio 1 (pag 1):
8 - Test di Ipotesi Esercizio 1: Dopo anni di esperienza e noto che la distribuzione della concentrazione di rame nel sangue umano e ben descritta da una distribuzione gaussiana di parametri μ=3.2 10-5
DettagliElementi di Psicometria (con laboratorio software 1)
Elementi di Psicometria (con laboratorio software 1) 05-La verifica delle ipotesi con le medie dei campioni (v. 1.0, 15 aprile 2019) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia,
DettagliUlteriori Conoscenze di Informatica e Statistica. Popolazione. Campione. I risultati di un esperimento sono variabili aleatorie.
Ulteriori Conoscenze di Informatica e Statistica Carlo Meneghini Dip. di fisica via della Vasca Navale 84, st. 83 (I piano) tel.: 06 55 17 72 17 meneghini@fis.uniroma3.it I risultati di un esperimento
DettagliStatistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità B
Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità B Cognome Nome: Part time: Numero di matricola: Diurno: ISTRUZIONI: Il punteggio relativo alla prima parte dell esame viene calcolato
DettagliLa statistica è la scienza che permette di conoscere il mondo intorno a noi attraverso i dati.
RICHIAMI DI STATISTICA La statistica è la scienza che permette di conoscere il mondo intorno a noi attraverso i dati. Quale è la media della distribuzione del reddito dei neolaureati? Per rispondere dovremmo
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2017-2018 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliIL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI
IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI Perchè confrontare le varianze stimate in due campioni? Torniamo all'esempio dei frinosomi Per poter applicare il test t avevamo detto che le varianze, e
DettagliParte 1 : Inferenza. Varianza nota test Z. Distribuzioni asintotiche dei test. Varianza ignota test t ad un campione
! Test d'ipotesi Parte 1 : Inferenza! Intervalli di confidenza! Test parametrici! Calcoli di potenza! Test non parametrici Distribuzioni asintotiche dei test A seconda dei casi il nostro test può convergere
DettagliUlteriori applicazioni del test del Chi-quadrato (χ 2 )
Ulteriori applicazioni del test del Chi-quadrato (χ 2 ) Finora abbiamo confrontato con il χ 2 le numerosità osservate in diverse categorie in un campione con le numerosità previste da un certo modello
DettagliCapitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson Apogeo
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 10 Test basati su due campioni e ANOVA a una via Insegnamento: Statistica Applicata Corsi di Laurea in "Scienze e tecnologie Alimentari"
DettagliCostruzione di macchine. Modulo di: Progettazione probabilistica e affidabilità. Marco Beghini. Lezione 7: Basi di statistica
Costruzione di macchine Modulo di: Progettazione probabilistica e affidabilità Marco Beghini Lezione 7: Basi di statistica Campione e Popolazione Estrazione da una popolazione (virtualmente infinita) di
DettagliVerifica delle ipotesi
Statistica inferenziale Stima dei parametri Verifica delle ipotesi Concetti fondamentali POPOLAZIONE o UNIVERSO Insieme degli elementi cui si rivolge il ricercatore per la sua indagine CAMPIONE Un sottoinsieme
DettagliEsercitazioni di Statistica Matematica A Esercitatori: Dott. Fabio Zucca - Dott. Maurizio U. Dini Lezioni del 7/1/2003 e del 14/1/2003
Esercitazioni di Statistica Matematica A Esercitatori: Dott. Fabio Zucca - Dott. Maurizio U. Dini Lezioni del 7/1/003 e del 14/1/003 1 Esercizi 1.1 Test su media (con varianza nota) Esercizio n. 1 Il calore
DettagliRICHIAMI DI STATISTICA DESCRITTIVA E DI INFERENZA: LA VERIFICA DI IPOTESI: TEST BASATI SU UN CAMPIONE
RICHIAMI DI STATISTICA DESCRITTIVA E DI INFERENZA: LA VERIFICA DI IPOTESI: TEST BASATI SU UN CAMPIONE 1 La verifica di ipotesi Finora abbiamo visto come si utilizza una statistica campionaria per stimare
DettagliCapitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson. Casa editrice: Pearson
Levine, Krehbiel, Berenson Statistica II ed. Casa editrice: Pearson Capitolo 10 Test basati su due campioni e ANOVA a una via Insegnamento: Statistica Corsi di Laurea Triennale in Economia Dipartimento
DettagliUniversità di Pavia Econometria. Richiami di Statistica. Eduardo Rossi
Università di Pavia Econometria Richiami di Statistica Eduardo Rossi Università di Pavia Campione casuale Siano (Y 1, Y 2,..., Y N ) variabili casuali tali che le y i siano realizzazioni mutuamente indipendenti
DettagliStatistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità D
Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità D Cognome Nome: Part time: Numero di matricola: Diurno: ISTRUZIONI: Il punteggio relativo alla prima parte dell esame viene calcolato
DettagliCorso di Statistica Esercitazione 1.8
Corso di Statistica Esercitazione.8 Test su medie e proporzioni Prof.ssa T. Laureti a.a. 202-203 Esercizio Un produttore vuole monitorare i valori dei livelli di impurità contenute nella merce che gli
DettagliMetodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale
DIPARTIMENTO DI SCIENZE AGRARIE E AMBIENTALI PRODUZIONE, TERRITORIO, AGROENERGIA Marco Acutis marco.acutis@unimi.it www.acutis.it CdS Scienze della Produzione e Protezione delle Piante (g59) CdS Biotecnologie
DettagliTeorema del Limite Centrale
Teorema del Limite Centrale Teorema. Sia data una popolazione numerica infinita di media µ e deviazione standard σ da cui vengono estratti dei campioni casuali formati ciascuno da n individui, con n abbastanza
DettagliMatematica II: Calcolo delle Probabilità e Statistica Matematica
Matematica II: Calcolo delle Probabilità e Statistica Matematica ELT A-Z Docente: dott. F. Zucca Esercitazione # 6 1 Test ed intervalli di confidenza per una popolazione Esercizio n. 1 Il calore (in calorie
DettagliAnalisi della varianza
Università degli Studi di Padova Facoltà di Medicina e Chirurgia Facoltà di Medicina e Chirurgia - A.A. 2009-10 Scuole di specializzazione Lezioni comuni Disciplina: Statistica Docente: dott.ssa Egle PERISSINOTTO
DettagliSTATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA
Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria Civile A.A. 2009-10 Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain 1 STATISTICHE, DISTRIBUZIONI CAMPIONARIE
DettagliLezione 16. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 16. A. Iodice. Ipotesi statistiche
Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 23 Outline 1 2 3 4 5 6 () Statistica 2 / 23 La verifica delle ipotesi Definizione Un ipotesi statistica
DettagliSTATISTICA ESERCITAZIONE 13
STATISTICA ESERCITAZIONE 13 Dott. Giuseppe Pandolfo 9 Marzo 2015 Errore di I tipo: si commette se l'ipotesi nulla H 0 viene rifiutata quando essa è vera Errore di II tipo: si commette se l'ipotesi nulla
DettagliINTERVALLI DI CONFIDENZA e TEST D IPOTESI 1 / 30
INTERVALLI DI CONFIDENZA e TEST D IPOTESI 1 / 30 Intervallo di confidenza: media 2 / 30 Supponiamo di considerare la media campionaria X e assumiamo che Intervallo di confidenza: media 2 / 30 Supponiamo
DettagliDistribuzione normale
Distribuzione normale istogramma delle frequenze di un insieme di misure relative a una grandezza che varia con continuità popolazione molto numerosa, costituita da una quantità praticamente illimitata
Dettagli05. Errore campionario e numerosità campionaria
Statistica per le ricerche di mercato A.A. 01/13 05. Errore campionario e numerosità campionaria Gli schemi di campionamento condividono lo stesso principio di fondo: rappresentare il più fedelmente possibile,
DettagliINTRODUZIONE ALLA STATISTICA PER LA RICERCA IN SANITA
INTRODUZIONE ALLA STATISTICA PER LA RICERCA IN SANITA IRCBG 19027 Modulo Dal campione alla popolazione: l'inferenza e l'intervallo di confidenza IRCCS Burlo Garofolo Formazione, Aula A via dell Istria
DettagliVerifica delle ipotesi. Verifica delle ipotesi
Con la procedura di stima intervallare si cerca definire in modo verosimile il valore di un parametro incognito a partire dalle osservazioni campionarie Valore campionario Procedura di stima intervallare
DettagliTeoria della stima dei parametri:
INFERENZA STATISTICA Teoria della verifica dell ipotesi : si verifica, in termini probabilistici, se una certa affermazione relativa alla popolazione è da ritenersi vera sulla base dei dati campionari
DettagliFondamenti statistici : Test d Ipotesi (1)
Fondamenti statistici : Test d Ipotesi (1) Ipotesi statistica: È una assunzione formulata su un particolare aspetto della popolazione considerazioni teoriche Informazioni relative a popolazioni analoghe
DettagliGli errori nella verifica delle ipotesi
Gli errori nella verifica delle ipotesi Nella statistica inferenziale si cerca di dire qualcosa di valido in generale, per la popolazione o le popolazioni, attraverso l analisi di uno o più campioni E
DettagliStatistica16 1/12/2015
I metodi non parametrici sono meno efficaci ma più generali (possono essere applicati a tutte le serie di dati). Vengono utilizzati quando non possono essere applicati i metodi parametrici (dati non distribuiti
DettagliTest delle Ipotesi Parte I
Test delle Ipotesi Parte I Test delle Ipotesi sulla media Introduzione Definizioni basilari Teoria per il caso di varianza nota Rischi nel test delle ipotesi Teoria per il caso di varianza non nota Test
DettagliParametri statistici
SMID a.a. 2004/2005 Corso di Metodi Statistici in Biomedicina Parametri statistici 24/1/2005 Deviazione standard della media La variabilità di una distribuzione può quindi essere espressa da un indice
DettagliDistribuzione Gaussiana - Facciamo un riassunto -
Distribuzione Gaussiana - Facciamo un riassunto - Nell ipotesi che i dati si distribuiscano seguendo una curva Gaussiana è possibile dare un carattere predittivo alla deviazione standard La prossima misura
DettagliRichiami di inferenza statistica Strumenti quantitativi per la gestione
Richiami di inferenza statistica Strumenti quantitativi per la gestione Emanuele Taufer Inferenza statistica Parametri e statistiche Esempi Tecniche di inferenza Stima Precisione delle stime Intervalli
DettagliUlteriori Conoscenze di Informatica e Statistica
Ulteriori Conoscenze di Informatica e Statistica Carlo Meneghini Dip. di fisica via della Vasca Navale 84, st. 83 (I piano) tel.: 06 55 17 72 17 meneghini@fis.uniroma3.it Indici di forma Descrivono le
DettagliRichiami di inferenza statistica. Strumenti quantitativi per la gestione. Emanuele Taufer
Richiami di inferenza statistica Strumenti quantitativi per la gestione Emanuele Taufer Inferenza statistica Inferenza statistica: insieme di tecniche che si utilizzano per ottenere informazioni su una
DettagliSchema lezione 5 Intervalli di confidenza
Schema lezione 5 Intervalli di confidenza Non centrerò quella barca, ne sono convinto al 95% COMPRENDERE: Significato di intervallo di confidenza Uso degli stimatori come quantità di pivot per stime intervallari
DettagliMetodologie statistiche per l analisi del rischio FONDAMENTI DI INFERENZA PER L ANALISI DEL RISCHIO
Corso di Laurea in Sicurezza igienico-sanitaria degli alimenti Metodologie statistiche per l analisi del rischio FONDAMENTI DI INFERENZA PER L ANALISI DEL RISCHIO Facoltà di Medicina Veterinaria, Università
DettagliIntroduzione alla statistica per la ricerca in sanità
Introduzione alla statistica per la ricerca in sanità Modulo La verifica delle ipotesi: il test statistico dott. Eugenio Traini eugenio.traini@burlo.trieste.it Verifica d Ipotesi - 1 Che cos è un ipotesi
DettagliAnalisi della regressione multipla
Analisi della regressione multipla y = β 0 + β 1 x 1 + β 2 x 2 +... β k x k + u 2. Inferenza Assunzione del Modello Classico di Regressione Lineare (CLM) Sappiamo che, date le assunzioni Gauss- Markov,
DettagliApprossimazione normale alla distribuzione binomiale
Approssimazione normale alla distribuzione binomiale P b (X r) costoso P b (X r) P(X r) per N grande Teorema: Se la variabile casuale X ha una distribuzione binomiale con parametri N e p, allora, per N
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 018-019 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per la
DettagliIl processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni
La statistica inferenziale Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni E necessario però anche aggiungere con
DettagliUniversity of Messina, Italy
TRATTAMENTO E VALUTAZIONE DI DATI STATISTICI Applicazione della statistica alla valutazione dei dati Le applicazioni più comuni della statistica alla chimica analitica sono: Definire l intervallo numerico
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2016-2017 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliDISTRIBUZIONI DI PROBABILITA (parte 1) 1 / 19
DISTRIBUZIONI DI PROBABILITA (parte 1) 1 / 19 Variabili casuali (o aleatorie) 2 / 19 Disponendo di metodi corretti per raccogliere i dati e costruire i campioni data una popolazione, i valori numerici
DettagliLEZIONI DI STATISTICA MEDICA
LEZIONI DI STATISTICA MEDICA Lezione n.12 - Test statistico Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona IPOTESI SCIENTIFICA Affermazione che si può sottoporre a verifica
DettagliCONFRONTO TRA LA MEDIE DI DUE CAMPIONI INDIPENDENTI
CONFRONTO TRA LA MEDIE DI DUE CAMPIONI INDIPENDENTI ipotesi sul confronto tra le medie di due campioni indipendenti Obiettivo: decidere, attraverso il confronto tra le medie dei due campioni indipendenti,
DettagliSTATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo
STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)
DettagliSTATISTICA A K (60 ore)
STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Esercizio In una prova sul carico di rottura di due tipi di corda si dispone di 2 campioni di ampiezza 26 e 35 rispettivamente. Nel
DettagliStatistica Applicata all edilizia: Stime e stimatori
Statistica Applicata all edilizia E-mail: orietta.nicolis@unibg.it 15 marzo 2011 Statistica Applicata all edilizia: Indice 1 2 Statistica Applicata all edilizia: Uno dei problemi principali della statistica
DettagliMetodologie statistiche per l analisi del rischio FONDAMENTI DI INFERENZA PER L ANALISI DEL RISCHIO
Corso di Laurea in Sicurezza igienico-sanitaria degli alimenti Metodologie statistiche per l analisi del rischio FONDAMENTI DI INFERENZA PER L ANALISI DEL RISCHIO Facoltà di Medicina Veterinaria, Università
DettagliUNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II DIPARTIMENTO DI INGEGNERIA AEROSPAZIALE D.I.A.S. STATISTICA PER L INNOVAZIONE. a.a.
UNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II DIPARTIMENTO DI INGEGNERIA AEROSPAZIALE D.I.A.S. STATISTICA PER L INNOVAZIONE a.a. 2007/2008 1,00 0,90 0,80 0,70 0,60 0,50 0,40 0,30 0,20 0,10 0,00 CDF empirica
DettagliAnalisi della varianza
Analisi della varianza Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona ANALISI DELLA VARIANZA - 1 Abbiamo k gruppi, con un numero variabile di unità statistiche.
DettagliEsercitazione 8 maggio 2014
Esercitazione 8 maggio 2014 Esercizio 2 dal tema d esame del 13.01.2014 (parte II). L età media di n gruppo di 10 studenti che hanno appena conseguito la laurea triennale è di 22 anni. a) Costruire un
DettagliMetodi Quantitativi per Economia, Finanza e Management. Lezione n 5 Test d Ipotesi
Metodi Quantitativi per Economia, Finanza e Management Lezione n 5 Test d Ipotesi Test per lo studio dell associazione tra variabili Nella teoria dei test, il ricercatore fornisce ipotesi riguardo la distribuzione
DettagliTest d Ipotesi Introduzione
Test d Ipotesi Introduzione Uno degli scopi più importanti di un analisi statistica è quello di utilizzare i dati provenienti da un campione per fare inferenza sulla popolazione da cui è stato estratto
DettagliStatistica Inferenziale Soluzioni 3. Verifica di ipotesi
ISTITUZIONI DI STATISTICA A. A. 007/008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona
DettagliCasa dello Studente. Casa dello Studente
Esercitazione - 14 aprile 2016 ESERCIZIO 1 Di seguito si riporta il giudizio (punteggio da 0 a 5) espresso da un gruppo di studenti rispetto alle diverse residenze studentesche di un Ateneo: a) Si calcolino
DettagliFondamenti di statistica per il miglioramento genetico delle piante. Antonio Di Matteo Università Federico II
Fondamenti di statistica per il miglioramento genetico delle piante Antonio Di Matteo Università Federico II Modulo 2 Variabili continue e Metodi parametrici Distribuzione Un insieme di misure è detto
DettagliIl Test di Ipotesi Lezione 5
Last updated May 23, 2016 Il Test di Ipotesi Lezione 5 G. Bacaro Statistica CdL in Scienze e Tecnologie per l'ambiente e la Natura I anno, II semestre Il test di ipotesi Cuore della statistica inferenziale!
DettagliUniversità degli Studi di Padova. Corso di Laurea in Medicina e Chirurgia - A.A
Università degli Studi di Padova Corso di Laurea in Medicina e Chirurgia - A.A. 015-16 Corso Integrato: Statistica e Metodologia Epidemiologica Disciplina: Statistica e Metodologia Epidemiologica Docenti:
DettagliEsercizi di Probabilità e Statistica
Esercizi di Probabilità e Statistica Samuel Rota Bulò 6 giugno 26 Statistica Esercizio Sia {X n } n una famiglia di v.a. di media µ e varianza σ 2. Verificare che X = n n X i σ 2 = n (X i µ) 2 S 2 = n
DettagliRICHIAMI DI CALCOLO DELLE PROBABILITÀ
UNIVERSITA DEL SALENTO INGEGNERIA CIVILE RICHIAMI DI CALCOLO DELLE PROBABILITÀ ing. Marianovella LEONE INTRODUZIONE Per misurare la sicurezza di una struttura, ovvero la sua affidabilità, esistono due
DettagliMetodi statistici per lo studio dei fenomeni biologici
Metodi statistici per lo studio dei fenomeni biologici Alla fine di questa lezione dovreste essere in grado di: descrivere la distribuzione di campionamento della differenza di due medie costruire gli
DettagliCorso introduttivo di Epidemiologia e Biostatistica
Corso introduttivo di Epidemiologia e Biostatistica massimo guerriero carlo pomari e con il contributo di: Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health ELEMENTI
DettagliCOGNOME.NOME...MATR..
STATISTICA 29.01.15 - PROVA GENERALE (CHALLENGE) Modalità A (A) ai fini della valutazione verranno considerate solo le risposte riportate dallo studente negli appositi riquadri bianchi: in caso di necessità
Dettaglilezione 4 AA Paolo Brunori
AA 2016-2017 Paolo Brunori dove eravamo arrivati - abbiamo individuato la regressione lineare semplice (OLS) come modo immediato per sintetizzare una relazione fra una variabile dipendente (Y) e una indipendente
DettagliDipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli
Dipartimento di Sociologia e Ricerca Sociale Corso di Laurea in Sociologia Insegnamento di Statistica (a.a. 2018-2019) dott.ssa Gaia Bertarelli Esercitazione n. 7 1. Utilizzando le tavole della distribuzione
Dettagli07/01/2016. Scalisi - Tecniche Psicometriche LA VERIFICA DELLE IPOTESI. La verifica delle ipotesi. Popolazioni e campioni
LA VERIFICA DELLE IPOTESI Popolazioni, campioni, parametri ed indicatori 1 2 3 Popolazioni e campioni Viene definita popolazione o universo l insieme completo di tutti gli elementi che hanno in comune
DettagliCOGNOME.NOME...MATR..
STATISTICA 29.01.15 - PROVA GENERALE (STANDARD) Modalità B (A) ai fini della valutazione verranno considerate solo le risposte riportate dallo studente negli appositi riquadri bianchi: in caso di necessità
DettagliTest delle ipotesi sulla media.
. Caso di un singolo campione. Varianza nota.. Ipotesi alternativa bilaterale Test delle ipotesi sulla media. Valore medio η e deviazione standard σ della popolazione note. η è il valore stimato dal nostro
Dettagli