UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:"

Transcript

1 UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA Prof.ssa Donatella Siepi tel: novembre 2014

2 8 LEZIONE

3 Statistica inferenziale Probabilità Campione Popolazione Statistica inferenziale

4 Basi dei test statistici

5 LA VERIFICA DI IPOTESI: TEST BASATI SU UN CAMPIONE

6 La verifica di ipotesi Una fase dell inferenza è quella che consente di verificare delle ipotesi sui parametri Obiettivo primario: capire e ridurre l incertezza per prendere decisioni Obiettivo secondario: controllare il rischio del prendere decisioni sulla base delle statistiche campionarie

7 La verifica di ipotesi Verifica di ipotesi: metodologia per fare inferenza sui parametri della popolazione alla luce dell analisi delle differenze tra i risultati osservati (statistica campionaria) e quelli che ci aspetteremmo se una qualche ipotesi sulla popolazione fosse vera. La verifica di ipotesi ha inizio con la formulazione del sistema di ipotesi sottoposto a verifica. Il sistema di ipotesi fa sempre riferimento a qualche parametro della popolazione. Consiste sempre in due ipotesi contrapposte.

8 Ipotesi nulla L ipotesi nulla è, in generale, l ipotesi che si vorrebbe rifiutare. Essa afferma che gli effetti osservati nei campioni sono dovuti a fluttuazioni casuali, sempre possibili quando esiste variabilità tra gli individui; si tratta di variazioni che sono tanto più marcate quanto più ridotto è il numero di osservazioni. L ipotesi nulla H0 deve essere rifiutata solamente se esiste l evidenza che la contraddice. E importante comprendere che l ipotesi nulla non è necessariamente vera, quando i dati campionari (eventualmente pochi) non sono tali da contraddirla. L ipotesi nulla H0 non è mai provata o verificata; è solo possibile negarla o disapprovarla, sulla base di dati sperimentali

9 Con un test statistico si determina solamente una probabilità, che può essere differente ripetendo lo stesso esperimento, e inoltre la decisione che ne deriva può essere errata. Come primo caso, si supponga che un giocatore utilizzi una moneta perfettamente bilanciata, ma di cui egli non conosca le caratteristiche. Mediante alcuni lanci, egli deve decidere se la moneta è bilanciata (H0) oppure truccata (H1). Si supponga quindi che egli lanci questa moneta 6 volte e che ottenga croce tutte le volte. Se fosse uno statistico ragionerebbe in questo modo: "Avere 6 croci su 6 lanci è un evento raro; più esattamente ha una probabilità di (1/2 6 =0,5 6 ) 0,0156 o 1,56% di avvenire, se la moneta non fosse truccata (H0 vera).

10 Con una ipotesi bilaterale, quindi comprendendo anche la possibilità di avere 6 volte testa/croce, la probabilità è esattamente uguale a 3,12%. Di conseguenza, poiché 3,12% è una probabilità ritenuta bassa, ottenere 6 volte testa oppure 6 volte croce sono eventi complessivamente poco probabili, seppure possibili". Se egli avesse prefissato come valore soglia la probabilità del 5%, con questo test statistico rifiuterebbe l ipotesi nulla. Giungerebbe alla conclusione che tra atteso (3 volte teste e 3 volte croce su 6 lanci) ed osservato (6 volte croce oppure l'opposto) esiste una differenza significativa e che pertanto la moneta è truccata. Ma noi, sappiamo che in realtà essa non la è. E un errore, che in statistica si chiama errore di I tipo (scritto spesso con l'iniziale maiuscola Tipo=errore di prima specie). Consiste nel rifiutare l ipotesi nulla H0, quando in realtà essa è vera

11 Si supponga ora, come secondo caso, che sempre all insaputa del giocatore questa volta la moneta sia truccata e dia solo croce. Se questa volta egli la lancia solo 3 volte, ovviamente otterrebbe 3 volte croce. In questo caso, se fosse uno statistico seguirebbe questo ragionamento: "Se la moneta non fosse truccata (H0 vera), la probabilità di trovare per caso 3 volte croce è alta, più esattamente uguale a 0,5 3 =0,125 o 12,5%".Con un test bilaterale la probabilità è 0,25. Pertanto, egli non rifiuterebbe l ipotesi nulla. Errando, arriverebbe alla conclusione che la moneta non è truccata. In questo caso, si ha l errore di II tipo (o seconda specie). Consiste nel non rifiutare (o accettare) l'ipotesi nulla H0, quando in realtà essa è falsa. In statistica, non è possibile eliminare questi due tipi di errore.

12 La verifica di ipotesi Una fase dell inferenza è quella che consente di verificare delle ipotesi sui parametri Obiettivo primario: capire e ridurre l incertezza per prendere decisioni Obiettivo secondario: controllare il rischio del prendere decisioni sulla base delle statistiche campionarie Esempio: in una azienda che produce scatole metalliche si intende valutare se il processo produttivo opera in modo tale da garantire che la lunghezza del lato maggiore sia pari a 368 mm. Viene estratto un campione di 25 scatole. Se la lunghezza delle scatole risultasse diversa sarebbe necessario un intervento correttivo, altrimenti no.

13 La verifica di ipotesi Nell approccio classico alla verifica di ipotesi, si individuano i seguenti elementi chiave: 1. L ipotesi nulla H 0 si riferisce sempre a un valore specifico del parametro della popolazione (ad esempio m), e non a una statistica campionaria (ad esempio la media campionaria). 2. L ipotesi nulla contiene sempre un segno di eguale relativo al valore specificato del parametro della popolazione (ad esempio H 0 : m=368 mm). 3. L ipotesi alternativa non contiene mai un segno di eguale relativo al valore specificato del parametro della popolazione (ad esempio H 1 : m 368 mm).

14 La verifica di ipotesi Se la statistica campionaria prescelta si avvicina al valore ipotizzato nell ipotesi nulla accettiamo H 0, altrimenti rifiutiamo H 0 a favore dell ipotesi alternativa H 1. La teoria della verifica di ipotesi fornisce una regola su cui basare il processo decisionale. Tale regola si basa sul calcolo della probabilità di ottenere un dato risultato campionario nel caso in cui l ipotesi nulla sia vera. Questo risultato viene ricavato determinando prima la distribuzione campionaria della statistica di interesse (statistica test) e quindi calcolando il valore assunto per il particolare campione considerato. La distribuzione campionaria della statistica test spesso è una distribuzione statistica nota, come la Normale o la t di Student, e quindi possiamo ricorrere a queste distribuzioni per sottoporre a verifica un ipotesi nulla.

15 La verifica di ipotesi La distribuzione campionaria della statistica test è divisa in due regioni: una regione di rifiuto (o regione critica) una regione di accettazione Regione di rifiuto: insieme dei valori della statistica test che non è probabile si verifichino quando è vera H 0 ed è probabile si verifichino quando H 0 è falsa. La regola decisionale è: Valore della statistica test Cade nella regione di accettazione Cade nella regione di rifiuto L ipotesi nulla non può essere rifiutata L ipotesi nulla deve essere rifiutata

16 La verifica di ipotesi Per prendere una decisione sull ipotesi nulla, dobbiamo determinare il valore critico della statistica test. Tale valore separa la regione di accettazione dalla regione di rifiuto.

17 La verifica di ipotesi Decidere sulla base della statistica campionaria => rischio di errore. Si distinguono due tipi di errore: L errore di prima specie si verifica se si rifiuta l ipotesi nulla quando è vera e quindi non dovrebbe essere rifiutata. La Probabilità che si verifichi un errore di prima specie è indicata con (alfa). L errore di seconda specie si verifica se si accetta l ipotesi nulla quando è falsa e quindi dovrebbe essere rifiutata. La Probabilità che si verifichi un errore di seconda specie è indicata con (beta).

18 La verifica di ipotesi Livello di significatività del test: probabilità di commettere un errore di prima specie. In genere si controlla l errore di prima specie => viene specificato prima di condurre la verifica di ipotesi Il valore di esprime la probabilità che la statistica test cada nella regione di rifiuto quando è vera H 0 => il valore critico dipende da. Coefficiente di confidenza: (1- ) esprime la probabilità di accettare H 0 quando è vera. Espresso in percentuale mi fornisce il livello di confidenza per stime intervallari. Rischio : rischio del consumatore. Non è controllabile Potenza del test (1- ): probabilità di rigettare H 0 quando è falsa => è auspicabile che sia più grande possibile => indicatore della bontà di un test statistico.

19 La verifica di ipotesi Lo schema seguente riassume i rischi del processo decisionale: In genere viene fissato a 0,05. Se le conseguenze di un errore di I specie sono gravi potrei scegliere un valore pari a 0,01 => aumenta il rischio di errore di seconda specie ( ) Per ridurre a parità di posso aumentare la dimensione del campione

20 Test Z per la media (s noto) Per verificare l ipotesi che la media della popolazione sia uguale ad un certo valore m, contro l ipotesi alternativa che la media differisca da tale valore, conoscendo s, si ricorre alla statistica Z: X è distribuita come una normale => sotto H 0 Z è distribuita come una normale standardizzata Se Z assume valori vicini allo zero siamo portati ad accettare H 0, altrimenti si propende per rifiutare H 0 (test a due code).

21 Test Z per la media (s noto) Approccio del valore critico (livello di significatività di 0,05) Regola decisionale: Rifiuto H 0 se Z>+1,96 o se Z<-1,96 Accetto H 0 altrimenti

22 Test Z per la media (s noto) Esempio: l azienda che produce scatole metalliche intende valutare se il processo produttivo opera in modo tale da garantire che la lunghezza del lato maggiore sia pari a 368 mm. Viene estratto un campione di 25 scatole. Lo scarto quadratico medio della popolazione è pari a 15 mm e la media campionaria assume il valore 372,5 mm. H 0 : m = 368 H 1 : m 368 Il valore della statistica test mi porta ad accettare H 0.

23 Le fasi della verifica di ipotesi 1. Specificate l ipotesi nulla H 0 e esprimetela in termini statistici. Nel verificare se la lunghezza media delle scatole è 368 mm, l ipotesi nulla è: m = Specificate l ipotesi alternativa H 1 e esprimetela in termini statistici. Nel verificare se la lunghezza media delle scatole è 368 mm, l ipotesi alternativa è: m Scegliete il livello di significatività. Il livello di significatività viene fissato in base all importanza relativa che si accorda ai rischi derivanti dal commettere un errore di prima specie e dal commettere un errore di seconda specie. Nell esempio considerato, abbiamo posto = 0, Scegliete l ampiezza campionaria. L ampiezza campionaria viene fissata dopo aver considerato i rischi derivanti da un errore di prima specie e da un errore di seconda specie (vale a dire dopo aver specificato e ) e tenendo conto dei vincoli di bilancio a cui si è sottoposti nel condurre lo studio. Nell esempio considerato sono state campionate 25 scatole. 5. Individuate la tecnica statistica da utilizzare e calcolate la statistica test corrispondente. Nell esempio considerato, s era noto e quindi abbiamo usato il test Z.

24 Le fasi della verifica di ipotesi 6. Calcolate i valori critici che separano la regione di rifiuto da quella di accettazione. Una volta specificate l ipotesi nulla e quella alternativa e una volta fissati il livello di significatività e l ampiezza del campione, si possono calcolare i valori critici delle distribuzioni delle statistiche test di modo che la regione di rifiuto e quella di accettazione risultino ben individuate. Nell esempio considerato, sono stati usati i valori +1,96 e 1,96, perché la statistica test Z si distribuisce secondo una normale standardizzata. 7. Raccogliete i dati e calcolate il valore campionario della statistica test. Nell esempio considerato, la media campionaria è pari a 372,5 mm e quindi Z = 1, Stabilite se la statistica test cade nella regione di rifiuto o in quella di accettazione. A tale scopo, confrontate il valore della statistica con i valori critici individuati. Nell esempio considerato, Z = 1,50 cade nella regione di accettazione perché -1,96 < Z = +1,50 < +1,96.

25 Le fasi della verifica di ipotesi 9. Prendete la decisione statistica. Se la statistica test cade nella regione di accettazione, l ipotesi nulla H 0 non può essere rifiutata. Se la statistica test cade nella regione di rifiuto, l ipotesi nulla H 0 viene rifiutata. Nell esempio considerato, l ipotesi nulla H 0 non è rifiutata. 10. Esprimete la decisione statistica con riferimento a una data situazione. Nell esempio relativo alla produzione di scatole, concludiamo che dal campione non si possono trarre degli elementi di prova sufficienti per affermare che la lunghezza media delle scatole è diversa da 368 mm. Non si rende necessario nessun intervento correttivo.

26 PROCEDURA DECISIONALE La procedura decisionale per condurre una verificare di ipotesi consta dei seguenti passi: specificare l ipotesi nulla e l ipotesi alternativa diinteresse considerare l appropriata statistica (meglio detta statistica test ) in relazione alle ipotesi di cui sopra fissare l errore di I tipo α (detto anche livello di significatività del test ) ad un valore accettabile; questa operazione identifica nella distribuzione della statistica test due regioni: la regione di accettazione e la regione di rifiuto (detta anche regione critica ) in base ai dati campionari (ottenuti da un campione casuale IID dalla popolazione sotto indagine) calcolare il valore osservato della statistica test se tale valore appartiene alla regione critica si deve rifiutare l ipotesi nulla, altrimenti apparterrà alla regione di accettazione e non si può rifiutare l ipotesi nulla

27 IL P-VALUE NELLA PROCEDURA DECISIONALE In alternativa al considerare le due regioni di accettazione e rifiuto, è possibile prendere la decisione in base al p-value: Il p-value rappresenta la probabilità di osservare un valore della statistica test uguale o più estremo del valore che si calcola a partire dal campione, quando l ipotesi H0 è vera.

28 L approccio del p-value Negli ultimi anni, anche grazie all ampia diffusione di pacchetti statistici e fogli elettronici, si è affermato un altro approccio alla verifica di ipotesi: l approccio del p-value. Il p-value è anche chiamato livello di significatività osservato. Regola decisionale: se il p-value è maggiore o uguale ad, l ipotesi nulla viene accettata se il p-value è minore di, l ipotesi nulla è rifiutata

29 Come si utilizza il p-value associato a sn in pratica per decidere tra H0 e H1? Il vantaggio del p value è che non ci serve più andare a consultare le tavole della Normale, della t-student, del Chiquadrato o della F, ecc. per decidere. Tutto quello che dobbiamo fare è confrontare il p-value associato a sn con il livello di significatività α che abbiamo fissato in precedenza

30 L approccio del p-value Esempio: l azienda che produce scatole metalliche intende valutare se il processo produttivo opera in modo tale da garantire che la lunghezza del lato maggiore sia pari a 368 mm. Viene estratto un campione di 25 scatole. Lo scarto quadratico medio della popolazione è pari a 15 mm e la media campionaria assume il valore 372,5 mm. H 0 : m = 368 H 1 : m 368 Il valore della statistica test è pari a 1,5. La probabilità che Z assuma valori uguali o più estremi di 1,5 coincide con la probabilità che assuma valori maggiori di 1,5 o minori di -1,5 (test a due code). Le due probabilità sono pari a 0,0668 e la loro somma è perciò 0,1336. Tale valore è maggiore di =0,05 perciò accetto H 0.

31 L approccio del p-value 1. Specificate l ipotesi nulla H Specificate l ipotesi alternativa H Fissate il livello di significatività. 4. Scegliete la tecnica statistica appropriata e la statistica test da utilizzare. 5. Raccogliete i dati e calcolate il valore campionario della statistica test. 6. Calcolate il p-value. Per farlo: (a) determinate la distribuzione della statistica test sotto l ipotesi H 0 ; (b) ponete la statistica test sull asse delle ascisse; (c) ombreggiate l area corretta al di sotto della curva della distribuzione, sulla base dell ipotesi alternativa H Confrontate il p-value con. 8. Prendete la decisione statistica. Se il p-value è maggiore o uguale ad, ipotesi nulla non è rifiutata. Se il p-value è minore di, l ipotesi nulla è rifiutata. 9. Esprimete la decisione statistica con riferimento alla situazione considerata.

32 Intervalli di confidenza e verifiche d ipotesi Gli intervalli di confidenza vengono usati per stimare i parametri della popolazione mentre la verifica di ipotesi serve per prendere decisioni sul valore dei parametri. Alternativamente alla verifica di ipotesi possiamo costruire un intervallo di confidenza per la media m. Accettiamo l ipotesi nulla se il valore ipotizzato è compreso nell intervallo costruito. Rifiutiamo l ipotesi nulla se il valore cade fuori dell intervallo. Nell esempio dell azienda che costruisce scatole di metallo, l intervallo di confidenza al livello del 95% sarà: cioè 372,5 ± (1,96) 15/5. ( X Zs / n) Quindi 366,62 m 378,38. Il valore 368 è compreso nell intervallo, perciò accetto H 0.

33 Statistica Medica Confronto tra due medie

34

35 Campioni appaiati Ad ogni osservazione del primo gruppo corrisponde una osservazione del secondo gruppo (singolo soggetto in due tempi diversi, tipicamente prima e dopo il trattamento). L appaiamento rende il confronto più preciso, eliminando parte della variabilità biologica.

36 Prima: x1 x2 x3..xn Dopo: y1 y2 y3.yn Campioni appaiati Consideriamo le differenze all interno di ciascuna coppia: d1=x1 y1 d2=x2 - y2 dn=xn - yn

37 Campioni appaiati L ipotesi nulla è che la media sia la stessa prima e dopo la terapia. Quindi l ipotesi nulla è che la media delle differenze (d) sia zero!! Calcoliamo la media delle differenze d e la deviazione standard delle differenze s d

38 Campioni appaiati Secondo l ipotesi nulla, la variabile t è distribuita come una t-student con n-1 gradi di libertà t n d s d L ipotesi nulla quindi si potrà accettare con 5% di confidenza se t <1.96. Altrimenti l ipotesi nulla viene rigettata.

39 Campioni appaiati:esempio Prima dopo

40 Campioni appaiati: test unilaterale Supponiamo ora che l ipotesi nulla sia che la media dopo la terapia sia inferiore. Dobbiamo allora fare un test unilaterale sulla media delle differenze. Se t<-1.62 allora si sarebbe verificato un evento che, sotto l ipotesi nulla, ha meno del 5% di probabilità di verificarsi. Se t> accetteremo l ipotesi nulla.

41 Campioni appaiati: esempio Sia la media delle differenze pari a -6.63, e la deviazione standard delle differenze sia 20.29, su n=63 osservazioni. Calcoliamo la t: t=sqrt(63)*(-6.63)/20.29=-2.59 Possiamo rigettare l ipotesi nulla con la confidenza del 5%.

42 Campioni indipendenti Supponiamo di avere due gruppi indipendenti e di voler verificare l ipotesi nulla che la media sia la stessa nelle due popolazioni. Come si implementa il test t- student in questo caso?

43 Campioni indipendenti:varianze uguali Il primo gruppo sia composto da n1 campioni e sia µ1 la media. Il secondo gruppo sia composto da n2 campioni e sia µ2 la media. Supponiamo che la deviazione standard nei due gruppi sia uguale e pari a σ. Ipotesi nulla Ho: µ1 = µ2

44 Campioni indipendenti:varianze uguali t n d s d Sotto Ho: la differenza delle medie è distribuita come una gaussiana con media zero e deviazione standard: 2 s s 2 n 1 n 2

45 Campioni indipendenti:varianze uguali La variabile t in questo caso è: t x 1 2 x 2 s s 2 n 1 n 2

46 Prima popolazione Campioni indipendenti:varianze disuguali Seconda popolazione

47 Varianze disuguali t x x 2 s s 2 2 n 1 n 2

48 Statistica Medica 6. Analisi della varianza

49 One way ANOVA Facciamo un esempio: per lo studio degli effetti dell esposizione a monossido di carbonio in soggetti con patologie coronariche, le distribuzioni del volume espiratorio forzato in un secondo dei pazienti di ciascuno di tre centri medici: John Hopkins University School, Rancho Los Amigos Medical Center, e St. Louis University School in Medicine. Sono tre popolazioni distinte. Vogliamo testare l ipotesi che le medie delle tre popolazioni sono uguali: µ1=µ2=µ3

50 Esempio john Hopkins Rancho Los Amigos sant Louis 3,23 3,22 2,79 3,47 2,88 3,22 1,86 1,71 2,25 2,47 2,89 2,98 3,01 3,77 2,47 1,69 3,29 2,77 2,1 3,39 2,95 2,81 3,86 3,56 3,28 2,64 2,88 3,36 2,71 2,63 2,61 2,71 3,38 2,91 3,41 3,07 1,98 2,87 2,81 2,57 2,61 3,17 2,08 3,39 2,23 2,47 3,17 2,19 2,47 4,06 2,74 1,98 2,88 2,81 2,63 2,85 2,53 2,43 3,2 3,53 n1=21 n2=16 n3=23 x1medio=2,63 litri x2medio=3,03 litri x3medio=2,88 litri s1=0,496 litri s2=0,523 litri s3=0,498 litri

51 One way ANOVA Per testare l ipotesi che le tre medie siano uguali, potrei fare i confronti a due a due,e per ciascuna coppia fare il test t-student. Nel caso N=3 popolazioni devo fare 6 confronti. Nel caso generale può essere un numero proibitivo di coppie. Inoltre questa procedura può condurre ad errori. L ipotesi µ1=µ2=µ3 va testata con un singolo test, l analisi della varianza (ANOVA). Quando c è una sola caratteristica che distingue le varie popolazioni, si parla di one way anova (ad un criterio di classificazione).

52 One way ANOVA Misura della variabilità delle osservazioni rispetto alle medie delle singole osservazioni (stima pooled della varianza comune): ( n1 1) s1 ( n2 1) s2 ( nk 1) s sw n n n k 1 2 k 2 k Varianza campionaria between

53 One way ANOVA Misura della variazione delle medie delle popolazioni rispetto alla media generale: k k k n n x n x n x n x ) ( ) ( ) ( k n x x n x x n x x s k k B Varianza campionaria within

54 One way ANOVA Sotto l ipotesi nulla le due varianze dovrebbero essere simili. Calcoliamo il rapporto, detto F F s s 2 B 2 w

55 One way anova La distribuzione di probabilità di F è nota, sotto l ipotesi nulla, e dipende da k-1 (gradi di libertà del numeratore) e dal numero di dati (n-k=gradi di libertà del denominatore). Questo permette di valutare la probabilità, sotto l ipotesi nulla, che si verifichi un evento almeno estremo come quello che si è verificato, che sarà consistente se tale probabilità sarà maggiore di 0.05.

56 One way ANOVA Torniamo al nostro esempio e calcoliamo la F, otteniamo F= La distribuzione è la F con gradi di libertà 2 e 57. La probabilità che F sia risulta uguale a , quindi non possiamo rifiutare l ipotesi nulla al 5% di confidenza.

57 One way ANOVA Se il risultato dell F test è 1, significa che le medie non sono tutte uguali. A questo punto possiamo cercare le popolazioni che si distinguono dalle altre mediante test specifici che indicano quali tra i gruppi sono differenti. Questo si ottiene con il test di Tukey quando si fanno i confronti multipli.

58

59 ANALISI UNIVARIATE e dati non parametrici 1) raccolta e codifica dei dati (valori osservati) 2) inserimento dei dati in una matrice. 3) definizione ipotesi nulla e ipotesi alternativa 4) calcolo dei ranghi 5) calcolo del valore Wx e zwx 6) si verifica l ipotesi in base alla distribuzione teorica normale 7) si interpretano i risultati IL TEST DI WILCOXON-MANN-WHITNEY

60 VERIFICA DELLE IPOTESI SU DUE CAMPIONI disegni TRA GRUPPI (BETWEEN) (n<30) Se la variabile è misurata su scala Ordinale la statistica più adatta per confrontare due gruppi (due misurazioni indipendenti) è l applicazione del test di Wilcoxon-Mann-Whitney. Questo è uno dei test non parametrici più potenti e rappresenta un alternativa molto valida al test parametrico t.

61 LA VERIFICA DELLE IPOTESI SU DUE CAMPIONI disegni TRA GRUPPI (BETWEEN) (n<30) IL TEST DI WILCOXON-MANN-WHITNEY Mediante questo test, usando come parametro il rango (o la mediana), è possibile verificare se due campioni x e y provengono dalla medesima popolazione. H0= x e y hanno la stessa distribuzione H1= x y x > y x < y

62 Test U di Mann-Whitney Due campioni indipendenti, dati ordinali Il test U di Mann-Whitney dovrebbe essere usato come alternativa non-parametrica ad un test t di Student su campioni indipendenti, se una qualsiasi delle assunzioni necessarie è violata.

63 Test di Wilcoxon Due campioni non indipendenti, dati ordinali Il test di Wilcoxon dovrebbe essere usato come alternativa non-parametrica al t di Student per campioni non indipendenti se una qualsiasi delle assunzioni necessarie per quest ultimo è violata.

64 KRUSKAL-WALLIS Analogo alla ANOVA viene utilizzato incaso di comparazione tra 3 o più gruppi di dati non parametrici

65 Test non parametrici

66

67 Chi-QUADRO

68

69

70 I TESTS del CHI-QUADRATO sono utilizzati per valutare l omogeneità, la casualità, l associazione, l indipendenza e la bontà di adattamento

71 Test Chi-quadrato per la differenza tra due proporzioni Il problema della verifica di ipotesi sulla differenza tra due proporzioni può essere affrontato anche con una procedura basata su una statistica test la cui distribuzione tende ad approssimarsi con una distribuzione chi-quadrato (χ2). Se siamo interessati a confrontare le proporzioni di casi che presentano una certa caratteristica in due gruppi indipendenti possiamo costruire una tabella a doppia entrata (o di contingenza) di dimensioni 2 2 nella quale sono riportati il numero (o le percentuali) di successi e insuccessi nei due gruppi

72 Test Chi-quadrato per la differenza tra due proporzioni

73 Test Chi-quadrato per la differenza tra due proporzioni Per verifica l ipotesi nulla secondo cui non c è differenza tra le due proporzioni H0: π1 = π2 contro l alternativa H1: π1 π2 si può considerare la statistica χ2 La statistica χ2 si ottiene calcolando per ogni cella della tabella di contingenza la differenza al quadrato fra la frequenza osservata (f0) e quella attesa (fe), divisa per fe, e sommando quindi il risultato ottenuto per ogni cella

74 Test Chi-quadrato per la differenza tra due proporzioni Per calcolare la frequenza attesa si deve tener conto del fatto che se l ipotesi nulla è vera la proporzione di successi e insuccessi è la stessa nei due gruppi e le proporzioni campionarie dovrebbero differire solo per effetto del caso. In questo caso per stimare il parametro π conviene utilizzare una combinazione delle due frequenze campionarie indicate con p Per calcolare la frequenza attesa fe per le celle relative al successo (prima riga) si dovrà moltiplicare l ampiezza campionaria n1 e n2 (totali di colonna) per p

75 Test Chi-quadrato per la differenza tra due proporzioni Analogamente, per calcolare la frequenza attesa fe per le celle relative all insuccesso (seconda riga) si dovrà moltiplicare l ampiezza campionaria n1 e n2 di ciascuno dei due gruppi per (1 p ) La statistica test introdotta nell equazione (11.1) si distribuisce approssimativamente secondo una distribuzione chi-quadrato con 1 grado di libertà Fissato α, l ipotesi nulla dovrà essere rifiutata se il valore osservato della statistica χ2 è maggiore del valore critico χ2 U di una distribuzione χ2 con 1 grado di libertà

76 Test Chi-quadrato per la differenza tra due proporzioni

77 Test Chi-quadrato per la differenza tra due proporzioni

78 Test Chi-quadrato per la differenza tra due proporzioni

79 Test Chi-quadrato per la differenza tra due proporzioni Il test χ2 opportunamente generalizzato può essere utilizzato per confrontare le proporzioni di più popolazioni indipendenti. Supponiamo di voler verificare l ipotesi nulla secondo cui le proporzioni di c popolazioni sono uguali H0: π1 = π2 = = πc contro l alternativa H1: non tutte le πj sono uguali tra loro (con j=1,,c) Per risolvere questo problema dovremo costruire una tabella di contingenza di due righe (successo e insuccesso) che avrà un numero di colonne pari a c La statistica test sarà la stessa dell equazione (11.1), dove la frequenza attesa viene calcolata dalla stima p di π = π1 = π2 = = πc che in questo caso si ottiene come

80 Test Chi-quadrato per la differenza tra due proporzioni La statistica test dell equazione (11.1) si distribuisce approssimativamente secondo una distribuzione chiquadrato con (2 1) (c 1)=(c 1) gradi di libertà Fissato α, l ipotesi nulla dovrà essere rifiutata se il valore osservato della statistica χ2 è maggiore del valore critico χ2 U di una distribuzione χ2 con (c 1) gradi di libertà

81 Test Chi-quadrato per la differenza tra due proporzioni

82 Test Chi-quadrato per la differenza tra due proporzioni Calcolo della statistica test χ2 per l esempio relativo alla soddisfazione dei clienti di 3 alberghi Regione di rifiuto e di accettazione del test χ2 (2 gradi di libertà) per la differenza tra tre proporzioni al livello di significatività α=0.05

83 Test Chi-quadrato per la differenza tra due proporzioni Foglio di Microsoft Excel con i calcoli necessari per calcolare valore critico e p-value (test chi-quadro, 3 gruppi)

84 Test Chi-quadrato per la differenza tra due proporzioni

85 Test Chi-quadrato per l indipendenza Se si considera una tabella di contingenza con r righe c colonne il procedimento del test χ2 può esser generalizzato per verificare l indipendenza tra due variabili categoriali X e Y In questo contesto le ipotesi nulla e alternativa sono H0: le due variabili categoriali sono indipendenti (X Y)(non sussistono relazioni tra le due variabili) H1: le due variabili categoriali sono dipendenti (X Y)(sussiste una relazione tra le due variabili) Il test si basa ancora una volta sull equazione (11.1) La regola decisionale consiste nel rifiutare H0 se il valore osservato della statistica 2 è maggiore del valore critico 2 U della distribuzione 2 con (r-1)x(c-1) gdl

86 Test Chi-quadrato per l indipendenza Pure se presentano delle analogie, la differenza fondamentale tra il test chi-quadrato per le proporzioni e per l indipendenza riguarda lo schema di campionamento: Nel confronto tra proporzioni siamo di fronte a campioni estratti da popolazioni indipendenti Nel test di indipendenza abbiamo un solo campione su cui rileviamo due variabili qualitative che possono assumere r e c modalità distinte Nel caso di test chi-quadrato per l indipendenza è possibile semplificare il calcolo delle frequenze attesa applicando la seguente regola:

87 Test Chi-quadrato per l indipendenza

88 Test Chi-quadrato per l indipendenza

89 Test Chi-quadrato per l indipendenza Regione di rifiuto e di accettazione del test 2 per l indipendenza nell esempio sulla soddisfazione dei clienti (al livello di significatività 0.05 con 6 gradi di libertà)

90 Test Chi-quadrato per l indipendenza Foglio di Microsoft Excel con i calcoli necessari per la verifica dell ipotesi di indipendenza tra motivo di insoddisfazione e albergo

91 Procedure per dati categorici Tipi di test Tabelle di contingenza Tabelle 2x2 Tabelle 2xc Tabelle rxc 1 3 o più N di campio ni Test su proporzione 2 Test X 2 per π c Test Z per π 1 = π 2 Test X 2 per π 1 = π 2

92 avanzi

93

94 poiché la distribuzione delle medie campionarie è una distribuzione normale, siamo in grado di calcolare l area sotto la curva utilizzando il rapporto critico e la statistica z Ad esempio: qual è la probabilità di estrarre un campione di 10 individui con altezza media 175 da una popolazione che ha media 170 cm e d.s. 5? Z = ( ) /(5/ 10) = 6.33 Utilizzando le tavole la probabilità è < 0.001

95

96 Introduzione Una volta effettuata una simulazione, è necessario stimare la precisione e l affidabilità dei risultati. Si supponga ad esempio di voler valutare il valore medio di un certo indice di prestazione x. x è una variabile aleatoria con valore medio m e varianza s 2. Ripetendo n esperimenti di simulazione, per ipotesi statisticamente indipendenti tra loro, si ottengono n osservazioni indipendenti X1, X2,..., Xn.

97 Valore medio di una grandezza Una stima di m è data dalla media campionaria X(n) 1 n Questo stimatore è anch esso una variabile aleatoria: ripetendo più volte la simulazione X(n) assume valori diversi n i 1 In generale X(n) m : è necessario valutare l affidabilità della stima. Il metodo dell intervallo di confidenza consiste nel determinare un intervallo attorno al valore X(n), in modo da prevedere con una certa probabilità (detta confidenza) che m cada in questo intervallo. Si noti che X(n) è uno stimatore non polarizzato di m, cioè E{X(n)} = m. X i

98 Livello di confidenza dello stimatore In formule si esprime nel modo seguente P X (n) m 1 dove è la semiampiezza dell intervallo di confidenza: [ X ( n) ; X ( n) ] Tipicamente 1 - vale 0,9 0,95 o 0,99 cioè affidabilità del 90, 95 o 99% rispettivamente.

99 Varianza campionaria Varianza di X(n): Var {X(n)} = s 2 /n da cui si vede che all aumentare del numero di campioni la stima della media migliora La varianza si può stimare mediante la varianza campionaria S 2 (n): S 2 (n) 1 n 2 [X i X(n)] n 1 i 1 Anch essa è uno stimatore non polarizzato cioè E{S 2 (n)}= s 2 sostituendo quindi s 2 con S 2 (n) si ha 1 Var[X(n)] S 2 (n)/n n [X i X(n)] 2 n(n 1) i 1

100 Calcolo di Se il numero di osservazioni è elevato (n > 30) si può assumere che X(n) abbia distribuzione gaussiana (Teo. Limite centrale) Si introduce la variabile aleatoria Z n : Z n [X(n) m] s 2 n La variabile Z n ha valor medio nullo e varianza unitaria con distribuzione gaussiana (variabile normale standard).

101 Calcolo di Si riporta di seguito la distribuzione di Z n /2 /2 -Z 1- /2 Z 1- /2 Il valore z 1- /2 è tale per cui l integrale della curva fra -z 1- /2 e z 1- /2 vale 1-. Ossia: P{ -z 1- /2 z z 1- /2 } = 1-

102 Calcolo di Poiché si suppone n abbastanza grande, si può sostituire nell espressione di Z n S 2 (n) al posto di s 2 : P z 1 2 X(n) m S 2 (n)/n z 1 2 P X(n) z 1 2 S 2 (n)/n m X(n) z 1 2 S 2 (n)/n 1 Il simbolo indica che questa è un approssimazione. Si ricava quindi la semiampiezza dell intervallo di confidenza: z 1 2 S 2 (n)/n

103 T-student Se i campioni Xi hanno distribuzione normale la variabile t n [X(n) m] S 2 (n) n ha una distribuzione detta t di Student a n-1 gradi di libertà e l intervallo di confidenza è in questo caso esattamente espresso da t n 1,1 2 S 2 (n)/n e prende il nome di intervallo di confidenza t. i valori della distribuzione t si trovano tabulati per i diversi valori di n in pratica raramente i campioni X i hanno distribuzione normale per cui l uso dell intervallo di confidenza t è ancora una approssimazione per n tendente all infinito i valori ottenuti con i due metodi coincidono

104 Tabella t-student Si riporta qui a fianco i valori tabulati della distribuzione t-student in funzione del numero di gradi di libertà per un valore 1- =0.95 n - 1 t n 1,

105 Esempio Si supponga di aver effettuato 9 esperimenti di simulazione indipendenti da cui si sono misurate 9 stime della variabile casuale X: X1, X2,., Xn. n Sia: S 2 (n) 1 n 1 X(n) 1 X i 65 n Si può determinare S 2 (n): 9 i 1 n i 1 X i X(n) ) i [X i X(n)]

106 Esempio Scegliendo di determinale l intervallo di confidenza con livello di confidenza del 95%, cioè 1- =0.95 si ha: t n 1,1 2 t 8, t n 1,1 2 S 2 (n)/n / [X(n) ;X(n) ] ; ;81.12 L intervallo di confidenza risulta quindi: P E X cioè

Capitolo 11 Test chi-quadro

Capitolo 11 Test chi-quadro Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 11 Test chi-quadro Insegnamento: Statistica Corsi di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara Docenti: Dott.

Dettagli

Esercizi di statistica

Esercizi di statistica Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..

Dettagli

Capitolo 9 Verifica di ipotesi: test basati su un campione

Capitolo 9 Verifica di ipotesi: test basati su un campione Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 9 Verifica di ipotesi: test basati su un campione Insegnamento: Statistica Corsi di Laurea Triennale in Economia Facoltà di Economia, Università

Dettagli

Capitolo 9 Verifica di ipotesi: test basati su un campione

Capitolo 9 Verifica di ipotesi: test basati su un campione Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 9 Verifica di ipotesi: test basati su un campione Insegnamento: Statistica Corsi di Laurea Triennale in Economia Dipartimento di Economia

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2016-2017 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

Statistica Inferenziale

Statistica Inferenziale Statistica Inferenziale a) L Intervallo di Confidenza b) La distribuzione t di Student c) La differenza delle medie d) L intervallo di confidenza della differenza Prof Paolo Chiodini Dalla Popolazione

Dettagli

Statistica. Capitolo 10. Verifica di Ipotesi su una Singola Popolazione. Cap. 10-1

Statistica. Capitolo 10. Verifica di Ipotesi su una Singola Popolazione. Cap. 10-1 Statistica Capitolo 1 Verifica di Ipotesi su una Singola Popolazione Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Formulare ipotesi nulla ed ipotesi alternativa

Dettagli

Contenuti: Capitolo 14 del libro di testo

Contenuti: Capitolo 14 del libro di testo Test d Ipotesi / TIPICI PROBLEMI DI VERIFICA DI IPOTESI SONO Test per la media Test per una proporzione Test per la varianza Test per due campioni indipendenti Test di indipendenza Contenuti Capitolo 4

Dettagli

Statistica (parte II) Esercitazione 4

Statistica (parte II) Esercitazione 4 Statistica (parte II) Esercitazione 4 Davide Passaretti 03/03/016 Test sulla differenza tra medie (varianze note) Un negozio di scarpe è interessato a capire se le misure delle scarpe acquistate da adulti

Dettagli

per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione

per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione Rapporti statistici di composizione la parte rispetto al tutto percentuali di derivazione per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione di frequenza (tassi) rapporti

Dettagli

STATISTICA MULTIVARIATA SSD MAT/06

STATISTICA MULTIVARIATA SSD MAT/06 Università degli studi di Ferrara Dipartimento di Matematica A.A. 2018/2019 I semestre STATISTICA MULTIVARIATA SSD MAT/06 LEZIONE 4 - Questioni di analisi e applicazione della regressione lineare Pratica

Dettagli

STATISTICA. Federico M. Stefanini. e.mail: a.a (3 CFU)

STATISTICA. Federico M. Stefanini. e.mail: a.a (3 CFU) STATISTICA a.a. 2001-2002 (3 CFU) Federico M. Stefanini Dipartimento di Statistica G.Parenti viale Morgagni 59, 50134 Firenze, tel. 055-4237211 PARTE 5-3.12.2001 e.mail: stefanin@ds.unifi.it http://www.ds.unifi.it/ricerca/pagperson/docenti/stefanini.htm

Dettagli

Modelli descrittivi, statistica e simulazione

Modelli descrittivi, statistica e simulazione Modelli descrittivi, statistica e simulazione Master per Smart Logistics specialist Roberto Cordone (roberto.cordone@unimi.it) Statistica inferenziale Cernusco S.N., giovedì 25 febbraio 2016 (9.00/13.00)

Dettagli

Contenuto del capitolo

Contenuto del capitolo Capitolo 8 Stima 1 Contenuto del capitolo Proprietà degli stimatori Correttezza: E(Stimatore) = parametro da stimare Efficienza Consistenza Intervalli di confidenza Per la media - per una proporzione Come

Dettagli

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2018-2019 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

10 TEST STATISTICI PER LA VERIFICA DI IPOTESI

10 TEST STATISTICI PER LA VERIFICA DI IPOTESI 10 TEST STATISTICI PER LA VERIFICA DI IPOTESI Un test statistico è una procedura che permette di decidere tra l ipotesi sperimentale H1 e l ipotesi nulla H0, quantificando la divergenza delle osservazioni

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2017-2018 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

La verifica delle ipotesi

La verifica delle ipotesi La verifica delle ipotesi Se abbiamo un idea di quale possa essere il valore di un parametro incognito possiamo sottoporlo ad una verifica, che sulla base di un risultato campionario, ci permetta di decidere

Dettagli

Statistica. Capitolo 13. Test sulla Bontà di Adattamento e Tabelle di Contingenza. Cap. 16-1

Statistica. Capitolo 13. Test sulla Bontà di Adattamento e Tabelle di Contingenza. Cap. 16-1 Statistica Capitolo 13 Test sulla Bontà di Adattamento e Tabelle di Contingenza Cap. 16-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Usare il test sulla bontà di adattamento

Dettagli

Soluzione Esercizio 1 (pag 1):

Soluzione Esercizio 1 (pag 1): 8 - Test di Ipotesi Esercizio 1: Dopo anni di esperienza e noto che la distribuzione della concentrazione di rame nel sangue umano e ben descritta da una distribuzione gaussiana di parametri μ=3.2 10-5

Dettagli

Elementi di Psicometria (con laboratorio software 1)

Elementi di Psicometria (con laboratorio software 1) Elementi di Psicometria (con laboratorio software 1) 05-La verifica delle ipotesi con le medie dei campioni (v. 1.0, 15 aprile 2019) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia,

Dettagli

Ulteriori Conoscenze di Informatica e Statistica. Popolazione. Campione. I risultati di un esperimento sono variabili aleatorie.

Ulteriori Conoscenze di Informatica e Statistica. Popolazione. Campione. I risultati di un esperimento sono variabili aleatorie. Ulteriori Conoscenze di Informatica e Statistica Carlo Meneghini Dip. di fisica via della Vasca Navale 84, st. 83 (I piano) tel.: 06 55 17 72 17 meneghini@fis.uniroma3.it I risultati di un esperimento

Dettagli

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità B

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità B Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità B Cognome Nome: Part time: Numero di matricola: Diurno: ISTRUZIONI: Il punteggio relativo alla prima parte dell esame viene calcolato

Dettagli

La statistica è la scienza che permette di conoscere il mondo intorno a noi attraverso i dati.

La statistica è la scienza che permette di conoscere il mondo intorno a noi attraverso i dati. RICHIAMI DI STATISTICA La statistica è la scienza che permette di conoscere il mondo intorno a noi attraverso i dati. Quale è la media della distribuzione del reddito dei neolaureati? Per rispondere dovremmo

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2017-2018 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI

IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI Perchè confrontare le varianze stimate in due campioni? Torniamo all'esempio dei frinosomi Per poter applicare il test t avevamo detto che le varianze, e

Dettagli

Parte 1 : Inferenza. Varianza nota test Z. Distribuzioni asintotiche dei test. Varianza ignota test t ad un campione

Parte 1 : Inferenza. Varianza nota test Z. Distribuzioni asintotiche dei test. Varianza ignota test t ad un campione ! Test d'ipotesi Parte 1 : Inferenza! Intervalli di confidenza! Test parametrici! Calcoli di potenza! Test non parametrici Distribuzioni asintotiche dei test A seconda dei casi il nostro test può convergere

Dettagli

Ulteriori applicazioni del test del Chi-quadrato (χ 2 )

Ulteriori applicazioni del test del Chi-quadrato (χ 2 ) Ulteriori applicazioni del test del Chi-quadrato (χ 2 ) Finora abbiamo confrontato con il χ 2 le numerosità osservate in diverse categorie in un campione con le numerosità previste da un certo modello

Dettagli

Capitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson Apogeo

Capitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson Apogeo Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 10 Test basati su due campioni e ANOVA a una via Insegnamento: Statistica Applicata Corsi di Laurea in "Scienze e tecnologie Alimentari"

Dettagli

Costruzione di macchine. Modulo di: Progettazione probabilistica e affidabilità. Marco Beghini. Lezione 7: Basi di statistica

Costruzione di macchine. Modulo di: Progettazione probabilistica e affidabilità. Marco Beghini. Lezione 7: Basi di statistica Costruzione di macchine Modulo di: Progettazione probabilistica e affidabilità Marco Beghini Lezione 7: Basi di statistica Campione e Popolazione Estrazione da una popolazione (virtualmente infinita) di

Dettagli

Verifica delle ipotesi

Verifica delle ipotesi Statistica inferenziale Stima dei parametri Verifica delle ipotesi Concetti fondamentali POPOLAZIONE o UNIVERSO Insieme degli elementi cui si rivolge il ricercatore per la sua indagine CAMPIONE Un sottoinsieme

Dettagli

Esercitazioni di Statistica Matematica A Esercitatori: Dott. Fabio Zucca - Dott. Maurizio U. Dini Lezioni del 7/1/2003 e del 14/1/2003

Esercitazioni di Statistica Matematica A Esercitatori: Dott. Fabio Zucca - Dott. Maurizio U. Dini Lezioni del 7/1/2003 e del 14/1/2003 Esercitazioni di Statistica Matematica A Esercitatori: Dott. Fabio Zucca - Dott. Maurizio U. Dini Lezioni del 7/1/003 e del 14/1/003 1 Esercizi 1.1 Test su media (con varianza nota) Esercizio n. 1 Il calore

Dettagli

RICHIAMI DI STATISTICA DESCRITTIVA E DI INFERENZA: LA VERIFICA DI IPOTESI: TEST BASATI SU UN CAMPIONE

RICHIAMI DI STATISTICA DESCRITTIVA E DI INFERENZA: LA VERIFICA DI IPOTESI: TEST BASATI SU UN CAMPIONE RICHIAMI DI STATISTICA DESCRITTIVA E DI INFERENZA: LA VERIFICA DI IPOTESI: TEST BASATI SU UN CAMPIONE 1 La verifica di ipotesi Finora abbiamo visto come si utilizza una statistica campionaria per stimare

Dettagli

Capitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson. Casa editrice: Pearson

Capitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson. Casa editrice: Pearson Levine, Krehbiel, Berenson Statistica II ed. Casa editrice: Pearson Capitolo 10 Test basati su due campioni e ANOVA a una via Insegnamento: Statistica Corsi di Laurea Triennale in Economia Dipartimento

Dettagli

Università di Pavia Econometria. Richiami di Statistica. Eduardo Rossi

Università di Pavia Econometria. Richiami di Statistica. Eduardo Rossi Università di Pavia Econometria Richiami di Statistica Eduardo Rossi Università di Pavia Campione casuale Siano (Y 1, Y 2,..., Y N ) variabili casuali tali che le y i siano realizzazioni mutuamente indipendenti

Dettagli

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità D

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità D Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità D Cognome Nome: Part time: Numero di matricola: Diurno: ISTRUZIONI: Il punteggio relativo alla prima parte dell esame viene calcolato

Dettagli

Corso di Statistica Esercitazione 1.8

Corso di Statistica Esercitazione 1.8 Corso di Statistica Esercitazione.8 Test su medie e proporzioni Prof.ssa T. Laureti a.a. 202-203 Esercizio Un produttore vuole monitorare i valori dei livelli di impurità contenute nella merce che gli

Dettagli

Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale

Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale DIPARTIMENTO DI SCIENZE AGRARIE E AMBIENTALI PRODUZIONE, TERRITORIO, AGROENERGIA Marco Acutis marco.acutis@unimi.it www.acutis.it CdS Scienze della Produzione e Protezione delle Piante (g59) CdS Biotecnologie

Dettagli

Teorema del Limite Centrale

Teorema del Limite Centrale Teorema del Limite Centrale Teorema. Sia data una popolazione numerica infinita di media µ e deviazione standard σ da cui vengono estratti dei campioni casuali formati ciascuno da n individui, con n abbastanza

Dettagli

Matematica II: Calcolo delle Probabilità e Statistica Matematica

Matematica II: Calcolo delle Probabilità e Statistica Matematica Matematica II: Calcolo delle Probabilità e Statistica Matematica ELT A-Z Docente: dott. F. Zucca Esercitazione # 6 1 Test ed intervalli di confidenza per una popolazione Esercizio n. 1 Il calore (in calorie

Dettagli

Analisi della varianza

Analisi della varianza Università degli Studi di Padova Facoltà di Medicina e Chirurgia Facoltà di Medicina e Chirurgia - A.A. 2009-10 Scuole di specializzazione Lezioni comuni Disciplina: Statistica Docente: dott.ssa Egle PERISSINOTTO

Dettagli

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria Civile A.A. 2009-10 Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain 1 STATISTICHE, DISTRIBUZIONI CAMPIONARIE

Dettagli

Lezione 16. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 16. A. Iodice. Ipotesi statistiche

Lezione 16. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 16. A. Iodice. Ipotesi statistiche Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 23 Outline 1 2 3 4 5 6 () Statistica 2 / 23 La verifica delle ipotesi Definizione Un ipotesi statistica

Dettagli

STATISTICA ESERCITAZIONE 13

STATISTICA ESERCITAZIONE 13 STATISTICA ESERCITAZIONE 13 Dott. Giuseppe Pandolfo 9 Marzo 2015 Errore di I tipo: si commette se l'ipotesi nulla H 0 viene rifiutata quando essa è vera Errore di II tipo: si commette se l'ipotesi nulla

Dettagli

INTERVALLI DI CONFIDENZA e TEST D IPOTESI 1 / 30

INTERVALLI DI CONFIDENZA e TEST D IPOTESI 1 / 30 INTERVALLI DI CONFIDENZA e TEST D IPOTESI 1 / 30 Intervallo di confidenza: media 2 / 30 Supponiamo di considerare la media campionaria X e assumiamo che Intervallo di confidenza: media 2 / 30 Supponiamo

Dettagli

Distribuzione normale

Distribuzione normale Distribuzione normale istogramma delle frequenze di un insieme di misure relative a una grandezza che varia con continuità popolazione molto numerosa, costituita da una quantità praticamente illimitata

Dettagli

05. Errore campionario e numerosità campionaria

05. Errore campionario e numerosità campionaria Statistica per le ricerche di mercato A.A. 01/13 05. Errore campionario e numerosità campionaria Gli schemi di campionamento condividono lo stesso principio di fondo: rappresentare il più fedelmente possibile,

Dettagli

INTRODUZIONE ALLA STATISTICA PER LA RICERCA IN SANITA

INTRODUZIONE ALLA STATISTICA PER LA RICERCA IN SANITA INTRODUZIONE ALLA STATISTICA PER LA RICERCA IN SANITA IRCBG 19027 Modulo Dal campione alla popolazione: l'inferenza e l'intervallo di confidenza IRCCS Burlo Garofolo Formazione, Aula A via dell Istria

Dettagli

Verifica delle ipotesi. Verifica delle ipotesi

Verifica delle ipotesi. Verifica delle ipotesi Con la procedura di stima intervallare si cerca definire in modo verosimile il valore di un parametro incognito a partire dalle osservazioni campionarie Valore campionario Procedura di stima intervallare

Dettagli

Teoria della stima dei parametri:

Teoria della stima dei parametri: INFERENZA STATISTICA Teoria della verifica dell ipotesi : si verifica, in termini probabilistici, se una certa affermazione relativa alla popolazione è da ritenersi vera sulla base dei dati campionari

Dettagli

Fondamenti statistici : Test d Ipotesi (1)

Fondamenti statistici : Test d Ipotesi (1) Fondamenti statistici : Test d Ipotesi (1) Ipotesi statistica: È una assunzione formulata su un particolare aspetto della popolazione considerazioni teoriche Informazioni relative a popolazioni analoghe

Dettagli

Gli errori nella verifica delle ipotesi

Gli errori nella verifica delle ipotesi Gli errori nella verifica delle ipotesi Nella statistica inferenziale si cerca di dire qualcosa di valido in generale, per la popolazione o le popolazioni, attraverso l analisi di uno o più campioni E

Dettagli

Statistica16 1/12/2015

Statistica16 1/12/2015 I metodi non parametrici sono meno efficaci ma più generali (possono essere applicati a tutte le serie di dati). Vengono utilizzati quando non possono essere applicati i metodi parametrici (dati non distribuiti

Dettagli

Test delle Ipotesi Parte I

Test delle Ipotesi Parte I Test delle Ipotesi Parte I Test delle Ipotesi sulla media Introduzione Definizioni basilari Teoria per il caso di varianza nota Rischi nel test delle ipotesi Teoria per il caso di varianza non nota Test

Dettagli

Parametri statistici

Parametri statistici SMID a.a. 2004/2005 Corso di Metodi Statistici in Biomedicina Parametri statistici 24/1/2005 Deviazione standard della media La variabilità di una distribuzione può quindi essere espressa da un indice

Dettagli

Distribuzione Gaussiana - Facciamo un riassunto -

Distribuzione Gaussiana - Facciamo un riassunto - Distribuzione Gaussiana - Facciamo un riassunto - Nell ipotesi che i dati si distribuiscano seguendo una curva Gaussiana è possibile dare un carattere predittivo alla deviazione standard La prossima misura

Dettagli

Richiami di inferenza statistica Strumenti quantitativi per la gestione

Richiami di inferenza statistica Strumenti quantitativi per la gestione Richiami di inferenza statistica Strumenti quantitativi per la gestione Emanuele Taufer Inferenza statistica Parametri e statistiche Esempi Tecniche di inferenza Stima Precisione delle stime Intervalli

Dettagli

Ulteriori Conoscenze di Informatica e Statistica

Ulteriori Conoscenze di Informatica e Statistica Ulteriori Conoscenze di Informatica e Statistica Carlo Meneghini Dip. di fisica via della Vasca Navale 84, st. 83 (I piano) tel.: 06 55 17 72 17 meneghini@fis.uniroma3.it Indici di forma Descrivono le

Dettagli

Richiami di inferenza statistica. Strumenti quantitativi per la gestione. Emanuele Taufer

Richiami di inferenza statistica. Strumenti quantitativi per la gestione. Emanuele Taufer Richiami di inferenza statistica Strumenti quantitativi per la gestione Emanuele Taufer Inferenza statistica Inferenza statistica: insieme di tecniche che si utilizzano per ottenere informazioni su una

Dettagli

Schema lezione 5 Intervalli di confidenza

Schema lezione 5 Intervalli di confidenza Schema lezione 5 Intervalli di confidenza Non centrerò quella barca, ne sono convinto al 95% COMPRENDERE: Significato di intervallo di confidenza Uso degli stimatori come quantità di pivot per stime intervallari

Dettagli

Metodologie statistiche per l analisi del rischio FONDAMENTI DI INFERENZA PER L ANALISI DEL RISCHIO

Metodologie statistiche per l analisi del rischio FONDAMENTI DI INFERENZA PER L ANALISI DEL RISCHIO Corso di Laurea in Sicurezza igienico-sanitaria degli alimenti Metodologie statistiche per l analisi del rischio FONDAMENTI DI INFERENZA PER L ANALISI DEL RISCHIO Facoltà di Medicina Veterinaria, Università

Dettagli

Introduzione alla statistica per la ricerca in sanità

Introduzione alla statistica per la ricerca in sanità Introduzione alla statistica per la ricerca in sanità Modulo La verifica delle ipotesi: il test statistico dott. Eugenio Traini eugenio.traini@burlo.trieste.it Verifica d Ipotesi - 1 Che cos è un ipotesi

Dettagli

Analisi della regressione multipla

Analisi della regressione multipla Analisi della regressione multipla y = β 0 + β 1 x 1 + β 2 x 2 +... β k x k + u 2. Inferenza Assunzione del Modello Classico di Regressione Lineare (CLM) Sappiamo che, date le assunzioni Gauss- Markov,

Dettagli

Approssimazione normale alla distribuzione binomiale

Approssimazione normale alla distribuzione binomiale Approssimazione normale alla distribuzione binomiale P b (X r) costoso P b (X r) P(X r) per N grande Teorema: Se la variabile casuale X ha una distribuzione binomiale con parametri N e p, allora, per N

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 018-019 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per la

Dettagli

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni La statistica inferenziale Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni E necessario però anche aggiungere con

Dettagli

University of Messina, Italy

University of Messina, Italy TRATTAMENTO E VALUTAZIONE DI DATI STATISTICI Applicazione della statistica alla valutazione dei dati Le applicazioni più comuni della statistica alla chimica analitica sono: Definire l intervallo numerico

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2016-2017 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

DISTRIBUZIONI DI PROBABILITA (parte 1) 1 / 19

DISTRIBUZIONI DI PROBABILITA (parte 1) 1 / 19 DISTRIBUZIONI DI PROBABILITA (parte 1) 1 / 19 Variabili casuali (o aleatorie) 2 / 19 Disponendo di metodi corretti per raccogliere i dati e costruire i campioni data una popolazione, i valori numerici

Dettagli

LEZIONI DI STATISTICA MEDICA

LEZIONI DI STATISTICA MEDICA LEZIONI DI STATISTICA MEDICA Lezione n.12 - Test statistico Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona IPOTESI SCIENTIFICA Affermazione che si può sottoporre a verifica

Dettagli

CONFRONTO TRA LA MEDIE DI DUE CAMPIONI INDIPENDENTI

CONFRONTO TRA LA MEDIE DI DUE CAMPIONI INDIPENDENTI CONFRONTO TRA LA MEDIE DI DUE CAMPIONI INDIPENDENTI ipotesi sul confronto tra le medie di due campioni indipendenti Obiettivo: decidere, attraverso il confronto tra le medie dei due campioni indipendenti,

Dettagli

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)

Dettagli

STATISTICA A K (60 ore)

STATISTICA A K (60 ore) STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Esercizio In una prova sul carico di rottura di due tipi di corda si dispone di 2 campioni di ampiezza 26 e 35 rispettivamente. Nel

Dettagli

Statistica Applicata all edilizia: Stime e stimatori

Statistica Applicata all edilizia: Stime e stimatori Statistica Applicata all edilizia E-mail: orietta.nicolis@unibg.it 15 marzo 2011 Statistica Applicata all edilizia: Indice 1 2 Statistica Applicata all edilizia: Uno dei problemi principali della statistica

Dettagli

Metodologie statistiche per l analisi del rischio FONDAMENTI DI INFERENZA PER L ANALISI DEL RISCHIO

Metodologie statistiche per l analisi del rischio FONDAMENTI DI INFERENZA PER L ANALISI DEL RISCHIO Corso di Laurea in Sicurezza igienico-sanitaria degli alimenti Metodologie statistiche per l analisi del rischio FONDAMENTI DI INFERENZA PER L ANALISI DEL RISCHIO Facoltà di Medicina Veterinaria, Università

Dettagli

UNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II DIPARTIMENTO DI INGEGNERIA AEROSPAZIALE D.I.A.S. STATISTICA PER L INNOVAZIONE. a.a.

UNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II DIPARTIMENTO DI INGEGNERIA AEROSPAZIALE D.I.A.S. STATISTICA PER L INNOVAZIONE. a.a. UNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II DIPARTIMENTO DI INGEGNERIA AEROSPAZIALE D.I.A.S. STATISTICA PER L INNOVAZIONE a.a. 2007/2008 1,00 0,90 0,80 0,70 0,60 0,50 0,40 0,30 0,20 0,10 0,00 CDF empirica

Dettagli

Analisi della varianza

Analisi della varianza Analisi della varianza Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona ANALISI DELLA VARIANZA - 1 Abbiamo k gruppi, con un numero variabile di unità statistiche.

Dettagli

Esercitazione 8 maggio 2014

Esercitazione 8 maggio 2014 Esercitazione 8 maggio 2014 Esercizio 2 dal tema d esame del 13.01.2014 (parte II). L età media di n gruppo di 10 studenti che hanno appena conseguito la laurea triennale è di 22 anni. a) Costruire un

Dettagli

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 5 Test d Ipotesi

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 5 Test d Ipotesi Metodi Quantitativi per Economia, Finanza e Management Lezione n 5 Test d Ipotesi Test per lo studio dell associazione tra variabili Nella teoria dei test, il ricercatore fornisce ipotesi riguardo la distribuzione

Dettagli

Test d Ipotesi Introduzione

Test d Ipotesi Introduzione Test d Ipotesi Introduzione Uno degli scopi più importanti di un analisi statistica è quello di utilizzare i dati provenienti da un campione per fare inferenza sulla popolazione da cui è stato estratto

Dettagli

Statistica Inferenziale Soluzioni 3. Verifica di ipotesi

Statistica Inferenziale Soluzioni 3. Verifica di ipotesi ISTITUZIONI DI STATISTICA A. A. 007/008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona

Dettagli

Casa dello Studente. Casa dello Studente

Casa dello Studente. Casa dello Studente Esercitazione - 14 aprile 2016 ESERCIZIO 1 Di seguito si riporta il giudizio (punteggio da 0 a 5) espresso da un gruppo di studenti rispetto alle diverse residenze studentesche di un Ateneo: a) Si calcolino

Dettagli

Fondamenti di statistica per il miglioramento genetico delle piante. Antonio Di Matteo Università Federico II

Fondamenti di statistica per il miglioramento genetico delle piante. Antonio Di Matteo Università Federico II Fondamenti di statistica per il miglioramento genetico delle piante Antonio Di Matteo Università Federico II Modulo 2 Variabili continue e Metodi parametrici Distribuzione Un insieme di misure è detto

Dettagli

Il Test di Ipotesi Lezione 5

Il Test di Ipotesi Lezione 5 Last updated May 23, 2016 Il Test di Ipotesi Lezione 5 G. Bacaro Statistica CdL in Scienze e Tecnologie per l'ambiente e la Natura I anno, II semestre Il test di ipotesi Cuore della statistica inferenziale!

Dettagli

Università degli Studi di Padova. Corso di Laurea in Medicina e Chirurgia - A.A

Università degli Studi di Padova. Corso di Laurea in Medicina e Chirurgia - A.A Università degli Studi di Padova Corso di Laurea in Medicina e Chirurgia - A.A. 015-16 Corso Integrato: Statistica e Metodologia Epidemiologica Disciplina: Statistica e Metodologia Epidemiologica Docenti:

Dettagli

Esercizi di Probabilità e Statistica

Esercizi di Probabilità e Statistica Esercizi di Probabilità e Statistica Samuel Rota Bulò 6 giugno 26 Statistica Esercizio Sia {X n } n una famiglia di v.a. di media µ e varianza σ 2. Verificare che X = n n X i σ 2 = n (X i µ) 2 S 2 = n

Dettagli

RICHIAMI DI CALCOLO DELLE PROBABILITÀ

RICHIAMI DI CALCOLO DELLE PROBABILITÀ UNIVERSITA DEL SALENTO INGEGNERIA CIVILE RICHIAMI DI CALCOLO DELLE PROBABILITÀ ing. Marianovella LEONE INTRODUZIONE Per misurare la sicurezza di una struttura, ovvero la sua affidabilità, esistono due

Dettagli

Metodi statistici per lo studio dei fenomeni biologici

Metodi statistici per lo studio dei fenomeni biologici Metodi statistici per lo studio dei fenomeni biologici Alla fine di questa lezione dovreste essere in grado di: descrivere la distribuzione di campionamento della differenza di due medie costruire gli

Dettagli

Corso introduttivo di Epidemiologia e Biostatistica

Corso introduttivo di Epidemiologia e Biostatistica Corso introduttivo di Epidemiologia e Biostatistica massimo guerriero carlo pomari e con il contributo di: Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health ELEMENTI

Dettagli

COGNOME.NOME...MATR..

COGNOME.NOME...MATR.. STATISTICA 29.01.15 - PROVA GENERALE (CHALLENGE) Modalità A (A) ai fini della valutazione verranno considerate solo le risposte riportate dallo studente negli appositi riquadri bianchi: in caso di necessità

Dettagli

lezione 4 AA Paolo Brunori

lezione 4 AA Paolo Brunori AA 2016-2017 Paolo Brunori dove eravamo arrivati - abbiamo individuato la regressione lineare semplice (OLS) come modo immediato per sintetizzare una relazione fra una variabile dipendente (Y) e una indipendente

Dettagli

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli Dipartimento di Sociologia e Ricerca Sociale Corso di Laurea in Sociologia Insegnamento di Statistica (a.a. 2018-2019) dott.ssa Gaia Bertarelli Esercitazione n. 7 1. Utilizzando le tavole della distribuzione

Dettagli

07/01/2016. Scalisi - Tecniche Psicometriche LA VERIFICA DELLE IPOTESI. La verifica delle ipotesi. Popolazioni e campioni

07/01/2016. Scalisi - Tecniche Psicometriche LA VERIFICA DELLE IPOTESI. La verifica delle ipotesi. Popolazioni e campioni LA VERIFICA DELLE IPOTESI Popolazioni, campioni, parametri ed indicatori 1 2 3 Popolazioni e campioni Viene definita popolazione o universo l insieme completo di tutti gli elementi che hanno in comune

Dettagli

COGNOME.NOME...MATR..

COGNOME.NOME...MATR.. STATISTICA 29.01.15 - PROVA GENERALE (STANDARD) Modalità B (A) ai fini della valutazione verranno considerate solo le risposte riportate dallo studente negli appositi riquadri bianchi: in caso di necessità

Dettagli

Test delle ipotesi sulla media.

Test delle ipotesi sulla media. . Caso di un singolo campione. Varianza nota.. Ipotesi alternativa bilaterale Test delle ipotesi sulla media. Valore medio η e deviazione standard σ della popolazione note. η è il valore stimato dal nostro

Dettagli