UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi donatella.siepi@unipg.it tel: 075 5853525."

Transcript

1 UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA Prof.ssa Donatella Siepi tel: dicembre 2014

2 7 LEZIONE

3 PROBABILITA

4 L incertezza Nella misura di una qualsiasi grandezza vi sono fonti di incertezza. Ripetendo la misura sotto le stesse condizioni sperimentali non è detto che si ottenga lo stesso risultato L incertezza può essere resa QUANTITATIVA usando la nozione di PROBABILITA.

5 Fenomeno deterministico: se l esperimento è condotto nelle stesse condizioni e il risultato è lo stesso Esempio: Il moto di un grave La traiettoria di una pallina su un biliardo Fenomeno non deterministico: anche se gli esperimenti sono condotti nelle stesse condizioni i risultati sono diversi Esempio: Risultato del lancio di una moneta Traiettoria di 100 palline in un biliardo Vincita in una lotteria Numero di lanci di un dado per ottenere un 6 La probabilità si occupa di fenomeni non deterministici

6 La probabilità si può anche definire come la quantificazione della possibilità che si verifichi uno specifico risultato a seguito di un detrminato evento I valori di probabilità sono allora tra 0 = impossibile 1 = certezza

7 In statistica è importante conoscere il limite di probabilità sotto al quale un determinato risultato non può essere definito unicamente un prodotto del caso LIVELLO di SIGNIFICATIVITA

8 Ad ogni livello di confidenza (o certezza), detto anche semplicemente livello e indicato con la lettera α, si può associare un intervallo di confidenza.

9 LIVELLO di SIGNIFICATIVITA o confidenza Se si ritiene che un evento si verifichi meno di una volta su 20 (P>0,05) si considera improbabile o statisticamente significativo * Se si ritiene che un evento si verifichi meno di una volta su 100 (P>0,01) si considera molto improbabile o statisticamente molto significativo ** Se si ritiene che un evento si verifichi meno di una volta su 1000 (P>0,001) si considera estremamente improbabile o statisticamente estremamente significativo **

10 Distribuzione di probabilità

11 DISTRIBUZIONI TEORICHE DI PROBABILITA DEFINIZIONI: Qualsiasi caratteristica misurabile è denominata variabile. Se una variabile può assumere numerosi valori tali che qualsiasi risultato è determinato dal caso, essa è nota come variabile casuale Una V.C. è un numero X che assume un valore in R, determinato sulla base di un evento E che si è presentato in seguito all esperimento al quale si riferisce. Tale numero è assunto da X con probabilità P Una distribuzione di probabilità è una funzione che sintetizza la relazione tra i valori di una variabile casuale e la probabilità che questi si presentino Una distribuzione di probabilità applica la teoria della probabilità per descrivere il comportamento di una variabile.

12 La conoscenza della distribuzione di probabilità di una variabile casuale fornisce ai clinici e ai ricercatori uno strumento potente per riassumere e descrivere il set di dati e per trarre conclusioni a partire dal campione della popolazione studiata Una distribuzione di probabilità può essere rappresentata con una tabella, un grafico o una formula

13 OSSERVAZIONI Una distribuzione è analoga ad una distribuzione di frequenze relative, ma mentre questa si ricava da un campione di osservazioni estratte da un popolazione, una distribuzione di probabilità è in relazione alla popolazione di tutti i possibili risultati Una distribuzione continua non permette la stima della probabilità di estrarre un particolare valore, ma solo quelli compresi in un dato intervallo. Per esempio, nella distribuzione delle altezze di una popolazione di studenti, non è possibile stimare la probabilità di avere un individuo alto esattamente 176,000 cm ma quella di avere un individuo tra 180 e 190 centimetri

14 La forma di una distribuzione di probabilità continua è usualmente definita da una curva senza sbalzi, mentre per una variabile discreta la probabilità è definita per i valori puntuali della variabile, e il grafico della distribuzione rassomiglia ad una serie di impulsi La forma di una distribuzione può essere simmetrica rispetto al valore centrale o ci può essere una coda più lunga da un lato piuttosto che da un altro. Se la coda è a sinistra (destra) la distribuzione viene detta asimmetrica a sinistra (destra) - Alcune distribuzioni teoriche di probabilità comunemente usate per descrivere dati sanitari sono: Distribuzione Gaussiana, la distribuzione log-normale, la distribuzione Binomiale e la distribuzione di Poisson

15 DISTRIBUZIONE BINOMIALE (cenni) DISTRIBUZIONE NORMALE DISTRIBUZIONE DI POISSON (cenni)

16 Poiché i valori di molte variabili si distribuiscono come una curva normale, le sue proprietà sono molto importanti, e se riusciamo a calcolare la media e la deviazione standard da un campione, questo ci permette di effettuare qualsiasi tipo di inferenza sulla popolazione dalla quale questo è stato estratto.

17 DISTRIBUZIONE BINOMIALE I lanci successivi devono essere indipendenti dai precedenti Le uscite devono essere completamente casuali La probabilità di una uscita deve essere costante nel tempo. Se poniamo in ascissa i valori di k e in ordinata le probabilità P(k), rappresentiamo graficamente la formula vista. Ad esempio assumiamo che la probabilità singola p sia 0.3, e il numero di prove n sia 10.

18 DISTRIBUZIONE BINOMIALE Distribuzione delle probabilità P(k) relative ai vari k considerati, quando p=0.3 e n=10.

19 DISTRIBUZIONE BINOMIALE La distribuzione binomiale permette di calcolare, per numeri n piccoli, le probabilità di avere un certo numero k di successi nelle n prove. Se abbiamo molte prove, n diventa molto grande. Trovare le probabilità dei successi k diventa difficile. Per alti n il problema non è di trovare la probabilità connessa ad uno specifico numero k di successi, ma di trovare ad esempio la probabilità di trovare più o meno di k successi.

20 DISTRIBUZIONE NORMALE Si ricorre allora alle distribuzioni NORMALE ( GAUSSIANA) o di Poisson, che valgono per n molto grande. In questo caso lo scaloide della distribuzione di probabilità binomiale, ossia l insieme dei rettangoli che rappresentano le probabilità dei singoli k, tende a diventare un area sottostante ad una linea continua.

21 DISTRIBUZIONE NORMALE

22 DISTRIBUZIONE NORMALE

23 DISTRIBUZIONE NORMALE

24 DISTRIBUZIONE NORMALE Molte distribuzioni empiriche (ossia distribuzioni di frequenza) sono approssimativamente normali. Quando effettuiamo un campionamento e ne diagrammiamo la distribuzione di frequenza, se il numero di elementi del campione è sufficientemente elevato e il numero di classi non è troppo piccolo (almeno 10-15), troveremo quasi sempre un campione distribuito normalmente.

25 DISTRIBUZIONE NORMALE Se il campione è distribuito normalmente si possono applicare le proprietà della curva teorica gaussiana al campione rimanendo entro un intervallo accettabile di errore (il campione essendo finito non sarà mai perfettamente normale).

26 DISTRIBUZIONE NORMALE Rappresentando graficamente questa funzione otteniamo la caratteristica curva a campana simmetrica intorno alla media:

27 DISTRIBUZIONE NORMALE In corrispondenza di +s e s la curva presenta i suoi punti di flesso. Tracciando diversi diagrammi per diversi valori di s ci accorgiamo che la curva è tanto più appiattita quanto maggiore è la deviazione standard.

28 DISTRIBUZIONE NORMALE Una proprietà fondamentale della gaussiana è la seguente: La probabilità che uno scarto dalla media sia maggiore di un certo valore è inversamente proporzionale al rapporto fra questo valore e la deviazione standard. Quindi esiste una probabilità definita e uguale per tutte le curve normali che un certo scarto sia inferiore a una (2, 3) deviazione standard. Tale probabilità è equivalente all area tratteggiata in figura:

29 DISTRIBUZIONE NORMALE

30 DISTRIBUZIONE NORMALE

31 DISTRIBUZIONE NORMALE

32 DISTRIBUZIONE NORMALE Probabilità che un valore cada casualmente entro alcune deviazioni standard: Entro 1.0 d.s. dalla media = 68.26% Entro 1.96 d.s. dalla media = 95.00% Entro 2.0 d.s. dalla media = 95.44% Entro d.s. dalla media = 99.00% Entro 3.0 d.s. dalla media = 99.73% Entro 3.29 d.s. dalla media = 99.90%

33 DISTRIBUZIONE DI POISSON La distribuzione binomiale tende alla poissoniana quando la probabilità dell evento p è molto piccola con n (prove) molto grande. La poissoniana è una distribuzione discreta, con la caratteristica che la media teorica (valore atteso) è uguale alla varianza: = s 2 = n p

34 DISTRIBUZIONE DI POISSON Questo tipo di distribuzione di frequenze (eventi che si verificano con frequenza molto bassa in uno spazio o in un tempo molto grande) si presenta in natura in alcuni casi, ad es.: Numero di microorganismi in una certa superficie o volume Decadimento di sostanze radioattive Insorgenza di antibioticoresistenza in una popolazione batterica Numero di morti per una malattia non frequente in una grande popolazione.

35 LA VERIFICA DI IPOTESI: TEST BASATI SU UN CAMPIONE

36 La verifica di ipotesi Una fase dell inferenza è quella che consente di verificare delle ipotesi sui parametri Obiettivo primario: capire e ridurre l incertezza per prendere decisioni Obiettivo secondario: controllare il rischio del prendere decisioni sulla base delle statistiche campionarie

37 La verifica di ipotesi Verifica di ipotesi: metodologia per fare inferenza sui parametri della popolazione alla luce dell analisi delle differenze tra i risultati osservati (statistica campionaria) e quelli che ci aspetteremmo se una qualche ipotesi sulla popolazione fosse vera. La verifica di ipotesi ha inizio con la formulazione del sistema di ipotesi sottoposto a verifica. Il sistema di ipotesi fa sempre riferimento a qualche parametro della popolazione. Consiste sempre in due ipotesi contrapposte.

38 Ipotesi nulla L ipotesi nulla è, in generale, l ipotesi che si vorrebbe rifiutare. Essa afferma che gli effetti osservati nei campioni sono dovuti a fluttuazioni casuali, sempre possibili quando esiste variabilità tra gli individui; si tratta di variazioni che sono tanto più marcate quanto più ridotto è il numero di osservazioni. L ipotesi nulla H0 deve essere rifiutata solamente se esiste l evidenza che la contraddice. E importante comprendere che l ipotesi nulla non è necessariamente vera, quando i dati campionari (eventualmente pochi) non sono tali da contraddirla. L ipotesi nulla H0 non è mai provata o verificata; è solo possibile negarla o disapprovarla, sulla base di dati sperimentali

39 Con un test statistico si determina solamente una probabilità, che può essere differente ripetendo lo stesso esperimento, e inoltre la decisione che ne deriva può essere errata. Come primo caso, si supponga che un giocatore utilizzi una moneta perfettamente bilanciata, ma di cui egli non conosca le caratteristiche. Mediante alcuni lanci, egli deve decidere se la moneta è bilanciata (H0) oppure truccata (H1). Si supponga quindi che egli lanci questa moneta 6 volte e che ottenga croce tutte le volte. Se fosse uno statistico ragionerebbe in questo modo: "Avere 6 croci su 6 lanci è un evento raro; più esattamente ha una probabilità di (1/2 6 =0,5 6 ) 0,0156 o 1,56% di avvenire, se la moneta non fosse truccata (H0 vera).

40 Con una ipotesi bilaterale, quindi comprendendo anche la possibilità di avere 6 volte testa/croce, la probabilità è esattamente uguale a 3,12%. Di conseguenza, poiché 3,12% è una probabilità ritenuta bassa, ottenere 6 volte testa oppure 6 volte croce sono eventi complessivamente poco probabili, seppure possibili". Se egli avesse prefissato come valore soglia la probabilità del 5%, con questo test statistico rifiuterebbe l ipotesi nulla. Giungerebbe alla conclusione che tra atteso (3 volte teste e 3 volte croce su 6 lanci) ed osservato (6 volte croce oppure l'opposto) esiste una differenza significativa e che pertanto la moneta è truccata. Ma noi, sappiamo che in realtà essa non la è. E un errore, che in statistica si chiama errore di I tipo (scritto spesso con l'iniziale maiuscola Tipo=errore di prima specie). Consiste nel rifiutare l ipotesi nulla H0, quando in realtà essa è vera

41 Si supponga ora, come secondo caso, che sempre all insaputa del giocatore questa volta la moneta sia truccata e dia solo croce. Se questa volta egli la lancia solo 3 volte, ovviamente otterrebbe 3 volte croce. In questo caso, se fosse uno statistico seguirebbe questo ragionamento: "Se la moneta non fosse truccata (H0 vera), la probabilità di trovare per caso 3 volte croce è alta, più esattamente uguale a 0,5 3 =0,125 o 12,5%".Con un test bilaterale la probabilità è 0,25. Pertanto, egli non rifiuterebbe l ipotesi nulla. Errando, arriverebbe alla conclusione che la moneta non è truccata. In questo caso, si ha l errore di II tipo (o seconda specie). Consiste nel non rifiutare (o accettare) l'ipotesi nulla H0, quando in realtà essa è falsa. In statistica, non è possibile eliminare questi due tipi di errore.

42 La verifica di ipotesi Nell approccio classico alla verifica di ipotesi, si individuano i seguenti elementi chiave: 1. L ipotesi nulla H 0 si riferisce sempre a un valore specifico del parametro della popolazione (ad esempio ), e non a una statistica campionaria (ad esempio la media campionaria). 2. L ipotesi nulla contiene sempre un segno di eguale relativo al valore specificato del parametro della popolazione (ad esempio H 0 : =368 mm). 3. L ipotesi alternativa non contiene mai un segno di eguale relativo al valore specificato del parametro della popolazione (ad esempio H 1 : 368 mm).

43 La verifica di ipotesi Se la statistica campionaria prescelta si avvicina al valore ipotizzato nell ipotesi nulla accettiamo H 0, altrimenti rifiutiamo H 0 a favore dell ipotesi alternativa H 1. La teoria della verifica di ipotesi fornisce una regola su cui basare il processo decisionale. Tale regola si basa sul calcolo della probabilità di ottenere un dato risultato campionario nel caso in cui l ipotesi nulla sia vera. Questo risultato viene ricavato determinando prima la distribuzione campionaria della statistica di interesse (statistica test) e quindi calcolando il valore assunto per il particolare campione considerato. La distribuzione campionaria della statistica test spesso è una distribuzione statistica nota, come la Normale o la t di Student, e quindi possiamo ricorrere a queste distribuzioni per sottoporre a verifica un ipotesi nulla.

44 L approccio del p-value 1. Specificate l ipotesi nulla H Specificate l ipotesi alternativa H Fissate il livello di significatività. 4. Scegliete la tecnica statistica appropriata e la statistica test da utilizzare. 5. Raccogliete i dati e calcolate il valore campionario della statistica test. 6. Calcolate il p-value. Per farlo: (a) determinate la distribuzione della statistica test sotto l ipotesi H 0 ; (b) ponete la statistica test sull asse delle ascisse; (c) ombreggiate l area corretta al di sotto della curva della distribuzione, sulla base dell ipotesi alternativa H Confrontate il p-value con a. 8. Prendete la decisione statistica. Se il p-value è maggiore o uguale ad a, ipotesi nulla non è rifiutata. Se il p-value è minore di a, l ipotesi nulla è rifiutata. 9. Esprimete la decisione statistica con riferimento alla situazione considerata.

45 Intervalli di confidenza e verifiche d ipotesi Gli intervalli di confidenza vengono usati per stimare i parametri della popolazione mentre la verifica di ipotesi serve per prendere decisioni sul valore dei parametri. Alternativamente alla verifica di ipotesi possiamo costruire un intervallo di confidenza per la media. Accettiamo l ipotesi nulla se il valore ipotizzato è compreso nell intervallo costruito. Rifiutiamo l ipotesi nulla se il valore cade fuori dell intervallo. Nell esempio dell azienda che costruisce scatole di metallo, l intervallo di confidenza al livello del 95% sarà: cioè 372,5 ± (1,96) 15/5. ( X Zs / n) Quindi 366,62 378,38. Il valore 368 è compreso nell intervallo, perciò accetto H 0.

46 La verifica di ipotesi La distribuzione campionaria della statistica test è divisa in due regioni: una regione di rifiuto (o regione critica) una regione di accettazione Regione di rifiuto: insieme dei valori della statistica test che non è probabile si verifichino quando è vera H 0 ed è probabile si verifichino quando H 0 è falsa. La regola decisionale è: Valore della statistica test Cade nella regione di accettazione Cade nella regione di rifiuto L ipotesi nulla non può essere rifiutata L ipotesi nulla deve essere rifiutata

47 La verifica di ipotesi Per prendere una decisione sull ipotesi nulla, dobbiamo determinare il valore critico della statistica test. Tale valore separa la regione di accettazione dalla regione di rifiuto.

48 La verifica di ipotesi Decidere sulla base della statistica campionaria => rischio di errore. Si distinguono due tipi di errore: L errore di prima specie si verifica se si rifiuta l ipotesi nulla quando è vera e quindi non dovrebbe essere rifiutata. La Probabilità che si verifichi un errore di prima specie è indicata con a(alfa). L errore di seconda specie si verifica se si accetta l ipotesi nulla quando è falsa e quindi dovrebbe essere rifiutata. La Probabilità che si verifichi un errore di seconda specie è indicata con (beta).

49 La verifica di ipotesi Livello di significatività del test: probabilità a di commettere un errore di prima specie. In genere si controlla l errore di prima specie => a viene specificato prima di condurre la verifica di ipotesi Il valore di a esprime la probabilità che la statistica test cada nella regione di rifiuto quando è vera H 0 => il valore critico dipende da a. Coefficiente di confidenza: (1-a) esprime la probabilità di accettare H 0 quando è vera. Espresso in percentuale mi fornisce il livello di confidenza per stime intervallari. Rischio : rischio del consumatore. Non è controllabile Potenza del test (1- ): probabilità di rigettare H 0 quando è falsa => è auspicabile che sia più grande possibile => indicatore della bontà di un test statistico.

50 La verifica di ipotesi Lo schema seguente riassume i rischi del processo decisionale: In genere a viene fissato a 0,05. Se le conseguenze di un errore di I specie sono gravi potrei scegliere un valore pari a 0,01 => aumenta il rischio di errore di seconda specie ( ) Per ridurre a parità di a posso aumentare la dimensione del campione

51 Test Z per la media (s noto) Per verificare l ipotesi che la media della popolazione sia uguale ad un certo valore, contro l ipotesi alternativa che la media differisca da tale valore, conoscendo s, si ricorre alla statistica Z: X è distribuita come una normale => sotto H 0 Z è distribuita come una normale standardizzata Se Z assume valori vicini allo zero siamo portati ad accettare H 0, altrimenti si propende per rifiutare H 0 (test a due code).

52 Test Z per la media (s noto) Approccio del valore critico (livello di significatività di 0,05) Regola decisionale: Rifiuto H 0 se Z>+1,96 o se Z<-1,96 Accetto H 0 altrimenti

53 Test Z per la media (s noto) Esempio: l azienda che produce scatole metalliche intende valutare se il processo produttivo opera in modo tale da garantire che la lunghezza del lato maggiore sia pari a 368 mm. Viene estratto un campione di 25 scatole. Lo scarto quadratico medio della popolazione è pari a 15 mm e la media campionaria assume il valore 372,5 mm. H 0 : = 368 H 1 : 368 Il valore della statistica test mi porta ad accettare H 0.

54 Le fasi della verifica di ipotesi 1. Specificate l ipotesi nulla H 0 e esprimetela in termini statistici. Nel verificare se la lunghezza media delle scatole è 368 mm, l ipotesi nulla è: = Specificate l ipotesi alternativa H 1 e esprimetela in termini statistici. Nel verificare se la lunghezza media delle scatole è 368 mm, l ipotesi alternativa è: Scegliete il livello di significatività. Il livello di significatività viene fissato in base all importanza relativa che si accorda ai rischi derivanti dal commettere un errore di prima specie e dal commettere un errore di seconda specie. Nell esempio considerato, abbiamo posto a = 0, Scegliete l ampiezza campionaria. L ampiezza campionaria viene fissata dopo aver considerato i rischi derivanti da un errore di prima specie e da un errore di seconda specie (vale a dire dopo aver specificato a e ) e tenendo conto dei vincoli di bilancio a cui si è sottoposti nel condurre lo studio. Nell esempio considerato sono state campionate 25 scatole. 5. Individuate la tecnica statistica da utilizzare e calcolate la statistica test corrispondente. Nell esempio considerato, s era noto e quindi abbiamo usato il test Z.

55 Le fasi della verifica di ipotesi 6. Calcolate i valori critici che separano la regione di rifiuto da quella di accettazione. Una volta specificate l ipotesi nulla e quella alternativa e una volta fissati il livello di significatività e l ampiezza del campione, si possono calcolare i valori critici delle distribuzioni delle statistiche test di modo che la regione di rifiuto e quella di accettazione risultino ben individuate. Nell esempio considerato, sono stati usati i valori +1,96 e 1,96, perché la statistica test Z si distribuisce secondo una normale standardizzata. 7. Raccogliete i dati e calcolate il valore campionario della statistica test. Nell esempio considerato, la media campionaria è pari a 372,5 mm e quindi Z = 1, Stabilite se la statistica test cade nella regione di rifiuto o in quella di accettazione. A tale scopo, confrontate il valore della statistica con i valori critici individuati. Nell esempio considerato, Z = 1,50 cade nella regione di accettazione perché -1,96 < Z = +1,50 < +1,96.

56 Le fasi della verifica di ipotesi 9. Prendete la decisione statistica. Se la statistica test cade nella regione di accettazione, l ipotesi nulla H 0 non può essere rifiutata. Se la statistica test cade nella regione di rifiuto, l ipotesi nulla H 0 viene rifiutata. Nell esempio considerato, l ipotesi nulla H 0 non è rifiutata. 10. Esprimete la decisione statistica con riferimento a una data situazione. Nell esempio relativo alla produzione di scatole, concludiamo che dal campione non si possono trarre degli elementi di prova sufficienti per affermare che la lunghezza media delle scatole è diversa da 368 mm. Non si rende necessario nessun intervento correttivo.

57 IL P-VALUE NELLA PROCEDURA DECISIONALE In alternativa al considerare le due regioni di accettazione e rifiuto, è possibile prendere la decisione in base al p-value: Il p-value rappresenta la probabilità di osservare un valore della statistica test uguale o più estremo del valore che si calcola a partire dal campione, quando l ipotesi H0 è vera.

58 L approccio del p-value Negli ultimi anni, anche grazie all ampia diffusione di pacchetti statistici e fogli elettronici, si è affermato un altro approccio alla verifica di ipotesi: l approccio del p-value. Il p-value è anche chiamato livello di significatività osservato. Regola decisionale: se il p-value è maggiore o uguale ad a, l ipotesi nulla viene accettata se il p-value è minore di a, l ipotesi nulla è rifiutata

59 Come si utilizza il p-value associato a sn in pratica per decidere tra H0 e H1? Il vantaggio del p value è che non ci serve più andare a consultare le tavole della Normale, della t-student, del Chiquadrato o della F, ecc. per decidere. Tutto quello che dobbiamo fare è confrontare il p-value associato a sn con il livello di significatività α che abbiamo fissato in precedenza

60 L approccio del p-value Esempio: l azienda che produce scatole metalliche intende valutare se il processo produttivo opera in modo tale da garantire che la lunghezza del lato maggiore sia pari a 368 mm. Viene estratto un campione di 25 scatole. Lo scarto quadratico medio della popolazione è pari a 15 mm e la media campionaria assume il valore 372,5 mm. H 0 : = 368 H 1 : 368 Il valore della statistica test è pari a 1,5. La probabilità che Z assuma valori uguali o più estremi di 1,5 coincide con la probabilità che assuma valori maggiori di 1,5 o minori di -1,5 (test a due code). Le due probabilità sono pari a 0,0668 e la loro somma è perciò 0,1336. Tale valore è maggiore di a=0,05 perciò accetto H 0.

61 Statistica Medica Confronto tra due medie

62

63 Campioni appaiati Ad ogni osservazione del primo gruppo corrisponde una osservazione del secondo gruppo (singolo soggetto in due tempi diversi, tipicamente prima e dopo il trattamento). L appaiamento rende il confronto più preciso, eliminando parte della variabilità biologica.

64 Prima: x1 x2 x3..xn Dopo: y1 y2 y3.yn Campioni appaiati Consideriamo le differenze all interno di ciascuna coppia: d1=x1 y1 d2=x2 - y2 dn=xn - yn

65 Campioni appaiati L ipotesi nulla è che la media sia la stessa prima e dopo la terapia. Quindi l ipotesi nulla è che la media delle differenze (d) sia zero!! Calcoliamo la media delle differenze d e la deviazione standard delle differenze s d

66 Campioni appaiati Secondo l ipotesi nulla, la variabile t è distribuita come una t-student con n-1 gradi di libertà t n d s d L ipotesi nulla quindi si potrà accettare con 5% di confidenza se t <1.96. Altrimenti l ipotesi nulla viene rigettata.

67 Campioni appaiati:esempio Prima dopo

68 Campioni appaiati: test unilaterale Supponiamo ora che l ipotesi nulla sia che la media dopo la terapia sia inferiore. Dobbiamo allora fare un test unilaterale sulla media delle differenze. Se t<-1.62 allora si sarebbe verificato un evento che, sotto l ipotesi nulla, ha meno del 5% di probabilità di verificarsi. Se t> accetteremo l ipotesi nulla.

69 Campioni appaiati: esempio Sia la media delle differenze pari a -6.63, e la deviazione standard delle differenze sia 20.29, su n=63 osservazioni. Calcoliamo la t: t=sqrt(63)*(-6.63)/20.29=-2.59 Possiamo rigettare l ipotesi nulla con la confidenza del 5%.

70 Campioni indipendenti Supponiamo di avere due gruppi indipendenti e di voler verificare l ipotesi nulla che la media sia la stessa nelle due popolazioni. Come si implementa il test t- student in questo caso?

71 Campioni indipendenti:varianze uguali Il primo gruppo sia composto da n1 campioni e sia µ1 la media. Il secondo gruppo sia composto da n2 campioni e sia µ2 la media. Supponiamo che la deviazione standard nei due gruppi sia uguale e pari a σ. Ipotesi nulla Ho: µ1 = µ2

72 Campioni indipendenti:varianze uguali t n d s d Sotto Ho: la differenza delle medie è distribuita come una gaussiana con media zero e deviazione standard: 2 s s 2 n 1 n 2

73 Campioni indipendenti:varianze uguali La variabile t in questo caso è: t x 1 2 x 2 s s 2 n 1 n 2

74 Prima popolazione Campioni indipendenti:varianze disuguali Seconda popolazione

75 Varianze disuguali t x x 2 s s 2 2 n 1 n 2

76 Statistica Medica 6. Analisi della varianza

77 One way ANOVA Facciamo un esempio: per lo studio degli effetti dell esposizione a monossido di carbonio in soggetti con patologie coronariche, le distribuzioni del volume espiratorio forzato in un secondo dei pazienti di ciascuno di tre centri medici: John Hopkins University School, Rancho Los Amigos Medical Center, e St. Louis University School in Medicine. Sono tre popolazioni distinte. Vogliamo testare l ipotesi che le medie delle tre popolazioni sono uguali: µ1=µ2=µ3

78 Esempio john Hopkins Rancho Los Amigos sant Louis 3,23 3,22 2,79 3,47 2,88 3,22 1,86 1,71 2,25 2,47 2,89 2,98 3,01 3,77 2,47 1,69 3,29 2,77 2,1 3,39 2,95 2,81 3,86 3,56 3,28 2,64 2,88 3,36 2,71 2,63 2,61 2,71 3,38 2,91 3,41 3,07 1,98 2,87 2,81 2,57 2,61 3,17 2,08 3,39 2,23 2,47 3,17 2,19 2,47 4,06 2,74 1,98 2,88 2,81 2,63 2,85 2,53 2,43 3,2 3,53 n1=21 n2=16 n3=23 x1medio=2,63 litri x2medio=3,03 litri x3medio=2,88 litri s1=0,496 litri s2=0,523 litri s3=0,498 litri

79 One way ANOVA Per testare l ipotesi che le tre medie siano uguali, potrei fare i confronti a due a due,e per ciascuna coppia fare il test t-student. Nel caso N=3 popolazioni devo fare 6 confronti. Nel caso generale può essere un numero proibitivo di coppie. Inoltre questa procedura può condurre ad errori. L ipotesi µ1=µ2=µ3 va testata con un singolo test, l analisi della varianza (ANOVA). Quando c è una sola caratteristica che distingue le varie popolazioni, si parla di one way anova (ad un criterio di classificazione).

80 One way ANOVA Misura della variabilità delle osservazioni rispetto alle medie delle singole osservazioni (stima pooled della varianza comune): ( n1 1) s1 ( n2 1) s2 ( nk 1) s sw n n n k 1 2 k 2 k Varianza campionaria between

81 One way ANOVA Misura della variazione delle medie delle popolazioni rispetto alla media generale: k k k n n x n x n x n x ) ( ) ( ) ( k n x x n x x n x x s k k B Varianza campionaria within

82 One way ANOVA Sotto l ipotesi nulla le due varianze dovrebbero essere simili. Calcoliamo il rapporto, detto F F s s 2 B 2 w

83 One way anova La distribuzione di probabilità di F è nota, sotto l ipotesi nulla, e dipende da k-1 (gradi di libertà del numeratore) e dal numero di dati (n-k=gradi di libertà del denominatore). Questo permette di valutare la probabilità, sotto l ipotesi nulla, che si verifichi un evento almeno estremo come quello che si è verificato, che sarà consistente se tale probabilità sarà maggiore di 0.05.

84 One way ANOVA Torniamo al nostro esempio e calcoliamo la F, otteniamo F= La distribuzione è la F con gradi di libertà 2 e 57. La probabilità che F sia risulta uguale a , quindi non possiamo rifiutare l ipotesi nulla al 5% di confidenza.

85 One way ANOVA Se il risultato dell F test è 1, significa che le medie non sono tutte uguali. A questo punto possiamo cercare le popolazioni che si distinguono dalle altre mediante test specifici che indicano quali tra i gruppi sono differenti. Questo si ottiene con il test di Tukey quando si fanno i confronti multipli.

86

87 ANALISI UNIVARIATE e dati non parametrici 1) raccolta e codifica dei dati (valori osservati) 2) inserimento dei dati in una matrice. 3) definizione ipotesi nulla e ipotesi alternativa 4) calcolo dei ranghi 5) calcolo del valore Wx e zwx 6) si verifica l ipotesi in base alla distribuzione teorica normale 7) si interpretano i risultati IL TEST DI WILCOXON-MANN-WHITNEY

88 VERIFICA DELLE IPOTESI SU DUE CAMPIONI disegni TRA GRUPPI (BETWEEN) (n<30) Se la variabile è misurata su scala Ordinale la statistica più adatta per confrontare due gruppi (due misurazioni indipendenti) è l applicazione del test di Wilcoxon-Mann-Whitney. Questo è uno dei test non parametrici più potenti e rappresenta un alternativa molto valida al test parametrico t.

89 LA VERIFICA DELLE IPOTESI SU DUE CAMPIONI disegni TRA GRUPPI (BETWEEN) (n<30) IL TEST DI WILCOXON-MANN-WHITNEY Mediante questo test, usando come parametro il rango (o la mediana), è possibile verificare se due campioni x e y provengono dalla medesima popolazione. H0= x e y hanno la stessa distribuzione H1= x y x > y x < y

90 Test U di Mann-Whitney Due campioni indipendenti, dati ordinali Il test U di Mann-Whitney dovrebbe essere usato come alternativa non-parametrica ad un test t di Student su campioni indipendenti, se una qualsiasi delle assunzioni necessarie è violata.

91 Test di Wilcoxon Due campioni non indipendenti, dati ordinali Il test di Wilcoxon dovrebbe essere usato come alternativa non-parametrica al t di Student per campioni non indipendenti se una qualsiasi delle assunzioni necessarie per quest ultimo è violata.

92 KRUSKAL-WALLIS Analogo alla ANOVA viene utilizzato incaso di comparazione tra 3 o più gruppi di dati non parametrici

93 Test non parametrici

Inferenza statistica. Statistica medica 1

Inferenza statistica. Statistica medica 1 Inferenza statistica L inferenza statistica è un insieme di metodi con cui si cerca di trarre una conclusione sulla popolazione sulla base di alcune informazioni ricavate da un campione estratto da quella

Dettagli

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: Esempi di domande risposta multipla (Modulo II) 1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: 1) ha un numero di elementi pari a 5; 2) ha un numero di elementi

Dettagli

Statistica. Lezione 6

Statistica. Lezione 6 Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 6 a.a 011-01 Dott.ssa Daniela Ferrante

Dettagli

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione)

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione) Esercitazione #5 di Statistica Test ed Intervalli di Confidenza (per una popolazione) Dicembre 00 1 Esercizi 1.1 Test su media (con varianza nota) Esercizio n. 1 Il calore (in calorie per grammo) emesso

Dettagli

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a) Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B Eventi indipendenti: un evento non influenza l altro Eventi disgiunti: il verificarsi di un evento esclude l altro Evento prodotto:

Dettagli

Test statistici di verifica di ipotesi

Test statistici di verifica di ipotesi Test e verifica di ipotesi Test e verifica di ipotesi Il test delle ipotesi consente di verificare se, e quanto, una determinata ipotesi (di carattere biologico, medico, economico,...) è supportata dall

Dettagli

Statistiche campionarie

Statistiche campionarie Statistiche campionarie Sul campione si possono calcolare le statistiche campionarie (come media campionaria, mediana campionaria, varianza campionaria,.) Le statistiche campionarie sono stimatori delle

Dettagli

Test d ipotesi. Statistica e biometria. D. Bertacchi. Test d ipotesi

Test d ipotesi. Statistica e biometria. D. Bertacchi. Test d ipotesi In molte situazioni una raccolta di dati (=esiti di esperimenti aleatori) viene fatta per prendere delle decisioni sulla base di quei dati. Ad esempio sperimentazioni su un nuovo farmaco per decidere se

Dettagli

VERIFICA DELLE IPOTESI

VERIFICA DELLE IPOTESI VERIFICA DELLE IPOTESI Nella verifica delle ipotesi è necessario fissare alcune fasi prima di iniziare ad analizzare i dati. a) Si deve stabilire quale deve essere l'ipotesi nulla (H0) e quale l'ipotesi

Dettagli

Slide Cerbara parte1 5. Le distribuzioni teoriche

Slide Cerbara parte1 5. Le distribuzioni teoriche Slide Cerbara parte1 5 Le distribuzioni teoriche I fenomeni biologici, demografici, sociali ed economici, che sono il principale oggetto della statistica, non sono retti da leggi matematiche. Però dalle

Dettagli

Esercizi test ipotesi. Prof. Raffaella Folgieri Email: folgieri@mtcube.com aa 2009/2010

Esercizi test ipotesi. Prof. Raffaella Folgieri Email: folgieri@mtcube.com aa 2009/2010 Esercizi test ipotesi Prof. Raffaella Folgieri Email: folgieri@mtcube.com aa 2009/2010 Verifica delle ipotesi - Esempio quelli di Striscia la Notizia" effettuano controlli casuali per vedere se le pompe

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2014-2015 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 12-Il t-test per campioni appaiati vers. 1.2 (7 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

Corso di. Dott.ssa Donatella Cocca

Corso di. Dott.ssa Donatella Cocca Corso di Statistica medica e applicata Dott.ssa Donatella Cocca 1 a Lezione Cos'è la statistica? Come in tutta la ricerca scientifica sperimentale, anche nelle scienze mediche e biologiche è indispensabile

Dettagli

E naturale chiedersi alcune cose sulla media campionaria x n

E naturale chiedersi alcune cose sulla media campionaria x n Supponiamo che un fabbricante stia introducendo un nuovo tipo di batteria per un automobile elettrica. La durata osservata x i delle i-esima batteria è la realizzazione (valore assunto) di una variabile

Dettagli

1. Distribuzioni campionarie

1. Distribuzioni campionarie Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 2012/2013 lezioni di statistica del 3 e 6 giugno 2013 - di Massimo Cristallo - 1. Distribuzioni campionarie

Dettagli

Analisi di dati di frequenza

Analisi di dati di frequenza Analisi di dati di frequenza Fase di raccolta dei dati Fase di memorizzazione dei dati in un foglio elettronico 0 1 1 1 Frequenze attese uguali Si assuma che dalle risposte al questionario sullo stato

Dettagli

Relazioni tra variabili

Relazioni tra variabili Università degli Studi di Padova Facoltà di Medicina e Chirurgia Corso di Laurea in Medicina e Chirurgia - A.A. 009-10 Scuole di specializzazione in: Medicina Legale, Medicina del Lavoro, Igiene e Medicina

Dettagli

SPC e distribuzione normale con Access

SPC e distribuzione normale con Access SPC e distribuzione normale con Access In questo articolo esamineremo una applicazione Access per il calcolo e la rappresentazione grafica della distribuzione normale, collegata con tabelle di Clienti,

Dettagli

Istituzioni di Statistica e Statistica Economica

Istituzioni di Statistica e Statistica Economica Istituzioni di Statistica e Statistica Economica Università degli Studi di Perugia Facoltà di Economia, Assisi, a.a. 2013/14 Esercitazione n. 4 A. Si supponga che la durata in giorni delle lampadine prodotte

Dettagli

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008 Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica 18 dicembre 008 Esame sull intero programma: esercizi da A a D Esame sulla seconda parte del programma: esercizi

Dettagli

La distribuzione Normale. La distribuzione Normale

La distribuzione Normale. La distribuzione Normale La Distribuzione Normale o Gaussiana è la distribuzione più importante ed utilizzata in tutta la statistica La curva delle frequenze della distribuzione Normale ha una forma caratteristica, simile ad una

Dettagli

La variabile casuale Binomiale

La variabile casuale Binomiale La variabile casuale Binomiale Si costruisce a partire dalla nozione di esperimento casuale Bernoulliano che consiste in un insieme di prove ripetute con le seguenti caratteristiche: i) ad ogni singola

Dettagli

L Analisi della Varianza ANOVA (ANalysis Of VAriance)

L Analisi della Varianza ANOVA (ANalysis Of VAriance) L Analisi della Varianza ANOVA (ANalysis Of VAriance) 1 CONCETTI GENERALI Finora abbiamo descritto test di ipotesi finalizzati alla verifica di ipotesi sulla differenza tra parametri di due popolazioni

Dettagli

Capitolo 12 La regressione lineare semplice

Capitolo 12 La regressione lineare semplice Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara

Dettagli

Esercitazione n.2 Inferenza su medie

Esercitazione n.2 Inferenza su medie Esercitazione n.2 Esercizio L ufficio del personale di una grande società intende stimare le spese mediche familiari dei suoi impiegati per valutare la possibilità di attuare un programma di assicurazione

Dettagli

Esercizio 1. Verifica di ipotesi sulla media (varianza nota), p-value del test

Esercizio 1. Verifica di ipotesi sulla media (varianza nota), p-value del test STATISTICA (2) ESERCITAZIONE 6 05.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Verifica di ipotesi sulla media (varianza nota), p-value del test Il preside della scuola elementare XYZ sospetta che

Dettagli

3. Confronto tra medie di due campioni indipendenti o appaiati

3. Confronto tra medie di due campioni indipendenti o appaiati BIOSTATISTICA 3. Confronto tra medie di due campioni indipendenti o appaiati Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk MARTA BLANGIARDO

Dettagli

Calcolo delle probabilità

Calcolo delle probabilità Calcolo delle probabilità Laboratorio di Bioinformatica Corso A aa 2005-2006 Statistica Dai risultati di un esperimento si determinano alcune caratteristiche della popolazione Calcolo delle probabilità

Dettagli

Facciamo qualche precisazione

Facciamo qualche precisazione Abbiamo introdotto alcuni indici statistici (di posizione, di variabilità e di forma) ottenibili da Excel con la funzione Riepilogo Statistiche Facciamo qualche precisazione Al fine della partecipazione

Dettagli

Temi di Esame a.a. 2012-2013. Statistica - CLEF

Temi di Esame a.a. 2012-2013. Statistica - CLEF Temi di Esame a.a. 2012-2013 Statistica - CLEF I Prova Parziale di Statistica (CLEF) 11 aprile 2013 Esercizio 1 Un computer è collegato a due stampanti, A e B. La stampante A è difettosa ed il 25% dei

Dettagli

Stima per intervalli Nei metodi di stima puntuale è sempre presente un ^ errore θ θ dovuto al fatto che la stima di θ in genere non coincide con il parametro θ. Sorge quindi l esigenza di determinare una

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Test delle ipotesi sulla varianza In un azienda che produce componenti meccaniche, è stato

Dettagli

Il concetto di valore medio in generale

Il concetto di valore medio in generale Il concetto di valore medio in generale Nella statistica descrittiva si distinguono solitamente due tipi di medie: - le medie analitiche, che soddisfano ad una condizione di invarianza e si calcolano tenendo

Dettagli

Un po di statistica. Christian Ferrari. Laboratorio di Matematica

Un po di statistica. Christian Ferrari. Laboratorio di Matematica Un po di statistica Christian Ferrari Laboratorio di Matematica 1 Introduzione La statistica è una parte della matematica applicata che si occupa della raccolta, dell analisi e dell interpretazione di

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 29-Analisi della potenza statistica vers. 1.0 (12 dicembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

STATISTICA IX lezione

STATISTICA IX lezione Anno Accademico 013-014 STATISTICA IX lezione 1 Il problema della verifica di un ipotesi statistica In termini generali, si studia la distribuzione T(X) di un opportuna grandezza X legata ai parametri

Dettagli

Potenza dello studio e dimensione campionaria. Laurea in Medicina e Chirurgia - Statistica medica 1

Potenza dello studio e dimensione campionaria. Laurea in Medicina e Chirurgia - Statistica medica 1 Potenza dello studio e dimensione campionaria Laurea in Medicina e Chirurgia - Statistica medica 1 Introduzione Nella pianificazione di uno studio clinico randomizzato è fondamentale determinare in modo

Dettagli

2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale

2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale BIOSTATISTICA 2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk

Dettagli

ELEMENTI DI STATISTICA

ELEMENTI DI STATISTICA Dipartimento di Ingegneria Meccanica Chimica e dei Materiali PROGETTAZIONE E GESTIONE DEGLI IMPIANTI INDUSTRIALI Esercitazione 6 ORE ELEMENTI DI STATISTICA Prof. Ing. Maria Teresa Pilloni Anno Accademico

Dettagli

FONDAMENTI DI PSICOMETRIA - 8 CFU

FONDAMENTI DI PSICOMETRIA - 8 CFU Ψ FONDAMENTI DI PSICOMETRIA - 8 CFU STIMA DELL ATTENDIBILITA STIMA DELL ATTENDIBILITA DEFINIZIONE DI ATTENDIBILITA (affidabilità, fedeltà) Grado di accordo tra diversi tentativi di misurare uno stesso

Dettagli

CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI

CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI VERO FALSO CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI 1. V F Un ipotesi statistica è un assunzione sulle caratteristiche di una o più variabili in una o più popolazioni 2. V F L ipotesi nulla unita

Dettagli

Corso di Psicometria Progredito

Corso di Psicometria Progredito Corso di Psicometria Progredito 3.1 Introduzione all inferenza statistica Prima Parte Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014

Dettagli

matematica probabilmente

matematica probabilmente IS science centre immaginario scientifico Laboratorio dell'immaginario Scientifico - Trieste tel. 040224424 - fax 040224439 - e-mail: lis@lis.trieste.it - www.immaginarioscientifico.it indice Altezze e

Dettagli

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010 LEZIONE 3 "Educare significa aiutare l'animo dell'uomo ad entrare nella totalità della realtà. Non si può però educare se non rivolgendosi alla libertà, la quale definisce il singolo, l'io. Quando uno

Dettagli

Metodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Metodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo Metodi statistici per l economia (Prof. Capitanio) Slide n. 9 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 TEST D IPOTESI Partiamo da un esempio presente sul libro di testo.

Dettagli

La logica statistica della verifica (test) delle ipotesi

La logica statistica della verifica (test) delle ipotesi La logica statistica della verifica (test) delle ipotesi Come posso confrontare diverse ipotesi? Nella statistica inferenziale classica vengono sempre confrontate due ipotesi: l ipotesi nulla e l ipotesi

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 10-Il test t per un campione e la stima intervallare (vers. 1.1, 25 ottobre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia,

Dettagli

Statistical Process Control

Statistical Process Control Statistical Process Control ESERCIZI Esercizio 1. Per la caratteristica di un processo distribuita gaussianamente sono note media e deviazione standard: µ = 100, σ = 0.2. 1a. Calcolare la linea centrale

Dettagli

Il Controllo Interno di Qualità dalla teoria alla pratica: guida passo per passo IL MODELLO TEORICO. Pasquale Iandolo

Il Controllo Interno di Qualità dalla teoria alla pratica: guida passo per passo IL MODELLO TEORICO. Pasquale Iandolo Il Controllo Interno di Qualità dalla teoria alla pratica: guida passo per passo IL MODELLO TEORICO Pasquale Iandolo Laboratorio analisi ASL 4 Chiavarese, Lavagna (GE) 42 Congresso Nazionale SIBioC Roma

Dettagli

8 Elementi di Statistica

8 Elementi di Statistica 8 Elementi di Statistica La conoscenza di alcuni elementi di statistica e di analisi degli errori è importante quando si vogliano realizzare delle osservazioni sperimentali significative, ed anche per

Dettagli

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Intervalli di confidenza

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Intervalli di confidenza Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica

Dettagli

La distribuzione Gaussiana

La distribuzione Gaussiana Università del Piemonte Orientale Corso di Laurea in Biotecnologie Corso di Statistica Medica La distribuzione Normale (o di Gauss) Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione

Dettagli

LEZIONE n. 5 (a cura di Antonio Di Marco)

LEZIONE n. 5 (a cura di Antonio Di Marco) LEZIONE n. 5 (a cura di Antonio Di Marco) IL P-VALUE (α) Data un ipotesi nulla (H 0 ), questa la si può accettare o rifiutare in base al valore del p- value. In genere il suo valore è un numero molto piccolo,

Dettagli

Teoria delle code. Sistemi stazionari: M/M/1 M/M/1/K M/M/S

Teoria delle code. Sistemi stazionari: M/M/1 M/M/1/K M/M/S Teoria delle code Sistemi stazionari: M/M/1 M/M/1/K M/M/S Fabio Giammarinaro 04/03/2008 Sommario INTRODUZIONE... 3 Formule generali di e... 3 Leggi di Little... 3 Cosa cerchiamo... 3 Legame tra N e le

Dettagli

Corso di Laurea in Scienze e Tecnologie Biomolecolari. NOME COGNOME N. Matr.

Corso di Laurea in Scienze e Tecnologie Biomolecolari. NOME COGNOME N. Matr. Corso di Laurea in Scienze e Tecnologie Biomolecolari Matematica e Statistica II Prova di esame del 18/7/2013 NOME COGNOME N. Matr. Rispondere ai punti degli esercizi nel modo più completo possibile, cercando

Dettagli

11. Analisi statistica degli eventi idrologici estremi

11. Analisi statistica degli eventi idrologici estremi . Analisi statistica degli eventi idrologici estremi I processi idrologici evolvono, nello spazio e nel tempo, secondo modalità che sono in parte predicibili (deterministiche) ed in parte casuali (stocastiche

Dettagli

iovanella@disp.uniroma2.it http://www.disp.uniroma2.it/users/iovanella Verifica di ipotesi

iovanella@disp.uniroma2.it http://www.disp.uniroma2.it/users/iovanella Verifica di ipotesi iovanella@disp.uniroma2.it http://www.disp.uniroma2.it/users/iovanella Verifica di ipotesi Idea di base Supponiamo di avere un idea del valore (incognito) di una media di un campione, magari attraverso

Dettagli

Corso integrato di informatica, statistica e analisi dei dati sperimentali Altri esercizi_esercitazione V

Corso integrato di informatica, statistica e analisi dei dati sperimentali Altri esercizi_esercitazione V Corso integrato di informatica, statistica e analisi dei dati sperimentali Altri esercizi_esercitazione V Sui PC a disposizione sono istallati diversi sistemi operativi. All accensione scegliere Windows.

Dettagli

Il confronto fra proporzioni

Il confronto fra proporzioni L. Boni Il rapporto Un rapporto (ratio), attribuendo un ampio significato al termine, è il risultato della divisione di una certa quantità a per un altra quantità b Il rapporto Spesso, in maniera più specifica,

Dettagli

Elementi di Psicometria

Elementi di Psicometria Elementi di Psicometria E2-Riepilogo finale vers. 1.2 Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2010-2011 G. Rossi (Dip. Psicologia) ElemPsico 2010-2011

Dettagli

PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE

PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) PROBABILITÀ -

Dettagli

STATISTICA INFERENZIALE

STATISTICA INFERENZIALE STATISTICA INFERENZIALE Premessa importante: si ipotizza che il comportamento della popolazione rispetto ad una variabile casuale X viene descritto attraverso una funzione parametrica di probabilità p

Dettagli

ESERCIZI DI STATISTICA DESCRITTIVA

ESERCIZI DI STATISTICA DESCRITTIVA ESERCIZI DI STATISTICA DESCRITTIVA ES1 Data la seguente serie di dati su Sesso e Altezza di 8 pazienti, riempire opportunamente due tabelle per rappresentare le distribuzioni di frequenze dei due caratteri,

Dettagli

Esercitazione n.4 Inferenza su varianza

Esercitazione n.4 Inferenza su varianza Esercizio 1 Un industria che produce lamiere metalliche ha ricevuto un ordine di acquisto di un grosso quantitativo di lamiere di un dato spessore. Per assicurare la qualità della propria fornitura, l

Dettagli

Prova di autovalutazione Prof. Roberta Siciliano

Prova di autovalutazione Prof. Roberta Siciliano Prova di autovalutazione Prof. Roberta Siciliano Esercizio 1 Nella seguente tabella è riportata la distribuzione di frequenza dei prezzi per camera di alcuni agriturismi, situati nella regione Basilicata.

Dettagli

Facoltà di Psicologia Università di Padova Anno Accademico 2010-2011

Facoltà di Psicologia Università di Padova Anno Accademico 2010-2011 Facoltà di Psicologia Università di Padova Anno Accademico 010-011 Corso di Psicometria - Modulo B Dott. Marco Vicentini marco.vicentini@unipd.it Rev. 10/01/011 La distribuzione F di Fisher - Snedecor

Dettagli

Tasso di interesse e capitalizzazione

Tasso di interesse e capitalizzazione Tasso di interesse e capitalizzazione Tasso di interesse = i = somma che devo restituire dopo un anno per aver preso a prestito un euro, in aggiunta alla restituzione dell euro iniziale Quindi: prendo

Dettagli

= variazione diviso valore iniziale, il tutto moltiplicato per 100. \ Esempio: PIL del 2000 = 500; PIL del 2001 = 520:

= variazione diviso valore iniziale, il tutto moltiplicato per 100. \ Esempio: PIL del 2000 = 500; PIL del 2001 = 520: Fig. 10.bis.1 Variazioni percentuali Variazione percentuale di x dalla data zero alla data uno: x1 x 0 %x = 100% x 0 = variazione diviso valore iniziale, il tutto moltiplicato per 100. \ Esempio: PIL del

Dettagli

L analisi dei rischi: l aspetto statistico Ing. Pier Giorgio DELLA ROLE Six Sigma Master Black Belt

L analisi dei rischi: l aspetto statistico Ing. Pier Giorgio DELLA ROLE Six Sigma Master Black Belt L analisi dei rischi: l aspetto statistico Ing. Pier Giorgio DELL ROLE Six Sigma Master lack elt Dicembre, 009 Introduzione Nell esecuzione dei progetti Six Sigma è di fondamentale importanza sapere se

Dettagli

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità C

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità C Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità C Cognome Nome: Part time: Numero di matricola: Diurno: ISTRUZIONI: Il punteggio relativo alla prima parte dell esame viene calcolato

Dettagli

Statistica e biometria. D. Bertacchi. Variabili aleatorie. V.a. discrete e continue. La densità di una v.a. discreta. Esempi.

Statistica e biometria. D. Bertacchi. Variabili aleatorie. V.a. discrete e continue. La densità di una v.a. discreta. Esempi. Iniziamo con definizione (capiremo fra poco la sua utilità): DEFINIZIONE DI VARIABILE ALEATORIA Una variabile aleatoria (in breve v.a.) X è funzione che ha come dominio Ω e come codominio R. In formule:

Dettagli

Esame di Statistica del 17 luglio 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova).

Esame di Statistica del 17 luglio 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Esame di Statistica del 17 luglio 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola Es. 1 Es. 2 Es. 3 Es. 4 Somma Voto finale Attenzione: si consegnano

Dettagli

Inferenza statistica I Alcuni esercizi. Stefano Tonellato

Inferenza statistica I Alcuni esercizi. Stefano Tonellato Inferenza statistica I Alcuni esercizi Stefano Tonellato Anno Accademico 2006-2007 Avvertenza Una parte del materiale è stato tratto da Grigoletto M. e Ventura L. (1998). Statistica per le scienze economiche,

Dettagli

f(x) = 1 x. Il dominio di questa funzione è il sottoinsieme proprio di R dato da

f(x) = 1 x. Il dominio di questa funzione è il sottoinsieme proprio di R dato da Data una funzione reale f di variabile reale x, definita su un sottoinsieme proprio D f di R (con questo voglio dire che il dominio di f è un sottoinsieme di R che non coincide con tutto R), ci si chiede

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2013-2014 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

~ Copyright Ripetizionando - All rights reserved ~ http://ripetizionando.wordpress.com STUDIO DI FUNZIONE

~ Copyright Ripetizionando - All rights reserved ~ http://ripetizionando.wordpress.com STUDIO DI FUNZIONE STUDIO DI FUNZIONE Passaggi fondamentali Per effettuare uno studio di funzione completo, che non lascia quindi margine a una quasi sicuramente errata inventiva, sono necessari i seguenti 7 passaggi: 1.

Dettagli

Edited by Foxit PDF Editor Copyright (c) by Foxit Software Company, 2004 For Evaluation Only.

Edited by Foxit PDF Editor Copyright (c) by Foxit Software Company, 2004 For Evaluation Only. In un mercato del lavoro competitivo esistono due tipi di lavoratori, quelli con alta produttività L A, che producono per 30 $ l'ora, e quelli con bassa produttività, L B, che producono per 5 $ l'ora.

Dettagli

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE La presentazione dei dati per molte ricerche mediche fa comunemente riferimento a frequenze, assolute o percentuali. Osservazioni cliniche conducono sovente

Dettagli

Probabilità discreta

Probabilità discreta Probabilità discreta Daniele A. Gewurz 1 Che probabilità c è che succeda...? Una delle applicazioni della combinatoria è nel calcolo di probabilità discrete. Quando abbiamo a che fare con un fenomeno che

Dettagli

Distribuzioni discrete

Distribuzioni discrete Distribuzioni discrete Esercitazione 4 novembre 003 Distribuzione binomiale Si fa un esperimento (o prova): può manifestarsi un certo evento A con probabilità p oppure no (con probabilità q = p). La distribuzione

Dettagli

Lineamenti di econometria 2

Lineamenti di econometria 2 Lineamenti di econometria 2 Camilla Mastromarco Università di Lecce Master II Livello "Analisi dei Mercati e Sviluppo Locale" (PIT 9.4) Aspetti Statistici della Regressione Aspetti Statistici della Regressione

Dettagli

Carte di controllo per attributi

Carte di controllo per attributi Carte di controllo per attributi Il controllo per variabili non sempre è effettuabile misurazioni troppo difficili o costose troppe variabili che definiscono qualità di un prodotto le caratteristiche dei

Dettagli

ANALISI DELLE FREQUENZE: IL TEST CHI 2

ANALISI DELLE FREQUENZE: IL TEST CHI 2 ANALISI DELLE FREQUENZE: IL TEST CHI 2 Quando si hanno scale nominali o ordinali, non è possibile calcolare il t, poiché non abbiamo medie, ma solo frequenze. In questi casi, per verificare se un evento

Dettagli

Statistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice

Statistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice Esercitazione 15 Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () 1 / 18 L importanza del gruppo di controllo In tutti i casi in cui si voglia studiare l effetto di un certo

Dettagli

Un gioco con tre dadi

Un gioco con tre dadi Un gioco con tre dadi Livello scolare: biennio Abilità interessate Costruire lo spazio degli eventi in casi semplici e determinarne la cardinalità. Valutare la probabilità in diversi contesti problematici.

Dettagli

Esercitazione n.1 (v.c. Binomiale, Poisson, Normale)

Esercitazione n.1 (v.c. Binomiale, Poisson, Normale) Esercizio 1. Un azienda produce palline da tennis che hanno probabilità 0,02 di essere difettose, indipendentemente l una dall altra. La confezione di vendita contiene 8 palline prese a caso dalla produzione

Dettagli

Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI

Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI 1. L azienda Wood produce legno compensato per costruzioni

Dettagli

Servizi di consulenza specialistica per IGRUE 2009 2012

Servizi di consulenza specialistica per IGRUE 2009 2012 Allegato 9A Metodo della stima delle differenze Descrizione della procedura Il metodo della stima delle differenze è indicato qualora il controllore ritenga che la popolazione sia affetta da un tasso di

Dettagli

Lezione n. 2 (a cura di Chiara Rossi)

Lezione n. 2 (a cura di Chiara Rossi) Lezione n. 2 (a cura di Chiara Rossi) QUANTILE Data una variabile casuale X, si definisce Quantile superiore x p : X P (X x p ) = p Quantile inferiore x p : X P (X x p ) = p p p=0.05 x p x p Graficamente,

Dettagli

Test non parametrici. Test non parametrici. Test non parametrici. Test non parametrici

Test non parametrici. Test non parametrici. Test non parametrici. Test non parametrici Test non parametrici Test non parametrici Il test T di Student per uno o per due campioni, il test F di Fisher per l'analisi della varianza, la correlazione, la regressione, insieme ad altri test di statistica

Dettagli

I ESERCITAZIONE. Gruppo I 100 individui. Trattamento I Nuovo Farmaco. Osservazione degli effetti sul raffreddore. Assegnazione casuale

I ESERCITAZIONE. Gruppo I 100 individui. Trattamento I Nuovo Farmaco. Osservazione degli effetti sul raffreddore. Assegnazione casuale I ESERCITAZIONE ESERCIZIO 1 Si vuole testare un nuovo farmaco contro il raffreddore. Allo studio partecipano 200 soggetti sani della stessa età e dello stesso sesso e con caratteristiche simili. i) Che

Dettagli

OSSERVAZIONI TEORICHE Lezione n. 4

OSSERVAZIONI TEORICHE Lezione n. 4 OSSERVAZIONI TEORICHE Lezione n. 4 Finalità: Sistematizzare concetti e definizioni. Verificare l apprendimento. Metodo: Lettura delle OSSERVAZIONI e risoluzione della scheda di verifica delle conoscenze

Dettagli

Statistica inferenziale

Statistica inferenziale Statistica inferenziale Popolazione e campione Molto spesso siamo interessati a trarre delle conclusioni su persone che hanno determinate caratteristiche (pazienti, atleti, bambini, gestanti, ) Osserveremo

Dettagli

19txtI_BORRA_2013 18/11/13 10:52 Pagina 449 TAVOLE STATISTICHE

19txtI_BORRA_2013 18/11/13 10:52 Pagina 449 TAVOLE STATISTICHE 19txtI_BORRA_2013 18/11/13 10:52 Pagina 449 TAVOLE STATISTICHE Nell inferenza è spesso richiesto il calcolo di alcuni valori critici o di alcune probabilità per le variabili casuali che sono state introdotte

Dettagli

Esercizi di Calcolo delle Probabilita (I)

Esercizi di Calcolo delle Probabilita (I) Esercizi di Calcolo delle Probabilita (I) 1. Si supponga di avere un urna con 15 palline di cui 5 rosse, 8 bianche e 2 nere. Immaginando di estrarre due palline con reimmissione, si dica con quale probabilità:

Dettagli

LA CORRELAZIONE LINEARE

LA CORRELAZIONE LINEARE LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad esempio, si può supporre che vi sia una relazione tra l insoddisfazione

Dettagli

Indici (Statistiche) che esprimono le caratteristiche di simmetria e

Indici (Statistiche) che esprimono le caratteristiche di simmetria e Indici di sintesi Indici (Statistiche) Gran parte della analisi statistica consiste nel condensare complessi pattern di osservazioni in un indicatore che sia capace di riassumere una specifica caratteristica

Dettagli

Si considerino gli eventi A = nessuno studente ha superato l esame e B = nessuno studente maschio ha superato l esame. Allora A c B è uguale a:

Si considerino gli eventi A = nessuno studente ha superato l esame e B = nessuno studente maschio ha superato l esame. Allora A c B è uguale a: TEST DI AUTOVALUTAZIONE - SETTIMANA 2 I diritti d autore sono riservati. Ogni sfruttamento commerciale non autorizzato sarà perseguito. Metodi statistici per la biologia 1 Parte A 1.1 Si considerino gli

Dettagli

PRODUZIONE DI LENTI A CONTATTO

PRODUZIONE DI LENTI A CONTATTO 1 PRODUZIONE DI LENTI A CONTATTO Per monitorare il processo di produzione di un determinato tipo di lenti a contatto viene misurato, ad intervalli di tempo regolari di h 15 minuti, il diametro X (in mm)

Dettagli