UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:
|
|
- Michelina Ferrante
- 8 anni fa
- Visualizzazioni
Transcript
1 UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA Prof.ssa Donatella Siepi tel: dicembre 2014
2 7 LEZIONE
3 PROBABILITA
4 L incertezza Nella misura di una qualsiasi grandezza vi sono fonti di incertezza. Ripetendo la misura sotto le stesse condizioni sperimentali non è detto che si ottenga lo stesso risultato L incertezza può essere resa QUANTITATIVA usando la nozione di PROBABILITA.
5 Fenomeno deterministico: se l esperimento è condotto nelle stesse condizioni e il risultato è lo stesso Esempio: Il moto di un grave La traiettoria di una pallina su un biliardo Fenomeno non deterministico: anche se gli esperimenti sono condotti nelle stesse condizioni i risultati sono diversi Esempio: Risultato del lancio di una moneta Traiettoria di 100 palline in un biliardo Vincita in una lotteria Numero di lanci di un dado per ottenere un 6 La probabilità si occupa di fenomeni non deterministici
6 La probabilità si può anche definire come la quantificazione della possibilità che si verifichi uno specifico risultato a seguito di un detrminato evento I valori di probabilità sono allora tra 0 = impossibile 1 = certezza
7 In statistica è importante conoscere il limite di probabilità sotto al quale un determinato risultato non può essere definito unicamente un prodotto del caso LIVELLO di SIGNIFICATIVITA
8 Ad ogni livello di confidenza (o certezza), detto anche semplicemente livello e indicato con la lettera α, si può associare un intervallo di confidenza.
9 LIVELLO di SIGNIFICATIVITA o confidenza Se si ritiene che un evento si verifichi meno di una volta su 20 (P>0,05) si considera improbabile o statisticamente significativo * Se si ritiene che un evento si verifichi meno di una volta su 100 (P>0,01) si considera molto improbabile o statisticamente molto significativo ** Se si ritiene che un evento si verifichi meno di una volta su 1000 (P>0,001) si considera estremamente improbabile o statisticamente estremamente significativo **
10 Distribuzione di probabilità
11 DISTRIBUZIONI TEORICHE DI PROBABILITA DEFINIZIONI: Qualsiasi caratteristica misurabile è denominata variabile. Se una variabile può assumere numerosi valori tali che qualsiasi risultato è determinato dal caso, essa è nota come variabile casuale Una V.C. è un numero X che assume un valore in R, determinato sulla base di un evento E che si è presentato in seguito all esperimento al quale si riferisce. Tale numero è assunto da X con probabilità P Una distribuzione di probabilità è una funzione che sintetizza la relazione tra i valori di una variabile casuale e la probabilità che questi si presentino Una distribuzione di probabilità applica la teoria della probabilità per descrivere il comportamento di una variabile.
12 La conoscenza della distribuzione di probabilità di una variabile casuale fornisce ai clinici e ai ricercatori uno strumento potente per riassumere e descrivere il set di dati e per trarre conclusioni a partire dal campione della popolazione studiata Una distribuzione di probabilità può essere rappresentata con una tabella, un grafico o una formula
13 OSSERVAZIONI Una distribuzione è analoga ad una distribuzione di frequenze relative, ma mentre questa si ricava da un campione di osservazioni estratte da un popolazione, una distribuzione di probabilità è in relazione alla popolazione di tutti i possibili risultati Una distribuzione continua non permette la stima della probabilità di estrarre un particolare valore, ma solo quelli compresi in un dato intervallo. Per esempio, nella distribuzione delle altezze di una popolazione di studenti, non è possibile stimare la probabilità di avere un individuo alto esattamente 176,000 cm ma quella di avere un individuo tra 180 e 190 centimetri
14 La forma di una distribuzione di probabilità continua è usualmente definita da una curva senza sbalzi, mentre per una variabile discreta la probabilità è definita per i valori puntuali della variabile, e il grafico della distribuzione rassomiglia ad una serie di impulsi La forma di una distribuzione può essere simmetrica rispetto al valore centrale o ci può essere una coda più lunga da un lato piuttosto che da un altro. Se la coda è a sinistra (destra) la distribuzione viene detta asimmetrica a sinistra (destra) - Alcune distribuzioni teoriche di probabilità comunemente usate per descrivere dati sanitari sono: Distribuzione Gaussiana, la distribuzione log-normale, la distribuzione Binomiale e la distribuzione di Poisson
15 DISTRIBUZIONE BINOMIALE (cenni) DISTRIBUZIONE NORMALE DISTRIBUZIONE DI POISSON (cenni)
16 Poiché i valori di molte variabili si distribuiscono come una curva normale, le sue proprietà sono molto importanti, e se riusciamo a calcolare la media e la deviazione standard da un campione, questo ci permette di effettuare qualsiasi tipo di inferenza sulla popolazione dalla quale questo è stato estratto.
17 DISTRIBUZIONE BINOMIALE I lanci successivi devono essere indipendenti dai precedenti Le uscite devono essere completamente casuali La probabilità di una uscita deve essere costante nel tempo. Se poniamo in ascissa i valori di k e in ordinata le probabilità P(k), rappresentiamo graficamente la formula vista. Ad esempio assumiamo che la probabilità singola p sia 0.3, e il numero di prove n sia 10.
18 DISTRIBUZIONE BINOMIALE Distribuzione delle probabilità P(k) relative ai vari k considerati, quando p=0.3 e n=10.
19 DISTRIBUZIONE BINOMIALE La distribuzione binomiale permette di calcolare, per numeri n piccoli, le probabilità di avere un certo numero k di successi nelle n prove. Se abbiamo molte prove, n diventa molto grande. Trovare le probabilità dei successi k diventa difficile. Per alti n il problema non è di trovare la probabilità connessa ad uno specifico numero k di successi, ma di trovare ad esempio la probabilità di trovare più o meno di k successi.
20 DISTRIBUZIONE NORMALE Si ricorre allora alle distribuzioni NORMALE ( GAUSSIANA) o di Poisson, che valgono per n molto grande. In questo caso lo scaloide della distribuzione di probabilità binomiale, ossia l insieme dei rettangoli che rappresentano le probabilità dei singoli k, tende a diventare un area sottostante ad una linea continua.
21 DISTRIBUZIONE NORMALE
22 DISTRIBUZIONE NORMALE
23 DISTRIBUZIONE NORMALE
24 DISTRIBUZIONE NORMALE Molte distribuzioni empiriche (ossia distribuzioni di frequenza) sono approssimativamente normali. Quando effettuiamo un campionamento e ne diagrammiamo la distribuzione di frequenza, se il numero di elementi del campione è sufficientemente elevato e il numero di classi non è troppo piccolo (almeno 10-15), troveremo quasi sempre un campione distribuito normalmente.
25 DISTRIBUZIONE NORMALE Se il campione è distribuito normalmente si possono applicare le proprietà della curva teorica gaussiana al campione rimanendo entro un intervallo accettabile di errore (il campione essendo finito non sarà mai perfettamente normale).
26 DISTRIBUZIONE NORMALE Rappresentando graficamente questa funzione otteniamo la caratteristica curva a campana simmetrica intorno alla media:
27 DISTRIBUZIONE NORMALE In corrispondenza di +s e s la curva presenta i suoi punti di flesso. Tracciando diversi diagrammi per diversi valori di s ci accorgiamo che la curva è tanto più appiattita quanto maggiore è la deviazione standard.
28 DISTRIBUZIONE NORMALE Una proprietà fondamentale della gaussiana è la seguente: La probabilità che uno scarto dalla media sia maggiore di un certo valore è inversamente proporzionale al rapporto fra questo valore e la deviazione standard. Quindi esiste una probabilità definita e uguale per tutte le curve normali che un certo scarto sia inferiore a una (2, 3) deviazione standard. Tale probabilità è equivalente all area tratteggiata in figura:
29 DISTRIBUZIONE NORMALE
30 DISTRIBUZIONE NORMALE
31 DISTRIBUZIONE NORMALE
32 DISTRIBUZIONE NORMALE Probabilità che un valore cada casualmente entro alcune deviazioni standard: Entro 1.0 d.s. dalla media = 68.26% Entro 1.96 d.s. dalla media = 95.00% Entro 2.0 d.s. dalla media = 95.44% Entro d.s. dalla media = 99.00% Entro 3.0 d.s. dalla media = 99.73% Entro 3.29 d.s. dalla media = 99.90%
33 DISTRIBUZIONE DI POISSON La distribuzione binomiale tende alla poissoniana quando la probabilità dell evento p è molto piccola con n (prove) molto grande. La poissoniana è una distribuzione discreta, con la caratteristica che la media teorica (valore atteso) è uguale alla varianza: = s 2 = n p
34 DISTRIBUZIONE DI POISSON Questo tipo di distribuzione di frequenze (eventi che si verificano con frequenza molto bassa in uno spazio o in un tempo molto grande) si presenta in natura in alcuni casi, ad es.: Numero di microorganismi in una certa superficie o volume Decadimento di sostanze radioattive Insorgenza di antibioticoresistenza in una popolazione batterica Numero di morti per una malattia non frequente in una grande popolazione.
35 LA VERIFICA DI IPOTESI: TEST BASATI SU UN CAMPIONE
36 La verifica di ipotesi Una fase dell inferenza è quella che consente di verificare delle ipotesi sui parametri Obiettivo primario: capire e ridurre l incertezza per prendere decisioni Obiettivo secondario: controllare il rischio del prendere decisioni sulla base delle statistiche campionarie
37 La verifica di ipotesi Verifica di ipotesi: metodologia per fare inferenza sui parametri della popolazione alla luce dell analisi delle differenze tra i risultati osservati (statistica campionaria) e quelli che ci aspetteremmo se una qualche ipotesi sulla popolazione fosse vera. La verifica di ipotesi ha inizio con la formulazione del sistema di ipotesi sottoposto a verifica. Il sistema di ipotesi fa sempre riferimento a qualche parametro della popolazione. Consiste sempre in due ipotesi contrapposte.
38 Ipotesi nulla L ipotesi nulla è, in generale, l ipotesi che si vorrebbe rifiutare. Essa afferma che gli effetti osservati nei campioni sono dovuti a fluttuazioni casuali, sempre possibili quando esiste variabilità tra gli individui; si tratta di variazioni che sono tanto più marcate quanto più ridotto è il numero di osservazioni. L ipotesi nulla H0 deve essere rifiutata solamente se esiste l evidenza che la contraddice. E importante comprendere che l ipotesi nulla non è necessariamente vera, quando i dati campionari (eventualmente pochi) non sono tali da contraddirla. L ipotesi nulla H0 non è mai provata o verificata; è solo possibile negarla o disapprovarla, sulla base di dati sperimentali
39 Con un test statistico si determina solamente una probabilità, che può essere differente ripetendo lo stesso esperimento, e inoltre la decisione che ne deriva può essere errata. Come primo caso, si supponga che un giocatore utilizzi una moneta perfettamente bilanciata, ma di cui egli non conosca le caratteristiche. Mediante alcuni lanci, egli deve decidere se la moneta è bilanciata (H0) oppure truccata (H1). Si supponga quindi che egli lanci questa moneta 6 volte e che ottenga croce tutte le volte. Se fosse uno statistico ragionerebbe in questo modo: "Avere 6 croci su 6 lanci è un evento raro; più esattamente ha una probabilità di (1/2 6 =0,5 6 ) 0,0156 o 1,56% di avvenire, se la moneta non fosse truccata (H0 vera).
40 Con una ipotesi bilaterale, quindi comprendendo anche la possibilità di avere 6 volte testa/croce, la probabilità è esattamente uguale a 3,12%. Di conseguenza, poiché 3,12% è una probabilità ritenuta bassa, ottenere 6 volte testa oppure 6 volte croce sono eventi complessivamente poco probabili, seppure possibili". Se egli avesse prefissato come valore soglia la probabilità del 5%, con questo test statistico rifiuterebbe l ipotesi nulla. Giungerebbe alla conclusione che tra atteso (3 volte teste e 3 volte croce su 6 lanci) ed osservato (6 volte croce oppure l'opposto) esiste una differenza significativa e che pertanto la moneta è truccata. Ma noi, sappiamo che in realtà essa non la è. E un errore, che in statistica si chiama errore di I tipo (scritto spesso con l'iniziale maiuscola Tipo=errore di prima specie). Consiste nel rifiutare l ipotesi nulla H0, quando in realtà essa è vera
41 Si supponga ora, come secondo caso, che sempre all insaputa del giocatore questa volta la moneta sia truccata e dia solo croce. Se questa volta egli la lancia solo 3 volte, ovviamente otterrebbe 3 volte croce. In questo caso, se fosse uno statistico seguirebbe questo ragionamento: "Se la moneta non fosse truccata (H0 vera), la probabilità di trovare per caso 3 volte croce è alta, più esattamente uguale a 0,5 3 =0,125 o 12,5%".Con un test bilaterale la probabilità è 0,25. Pertanto, egli non rifiuterebbe l ipotesi nulla. Errando, arriverebbe alla conclusione che la moneta non è truccata. In questo caso, si ha l errore di II tipo (o seconda specie). Consiste nel non rifiutare (o accettare) l'ipotesi nulla H0, quando in realtà essa è falsa. In statistica, non è possibile eliminare questi due tipi di errore.
42 La verifica di ipotesi Nell approccio classico alla verifica di ipotesi, si individuano i seguenti elementi chiave: 1. L ipotesi nulla H 0 si riferisce sempre a un valore specifico del parametro della popolazione (ad esempio ), e non a una statistica campionaria (ad esempio la media campionaria). 2. L ipotesi nulla contiene sempre un segno di eguale relativo al valore specificato del parametro della popolazione (ad esempio H 0 : =368 mm). 3. L ipotesi alternativa non contiene mai un segno di eguale relativo al valore specificato del parametro della popolazione (ad esempio H 1 : 368 mm).
43 La verifica di ipotesi Se la statistica campionaria prescelta si avvicina al valore ipotizzato nell ipotesi nulla accettiamo H 0, altrimenti rifiutiamo H 0 a favore dell ipotesi alternativa H 1. La teoria della verifica di ipotesi fornisce una regola su cui basare il processo decisionale. Tale regola si basa sul calcolo della probabilità di ottenere un dato risultato campionario nel caso in cui l ipotesi nulla sia vera. Questo risultato viene ricavato determinando prima la distribuzione campionaria della statistica di interesse (statistica test) e quindi calcolando il valore assunto per il particolare campione considerato. La distribuzione campionaria della statistica test spesso è una distribuzione statistica nota, come la Normale o la t di Student, e quindi possiamo ricorrere a queste distribuzioni per sottoporre a verifica un ipotesi nulla.
44 L approccio del p-value 1. Specificate l ipotesi nulla H Specificate l ipotesi alternativa H Fissate il livello di significatività. 4. Scegliete la tecnica statistica appropriata e la statistica test da utilizzare. 5. Raccogliete i dati e calcolate il valore campionario della statistica test. 6. Calcolate il p-value. Per farlo: (a) determinate la distribuzione della statistica test sotto l ipotesi H 0 ; (b) ponete la statistica test sull asse delle ascisse; (c) ombreggiate l area corretta al di sotto della curva della distribuzione, sulla base dell ipotesi alternativa H Confrontate il p-value con a. 8. Prendete la decisione statistica. Se il p-value è maggiore o uguale ad a, ipotesi nulla non è rifiutata. Se il p-value è minore di a, l ipotesi nulla è rifiutata. 9. Esprimete la decisione statistica con riferimento alla situazione considerata.
45 Intervalli di confidenza e verifiche d ipotesi Gli intervalli di confidenza vengono usati per stimare i parametri della popolazione mentre la verifica di ipotesi serve per prendere decisioni sul valore dei parametri. Alternativamente alla verifica di ipotesi possiamo costruire un intervallo di confidenza per la media. Accettiamo l ipotesi nulla se il valore ipotizzato è compreso nell intervallo costruito. Rifiutiamo l ipotesi nulla se il valore cade fuori dell intervallo. Nell esempio dell azienda che costruisce scatole di metallo, l intervallo di confidenza al livello del 95% sarà: cioè 372,5 ± (1,96) 15/5. ( X Zs / n) Quindi 366,62 378,38. Il valore 368 è compreso nell intervallo, perciò accetto H 0.
46 La verifica di ipotesi La distribuzione campionaria della statistica test è divisa in due regioni: una regione di rifiuto (o regione critica) una regione di accettazione Regione di rifiuto: insieme dei valori della statistica test che non è probabile si verifichino quando è vera H 0 ed è probabile si verifichino quando H 0 è falsa. La regola decisionale è: Valore della statistica test Cade nella regione di accettazione Cade nella regione di rifiuto L ipotesi nulla non può essere rifiutata L ipotesi nulla deve essere rifiutata
47 La verifica di ipotesi Per prendere una decisione sull ipotesi nulla, dobbiamo determinare il valore critico della statistica test. Tale valore separa la regione di accettazione dalla regione di rifiuto.
48 La verifica di ipotesi Decidere sulla base della statistica campionaria => rischio di errore. Si distinguono due tipi di errore: L errore di prima specie si verifica se si rifiuta l ipotesi nulla quando è vera e quindi non dovrebbe essere rifiutata. La Probabilità che si verifichi un errore di prima specie è indicata con a(alfa). L errore di seconda specie si verifica se si accetta l ipotesi nulla quando è falsa e quindi dovrebbe essere rifiutata. La Probabilità che si verifichi un errore di seconda specie è indicata con (beta).
49 La verifica di ipotesi Livello di significatività del test: probabilità a di commettere un errore di prima specie. In genere si controlla l errore di prima specie => a viene specificato prima di condurre la verifica di ipotesi Il valore di a esprime la probabilità che la statistica test cada nella regione di rifiuto quando è vera H 0 => il valore critico dipende da a. Coefficiente di confidenza: (1-a) esprime la probabilità di accettare H 0 quando è vera. Espresso in percentuale mi fornisce il livello di confidenza per stime intervallari. Rischio : rischio del consumatore. Non è controllabile Potenza del test (1- ): probabilità di rigettare H 0 quando è falsa => è auspicabile che sia più grande possibile => indicatore della bontà di un test statistico.
50 La verifica di ipotesi Lo schema seguente riassume i rischi del processo decisionale: In genere a viene fissato a 0,05. Se le conseguenze di un errore di I specie sono gravi potrei scegliere un valore pari a 0,01 => aumenta il rischio di errore di seconda specie ( ) Per ridurre a parità di a posso aumentare la dimensione del campione
51 Test Z per la media (s noto) Per verificare l ipotesi che la media della popolazione sia uguale ad un certo valore, contro l ipotesi alternativa che la media differisca da tale valore, conoscendo s, si ricorre alla statistica Z: X è distribuita come una normale => sotto H 0 Z è distribuita come una normale standardizzata Se Z assume valori vicini allo zero siamo portati ad accettare H 0, altrimenti si propende per rifiutare H 0 (test a due code).
52 Test Z per la media (s noto) Approccio del valore critico (livello di significatività di 0,05) Regola decisionale: Rifiuto H 0 se Z>+1,96 o se Z<-1,96 Accetto H 0 altrimenti
53 Test Z per la media (s noto) Esempio: l azienda che produce scatole metalliche intende valutare se il processo produttivo opera in modo tale da garantire che la lunghezza del lato maggiore sia pari a 368 mm. Viene estratto un campione di 25 scatole. Lo scarto quadratico medio della popolazione è pari a 15 mm e la media campionaria assume il valore 372,5 mm. H 0 : = 368 H 1 : 368 Il valore della statistica test mi porta ad accettare H 0.
54 Le fasi della verifica di ipotesi 1. Specificate l ipotesi nulla H 0 e esprimetela in termini statistici. Nel verificare se la lunghezza media delle scatole è 368 mm, l ipotesi nulla è: = Specificate l ipotesi alternativa H 1 e esprimetela in termini statistici. Nel verificare se la lunghezza media delle scatole è 368 mm, l ipotesi alternativa è: Scegliete il livello di significatività. Il livello di significatività viene fissato in base all importanza relativa che si accorda ai rischi derivanti dal commettere un errore di prima specie e dal commettere un errore di seconda specie. Nell esempio considerato, abbiamo posto a = 0, Scegliete l ampiezza campionaria. L ampiezza campionaria viene fissata dopo aver considerato i rischi derivanti da un errore di prima specie e da un errore di seconda specie (vale a dire dopo aver specificato a e ) e tenendo conto dei vincoli di bilancio a cui si è sottoposti nel condurre lo studio. Nell esempio considerato sono state campionate 25 scatole. 5. Individuate la tecnica statistica da utilizzare e calcolate la statistica test corrispondente. Nell esempio considerato, s era noto e quindi abbiamo usato il test Z.
55 Le fasi della verifica di ipotesi 6. Calcolate i valori critici che separano la regione di rifiuto da quella di accettazione. Una volta specificate l ipotesi nulla e quella alternativa e una volta fissati il livello di significatività e l ampiezza del campione, si possono calcolare i valori critici delle distribuzioni delle statistiche test di modo che la regione di rifiuto e quella di accettazione risultino ben individuate. Nell esempio considerato, sono stati usati i valori +1,96 e 1,96, perché la statistica test Z si distribuisce secondo una normale standardizzata. 7. Raccogliete i dati e calcolate il valore campionario della statistica test. Nell esempio considerato, la media campionaria è pari a 372,5 mm e quindi Z = 1, Stabilite se la statistica test cade nella regione di rifiuto o in quella di accettazione. A tale scopo, confrontate il valore della statistica con i valori critici individuati. Nell esempio considerato, Z = 1,50 cade nella regione di accettazione perché -1,96 < Z = +1,50 < +1,96.
56 Le fasi della verifica di ipotesi 9. Prendete la decisione statistica. Se la statistica test cade nella regione di accettazione, l ipotesi nulla H 0 non può essere rifiutata. Se la statistica test cade nella regione di rifiuto, l ipotesi nulla H 0 viene rifiutata. Nell esempio considerato, l ipotesi nulla H 0 non è rifiutata. 10. Esprimete la decisione statistica con riferimento a una data situazione. Nell esempio relativo alla produzione di scatole, concludiamo che dal campione non si possono trarre degli elementi di prova sufficienti per affermare che la lunghezza media delle scatole è diversa da 368 mm. Non si rende necessario nessun intervento correttivo.
57 IL P-VALUE NELLA PROCEDURA DECISIONALE In alternativa al considerare le due regioni di accettazione e rifiuto, è possibile prendere la decisione in base al p-value: Il p-value rappresenta la probabilità di osservare un valore della statistica test uguale o più estremo del valore che si calcola a partire dal campione, quando l ipotesi H0 è vera.
58 L approccio del p-value Negli ultimi anni, anche grazie all ampia diffusione di pacchetti statistici e fogli elettronici, si è affermato un altro approccio alla verifica di ipotesi: l approccio del p-value. Il p-value è anche chiamato livello di significatività osservato. Regola decisionale: se il p-value è maggiore o uguale ad a, l ipotesi nulla viene accettata se il p-value è minore di a, l ipotesi nulla è rifiutata
59 Come si utilizza il p-value associato a sn in pratica per decidere tra H0 e H1? Il vantaggio del p value è che non ci serve più andare a consultare le tavole della Normale, della t-student, del Chiquadrato o della F, ecc. per decidere. Tutto quello che dobbiamo fare è confrontare il p-value associato a sn con il livello di significatività α che abbiamo fissato in precedenza
60 L approccio del p-value Esempio: l azienda che produce scatole metalliche intende valutare se il processo produttivo opera in modo tale da garantire che la lunghezza del lato maggiore sia pari a 368 mm. Viene estratto un campione di 25 scatole. Lo scarto quadratico medio della popolazione è pari a 15 mm e la media campionaria assume il valore 372,5 mm. H 0 : = 368 H 1 : 368 Il valore della statistica test è pari a 1,5. La probabilità che Z assuma valori uguali o più estremi di 1,5 coincide con la probabilità che assuma valori maggiori di 1,5 o minori di -1,5 (test a due code). Le due probabilità sono pari a 0,0668 e la loro somma è perciò 0,1336. Tale valore è maggiore di a=0,05 perciò accetto H 0.
61 Statistica Medica Confronto tra due medie
62
63 Campioni appaiati Ad ogni osservazione del primo gruppo corrisponde una osservazione del secondo gruppo (singolo soggetto in due tempi diversi, tipicamente prima e dopo il trattamento). L appaiamento rende il confronto più preciso, eliminando parte della variabilità biologica.
64 Prima: x1 x2 x3..xn Dopo: y1 y2 y3.yn Campioni appaiati Consideriamo le differenze all interno di ciascuna coppia: d1=x1 y1 d2=x2 - y2 dn=xn - yn
65 Campioni appaiati L ipotesi nulla è che la media sia la stessa prima e dopo la terapia. Quindi l ipotesi nulla è che la media delle differenze (d) sia zero!! Calcoliamo la media delle differenze d e la deviazione standard delle differenze s d
66 Campioni appaiati Secondo l ipotesi nulla, la variabile t è distribuita come una t-student con n-1 gradi di libertà t n d s d L ipotesi nulla quindi si potrà accettare con 5% di confidenza se t <1.96. Altrimenti l ipotesi nulla viene rigettata.
67 Campioni appaiati:esempio Prima dopo
68 Campioni appaiati: test unilaterale Supponiamo ora che l ipotesi nulla sia che la media dopo la terapia sia inferiore. Dobbiamo allora fare un test unilaterale sulla media delle differenze. Se t<-1.62 allora si sarebbe verificato un evento che, sotto l ipotesi nulla, ha meno del 5% di probabilità di verificarsi. Se t> accetteremo l ipotesi nulla.
69 Campioni appaiati: esempio Sia la media delle differenze pari a -6.63, e la deviazione standard delle differenze sia 20.29, su n=63 osservazioni. Calcoliamo la t: t=sqrt(63)*(-6.63)/20.29=-2.59 Possiamo rigettare l ipotesi nulla con la confidenza del 5%.
70 Campioni indipendenti Supponiamo di avere due gruppi indipendenti e di voler verificare l ipotesi nulla che la media sia la stessa nelle due popolazioni. Come si implementa il test t- student in questo caso?
71 Campioni indipendenti:varianze uguali Il primo gruppo sia composto da n1 campioni e sia µ1 la media. Il secondo gruppo sia composto da n2 campioni e sia µ2 la media. Supponiamo che la deviazione standard nei due gruppi sia uguale e pari a σ. Ipotesi nulla Ho: µ1 = µ2
72 Campioni indipendenti:varianze uguali t n d s d Sotto Ho: la differenza delle medie è distribuita come una gaussiana con media zero e deviazione standard: 2 s s 2 n 1 n 2
73 Campioni indipendenti:varianze uguali La variabile t in questo caso è: t x 1 2 x 2 s s 2 n 1 n 2
74 Prima popolazione Campioni indipendenti:varianze disuguali Seconda popolazione
75 Varianze disuguali t x x 2 s s 2 2 n 1 n 2
76 Statistica Medica 6. Analisi della varianza
77 One way ANOVA Facciamo un esempio: per lo studio degli effetti dell esposizione a monossido di carbonio in soggetti con patologie coronariche, le distribuzioni del volume espiratorio forzato in un secondo dei pazienti di ciascuno di tre centri medici: John Hopkins University School, Rancho Los Amigos Medical Center, e St. Louis University School in Medicine. Sono tre popolazioni distinte. Vogliamo testare l ipotesi che le medie delle tre popolazioni sono uguali: µ1=µ2=µ3
78 Esempio john Hopkins Rancho Los Amigos sant Louis 3,23 3,22 2,79 3,47 2,88 3,22 1,86 1,71 2,25 2,47 2,89 2,98 3,01 3,77 2,47 1,69 3,29 2,77 2,1 3,39 2,95 2,81 3,86 3,56 3,28 2,64 2,88 3,36 2,71 2,63 2,61 2,71 3,38 2,91 3,41 3,07 1,98 2,87 2,81 2,57 2,61 3,17 2,08 3,39 2,23 2,47 3,17 2,19 2,47 4,06 2,74 1,98 2,88 2,81 2,63 2,85 2,53 2,43 3,2 3,53 n1=21 n2=16 n3=23 x1medio=2,63 litri x2medio=3,03 litri x3medio=2,88 litri s1=0,496 litri s2=0,523 litri s3=0,498 litri
79 One way ANOVA Per testare l ipotesi che le tre medie siano uguali, potrei fare i confronti a due a due,e per ciascuna coppia fare il test t-student. Nel caso N=3 popolazioni devo fare 6 confronti. Nel caso generale può essere un numero proibitivo di coppie. Inoltre questa procedura può condurre ad errori. L ipotesi µ1=µ2=µ3 va testata con un singolo test, l analisi della varianza (ANOVA). Quando c è una sola caratteristica che distingue le varie popolazioni, si parla di one way anova (ad un criterio di classificazione).
80 One way ANOVA Misura della variabilità delle osservazioni rispetto alle medie delle singole osservazioni (stima pooled della varianza comune): ( n1 1) s1 ( n2 1) s2 ( nk 1) s sw n n n k 1 2 k 2 k Varianza campionaria between
81 One way ANOVA Misura della variazione delle medie delle popolazioni rispetto alla media generale: k k k n n x n x n x n x ) ( ) ( ) ( k n x x n x x n x x s k k B Varianza campionaria within
82 One way ANOVA Sotto l ipotesi nulla le due varianze dovrebbero essere simili. Calcoliamo il rapporto, detto F F s s 2 B 2 w
83 One way anova La distribuzione di probabilità di F è nota, sotto l ipotesi nulla, e dipende da k-1 (gradi di libertà del numeratore) e dal numero di dati (n-k=gradi di libertà del denominatore). Questo permette di valutare la probabilità, sotto l ipotesi nulla, che si verifichi un evento almeno estremo come quello che si è verificato, che sarà consistente se tale probabilità sarà maggiore di 0.05.
84 One way ANOVA Torniamo al nostro esempio e calcoliamo la F, otteniamo F= La distribuzione è la F con gradi di libertà 2 e 57. La probabilità che F sia risulta uguale a , quindi non possiamo rifiutare l ipotesi nulla al 5% di confidenza.
85 One way ANOVA Se il risultato dell F test è 1, significa che le medie non sono tutte uguali. A questo punto possiamo cercare le popolazioni che si distinguono dalle altre mediante test specifici che indicano quali tra i gruppi sono differenti. Questo si ottiene con il test di Tukey quando si fanno i confronti multipli.
86
87 ANALISI UNIVARIATE e dati non parametrici 1) raccolta e codifica dei dati (valori osservati) 2) inserimento dei dati in una matrice. 3) definizione ipotesi nulla e ipotesi alternativa 4) calcolo dei ranghi 5) calcolo del valore Wx e zwx 6) si verifica l ipotesi in base alla distribuzione teorica normale 7) si interpretano i risultati IL TEST DI WILCOXON-MANN-WHITNEY
88 VERIFICA DELLE IPOTESI SU DUE CAMPIONI disegni TRA GRUPPI (BETWEEN) (n<30) Se la variabile è misurata su scala Ordinale la statistica più adatta per confrontare due gruppi (due misurazioni indipendenti) è l applicazione del test di Wilcoxon-Mann-Whitney. Questo è uno dei test non parametrici più potenti e rappresenta un alternativa molto valida al test parametrico t.
89 LA VERIFICA DELLE IPOTESI SU DUE CAMPIONI disegni TRA GRUPPI (BETWEEN) (n<30) IL TEST DI WILCOXON-MANN-WHITNEY Mediante questo test, usando come parametro il rango (o la mediana), è possibile verificare se due campioni x e y provengono dalla medesima popolazione. H0= x e y hanno la stessa distribuzione H1= x y x > y x < y
90 Test U di Mann-Whitney Due campioni indipendenti, dati ordinali Il test U di Mann-Whitney dovrebbe essere usato come alternativa non-parametrica ad un test t di Student su campioni indipendenti, se una qualsiasi delle assunzioni necessarie è violata.
91 Test di Wilcoxon Due campioni non indipendenti, dati ordinali Il test di Wilcoxon dovrebbe essere usato come alternativa non-parametrica al t di Student per campioni non indipendenti se una qualsiasi delle assunzioni necessarie per quest ultimo è violata.
92 KRUSKAL-WALLIS Analogo alla ANOVA viene utilizzato incaso di comparazione tra 3 o più gruppi di dati non parametrici
93 Test non parametrici
Inferenza statistica. Statistica medica 1
Inferenza statistica L inferenza statistica è un insieme di metodi con cui si cerca di trarre una conclusione sulla popolazione sulla base di alcune informazioni ricavate da un campione estratto da quella
Dettagli1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:
Esempi di domande risposta multipla (Modulo II) 1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: 1) ha un numero di elementi pari a 5; 2) ha un numero di elementi
DettagliStatistica. Lezione 6
Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 6 a.a 011-01 Dott.ssa Daniela Ferrante
DettagliEsercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione)
Esercitazione #5 di Statistica Test ed Intervalli di Confidenza (per una popolazione) Dicembre 00 1 Esercizi 1.1 Test su media (con varianza nota) Esercizio n. 1 Il calore (in calorie per grammo) emesso
DettagliProbabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)
Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B Eventi indipendenti: un evento non influenza l altro Eventi disgiunti: il verificarsi di un evento esclude l altro Evento prodotto:
DettagliTest statistici di verifica di ipotesi
Test e verifica di ipotesi Test e verifica di ipotesi Il test delle ipotesi consente di verificare se, e quanto, una determinata ipotesi (di carattere biologico, medico, economico,...) è supportata dall
DettagliStatistiche campionarie
Statistiche campionarie Sul campione si possono calcolare le statistiche campionarie (come media campionaria, mediana campionaria, varianza campionaria,.) Le statistiche campionarie sono stimatori delle
DettagliTest d ipotesi. Statistica e biometria. D. Bertacchi. Test d ipotesi
In molte situazioni una raccolta di dati (=esiti di esperimenti aleatori) viene fatta per prendere delle decisioni sulla base di quei dati. Ad esempio sperimentazioni su un nuovo farmaco per decidere se
DettagliVERIFICA DELLE IPOTESI
VERIFICA DELLE IPOTESI Nella verifica delle ipotesi è necessario fissare alcune fasi prima di iniziare ad analizzare i dati. a) Si deve stabilire quale deve essere l'ipotesi nulla (H0) e quale l'ipotesi
DettagliSlide Cerbara parte1 5. Le distribuzioni teoriche
Slide Cerbara parte1 5 Le distribuzioni teoriche I fenomeni biologici, demografici, sociali ed economici, che sono il principale oggetto della statistica, non sono retti da leggi matematiche. Però dalle
DettagliEsercizi test ipotesi. Prof. Raffaella Folgieri Email: folgieri@mtcube.com aa 2009/2010
Esercizi test ipotesi Prof. Raffaella Folgieri Email: folgieri@mtcube.com aa 2009/2010 Verifica delle ipotesi - Esempio quelli di Striscia la Notizia" effettuano controlli casuali per vedere se le pompe
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2014-2015 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliElementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 12-Il t-test per campioni appaiati vers. 1.2 (7 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca
DettagliCorso di. Dott.ssa Donatella Cocca
Corso di Statistica medica e applicata Dott.ssa Donatella Cocca 1 a Lezione Cos'è la statistica? Come in tutta la ricerca scientifica sperimentale, anche nelle scienze mediche e biologiche è indispensabile
DettagliE naturale chiedersi alcune cose sulla media campionaria x n
Supponiamo che un fabbricante stia introducendo un nuovo tipo di batteria per un automobile elettrica. La durata osservata x i delle i-esima batteria è la realizzazione (valore assunto) di una variabile
Dettagli1. Distribuzioni campionarie
Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 2012/2013 lezioni di statistica del 3 e 6 giugno 2013 - di Massimo Cristallo - 1. Distribuzioni campionarie
DettagliAnalisi di dati di frequenza
Analisi di dati di frequenza Fase di raccolta dei dati Fase di memorizzazione dei dati in un foglio elettronico 0 1 1 1 Frequenze attese uguali Si assuma che dalle risposte al questionario sullo stato
DettagliRelazioni tra variabili
Università degli Studi di Padova Facoltà di Medicina e Chirurgia Corso di Laurea in Medicina e Chirurgia - A.A. 009-10 Scuole di specializzazione in: Medicina Legale, Medicina del Lavoro, Igiene e Medicina
DettagliSPC e distribuzione normale con Access
SPC e distribuzione normale con Access In questo articolo esamineremo una applicazione Access per il calcolo e la rappresentazione grafica della distribuzione normale, collegata con tabelle di Clienti,
DettagliIstituzioni di Statistica e Statistica Economica
Istituzioni di Statistica e Statistica Economica Università degli Studi di Perugia Facoltà di Economia, Assisi, a.a. 2013/14 Esercitazione n. 4 A. Si supponga che la durata in giorni delle lampadine prodotte
DettagliUniversità di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008
Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica 18 dicembre 008 Esame sull intero programma: esercizi da A a D Esame sulla seconda parte del programma: esercizi
DettagliLa distribuzione Normale. La distribuzione Normale
La Distribuzione Normale o Gaussiana è la distribuzione più importante ed utilizzata in tutta la statistica La curva delle frequenze della distribuzione Normale ha una forma caratteristica, simile ad una
DettagliLa variabile casuale Binomiale
La variabile casuale Binomiale Si costruisce a partire dalla nozione di esperimento casuale Bernoulliano che consiste in un insieme di prove ripetute con le seguenti caratteristiche: i) ad ogni singola
DettagliL Analisi della Varianza ANOVA (ANalysis Of VAriance)
L Analisi della Varianza ANOVA (ANalysis Of VAriance) 1 CONCETTI GENERALI Finora abbiamo descritto test di ipotesi finalizzati alla verifica di ipotesi sulla differenza tra parametri di due popolazioni
DettagliCapitolo 12 La regressione lineare semplice
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara
DettagliEsercitazione n.2 Inferenza su medie
Esercitazione n.2 Esercizio L ufficio del personale di una grande società intende stimare le spese mediche familiari dei suoi impiegati per valutare la possibilità di attuare un programma di assicurazione
DettagliEsercizio 1. Verifica di ipotesi sulla media (varianza nota), p-value del test
STATISTICA (2) ESERCITAZIONE 6 05.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Verifica di ipotesi sulla media (varianza nota), p-value del test Il preside della scuola elementare XYZ sospetta che
Dettagli3. Confronto tra medie di due campioni indipendenti o appaiati
BIOSTATISTICA 3. Confronto tra medie di due campioni indipendenti o appaiati Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk MARTA BLANGIARDO
DettagliCalcolo delle probabilità
Calcolo delle probabilità Laboratorio di Bioinformatica Corso A aa 2005-2006 Statistica Dai risultati di un esperimento si determinano alcune caratteristiche della popolazione Calcolo delle probabilità
DettagliFacciamo qualche precisazione
Abbiamo introdotto alcuni indici statistici (di posizione, di variabilità e di forma) ottenibili da Excel con la funzione Riepilogo Statistiche Facciamo qualche precisazione Al fine della partecipazione
DettagliTemi di Esame a.a. 2012-2013. Statistica - CLEF
Temi di Esame a.a. 2012-2013 Statistica - CLEF I Prova Parziale di Statistica (CLEF) 11 aprile 2013 Esercizio 1 Un computer è collegato a due stampanti, A e B. La stampante A è difettosa ed il 25% dei
DettagliStima per intervalli Nei metodi di stima puntuale è sempre presente un ^ errore θ θ dovuto al fatto che la stima di θ in genere non coincide con il parametro θ. Sorge quindi l esigenza di determinare una
DettagliCORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Test delle ipotesi sulla varianza In un azienda che produce componenti meccaniche, è stato
DettagliIl concetto di valore medio in generale
Il concetto di valore medio in generale Nella statistica descrittiva si distinguono solitamente due tipi di medie: - le medie analitiche, che soddisfano ad una condizione di invarianza e si calcolano tenendo
DettagliUn po di statistica. Christian Ferrari. Laboratorio di Matematica
Un po di statistica Christian Ferrari Laboratorio di Matematica 1 Introduzione La statistica è una parte della matematica applicata che si occupa della raccolta, dell analisi e dell interpretazione di
DettagliElementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 29-Analisi della potenza statistica vers. 1.0 (12 dicembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca
DettagliSTATISTICA IX lezione
Anno Accademico 013-014 STATISTICA IX lezione 1 Il problema della verifica di un ipotesi statistica In termini generali, si studia la distribuzione T(X) di un opportuna grandezza X legata ai parametri
DettagliPotenza dello studio e dimensione campionaria. Laurea in Medicina e Chirurgia - Statistica medica 1
Potenza dello studio e dimensione campionaria Laurea in Medicina e Chirurgia - Statistica medica 1 Introduzione Nella pianificazione di uno studio clinico randomizzato è fondamentale determinare in modo
Dettagli2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale
BIOSTATISTICA 2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk
DettagliELEMENTI DI STATISTICA
Dipartimento di Ingegneria Meccanica Chimica e dei Materiali PROGETTAZIONE E GESTIONE DEGLI IMPIANTI INDUSTRIALI Esercitazione 6 ORE ELEMENTI DI STATISTICA Prof. Ing. Maria Teresa Pilloni Anno Accademico
DettagliFONDAMENTI DI PSICOMETRIA - 8 CFU
Ψ FONDAMENTI DI PSICOMETRIA - 8 CFU STIMA DELL ATTENDIBILITA STIMA DELL ATTENDIBILITA DEFINIZIONE DI ATTENDIBILITA (affidabilità, fedeltà) Grado di accordo tra diversi tentativi di misurare uno stesso
DettagliCAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI
VERO FALSO CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI 1. V F Un ipotesi statistica è un assunzione sulle caratteristiche di una o più variabili in una o più popolazioni 2. V F L ipotesi nulla unita
DettagliCorso di Psicometria Progredito
Corso di Psicometria Progredito 3.1 Introduzione all inferenza statistica Prima Parte Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014
Dettaglimatematica probabilmente
IS science centre immaginario scientifico Laboratorio dell'immaginario Scientifico - Trieste tel. 040224424 - fax 040224439 - e-mail: lis@lis.trieste.it - www.immaginarioscientifico.it indice Altezze e
DettagliLEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010
LEZIONE 3 "Educare significa aiutare l'animo dell'uomo ad entrare nella totalità della realtà. Non si può però educare se non rivolgendosi alla libertà, la quale definisce il singolo, l'io. Quando uno
DettagliMetodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo
Metodi statistici per l economia (Prof. Capitanio) Slide n. 9 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 TEST D IPOTESI Partiamo da un esempio presente sul libro di testo.
DettagliLa logica statistica della verifica (test) delle ipotesi
La logica statistica della verifica (test) delle ipotesi Come posso confrontare diverse ipotesi? Nella statistica inferenziale classica vengono sempre confrontate due ipotesi: l ipotesi nulla e l ipotesi
DettagliElementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 10-Il test t per un campione e la stima intervallare (vers. 1.1, 25 ottobre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia,
DettagliStatistical Process Control
Statistical Process Control ESERCIZI Esercizio 1. Per la caratteristica di un processo distribuita gaussianamente sono note media e deviazione standard: µ = 100, σ = 0.2. 1a. Calcolare la linea centrale
DettagliIl Controllo Interno di Qualità dalla teoria alla pratica: guida passo per passo IL MODELLO TEORICO. Pasquale Iandolo
Il Controllo Interno di Qualità dalla teoria alla pratica: guida passo per passo IL MODELLO TEORICO Pasquale Iandolo Laboratorio analisi ASL 4 Chiavarese, Lavagna (GE) 42 Congresso Nazionale SIBioC Roma
Dettagli8 Elementi di Statistica
8 Elementi di Statistica La conoscenza di alcuni elementi di statistica e di analisi degli errori è importante quando si vogliano realizzare delle osservazioni sperimentali significative, ed anche per
DettagliUniversità del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Intervalli di confidenza
Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica
DettagliLa distribuzione Gaussiana
Università del Piemonte Orientale Corso di Laurea in Biotecnologie Corso di Statistica Medica La distribuzione Normale (o di Gauss) Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione
DettagliLEZIONE n. 5 (a cura di Antonio Di Marco)
LEZIONE n. 5 (a cura di Antonio Di Marco) IL P-VALUE (α) Data un ipotesi nulla (H 0 ), questa la si può accettare o rifiutare in base al valore del p- value. In genere il suo valore è un numero molto piccolo,
DettagliTeoria delle code. Sistemi stazionari: M/M/1 M/M/1/K M/M/S
Teoria delle code Sistemi stazionari: M/M/1 M/M/1/K M/M/S Fabio Giammarinaro 04/03/2008 Sommario INTRODUZIONE... 3 Formule generali di e... 3 Leggi di Little... 3 Cosa cerchiamo... 3 Legame tra N e le
DettagliCorso di Laurea in Scienze e Tecnologie Biomolecolari. NOME COGNOME N. Matr.
Corso di Laurea in Scienze e Tecnologie Biomolecolari Matematica e Statistica II Prova di esame del 18/7/2013 NOME COGNOME N. Matr. Rispondere ai punti degli esercizi nel modo più completo possibile, cercando
Dettagli11. Analisi statistica degli eventi idrologici estremi
. Analisi statistica degli eventi idrologici estremi I processi idrologici evolvono, nello spazio e nel tempo, secondo modalità che sono in parte predicibili (deterministiche) ed in parte casuali (stocastiche
Dettagliiovanella@disp.uniroma2.it http://www.disp.uniroma2.it/users/iovanella Verifica di ipotesi
iovanella@disp.uniroma2.it http://www.disp.uniroma2.it/users/iovanella Verifica di ipotesi Idea di base Supponiamo di avere un idea del valore (incognito) di una media di un campione, magari attraverso
DettagliCorso integrato di informatica, statistica e analisi dei dati sperimentali Altri esercizi_esercitazione V
Corso integrato di informatica, statistica e analisi dei dati sperimentali Altri esercizi_esercitazione V Sui PC a disposizione sono istallati diversi sistemi operativi. All accensione scegliere Windows.
DettagliIl confronto fra proporzioni
L. Boni Il rapporto Un rapporto (ratio), attribuendo un ampio significato al termine, è il risultato della divisione di una certa quantità a per un altra quantità b Il rapporto Spesso, in maniera più specifica,
DettagliElementi di Psicometria
Elementi di Psicometria E2-Riepilogo finale vers. 1.2 Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2010-2011 G. Rossi (Dip. Psicologia) ElemPsico 2010-2011
DettagliPROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE
Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) PROBABILITÀ -
DettagliSTATISTICA INFERENZIALE
STATISTICA INFERENZIALE Premessa importante: si ipotizza che il comportamento della popolazione rispetto ad una variabile casuale X viene descritto attraverso una funzione parametrica di probabilità p
DettagliESERCIZI DI STATISTICA DESCRITTIVA
ESERCIZI DI STATISTICA DESCRITTIVA ES1 Data la seguente serie di dati su Sesso e Altezza di 8 pazienti, riempire opportunamente due tabelle per rappresentare le distribuzioni di frequenze dei due caratteri,
DettagliEsercitazione n.4 Inferenza su varianza
Esercizio 1 Un industria che produce lamiere metalliche ha ricevuto un ordine di acquisto di un grosso quantitativo di lamiere di un dato spessore. Per assicurare la qualità della propria fornitura, l
DettagliProva di autovalutazione Prof. Roberta Siciliano
Prova di autovalutazione Prof. Roberta Siciliano Esercizio 1 Nella seguente tabella è riportata la distribuzione di frequenza dei prezzi per camera di alcuni agriturismi, situati nella regione Basilicata.
DettagliFacoltà di Psicologia Università di Padova Anno Accademico 2010-2011
Facoltà di Psicologia Università di Padova Anno Accademico 010-011 Corso di Psicometria - Modulo B Dott. Marco Vicentini marco.vicentini@unipd.it Rev. 10/01/011 La distribuzione F di Fisher - Snedecor
DettagliTasso di interesse e capitalizzazione
Tasso di interesse e capitalizzazione Tasso di interesse = i = somma che devo restituire dopo un anno per aver preso a prestito un euro, in aggiunta alla restituzione dell euro iniziale Quindi: prendo
Dettagli= variazione diviso valore iniziale, il tutto moltiplicato per 100. \ Esempio: PIL del 2000 = 500; PIL del 2001 = 520:
Fig. 10.bis.1 Variazioni percentuali Variazione percentuale di x dalla data zero alla data uno: x1 x 0 %x = 100% x 0 = variazione diviso valore iniziale, il tutto moltiplicato per 100. \ Esempio: PIL del
DettagliL analisi dei rischi: l aspetto statistico Ing. Pier Giorgio DELLA ROLE Six Sigma Master Black Belt
L analisi dei rischi: l aspetto statistico Ing. Pier Giorgio DELL ROLE Six Sigma Master lack elt Dicembre, 009 Introduzione Nell esecuzione dei progetti Six Sigma è di fondamentale importanza sapere se
DettagliStatistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità C
Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità C Cognome Nome: Part time: Numero di matricola: Diurno: ISTRUZIONI: Il punteggio relativo alla prima parte dell esame viene calcolato
DettagliStatistica e biometria. D. Bertacchi. Variabili aleatorie. V.a. discrete e continue. La densità di una v.a. discreta. Esempi.
Iniziamo con definizione (capiremo fra poco la sua utilità): DEFINIZIONE DI VARIABILE ALEATORIA Una variabile aleatoria (in breve v.a.) X è funzione che ha come dominio Ω e come codominio R. In formule:
DettagliEsame di Statistica del 17 luglio 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova).
Esame di Statistica del 17 luglio 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola Es. 1 Es. 2 Es. 3 Es. 4 Somma Voto finale Attenzione: si consegnano
DettagliInferenza statistica I Alcuni esercizi. Stefano Tonellato
Inferenza statistica I Alcuni esercizi Stefano Tonellato Anno Accademico 2006-2007 Avvertenza Una parte del materiale è stato tratto da Grigoletto M. e Ventura L. (1998). Statistica per le scienze economiche,
Dettaglif(x) = 1 x. Il dominio di questa funzione è il sottoinsieme proprio di R dato da
Data una funzione reale f di variabile reale x, definita su un sottoinsieme proprio D f di R (con questo voglio dire che il dominio di f è un sottoinsieme di R che non coincide con tutto R), ci si chiede
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2013-2014 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
Dettagli~ Copyright Ripetizionando - All rights reserved ~ http://ripetizionando.wordpress.com STUDIO DI FUNZIONE
STUDIO DI FUNZIONE Passaggi fondamentali Per effettuare uno studio di funzione completo, che non lascia quindi margine a una quasi sicuramente errata inventiva, sono necessari i seguenti 7 passaggi: 1.
DettagliEdited by Foxit PDF Editor Copyright (c) by Foxit Software Company, 2004 For Evaluation Only.
In un mercato del lavoro competitivo esistono due tipi di lavoratori, quelli con alta produttività L A, che producono per 30 $ l'ora, e quelli con bassa produttività, L B, che producono per 5 $ l'ora.
DettagliSTATISTICA INFERENZIALE PER VARIABILI QUALITATIVE
STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE La presentazione dei dati per molte ricerche mediche fa comunemente riferimento a frequenze, assolute o percentuali. Osservazioni cliniche conducono sovente
DettagliProbabilità discreta
Probabilità discreta Daniele A. Gewurz 1 Che probabilità c è che succeda...? Una delle applicazioni della combinatoria è nel calcolo di probabilità discrete. Quando abbiamo a che fare con un fenomeno che
DettagliDistribuzioni discrete
Distribuzioni discrete Esercitazione 4 novembre 003 Distribuzione binomiale Si fa un esperimento (o prova): può manifestarsi un certo evento A con probabilità p oppure no (con probabilità q = p). La distribuzione
DettagliLineamenti di econometria 2
Lineamenti di econometria 2 Camilla Mastromarco Università di Lecce Master II Livello "Analisi dei Mercati e Sviluppo Locale" (PIT 9.4) Aspetti Statistici della Regressione Aspetti Statistici della Regressione
DettagliCarte di controllo per attributi
Carte di controllo per attributi Il controllo per variabili non sempre è effettuabile misurazioni troppo difficili o costose troppe variabili che definiscono qualità di un prodotto le caratteristiche dei
DettagliANALISI DELLE FREQUENZE: IL TEST CHI 2
ANALISI DELLE FREQUENZE: IL TEST CHI 2 Quando si hanno scale nominali o ordinali, non è possibile calcolare il t, poiché non abbiamo medie, ma solo frequenze. In questi casi, per verificare se un evento
DettagliStatistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice
Esercitazione 15 Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () 1 / 18 L importanza del gruppo di controllo In tutti i casi in cui si voglia studiare l effetto di un certo
DettagliUn gioco con tre dadi
Un gioco con tre dadi Livello scolare: biennio Abilità interessate Costruire lo spazio degli eventi in casi semplici e determinarne la cardinalità. Valutare la probabilità in diversi contesti problematici.
DettagliEsercitazione n.1 (v.c. Binomiale, Poisson, Normale)
Esercizio 1. Un azienda produce palline da tennis che hanno probabilità 0,02 di essere difettose, indipendentemente l una dall altra. La confezione di vendita contiene 8 palline prese a caso dalla produzione
DettagliUniversità degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI
Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI 1. L azienda Wood produce legno compensato per costruzioni
DettagliServizi di consulenza specialistica per IGRUE 2009 2012
Allegato 9A Metodo della stima delle differenze Descrizione della procedura Il metodo della stima delle differenze è indicato qualora il controllore ritenga che la popolazione sia affetta da un tasso di
DettagliLezione n. 2 (a cura di Chiara Rossi)
Lezione n. 2 (a cura di Chiara Rossi) QUANTILE Data una variabile casuale X, si definisce Quantile superiore x p : X P (X x p ) = p Quantile inferiore x p : X P (X x p ) = p p p=0.05 x p x p Graficamente,
DettagliTest non parametrici. Test non parametrici. Test non parametrici. Test non parametrici
Test non parametrici Test non parametrici Il test T di Student per uno o per due campioni, il test F di Fisher per l'analisi della varianza, la correlazione, la regressione, insieme ad altri test di statistica
DettagliI ESERCITAZIONE. Gruppo I 100 individui. Trattamento I Nuovo Farmaco. Osservazione degli effetti sul raffreddore. Assegnazione casuale
I ESERCITAZIONE ESERCIZIO 1 Si vuole testare un nuovo farmaco contro il raffreddore. Allo studio partecipano 200 soggetti sani della stessa età e dello stesso sesso e con caratteristiche simili. i) Che
DettagliOSSERVAZIONI TEORICHE Lezione n. 4
OSSERVAZIONI TEORICHE Lezione n. 4 Finalità: Sistematizzare concetti e definizioni. Verificare l apprendimento. Metodo: Lettura delle OSSERVAZIONI e risoluzione della scheda di verifica delle conoscenze
DettagliStatistica inferenziale
Statistica inferenziale Popolazione e campione Molto spesso siamo interessati a trarre delle conclusioni su persone che hanno determinate caratteristiche (pazienti, atleti, bambini, gestanti, ) Osserveremo
Dettagli19txtI_BORRA_2013 18/11/13 10:52 Pagina 449 TAVOLE STATISTICHE
19txtI_BORRA_2013 18/11/13 10:52 Pagina 449 TAVOLE STATISTICHE Nell inferenza è spesso richiesto il calcolo di alcuni valori critici o di alcune probabilità per le variabili casuali che sono state introdotte
DettagliEsercizi di Calcolo delle Probabilita (I)
Esercizi di Calcolo delle Probabilita (I) 1. Si supponga di avere un urna con 15 palline di cui 5 rosse, 8 bianche e 2 nere. Immaginando di estrarre due palline con reimmissione, si dica con quale probabilità:
DettagliLA CORRELAZIONE LINEARE
LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad esempio, si può supporre che vi sia una relazione tra l insoddisfazione
DettagliIndici (Statistiche) che esprimono le caratteristiche di simmetria e
Indici di sintesi Indici (Statistiche) Gran parte della analisi statistica consiste nel condensare complessi pattern di osservazioni in un indicatore che sia capace di riassumere una specifica caratteristica
DettagliSi considerino gli eventi A = nessuno studente ha superato l esame e B = nessuno studente maschio ha superato l esame. Allora A c B è uguale a:
TEST DI AUTOVALUTAZIONE - SETTIMANA 2 I diritti d autore sono riservati. Ogni sfruttamento commerciale non autorizzato sarà perseguito. Metodi statistici per la biologia 1 Parte A 1.1 Si considerino gli
DettagliPRODUZIONE DI LENTI A CONTATTO
1 PRODUZIONE DI LENTI A CONTATTO Per monitorare il processo di produzione di un determinato tipo di lenti a contatto viene misurato, ad intervalli di tempo regolari di h 15 minuti, il diametro X (in mm)
Dettagli