LEZIONI DI STATISTCA APPLICATA. Parte 2. Statistica inferenziale. Variabili continue per categoriali. Alessandro Valbonesi

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "LEZIONI DI STATISTCA APPLICATA. Parte 2. Statistica inferenziale. Variabili continue per categoriali. Alessandro Valbonesi"

Transcript

1 LEZIONI DI STATISTCA APPLICATA Parte 2 Statistica inferenziale Variabili continue per categoriali Alessandro Valbonesi SARRF di Scienze ambientali Anno accademico

2 CAPITOLO 4 - TEST STATISTICI CHE COINVOLGONO VARIABILI CONTINUE PER CATEGORIALI - Nei test statistici che coinvolgono variabili continue per categoriali, la variabile continua, che può essere anche discreta, rappresenta le misurazioni (o i conteggi, nel caso di variabile discreta) eseguite sui soggetti 1, mentre quella categoriale rappresenta la variabile di raggruppamento perché indica il criterio che ci ha consentito di dividere le osservazioni in due o più distinte categorie. I test più usati sono il t-test, detto anche t-di Student, che si basa sul confronto tra medie, e l F di Fisher che si basa sul confronto tra varianze, per cui si parla di analisi della varianza (in inglese abbreviato con l acronimo ANOVA, analysis of variance). Il primo è limitato al solo confronto tra due medie, oppure tra il valore di una osservazione (un dato) ed una media (ottenuta da più dati). Il secondo test è una derivazione del primo, anche dal punto di vista algebrico dato che t 2 = F ma non è limitato al confronto tra due gruppi per cui è quello maggiormente più usato. Entrambi i test, essendo dei test parametrici ovvero basati su dei parametri (media, varianza) di popolazione hanno comunque dei presupposti che devono essere soddisfatti, se ciò no avviene bisogna ricorre a test non parametrici. Abbiamo già detto che quando si esegue un test inferenziale occorre formulare un ipotesi iniziale e l ipotesi più semplice è l ipotesi zero, ovvero che le due medie ottenute dai due gruppi di dati, siano statisticamente uguali in quanto rappresentano la stima di un'unica popolazione, H 0 : x 1 = x 2 = 0. L aggettivo statisticamente sta ad indicare che le medie non saranno mai matematicamente uguali a causa di un errore statistico dovuto alla variabilità intrinseca dei componenti dei due gruppi. Pertanto, quello che dobbiamo verificare è se questa differenza sia dovuta solo alla componente stocastica (casuale) oppure alla variabile di raggruppamento, ciò al fatto che le medie sono state ottenute a partire da due categorie distinte e quindi sono stime di due popolazioni differenti, H 1 : ( x 1 = 1 ) ( x 2 = 2 ) INFERENZA SU UNA O DUE MEDIE CON IL TEST t DI STUDENT Questo test si basa su una estensione del teorema centrale: le differenze delle medie dalla media parametrica (Y - ), come pure la relativa standardizzazione ([ x - ), è una curva simmetrica. La nuova distribuzione di probabilità è più ampia della corrispondente distribuzione normale standardizzata, in quanto il denominatore è l errore standard delle medie campionarie invece che l errore standard parametrico (della popolazione), per cui sarà a volte più piccolo, a volte più grande rispetto al valore atteso. Questa distribuzione di probabilità è quella studiata da Gosset (conosciuto sotto lo pseudonimo di Student): t = media del campione - media della popolazione = errore standard del campione 1 In inglese si usa il termine generico items (elementi di un gruppo) 50

3 Quando si considerano due medie campionare 2, ottenute da campioni aventi la stessa numerosità (n), la precedente formula può essere scritta nel seguente modo 3 : Nel caso che i campioni abbiano numerosità diverse la formula diventa: ( Y1 Y2 ) ( 1 2 ) t s = 2 2 s1 s2 n n 1 2 Si noti che al denominare c è l errore standard delle medie (es = s 2 = s/ n ) e che quando si n voglia testare H 0, il secondo membro del numeratore diventa uguale a 0 in quanto indicano la stessa media parametrica: 1 = 2. E' condizione di validità della distribuzione t di Student, e quindi dei test che la utilizzano, che: - la distribuzione dei dati sia normale; - le varianze siano omogenee; - le osservazioni siano raccolte in modo indipendente. Rispetto alla condizione di normalità la distribuzione t è robusta. Con tale termine tecnico si intende affermare che rimane approssimativamente valida, anche quando le distribuzioni di dati non rispettano esattamente la condizione dalla normalità. La seconda condizione è vincolante, per cui se non è soddisfatta bisogna cercare di ovviare operando una trasformazione dei dati e nel caso che non si riesca ad ottenere varianze omogenee con questo artefatto bisognerà ricorrere a test non parametrici. I test che verificano l omogeneità della varianza saranno illustrati successivamente quando si illustrerà l F-test. La terza condizione dipende dalla modalità di organizzazione della raccolta dei dati. Ad esempio, le osservazioni non sono indipendenti se entro un gruppo di persone delle quali si misura il peso esistono più fratelli; se, in un esperimento sulla conducibilità elettrica di un metallo a temperature diverse, si utilizzano campioni di metallo diversi ma un campione è misurato più volte. Nella statistica applicata, il test t è utilizzato in quattro casi, cioè per il confronto tra: 1 - la media di un campione e la media parametrica o una generica media attesa; 2 un singolo dato e la media di un campione, per verificare se possono appartenere alla stessa popolazione; 3 - la media delle differenze di due campioni dipendenti; 4 - le medie di due campioni indipendenti. In ognuno di questi casi si ottiene un valore di t la cui significatività, ovvero la probabilità di ottenere quel valore nel caso H 0 sia vera, può essere ottenuta consultando i valori critici riportati sulle tavole della distribuzione di t. - Nel test ad una coda, la zona di rifiuto è solamente da una parte della distribuzione (a sinistra quando il segno è negativo, a destra quando è positivo), in questo caso il ricercatore si chiede se una media è maggiore dell'altra, escludendo a priori che essa possa essere minore, o viceversa. Per esempio se si vuole controllare l effetto di una dieta dimagrante è ovvio che ci aspettiamo che i pesi 2 Dato che le formule sono state spesso scannerizzate da testi differenti si possono trovare simboli discordanti. Un esempio è la media campionaria che qui figura simbolizzata con Y mentre in quella precedente con x. L autore si scusa per questo inconveniente! 3 In molti testi viene riportata una formula apparentemente più complessa ma sostanzialmente uguale a quella riportata in queste dispense. 51

4 delle persone, registrati dopo la dieta, siano diminuiti rispetto ai valori iniziali e che questa diminuzione sia imputabile alla dieta H 1 e non al caso H 0 ; quindi l ipotesi alternativa è H 1 : x i > x f - nel test a due code, la zona di rifiuto è simmetricamente distribuita dalle due parti e vi si ricorre quando non si ha alcuna idea sui possibili risultati, ovvero il ricercatore si chiede se tra le due medie esista una differenza significativa, senza che egli abbia indicazioni su quali sia la maggiore o la minore. E' maggiore la probabilità di dimostrare l'esistenza di una differenza significativa mediante un test ad una coda che con un test a due code. Con un termine tecnico, si dice che il test a due code è più conservativo, mentre quello ad una coda è più potente. Test per la differenza appaiata al livello di significatività ( = 0,05) del 5% con 10 gdl: Test unilaterale Test bilaterale Abitualmente nei testi di statistica sono riportate due differenti tabelle di valori critici della distribuzione t : quella per test unilaterali e quella per test bilaterali. In queste tabelle, la parte superiore di ogni colonna indica l'area sottesa dalle rispettive code della distribuzione, mentre le righe (v) si riferiscono ai gdl. I valori critici per l'area in una coda al rischio coincidono con quelli del rischio 2 nella distribuzione a due code (per esempio, i valori per =0,05 coincidono con la colonna di = 0,1 nella tabella per test a due code) 4 Test valore critico per 10 gdl Unilaterale 0,05 1,8125 bilaterale 0,05 (somma di =0,025 nelle due code) 2,228 Vediamo ora alcuni esempi relativi ai quattro casi di confronti in cui è possibile applicare il t-test. 4 Se abbiamo invece una tabella con i valori critici di t per test ad una coda, i valori critici per test a due code coincidono con quelli di /2 52

5 1 - La media di un campione e una generica media attesa. Disponendo di un campione di 13 individui di Heterocypris incongruens pescati in un fiume, dei quali sono riportate le lunghezze (in mm), si vuole verificare se alla probabilità P = 0.99 la loro lunghezza media è significativamente differente dalla media di 1,25 mm stimata per la stessa specie nei laghi della regione, in varie ricerche precedenti. Dai 13 dati campionari, devono essere calcolati il valore della media e della deviazione standard: X = 1,235; s (deviazione standard) = 0,059; n = 13 2 La domanda dell esempio richiede un test a due code o bilaterale, poiché prima della raccolta dei dati è ugualmente logico che la media del campione abbia un valore sia significativamente minore sia maggiore della media attesa. Alla probabilità α = 0.01 per un test bilaterale con 12 gdl il valore critico riportato è uguale a 3,055. Il valore assoluto di t calcolato (0,900) è nettamente inferiore a quello critico sinottica; di conseguenza, non si è in grado di rifiutare l ipotesi nulla e quindi si può affermare che la dimensione media dei 13 individui della specie Heterocypris incongruens pescati nel fiume non è significativamente diversa da quella degli individui della stessa specie che vivono nei laghi della regione. Oltre che fornire una risposta mediante l applicazione del test t per un campione, è possibile avere anche una risposta attraverso la stima dell intervallo di confidenza della media campionaria, che come abbiamo visto utilizza i valori di t = 1,235 ± 3,055* = 1,235 ± I limiti inferiori e superiori dell intervallo di confidenza risultano rispettivamente 1,186 e 1,285. La media della popolazione μ 0 uguale a 1,25 è compresa nell intervallo fiduciale della media campionaria. Pertanto, otteniamo un risultato analogo a quello di un t-test bilaterale. Se fosse stata rifiutata l ipotesi nulla, il valore atteso (ovvero quello della popolazione degli altri laghi) risulterebbe escluso dall intervallo fiduciale calcolato. 53

6 2 Un singolo dato e la media di un campione Nelle rilevazioni in natura ed in laboratorio, sovente sorge il problema che una certa misura possa essere errata, rispetto alle altre del campione raccolto. Le cause possono essere le più diverse: l imperizia del nuovo rilevatore rispetto all esperto che ha raccolto gli altri dati, il funzionamento non corretto dello strumento, una condizione ambientale differente, il materiale o i reagenti di qualità diversa, una procedura nuova o applicata in modo non corretto. In altri casi, come in tassonomia, sorge il problema di verificare se l individuo che si sta analizzando possa essere di un altra popolazione rispetto alle unità già raccolte. La verifica a questi sospetti, che può essere condotta con un test unilaterale o bilaterale secondo le ipotesi formulate, è fatta mediante un test t la cui formula risulta essere: dove X 1 = singola rilevazione da verificare; X A = media del campione A; S 2 A = varianza del campione A; n A = numero di osservazioni del campione A. ESEMPIO. Si vuole verificare se una misura (49,7) può essere ritenuta diversa dalle 6 del campione raccolto (40,3-38,8-33,5-38,6-31,9-37,6). Risposta. La media del campione è uguale a 36,783 e la varianza risulta uguale a 11,006. Da essi deriva 11,006 11,006 3,583 3,60 i valori critici di t con 6-1 gdl, per un test a una coda 5, sono: - 2,015 alla probabilità α = 0,05; - 3,365 alla probabilità α = 0,01 In questo caso si sono considerati i valori critici per un test ad una coda in quanto il dato che vogliamo testare è maggiore della media campionaria per cui c è solo una possibilità da verificare, ovvero se questo valore è abbastanza grande per non poterlo considerare appartenente ai valori del campione. In questo caso posiamo rifiutare H 0 (il valore di t è risultato superiore ad entrambi i valori critici) con una probabilità di sbagliare (errore di tipo I, ovvero rigetto di un H 0 vero) di 0,01. 5 Se abbiamo valori di t tabulati per test a due code occorre consultare i valori di che lasciano 0,05 e 0,01 su una coda, ovvero vedere i valori di 2 (0,1 e 0,02). 54

7 3 - La media delle differenze di due campioni dipendenti (dati appaiati); Le caratteristiche distintive di questo test sono: poter accoppiare ogni osservazione di un campione con una e una sola osservazione dell'altro campione; necessariamente i due gruppi hanno sempre lo stesso numero di dati. Scopo principale dell appaiamento dei dati: - creare il massimo di omogeneità entro ogni coppia - creare il massimo di eterogeneità tra le coppie Situazione A : auto-accoppiamento (dati auto-appaiati) ogni soggetto serve come controllo di se stesso e i dati vengono ricavati dagli stessi individui in momenti diversi. Per esempio i confronti prima-e-dopo riferiti agli stessi individui: - confronto tra i livelli di pressione rilevati nello stesso gruppo di individui sia in condizioni normali che dopo uno stress; - confronto tra trattamento e controllo sugli stessi individui. Stuazione B : osservazioni naturalmente appaiate non sono ottenute dagli stessi individui, ma da coppie di individui scelti appositamente. Per esempio: - misure rilevate in coppie di animali tratti dalla stessa nidiata e sottoposti a situazioni ambientali differenti; - confronto tra il comportamento materno e paterno nella cura alla prole, quando si dispone di dati relativi a coppie. Il confronto tra trattamento e controllo sugli stessi individui o tra situazioni simili si propone di eliminare alcune sorgenti di variabilità che potrebbero nascondere le reali differenze tra le due serie di misure: esaminare le differenze fra due misurazioni riduce l'effetto della variabilità intrinseca degli individui. ESEMPIO. Si vuole verificare se un conservante per alimentazione umana abbia effetti sui fattori di crescita. A questo scopo, un gruppo di 10 cavie adulte è stato sottoposto a un regime di alimentazione contenente la sostanza da testare. Ogni soggetto è stato pesato sia prima che dopo la nuova dieta, per misurarne le variazioni. Nella tabella sottostante sono riportati i pesi in grammi prima e dopo la dieta, per ognuna delle 10 cavie: devianza della differenza medie 168,2 177, 2 9 (l ordine dei due membri della differenza D, non ha importanza. La differenza potrà pertanto risultare o positiva o negativa e di conseguenza anche il valore di t trovato, che andrà comunque considerato in valore assoluto per confrontarlo con i valori tabulari ) 55

8 Si vuole sapere: 1 - Se la sostanza può essere la causa di variazioni significative di peso. 2 - Quale è la reale variazione (δ) di peso determinata dal conservante, alla probabilità α = Risposta 1. bisogna applicare un t-test per dati appaiati, bilaterale (non sappiamo a priori quale sarà l effetto), in cui (come sempre) H 0 : x 1 = x 2 = 0. In questo caso possiamo anche dire che: - l ipotesi nulla H 0 afferma che la media reale (δ) delle singole differenze (D) è H 0 : δ= 0 - mentre l ipotesi alternativa H 1 afferma che H 1 : δ# 0. Risulta pertanto che nell applicare la formula generale è indifferente considerare la differenza delle due medie (168,2 177,2 = 9) o la media delle singole differenze ( d = 9). Nel caso di dati appaiati cambia invece il denominatore che in questo caso è l errore standard della differenza tra le medie, per cui la formula per il calcolo di t risulta : d t = SE diff Svolgendo i calcoli abbiamo che: la somma delle (d - d ) 2, cioè la devianza delle differenze, risulta uguale a 676, la deviazione standard (sd) il numero di coppie di osservazioni (n) o di differenze sulle quali sono stati effettuati i calcoli, n = 10 Il valore di t con 9 gdl è uguale a 3,28. Per un test a due code, il valore critico della distribuzione t per 9 gdl e δ= 0,05 è uguale a 2,262. Il valore calcolato (3,28) è superiore al valore critico: la probabilità P che la differenza riscontrata sia dovuta al caso è minore di 0,05, per cui si rifiuta l'ipotesi nulla H 0 e si accetta l'ipotesi alternativa H 1 : la nuova dieta determina nelle cavie una differenza ponderale che è significativa. Risposta 2. Il valore reale (δ) della differenza è ottenuto mediante la stima dell'intervallo fiduciale della differenza media, che per due campioni dipendenti è dato da Con i dati dell'esercizio, per la probabilità α= 0.05, alla quale corrisponde un valore con t in entrambe le code o t 0.05 bilaterale uguale a 2,262 si ottiene: 2,262* 2,741 = 6,199 dalla quale risulta un intervallo L s = 15,199 e L i = 2,801. Si può osservare che il valore di d espresso nell'ipotesi nulla (Η 0 :δ = 0) è escluso dall'intervallo fiduciale calcolato; quindi si discosta dal valore medio sperimentale in modo significativo alla probabilità prescelta. In un test a due code, alla medesima probabilità con cui nel test t per dati appaiati la differenza media risulta significativa, il valore dell'ipotesi nulla è escluso 56

9 dall'intervallo fiduciale. Per quanto riguarda la significatività, i due approcci forniscono la medesima informazione le medie di due campioni indipendenti. La caratteristica distintiva di questo test è che le osservazioni di un campione sono completamente indipendenti da quelle dell altro campione e gli elementi che compongono i due gruppi sono stati assegnati casualmente ad uno o all altro dei due gruppi. In molti casi, non è tecnicamente possibile formare due campioni dipendenti. Spesso non è possibile misurare gli effetti di due differenti trattamenti sugli stessi individui: è il caso in cui si confrontano misure di accrescimento somatico in animali o piante sottoposte a condizioni ambientali differenti oppure si confrontano livelli d inquinamento idrico tra due fiumi differenti con rilevazioni in varie stazioni. Altre volte, non è possibile nemmeno fare appaiamenti naturali o artificiali, perché le situazioni non si ripetono a coppie nelle medesime condizioni e la dose di soggettività è ritenuta eccessiva. L'unica possibile strategia di analisi dei dati è quella di confrontare due campioni indipendenti, due campioni formati da individui differenti. Aumenta la variabilità tra i due gruppi: nel caso di cavie, in uno possono essere presenti più maschi o più femmine, più individui anziani o più giovani, più sani o ammalati, per cui la variabilità delle risposte aumenta. Ma si ottengono due vantaggi: - poter utilizzare un numero differente di osservazioni, - avere dati che più facilmente sono espressione della variabilità casuale, - utilizzare per il confronto con il proprio un campione raccolto da altri. Con il test di significatività per due campioni indipendenti, viene verificata la stessa ipotesi del caso di dati appaiati, seppure espressa in forma diversa. E' fondamentale comprendere che: - per due campioni dipendenti i calcoli vengono effettuati sulla sola colonna delle differenze; - nel caso di due campioni indipendenti i calcoli vengono effettuati sulle due serie di osservazioni. In un test a due code o bilaterale, l'ipotesi nulla H 0 è che i due campioni (indicati con A e B) siano estratti dalla stessa popolazione oppure da due popolazioni differenti ma con media (µ) uguale; essa può essere scritta come H 0 : µ A = µ B oppure H 0 : µ A - µ B = 0 e la sua ipotesi alternativa H 1 come H 1 : µ A # µ B oppure H1: µa - µb # 0 In un test ad una coda o unilaterale si possono avere due impostazioni alternative: -H 1 : µa > µb oppure H 1 : µa - µb > 0 - H 1 : µa < µb oppure H 1 : µa - µb < 0 Nel caso di 2 campioni indipendenti, i gradi di libertà del t sono uguali a (n A 1) + (n B -1), che possono anche essere scritti come (n A + n B - 2) oppure (N-2). Il valore del t è ottenuto mediante la formula generale riportata all inizio di questo paragrafo ( Y1 Y2 ) ( 1 2 ) t s = 2 2 s1 s2 n n Nel caso di test ad una coda occorre tenere presente che questo è meno conservativo per cui, dato che l intervallo fiduciale è sempre bilaterale, si possono avere risultati discordanti tra i due approcci. 57

10 e nel caso che le numerosità siano uguali diventa: Vediamo ora di fare questa analisi considerando i dati precedenti ma ottenuti da un altra situazione in cui i dati non siano appaiati ma indipendenti. Si vuole sempre verificare se un conservante per alimentazione umana abbia effetti sui fattori di crescita. A questo scopo, un gruppo di 20 cavie adulte è stato suddiviso casualmente in due gruppi da 10 individui ciascuno (ogni individuo deve avere la stessa probabilità di essere inserito nell uno o nell altro gruppo). Un gruppo è stato sottoposto a un regime di alimentazione contenente la sostanza da testare l altro funziona da controllo e quindi non assume la sostanza. Ogni soggetto è stato pesato sia prima che l inizio dell esperimento, per misurarne le variazioni ponderali. Nella tabella è quindi riportata la variazione in peso (grammi) osservata tra l inizio e la fine dell esperimento, per ognuna delle 10 cavie dei due gruppi e l intestazione dei due gruppi va quindi letta come: gruppo controllo (e non prima) e gruppo trattato (e non dopo). Si vuole sapere se la sostanza può essere la causa di variazioni significative di peso. Risposta. Bisogna applicare un t-test per dati indipendenti, bilaterale (non sappiamo a priori quale sarà l effetto), in cui (come sempre) H 0 : x 1 = x 2 = 0. Le medie sono sempre 168,2 per il gruppo controllo e 177, 2 per il gruppo trattato, per cui la differenza è sempre 9. Questa volta però il t test viene fatto sulle medie e non sulla differenza delle osservazioni per cui: 9 t = = 2,00 1 *(130,62 71,73) 10 Risulta pertanto che t = 2,00 (mentre con i dati appaiati risultava essere 3,28) ed il valore critico, alla stessa probabilità α= 0,05, risulta essere 2,101, perché i gdl sono 18 (mentre con i dati appaiati risultava essere 2,262 perché i gdl erano pari al numero dei confronti 1, ovvero 9). Il valore calcolato (2,00) è inferiore al valore critico: la probabilità P che la differenza riscontrata sia dovuta al caso è superiore di 0,05, per cui si accetta l'ipotesi nulla H 0 e si rifiuta l'ipotesi alternativa H 1 : la nuova dieta non determina nelle cavie una differenza ponderale significativa. Stessi dati risultati diversi! Nei dati appaiati una differenza di 9 gr. tra i due gruppi era sufficiente ad individuare un effetto della sostanza testata su peso delle cavie mentre la stessa differenza non lo è nel caso di dati indipendenti. La cosa potrebbe sembrare strana ma se ci ragioniamo risulta chiaro che nel primo caso, trattandosi degli stessi individui monitorati prima e dopo la somministrazione della sostanza, la differenza osservata era verosimilmente imputabile alla sola sostanza, mentre nel secondo caso i due gruppi sono costituiti da cavie differenti per cui ci possono essere differenze imputabili ad altri fattori. L eterogeneità dei due gruppi misurata come varianza dentro i gruppi (s s 2 2 ) risulta essere maggiore per cui il test è più conservativo, ovvero tende ad essere maggiormente protettivo verso un errore di tipo I (rigetto di un H 0 vera). Vedremo in seguito come per questo tipo di confronti si preferisca fare il test di Fisher, F-test. In effetti non c è nessuna differenza tra questi due test (abbiamo già accennato all equivalenza matematica. F = t 2 ) quando ci riferiamo a confronti fra due gruppi. Il test di Fisher ha il vantaggio che può essere esteso a confronti maggiori di due gruppi (il t test no) ed in più si possono usare più variabili di raggruppamento (test multifattoriale). Per esempio se abbiamo il sospetto che una determinata sostanza possa avere un effetto diverso a seconda dell età degli animali, possiamo suddividere i due gruppi, controllo e trattamento, in altri sottogruppi (età, sesso, condizioni fisiologiche e patologiche, 58

11 ecc..) per cui possiamo scorporare le varie fonti di variazione al fine di risalire alla valutazione del reale effetto prodotto dalla sostanza in esame. Deve pertanto risultare chiaro che Il modello statistico, ovvero i test statistici devono essere già programmati nella fase iniziale del disegno sperimentale, poiché è da essi che dipende il tipo di campionamento. Ritorniamo ora all esempio pratico e vediamo come, anche in questo, caso è possibile calcolare l intervallo di confidenza, IC = x ± t (, v) *es delle due medie campionarie e con esso si può conoscere l intervallo entro il quale è collocato il valore reale delle due popolazioni alla probabilità α=0,05 e gdl = 9. Per il gruppo di controllo: 95% IC = 168,2 ± 2,262* intervallo L s = 176,4 e L i = 160,0. Per il gruppo di trattati: 95% IC = 177,2 ± 2,262* intervallo L s = 183,3 e L i = 171,1. 130, ,73 10 = 168,2 ± 8,176 dalla quale risulta un = 177,2 ± 6,059 dalla quale risulta un I questo caso dato che i due intervalli fiduciali si sovrappongono parzialmente non possiamo escludere che la vera media dei due gruppi sia identica e quindi accettiamo H 0 I t-test possono essere eseguiti con excel selezionando dal menù strumenti l opzione Analisi dati ed il tipo di test che si vuole eseguire. A conclusione ricordiamo che il t-test, come del resto tutti i test statistici, ha delle assunzioni che devono essere soddisfatte (es., omogeneità delle varianze) e se ciò non avviene occorre ripiegare su test non parametrici che in questo caso i più comuni sono: Wilcox Signed Rank test per dati appaiati; Mann-Whitneu U e Kolmogorov-Smirnov z per dati indipendenti 59

VERIFICA DELLE IPOTESI

VERIFICA DELLE IPOTESI VERIFICA DELLE IPOTESI Nella verifica delle ipotesi è necessario fissare alcune fasi prima di iniziare ad analizzare i dati. a) Si deve stabilire quale deve essere l'ipotesi nulla (H0) e quale l'ipotesi

Dettagli

Statistica. Lezione 6

Statistica. Lezione 6 Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 6 a.a 011-01 Dott.ssa Daniela Ferrante

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2014-2015 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 12-Il t-test per campioni appaiati vers. 1.2 (7 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

3. Confronto tra medie di due campioni indipendenti o appaiati

3. Confronto tra medie di due campioni indipendenti o appaiati BIOSTATISTICA 3. Confronto tra medie di due campioni indipendenti o appaiati Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk MARTA BLANGIARDO

Dettagli

1. Distribuzioni campionarie

1. Distribuzioni campionarie Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 2012/2013 lezioni di statistica del 3 e 6 giugno 2013 - di Massimo Cristallo - 1. Distribuzioni campionarie

Dettagli

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: Esempi di domande risposta multipla (Modulo II) 1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: 1) ha un numero di elementi pari a 5; 2) ha un numero di elementi

Dettagli

ANALISI DELLE FREQUENZE: IL TEST CHI 2

ANALISI DELLE FREQUENZE: IL TEST CHI 2 ANALISI DELLE FREQUENZE: IL TEST CHI 2 Quando si hanno scale nominali o ordinali, non è possibile calcolare il t, poiché non abbiamo medie, ma solo frequenze. In questi casi, per verificare se un evento

Dettagli

Stima per intervalli Nei metodi di stima puntuale è sempre presente un ^ errore θ θ dovuto al fatto che la stima di θ in genere non coincide con il parametro θ. Sorge quindi l esigenza di determinare una

Dettagli

L Analisi della Varianza ANOVA (ANalysis Of VAriance)

L Analisi della Varianza ANOVA (ANalysis Of VAriance) L Analisi della Varianza ANOVA (ANalysis Of VAriance) 1 CONCETTI GENERALI Finora abbiamo descritto test di ipotesi finalizzati alla verifica di ipotesi sulla differenza tra parametri di due popolazioni

Dettagli

Corso di Psicometria Progredito

Corso di Psicometria Progredito Corso di Psicometria Progredito 3.1 Introduzione all inferenza statistica Prima Parte Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014

Dettagli

Statistiche campionarie

Statistiche campionarie Statistiche campionarie Sul campione si possono calcolare le statistiche campionarie (come media campionaria, mediana campionaria, varianza campionaria,.) Le statistiche campionarie sono stimatori delle

Dettagli

Facoltà di Psicologia Università di Padova Anno Accademico 2010-2011

Facoltà di Psicologia Università di Padova Anno Accademico 2010-2011 Facoltà di Psicologia Università di Padova Anno Accademico 010-011 Corso di Psicometria - Modulo B Dott. Marco Vicentini marco.vicentini@unipd.it Rev. 10/01/011 La distribuzione F di Fisher - Snedecor

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 10-Il test t per un campione e la stima intervallare (vers. 1.1, 25 ottobre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia,

Dettagli

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione)

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione) Esercitazione #5 di Statistica Test ed Intervalli di Confidenza (per una popolazione) Dicembre 00 1 Esercizi 1.1 Test su media (con varianza nota) Esercizio n. 1 Il calore (in calorie per grammo) emesso

Dettagli

STATISTICA IX lezione

STATISTICA IX lezione Anno Accademico 013-014 STATISTICA IX lezione 1 Il problema della verifica di un ipotesi statistica In termini generali, si studia la distribuzione T(X) di un opportuna grandezza X legata ai parametri

Dettagli

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a) Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B Eventi indipendenti: un evento non influenza l altro Eventi disgiunti: il verificarsi di un evento esclude l altro Evento prodotto:

Dettagli

La distribuzione Normale. La distribuzione Normale

La distribuzione Normale. La distribuzione Normale La Distribuzione Normale o Gaussiana è la distribuzione più importante ed utilizzata in tutta la statistica La curva delle frequenze della distribuzione Normale ha una forma caratteristica, simile ad una

Dettagli

LA CORRELAZIONE LINEARE

LA CORRELAZIONE LINEARE LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad esempio, si può supporre che vi sia una relazione tra l insoddisfazione

Dettagli

Inferenza statistica. Statistica medica 1

Inferenza statistica. Statistica medica 1 Inferenza statistica L inferenza statistica è un insieme di metodi con cui si cerca di trarre una conclusione sulla popolazione sulla base di alcune informazioni ricavate da un campione estratto da quella

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 29-Analisi della potenza statistica vers. 1.0 (12 dicembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

Analisi dei residui. Test Esatto di Fisher. Differenza fra proporzioni

Analisi dei residui. Test Esatto di Fisher. Differenza fra proporzioni Statistica Economica Materiale didattico a cura del docente Analisi dei residui Test Esatto di Fisher Differenza fra proporzioni 1 Analisi dei residui Il test statistico ed il suo p-valore riassumono la

Dettagli

T DI STUDENT Quando si vogliono confrontare solo due medie, si può utilizzare il test t di Student La formula per calcolare il t è la seguente:

T DI STUDENT Quando si vogliono confrontare solo due medie, si può utilizzare il test t di Student La formula per calcolare il t è la seguente: T DI STUDENT Quando si vogliono confrontare solo due medie, si può utilizzare il test t di Student La formula per calcolare il t è la seguente: t = X i X j s 2 i (n i 1) + s 2 j (n j 1) n i + n j - 2 1

Dettagli

E naturale chiedersi alcune cose sulla media campionaria x n

E naturale chiedersi alcune cose sulla media campionaria x n Supponiamo che un fabbricante stia introducendo un nuovo tipo di batteria per un automobile elettrica. La durata osservata x i delle i-esima batteria è la realizzazione (valore assunto) di una variabile

Dettagli

iovanella@disp.uniroma2.it http://www.disp.uniroma2.it/users/iovanella Verifica di ipotesi

iovanella@disp.uniroma2.it http://www.disp.uniroma2.it/users/iovanella Verifica di ipotesi iovanella@disp.uniroma2.it http://www.disp.uniroma2.it/users/iovanella Verifica di ipotesi Idea di base Supponiamo di avere un idea del valore (incognito) di una media di un campione, magari attraverso

Dettagli

Statistica e biometria. D. Bertacchi. Variabili aleatorie. V.a. discrete e continue. La densità di una v.a. discreta. Esempi.

Statistica e biometria. D. Bertacchi. Variabili aleatorie. V.a. discrete e continue. La densità di una v.a. discreta. Esempi. Iniziamo con definizione (capiremo fra poco la sua utilità): DEFINIZIONE DI VARIABILE ALEATORIA Una variabile aleatoria (in breve v.a.) X è funzione che ha come dominio Ω e come codominio R. In formule:

Dettagli

Corso di. Dott.ssa Donatella Cocca

Corso di. Dott.ssa Donatella Cocca Corso di Statistica medica e applicata Dott.ssa Donatella Cocca 1 a Lezione Cos'è la statistica? Come in tutta la ricerca scientifica sperimentale, anche nelle scienze mediche e biologiche è indispensabile

Dettagli

APPUNTI DI MATEMATICA LE FRAZIONI ALGEBRICHE ALESSANDRO BOCCONI

APPUNTI DI MATEMATICA LE FRAZIONI ALGEBRICHE ALESSANDRO BOCCONI APPUNTI DI MATEMATICA LE FRAZIONI ALGEBRICHE ALESSANDRO BOCCONI Indice 1 Le frazioni algebriche 1.1 Il minimo comune multiplo e il Massimo Comun Divisore fra polinomi........ 1. Le frazioni algebriche....................................

Dettagli

Facciamo qualche precisazione

Facciamo qualche precisazione Abbiamo introdotto alcuni indici statistici (di posizione, di variabilità e di forma) ottenibili da Excel con la funzione Riepilogo Statistiche Facciamo qualche precisazione Al fine della partecipazione

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2013-2014 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

Psicometria (8 CFU) Corso di Laurea triennale STANDARDIZZAZIONE

Psicometria (8 CFU) Corso di Laurea triennale STANDARDIZZAZIONE Psicometria (8 CFU) Corso di Laurea triennale Un punteggio all interno di una distribuzione è in realtà privo di significato se preso da solo. Sapere che un soggetto ha ottenuto un punteggio x=52 in una

Dettagli

Il confronto fra proporzioni

Il confronto fra proporzioni L. Boni Il rapporto Un rapporto (ratio), attribuendo un ampio significato al termine, è il risultato della divisione di una certa quantità a per un altra quantità b Il rapporto Spesso, in maniera più specifica,

Dettagli

CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI

CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI VERO FALSO CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI 1. V F Un ipotesi statistica è un assunzione sulle caratteristiche di una o più variabili in una o più popolazioni 2. V F L ipotesi nulla unita

Dettagli

Capitolo 2 Distribuzioni di frequenza

Capitolo 2 Distribuzioni di frequenza Edizioni Simone - Vol. 43/1 Compendio di statistica Capitolo 2 Distribuzioni di frequenza Sommario 1. Distribuzioni semplici. - 2. Distribuzioni doppie. - 3. Distribuzioni parziali: condizionate e marginali.

Dettagli

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Analisi dei dati quantitativi :

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Analisi dei dati quantitativi : Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Analisi dei dati quantitativi : Confronto tra due medie Università del Piemonte Orientale Corso di laurea in

Dettagli

Il concetto di valore medio in generale

Il concetto di valore medio in generale Il concetto di valore medio in generale Nella statistica descrittiva si distinguono solitamente due tipi di medie: - le medie analitiche, che soddisfano ad una condizione di invarianza e si calcolano tenendo

Dettagli

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Intervalli di confidenza

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Intervalli di confidenza Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica

Dettagli

Dimensione di uno Spazio vettoriale

Dimensione di uno Spazio vettoriale Capitolo 4 Dimensione di uno Spazio vettoriale 4.1 Introduzione Dedichiamo questo capitolo ad un concetto fondamentale in algebra lineare: la dimensione di uno spazio vettoriale. Daremo una definizione

Dettagli

Test non parametrici. Test non parametrici. Test non parametrici. Test non parametrici

Test non parametrici. Test non parametrici. Test non parametrici. Test non parametrici Test non parametrici Test non parametrici Il test T di Student per uno o per due campioni, il test F di Fisher per l'analisi della varianza, la correlazione, la regressione, insieme ad altri test di statistica

Dettagli

RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL

RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL 1 RAPPRESENTAZIONE GRAFICA Per l analisi dati con Excel si fa riferimento alla versione 2007 di Office, le versioni successive non differiscono

Dettagli

Relazioni tra variabili

Relazioni tra variabili Università degli Studi di Padova Facoltà di Medicina e Chirurgia Corso di Laurea in Medicina e Chirurgia - A.A. 009-10 Scuole di specializzazione in: Medicina Legale, Medicina del Lavoro, Igiene e Medicina

Dettagli

4 3 4 = 4 x 10 2 + 3 x 10 1 + 4 x 10 0 aaa 10 2 10 1 10 0

4 3 4 = 4 x 10 2 + 3 x 10 1 + 4 x 10 0 aaa 10 2 10 1 10 0 Rappresentazione dei numeri I numeri che siamo abituati ad utilizzare sono espressi utilizzando il sistema di numerazione decimale, che si chiama così perché utilizza 0 cifre (0,,2,3,4,5,6,7,8,9). Si dice

Dettagli

Statistica inferenziale

Statistica inferenziale Statistica inferenziale Popolazione e campione Molto spesso siamo interessati a trarre delle conclusioni su persone che hanno determinate caratteristiche (pazienti, atleti, bambini, gestanti, ) Osserveremo

Dettagli

Metodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Metodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo Metodi statistici per l economia (Prof. Capitanio) Slide n. 9 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 TEST D IPOTESI Partiamo da un esempio presente sul libro di testo.

Dettagli

Potenza dello studio e dimensione campionaria. Laurea in Medicina e Chirurgia - Statistica medica 1

Potenza dello studio e dimensione campionaria. Laurea in Medicina e Chirurgia - Statistica medica 1 Potenza dello studio e dimensione campionaria Laurea in Medicina e Chirurgia - Statistica medica 1 Introduzione Nella pianificazione di uno studio clinico randomizzato è fondamentale determinare in modo

Dettagli

Alessandro Pellegrini

Alessandro Pellegrini Esercitazione sulle Rappresentazioni Numeriche Esistono 1 tipi di persone al mondo: quelli che conoscono il codice binario e quelli che non lo conoscono Alessandro Pellegrini Cosa studiare prima Conversione

Dettagli

I punteggi zeta e la distribuzione normale

I punteggi zeta e la distribuzione normale QUINTA UNITA I punteggi zeta e la distribuzione normale I punteggi ottenuti attraverso una misurazione risultano di difficile interpretazione se presi in stessi. Affinché acquistino significato è necessario

Dettagli

La logica statistica della verifica (test) delle ipotesi

La logica statistica della verifica (test) delle ipotesi La logica statistica della verifica (test) delle ipotesi Come posso confrontare diverse ipotesi? Nella statistica inferenziale classica vengono sempre confrontate due ipotesi: l ipotesi nulla e l ipotesi

Dettagli

Laboratorio di Pedagogia Sperimentale. Indice

Laboratorio di Pedagogia Sperimentale. Indice INSEGNAMENTO DI LABORATORIO DI PEDAGOGIA SPERIMENTALE LEZIONE III INTRODUZIONE ALLA RICERCA SPERIMENTALE (PARTE III) PROF. VINCENZO BONAZZA Indice 1 L ipotesi -----------------------------------------------------------

Dettagli

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010 LEZIONE 3 "Educare significa aiutare l'animo dell'uomo ad entrare nella totalità della realtà. Non si può però educare se non rivolgendosi alla libertà, la quale definisce il singolo, l'io. Quando uno

Dettagli

f(x) = 1 x. Il dominio di questa funzione è il sottoinsieme proprio di R dato da

f(x) = 1 x. Il dominio di questa funzione è il sottoinsieme proprio di R dato da Data una funzione reale f di variabile reale x, definita su un sottoinsieme proprio D f di R (con questo voglio dire che il dominio di f è un sottoinsieme di R che non coincide con tutto R), ci si chiede

Dettagli

Statistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice

Statistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice Esercitazione 15 Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () 1 / 18 L importanza del gruppo di controllo In tutti i casi in cui si voglia studiare l effetto di un certo

Dettagli

4. Confronto tra medie di tre o più campioni indipendenti

4. Confronto tra medie di tre o più campioni indipendenti BIOSTATISTICA 4. Confronto tra medie di tre o più campioni indipendenti Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk MARTA BLANGIARDO

Dettagli

LA STATISTICA NEI TEST INVALSI

LA STATISTICA NEI TEST INVALSI LA STATISTICA NEI TEST INVALSI 1 Prova Nazionale 2011 Osserva il grafico seguente che rappresenta la distribuzione percentuale di famiglie per numero di componenti, in base al censimento 2001. Qual è la

Dettagli

Corso di Laurea in Scienze e Tecnologie Biomolecolari. NOME COGNOME N. Matr.

Corso di Laurea in Scienze e Tecnologie Biomolecolari. NOME COGNOME N. Matr. Corso di Laurea in Scienze e Tecnologie Biomolecolari Matematica e Statistica II Prova di esame del 18/7/2013 NOME COGNOME N. Matr. Rispondere ai punti degli esercizi nel modo più completo possibile, cercando

Dettagli

LEZIONE n. 5 (a cura di Antonio Di Marco)

LEZIONE n. 5 (a cura di Antonio Di Marco) LEZIONE n. 5 (a cura di Antonio Di Marco) IL P-VALUE (α) Data un ipotesi nulla (H 0 ), questa la si può accettare o rifiutare in base al valore del p- value. In genere il suo valore è un numero molto piccolo,

Dettagli

PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE

PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) PROBABILITÀ -

Dettagli

Le funzioni continue. A. Pisani Liceo Classico Dante Alighieri A.S. 2002-03. A. Pisani, appunti di Matematica 1

Le funzioni continue. A. Pisani Liceo Classico Dante Alighieri A.S. 2002-03. A. Pisani, appunti di Matematica 1 Le funzioni continue A. Pisani Liceo Classico Dante Alighieri A.S. -3 A. Pisani, appunti di Matematica 1 Nota bene Questi appunti sono da intendere come guida allo studio e come riassunto di quanto illustrato

Dettagli

SPC e distribuzione normale con Access

SPC e distribuzione normale con Access SPC e distribuzione normale con Access In questo articolo esamineremo una applicazione Access per il calcolo e la rappresentazione grafica della distribuzione normale, collegata con tabelle di Clienti,

Dettagli

Appunti sulla Macchina di Turing. Macchina di Turing

Appunti sulla Macchina di Turing. Macchina di Turing Macchina di Turing Una macchina di Turing è costituita dai seguenti elementi (vedi fig. 1): a) una unità di memoria, detta memoria esterna, consistente in un nastro illimitato in entrambi i sensi e suddiviso

Dettagli

~ Copyright Ripetizionando - All rights reserved ~ http://ripetizionando.wordpress.com STUDIO DI FUNZIONE

~ Copyright Ripetizionando - All rights reserved ~ http://ripetizionando.wordpress.com STUDIO DI FUNZIONE STUDIO DI FUNZIONE Passaggi fondamentali Per effettuare uno studio di funzione completo, che non lascia quindi margine a una quasi sicuramente errata inventiva, sono necessari i seguenti 7 passaggi: 1.

Dettagli

Misure della dispersione o della variabilità

Misure della dispersione o della variabilità QUARTA UNITA Misure della dispersione o della variabilità Abbiamo visto che un punteggio di per sé non ha alcun significato e lo acquista solo quando è posto a confronto con altri punteggi o con una statistica.

Dettagli

LE SUCCESSIONI 1. COS E UNA SUCCESSIONE

LE SUCCESSIONI 1. COS E UNA SUCCESSIONE LE SUCCESSIONI 1. COS E UNA SUCCESSIONE La sequenza costituisce un esempio di SUCCESSIONE. Ecco un altro esempio di successione: Una successione è dunque una sequenza infinita di numeri reali (ma potrebbe

Dettagli

risulta (x) = 1 se x < 0.

risulta (x) = 1 se x < 0. Questo file si pone come obiettivo quello di mostrarvi come lo studio di una funzione reale di una variabile reale, nella cui espressione compare un qualche valore assoluto, possa essere svolto senza necessariamente

Dettagli

1. PRIME PROPRIETÀ 2

1. PRIME PROPRIETÀ 2 RELAZIONI 1. Prime proprietà Il significato comune del concetto di relazione è facilmente intuibile: due elementi sono in relazione se c è un legame tra loro descritto da una certa proprietà; ad esempio,

Dettagli

Tema A. 1.2. Se due eventi A e B sono indipendenti e tali che P (A) = 1/2 e P (B) = 2/3, si può certamente concludere che

Tema A. 1.2. Se due eventi A e B sono indipendenti e tali che P (A) = 1/2 e P (B) = 2/3, si può certamente concludere che Statistica Cognome: Laurea Triennale in Biologia Nome: 26 luglio 2012 Matricola: Tema A 1. Parte A 1.1. Sia x 1, x 2,..., x n un campione di n dati con media campionaria x e varianza campionaria s 2 x

Dettagli

Consideriamo due polinomi

Consideriamo due polinomi Capitolo 3 Il luogo delle radici Consideriamo due polinomi N(z) = (z z 1 )(z z 2 )... (z z m ) D(z) = (z p 1 )(z p 2 )... (z p n ) della variabile complessa z con m < n. Nelle problematiche connesse al

Dettagli

Basi di matematica per il corso di micro

Basi di matematica per il corso di micro Basi di matematica per il corso di micro Microeconomia (anno accademico 2006-2007) Lezione del 21 Marzo 2007 Marianna Belloc 1 Le funzioni 1.1 Definizione Una funzione è una regola che descrive una relazione

Dettagli

Analisi di dati di frequenza

Analisi di dati di frequenza Analisi di dati di frequenza Fase di raccolta dei dati Fase di memorizzazione dei dati in un foglio elettronico 0 1 1 1 Frequenze attese uguali Si assuma che dalle risposte al questionario sullo stato

Dettagli

Servizi di consulenza specialistica per IGRUE 2009 2012

Servizi di consulenza specialistica per IGRUE 2009 2012 Allegato 9A Metodo della stima delle differenze Descrizione della procedura Il metodo della stima delle differenze è indicato qualora il controllore ritenga che la popolazione sia affetta da un tasso di

Dettagli

13. Campi vettoriali

13. Campi vettoriali 13. Campi vettoriali 1 Il campo di velocità di un fluido Il concetto di campo in fisica non è limitato ai fenomeni elettrici. In generale il valore di una grandezza fisica assegnato per ogni punto dello

Dettagli

8 Elementi di Statistica

8 Elementi di Statistica 8 Elementi di Statistica La conoscenza di alcuni elementi di statistica e di analisi degli errori è importante quando si vogliano realizzare delle osservazioni sperimentali significative, ed anche per

Dettagli

Test d ipotesi. Statistica e biometria. D. Bertacchi. Test d ipotesi

Test d ipotesi. Statistica e biometria. D. Bertacchi. Test d ipotesi In molte situazioni una raccolta di dati (=esiti di esperimenti aleatori) viene fatta per prendere delle decisioni sulla base di quei dati. Ad esempio sperimentazioni su un nuovo farmaco per decidere se

Dettagli

I ESERCITAZIONE. Gruppo I 100 individui. Trattamento I Nuovo Farmaco. Osservazione degli effetti sul raffreddore. Assegnazione casuale

I ESERCITAZIONE. Gruppo I 100 individui. Trattamento I Nuovo Farmaco. Osservazione degli effetti sul raffreddore. Assegnazione casuale I ESERCITAZIONE ESERCIZIO 1 Si vuole testare un nuovo farmaco contro il raffreddore. Allo studio partecipano 200 soggetti sani della stessa età e dello stesso sesso e con caratteristiche simili. i) Che

Dettagli

Per studio di funzione intendiamo un insieme di procedure che hanno lo scopo di analizzare le proprietà di una funzione f ( x) R R

Per studio di funzione intendiamo un insieme di procedure che hanno lo scopo di analizzare le proprietà di una funzione f ( x) R R Studio di funzione Per studio di funzione intendiamo un insieme di procedure che hanno lo scopo di analizzare le proprietà di una funzione f ( x) R R : allo scopo di determinarne le caratteristiche principali.

Dettagli

Un gioco con tre dadi

Un gioco con tre dadi Un gioco con tre dadi Livello scolare: biennio Abilità interessate Costruire lo spazio degli eventi in casi semplici e determinarne la cardinalità. Valutare la probabilità in diversi contesti problematici.

Dettagli

Capitolo 25: Lo scambio nel mercato delle assicurazioni

Capitolo 25: Lo scambio nel mercato delle assicurazioni Capitolo 25: Lo scambio nel mercato delle assicurazioni 25.1: Introduzione In questo capitolo la teoria economica discussa nei capitoli 23 e 24 viene applicata all analisi dello scambio del rischio nel

Dettagli

Calcolo delle probabilità

Calcolo delle probabilità Calcolo delle probabilità Laboratorio di Bioinformatica Corso A aa 2005-2006 Statistica Dai risultati di un esperimento si determinano alcune caratteristiche della popolazione Calcolo delle probabilità

Dettagli

Il coefficiente di correlazione di Spearman per ranghi

Il coefficiente di correlazione di Spearman per ranghi Il coefficiente di correlazione di Spearman per ranghi Questo indice di correlazione non parametrico viene indicato con r s o Spearman rho e permette di valutare la forza del rapporto tra due variabili

Dettagli

Relazioni statistiche: regressione e correlazione

Relazioni statistiche: regressione e correlazione Relazioni statistiche: regressione e correlazione È detto studio della connessione lo studio si occupa della ricerca di relazioni fra due variabili statistiche o fra una mutabile e una variabile statistica

Dettagli

11. Analisi statistica degli eventi idrologici estremi

11. Analisi statistica degli eventi idrologici estremi . Analisi statistica degli eventi idrologici estremi I processi idrologici evolvono, nello spazio e nel tempo, secondo modalità che sono in parte predicibili (deterministiche) ed in parte casuali (stocastiche

Dettagli

Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI

Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI 1. L azienda Wood produce legno compensato per costruzioni

Dettagli

Analizza/Confronta medie. ELEMENTI DI PSICOMETRIA Esercitazione n. 7-8-9-107. Test t. Test t. t-test test e confronto tra medie chi quadrato

Analizza/Confronta medie. ELEMENTI DI PSICOMETRIA Esercitazione n. 7-8-9-107. Test t. Test t. t-test test e confronto tra medie chi quadrato Analizza/Confronta medie ELEMENTI DI PSICOMETRIA Esercitazione n. 7-8-9-107 t-test test e confronto tra medie chi quadrato C.d.L. Comunicazione e Psicologia a.a. 2008/09 Medie Calcola medie e altre statistiche

Dettagli

LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE

LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE DESCRIZIONE DEI DATI DA ESAMINARE Sono stati raccolti i dati sul peso del polmone di topi normali e affetti da una patologia simile

Dettagli

OSSERVAZIONI TEORICHE Lezione n. 4

OSSERVAZIONI TEORICHE Lezione n. 4 OSSERVAZIONI TEORICHE Lezione n. 4 Finalità: Sistematizzare concetti e definizioni. Verificare l apprendimento. Metodo: Lettura delle OSSERVAZIONI e risoluzione della scheda di verifica delle conoscenze

Dettagli

Siamo così arrivati all aritmetica modulare, ma anche a individuare alcuni aspetti di come funziona l aritmetica del calcolatore come vedremo.

Siamo così arrivati all aritmetica modulare, ma anche a individuare alcuni aspetti di come funziona l aritmetica del calcolatore come vedremo. DALLE PESATE ALL ARITMETICA FINITA IN BASE 2 Si è trovato, partendo da un problema concreto, che con la base 2, utilizzando alcune potenze della base, operando con solo addizioni, posso ottenere tutti

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 5-Indici di variabilità (vers. 1.0c, 20 ottobre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

SISTEMI DI NUMERAZIONE E CODICI

SISTEMI DI NUMERAZIONE E CODICI SISTEMI DI NUMERAZIONE E CODICI Il Sistema di Numerazione Decimale Il sistema decimale o sistema di numerazione a base dieci usa dieci cifre, dette cifre decimali, da O a 9. Il sistema decimale è un sistema

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Test delle ipotesi per la media (varianza nota), p-value del test Il manager di un fast-food

Dettagli

Test statistici di verifica di ipotesi

Test statistici di verifica di ipotesi Test e verifica di ipotesi Test e verifica di ipotesi Il test delle ipotesi consente di verificare se, e quanto, una determinata ipotesi (di carattere biologico, medico, economico,...) è supportata dall

Dettagli

Titolo della lezione. Analisi dell associazione tra due caratteri: indipendenza e dipendenza

Titolo della lezione. Analisi dell associazione tra due caratteri: indipendenza e dipendenza Titolo della lezione Analisi dell associazione tra due caratteri: indipendenza e dipendenza Introduzione Analisi univariata, bivariata, multivariata Analizzare le relazioni tra i caratteri, per cercare

Dettagli

PROGETTO INDAGINE DI OPINIONE SUL PROCESSO DI FUSIONE DEI COMUNI NEL PRIMIERO

PROGETTO INDAGINE DI OPINIONE SUL PROCESSO DI FUSIONE DEI COMUNI NEL PRIMIERO PROGETTO INDAGINE DI OPINIONE SUL PROCESSO DI FUSIONE DEI COMUNI NEL PRIMIERO L indagine si è svolta nel periodo dal 26 agosto al 16 settembre 2014 con l obiettivo di conoscere l opinione dei residenti

Dettagli

RELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della

RELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della RELAZIONE TRA VARIABILI QUANTITATIVE Lezione 7 a Accade spesso nella ricerca in campo biomedico, così come in altri campi della scienza, di voler studiare come il variare di una o più variabili (variabili

Dettagli

Vademecum studio funzione

Vademecum studio funzione Vademecum studio funzione Campo di Esistenza di una funzione o dominio: Studiare una funzione significa determinare gli elementi caratteristici che ci permettono di disegnarne il grafico, a partire dalla

Dettagli

LE FUNZIONI A DUE VARIABILI

LE FUNZIONI A DUE VARIABILI Capitolo I LE FUNZIONI A DUE VARIABILI In questo primo capitolo introduciamo alcune definizioni di base delle funzioni reali a due variabili reali. Nel seguito R denoterà l insieme dei numeri reali mentre

Dettagli

Esercizio 1. Verifica di ipotesi sulla media (varianza nota), p-value del test

Esercizio 1. Verifica di ipotesi sulla media (varianza nota), p-value del test STATISTICA (2) ESERCITAZIONE 6 05.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Verifica di ipotesi sulla media (varianza nota), p-value del test Il preside della scuola elementare XYZ sospetta che

Dettagli

Come visto precedentemente l equazione integro differenziale rappresentativa dell equilibrio elettrico di un circuito RLC è la seguente: 1 = (1)

Come visto precedentemente l equazione integro differenziale rappresentativa dell equilibrio elettrico di un circuito RLC è la seguente: 1 = (1) Transitori Analisi nel dominio del tempo Ricordiamo che si definisce transitorio il periodo di tempo che intercorre nel passaggio, di un sistema, da uno stato energetico ad un altro, non è comunque sempre

Dettagli

LABORATORIO EXCEL XLSTAT 2008 SCHEDE 2 e 3 VARIABILI QUANTITATIVE

LABORATORIO EXCEL XLSTAT 2008 SCHEDE 2 e 3 VARIABILI QUANTITATIVE Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) LABORATORIO EXCEL

Dettagli

Capitolo 25: Lo scambio nel mercato delle assicurazioni

Capitolo 25: Lo scambio nel mercato delle assicurazioni Capitolo 25: Lo scambio nel mercato delle assicurazioni 25.1: Introduzione In questo capitolo la teoria economica discussa nei capitoli 23 e 24 viene applicata all analisi dello scambio del rischio nel

Dettagli

Capitolo 12 La regressione lineare semplice

Capitolo 12 La regressione lineare semplice Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara

Dettagli