Metodologie statistiche per l analisi del rischio FONDAMENTI DI INFERENZA PER L ANALISI DEL RISCHIO

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Metodologie statistiche per l analisi del rischio FONDAMENTI DI INFERENZA PER L ANALISI DEL RISCHIO"

Transcript

1 Corso di Laurea in Sicurezza igienico-sanitaria degli alimenti Metodologie statistiche per l analisi del rischio FONDAMENTI DI INFERENZA PER L ANALISI DEL RISCHIO Facoltà di Medicina Veterinaria, Università di Padova Docente: Dott. L. Corain 1

2 SOMMARIO Distribuzioni campionarie Teorema del limite centrale Stima e intervalli di confidenza Verifica di ipotesi Errore di primo e di secondo tipo Verifica di ipotesi ad un campione Verifica di ipotesi a due campioni Verifica di ipotesi a più campioni (ANOVA) 2

3 DISTRIBUZIONI CAMPIONARIE L interesse dell inferenza statistica è di trarre conclusioni sulla popolazione e su alcuni suoi parametri e non sul solo campione. A questo scopo si utilizzano delle statistiche, ovvero delle funzioni calcolate sulla base di un campione allo scopo o di stimare (stima) o prendere delle decisioni (verifica di ipotesi) sui valori dei corrispondenti parametri dell intera popolazione. La media campionaria è l esempio di una statistica utilizzata per stimare la media di una variabile di interesse (ad es. la prevalenza di un patogeno) riferita all intera popolazione (un dato processo alimentare). La proporzione campionaria è una statistica utilizzata per stimare la proporzione di unità (ad es. confezioni di prodotto) in una popolazione (processo alimentare) che hanno una certa caratteristica (sono contaminate). 3

4 DISTRIBUZIONI CAMPIONARIE Supponendo ipoteticamente di procedere all estrazione di tutti i possibili campioni, la distribuzione di tutti i risultati ottenuti si dice distribuzione campionaria. La distribuzione della media campionaria èperciò la distribuzione di tutte le possibili medie che osserveremmo se procedessimo all estrazione di tutti i possibile campioni di una certa ampiezza. Nella pratica invece, da una popolazione viene estratto a caso un solo campione, di ampiezza prestabilita a partire dal quale si può calcolare il valore osservato della statistica campionaria. La media campionaria è non distorta per la media della popolazione, cioè la media di tutte le possibili medie campionarie (calcolate a partire campioni di uguale ampiezza n) fornisce la vera media della popolazione. 4

5 DISTRIBUZIONI CAMPIONARIE Mentre le osservazioni nella popolazione assumono anche valori estremamente piccoli o estremamente grandi, la media campionaria è caratterizzata da una minore variabilità rispetto ai dati originali. Le medie campionarie saranno quindi caratterizzate, in generale, da valori meno dispersi rispetto a quelli che si osservano nella popolazione. Lo scarto quadratico medio della media campionaria, detto errore standard della media, quantifica la variazione della media campionaria da campione a campione: L errore standard della media σ X = σ / L errore standard della media campionaria è uguale allo scarto quadratico medio della popolazione diviso n. n 5

6 DISTRIBUZIONI CAMPIONARIE Introdotta l idea di distribuzione campionaria e definito l errore standard della media, bisogna stabilire quale sia la distribuzione della media campionaria. Se un campione è estratto da una popolazione normale con media µ e scarto quadratico medio σ, la media campionaria ha distribuzione normale indipendentemente dall ampiezza campionaria n, ed è caratterizzata da valore atteso µ = µ e scarto quadratico X medio pari all errore standard σ. In figura sono riportate le X distribuzioni delle medie campionarie di 500 campioni di ampiezza 1,2,4,8,16 e 32 estratti da una popolazione normale. 6

7 TEOREMA DEL LIMITE CENTRALE Sinora abbiamo analizzato la distribuzione della media campionaria nel caso di una popolazione normale. Tuttavia, si presenteranno spesso casi in cui la distribuzione della popolazione può non essere normale. In questi casi è utile riferirsi ad un importante teorema della statistica, il teorema del limite centrale, che consente di dire qualcosa sulla distribuzione della media campionaria, anche nel caso in cui una popolazione non abbia distribuzione normale. Teorema del limite centrale Quando l ampiezza del campione casuale diventa sufficientemente grande, la distribuzione della media campionaria può essere approssimata dalla distribuzione normale. E questo indipendentemente dalla forma della distribuzione dei singoli valori della popolazione. 7

8 TEOREMA DEL LIMITE CENTRALE Si tratta, allora, di stabilire cosa si intende per sufficientemente grande, problema ampiamente affrontato dagli statistici. Come regola di carattere generale, molti sono concordi nell affermare che quando il campione raggiunge un ampiezza pari almeno a 30, la distribuzione della media campionaria può ritenersi approssimativamente normale. Tuttavia, il teorema del limite centrale può essere applicato anche con campioni di ampiezza inferiore se si sa che la distribuzione della popolazione ha alcune caratteristiche che la avvicinano di per se stessa alla normale (ad esempio, quando è simmetrica). Il teorema del limite centrale svolge un ruolo cruciale in ambito inferenziale, in quanto consente di fare inferenza sulla media della popolazione senza dover conoscere la forma specifica della distribuzione della popolazione. 8

9 TEOREMA DEL LIMITE CENTRALE Ciascuna delle distribuzioni campionarie riportate è ottenuta estraendo 500 campioni diversi dalle rispettive popolazioni. Sono state considerate diverse ampiezze campionarie (n = 2, 5, 30). Nella seconda colonna è riportata la distribuzione della media campionaria nel caso di una popolazione la cui distribuzione (uniforme o rettangolare) è simmetrica e nella terza si considera una popolazione con distribuzione obliqua a destra (esponenziale). 9

10 TEOREMA DEL LIMITE CENTRALE Sulla base dei risultati ottenuti per le distribuzioni note (la normale, l uniforme l esponenziale) possiamo trarre alcune conclusioni in merito al teorema del limite centrale: Per la maggior parte delle popolazioni, indipendentemente dalla forma della loro distribuzione, la distribuzione della media campionaria è approssimativamente normale, purché si considerino campioni di almeno 30 osservazioni. Se la distribuzione della popolazione è abbastanza simmetrica, la distribuzione della media campionaria è approssimativamente una normale, purché si considerino campioni di almeno 5 osservazioni. Se la popolazione ha una distribuzione normale, la media campionaria è distribuita secondo la legge normale, indipendentemente dall ampiezza del campione. 10

11 STIMA E INTERVALLI DI CONFIDENZA L inferenza statistica è il processo attraverso il quale i risultati campionari vengono utilizzati per trarre conclusioni sulle caratteristiche (parametri e formadella distribuzione) di una popolazione. Tale processo consente di stimare caratteristiche non note della popolazione come i parametri (ad es. la media per le var. numeriche o la proporzione per le var. categoriali) che caratterizzano la distribuzione della variabile di interesse. Ci sono due approcci fondamentali di stima: le stime puntuali e le stime per intervalli (intervalli di confidenza). Uno stimatore puntuale è una statistica (cioè una funzione dei dati campionari) che viene definita allo scopo di fornire una sintesi su un parametro di interesse. 11

12 STIMA E INTERVALLI DI CONFIDENZA La stima puntuale è lo specifico valore assunto da una statistica, calcolata in corrispondenza dei dati campionari e che viene utilizzata per stimare il vero valore non noto di un parametro di una popolazione. Uno stimatore per intervallo è un intervallo costruito attorno allo stimatore puntuale, in modo tale che sia nota e fissata la probabilità che il parametro appartenga all intervallo stesso. Tale probabilità è detta livello di confidenza ed è in generale indicato con (1 α)% dove α è la probabilità che il parametro si trovi al di fuori dell intervallo di confidenza. Quindi la confidenza è il grado di fiducia che l intervallo possa contenere effettivamente il parametro di interesse. 12

13 STIMA E INTERVALLI DI CONFIDENZA Esempio: si consideri un processo industriale di riempimento di scatole di cereali e sia assuma che il peso X delle scatole sia X~N(µ;15 2 ). Dato un campione casuale di n=25 scatole con peso medio grammi si vuole costruire un intervallo di confidenza al 95% per µ. Per la proprietà della distribuzione normale e della media campionaria risulta che X µ P Zα/2 Zα/2 = 1 α σ / n quindi un intervallo di confidenza all (1 α)% per µ è dato da X Z σ / n µ X + Z σ / n α/2 α/2 Nel caso specifico si ottiene µ

14 STIMA E INTERVALLI DI CONFIDENZA Ipotizziamo che µ sia uguale a 368. Per comprendere a fondo il significato della stima per intervallo e le sue proprietà è utile fare riferimento all ipotetico insieme di tutti i possibili campioni di ampiezza n che è possibile ottenere. Osserviamo che per alcuni campioni la stima per intervalli di µ è corretta, mentre per altri non lo è. 14

15 STIMA E INTERVALLI DI CONFIDENZA Nella pratica estraiamo un solo campione e siccome non conosciamo la media della popolazione non possiamo stabilire se le conclusioni a cui perveniamo sono corrette o meno. Tuttavia possiamo affermare di avere una fiducia all (1 α)% che la media appartenga all intervallo stimato. Quindi, l intervallo di confidenza all (1 α)% della media con σ noto si ottiene utilizzando l equazione: Intervallo di confidenza per la media con σ noto X Z σ / n µ X + Z σ / n α/2 α/2 dove Z α/2 è il valore a cui corrisponde un area cumulata pari a (1 α/2) della distribuzione normale standard. 15

16 STIMA E INTERVALLI DI CONFIDENZA In alcuni casi risulta desiderabile un grado di certezza maggiore, ad es. del 99%, ed in altri casi possiamo accettare un grado minore di sicurezza, ad es. del 90%. Il valore Z α/2 di Z che viene scelto per costruire un intervallo di confidenza è chiamato valore critico. A ciascun livello di confidenza (1 α) corrisponde un diverso valore critico. Livelli di confidenza maggiori si ottengono perciò a prezzo di un ampliamento dell intervallo di confidenza: esiste un tradeoff tra utilità pratica dell intervallo e livello di confidenza. 16

17 STIMA E INTERVALLI DI CONFIDENZA In genere lo scarto quadratico medio della popolazione σ, al pari della media µ, non è noto. Pertanto, per ottenere un intervallo di confidenza per la media della popolazione possiamo basarci sulle sole statistiche campionarie X e S. Se la variabile casuale X ha una distribuzione normale allora la statistica t = X S µ ha una distribuzione t di Student con (n 1) gradi di libertà. Se variabile casuale X non ha una distribuzione normale la statistica t ha comunque approssimativamente una distribuzione t di Student in virtù del Teorema del Limite Centrale. n 17

18 STIMA E INTERVALLI DI CONFIDENZA La distribuzione t di Student ha una forma molto simile a quella della normale standardizzata. Tuttavia il grafico risulta più appiattito e l area sottesa sulle code è maggiore di quella della normale a causa del fatto che s non è noto e viene stimato da S. L incertezza su s causa la maggior variabilità di t. All aumentare dei gradi di libertà, la distribuzione t si avvicina progressivamente alla distribuzione normale fino a che le due distribuzioni risultano virtualmente identiche. 18

19 STIMA E INTERVALLI DI CONFIDENZA Il significato dei gradi di libertà è legato al fatto che per calcolare S 2 è necessario calcolare preventivamente X. Quindi, dato il valore di X, solo n 1 osservazioni campionarie sono libere di variare: ci sono quindi n 1 gradi di libertà. L intervallo di confidenza all (1 α)% della media quando σ non è noto è definito nell equazione: Intervallo di confidenza per la media (σ non noto) X t S/ n µ X + t S/ n n 1; α/ 2 n 1; α/ 2 dove t n 1;α/2 è il valore critico a cui corrisponde un area cumulata pari a (1 α/2) della distribuzione t di Student con (n 1) gradi di libertà. 19

20 STIMA E INTERVALLI DI CONFIDENZA Data una popolazione i cui elementi possiedono una certa caratteristica secondo una data proporzione, indicata dal parametro incognito π, è possibile costruire un intervallo di confidenza per π a partire dal corrispondente stimatore puntuale, dato dalla frequenza campionaria p=x/n, dove n è l ampiezza campionaria e X è il numero di elementi del campione che hanno la caratteristica di interesse. L equazione seguente definisce l intervallo di confidenza all (1 α)% per la proporzione nella popolazione. Intervallo di confidenza per la proporzione p Z p(1 p) n π p+ Z p(1 p) n α/2 α/2 dove Z α/2 è il valore critico della distribuzione normale standard e si assume che X e (n X) siano entrambi >5. 20

21 VERIFICA DI IPOTESI La verifica di ipotesi è una procedura inferenziale che ha come scopo quello di considerare l informazione empirica (ottenuta da una statistica campionaria) e di stabilire se questa è favorevole ad una asserzione di interesse sui parametri della popolazione. Ad esempio, potremmo asserire che il processo produttivo di riempimento delle scatole di cerali può essere considerato appropriato (sotto controllo) se il peso medio µ delle scatole è di 368 grammi. La verifica di ipotesi ha inizio proprio con una considerazione di una teoria o proposizione riguardante un particolare parametro della popolazione e l ipotesi che il valore del parametro della popolazione sia uguale ad un dato valore prende il nome di ipotesi nulla. 21

22 VERIFICA DI IPOTESI L ipotesi nulla in genere coincide con lo stato delle cose e viene indicata con il simbolo H 0, quindi nell esempio del processo produttivo H 0 : µ = 368 Sebbene le informazioni siamo tratte a partire dal campione, l ipotesi è espressa con riferimento a un parametro della popolazione, perché si è interessati all intero processo produttivo, vale a dire alla popolazione di tutte le scatole di cereali prodotte. Se i risultati campionari non fossero favorevoli all ipotesi nulla si dovrebbe concludere che l ipotesi nulla sia falsa e chiaramente ci deve essere un altra ipotesi che risulti vera. L ipotesi alternativa H 1 è l asserzione opposta all ipotesi nulla, e nell esempio in questione H 1 : µ

23 VERIFICA DI IPOTESI L ipotesi alternativa rappresenta la conclusione a cui si giunge quando si rifiuta l ipotesi nulla (decisione forte), cioè quando il campione osservato fornisce sufficiente evidenza del fatto che l ipotesi nulla sia falsa. D altro canto il mancato rifiuto dell ipotesi nulla non prova che essa è vera. Quello che si può concludere è che non vi è sufficiente evidenza empirica contraria ad essa (decisione debole). Di seguito sono riassunti i punti principali che sintetizzano il concetto di ipotesi nulla e di ipotesi alternativa: l ipotesi nulla H 0 rappresenta lo stato attuale delle cose o l attuale convinzione riguardo a una situazione; l ipotesi alternativa H 1 è specificata come ipotesi opposta all ipotesi nulla e rappresenta una certa 23

24 VERIFICA DI IPOTESI conclusione inferenziale che si è interessati a dimostrare. se si rifiuta l ipotesi nulla si accetta l ipotesi alternativa. se si accetta l ipotesi nulla ciò non significa che si è dimostrato che l ipotesi nulla sia vera. l ipotesi nulla H 0 si riferisce sempre a un valore specifico del parametro della popolazione (ad esempio µ), e non a una statistica campionaria (ad esempio X ). l ipotesi nulla contiene sempre un segno di eguale relativo al valore specificato del parametro della popolazione (ad esempio H 0 : µ = 368 grammi). l ipotesi alternativa non contiene mai un segno di eguale relativo al valore specificato del parametro della popolazione (ad esempio H 1 : µ 368 grammi). 24

25 VERIFICA DI IPOTESI La logica sottostante alla verifica di ipotesi è quella di stabilire la plausibilità dell ipotesi nulla alla luce delle informazioni campionarie. Se ipotesi nulla asserisce che il peso medio dei cereali contenuti in tutte le scatole prodotte è 368 grammi (il valore del parametro specificato dall azienda) si procede all estrazione di un campione di scatole e si pesa ciascuna scatola per calcolare la media campionaria (statistica che stima il vero valore del parametro µ). Anche se l ipotesi nulla è vera, è probabile che la statistica differisca dal vero valore del parametro per effetto del caso (della variabilità campionaria). Ciononostante ci aspettiamo che in questo caso la statistica campionaria sia vicina al parametro della popolazione. 25

26 VERIFICA DI IPOTESI La teoria della verifica di ipotesi fornisce definizioni chiare sulla base delle quali valutare le differenze osservate tra la statistica e il parametro. Il processo decisionale è sostenuto dal punto di vista quantitativo, valutando la probabilità di ottenere un dato risultato campionario, se l ipotesi nulla fosse vera. Tale probabilità si ottiene determinando prima la distribuzione campionaria della statistica di interesse (ad es. la media campionaria) e poi calcolando la probabilità che la statistica test assuma il valore osservato in corrispondenza del campione estratto. La distribuzione campionaria della statistica test spesso è una distribuzione statistica nota, come la normale o la t, e quindi possiamo ricorrere a queste distribuzioni per decidere se rifiutare o meno a un ipotesi nulla. 26

27 VERIFICA DI IPOTESI La distribuzione campionaria della statistica test è divisa in due regioni: una regione di rifiuto (chiamata anche regione critica) e una regione di accettazione. Se la statistica test cade nella regione di accettazione, l ipotesi nulla non può essere rifiutata e se la statistica test cade nella regione di rifiuto, l ipotesi nulla deve essere rifiutata. La regione di rifiuto può essere vista come l insieme di... 27

28 ERRORE DI PRIMO E DI SECONDO TIPO tutti i valori della statistica test che non è probabile che si verifichino quando l ipotesi nulla è vera, mentre è probabile che questi valori si verifichino quando l ipotesi nulla è falsa. Per prendere una decisione sull ipotesi nulla, dobbiamo in primo luogo definire le regioni di rifiuto e di accettazione e questo viene fatto determinando il cosiddetto valore critico della statistica test. La determinazione di questo valore dipende dall ampiezza della regione di rifiuto, che è legata al rischio comportato dal prendere una decisione sul parametro alla luce delle sole informazioni campionarie. Quando si applica un procedimento di verifica di ipotesi, si possono commettere due tipi di errori, l errore di prima specie e l errore di seconda specie. 28

29 ERRORE DI PRIMO E DI SECONDO TIPO L errore di prima specie (detto anche livello di significatività) si verifica se si rifiuta l ipotesi nulla quando questa è vera e quindi non dovrebbe essere rifiutata. La probabilità che si verifichi un errore di prima specie è indicata con α. L errore di seconda specie si verifica se si accetta l ipotesi nulla quando questa è falsa e quindi dovrebbe essere rifiutata. La probabilità che si verifichi un errore di seconda specie è indicata con β. 29

30 ERRORE DI PRIMO E DI SECONDO TIPO In genere, si controlla l errore di prima specie fissando il livello del rischio α che si è disposti a tollerare. Dal momento che il livello di significatività è specificato prima di condurre la verifica di ipotesi, il rischio di commettere un errore di prima specie α è sotto il controllo di chi compie l analisi (in genere i valori assegnati ad α sono 0.01, 0.05 o 0.1). La scelta di α dipende fondamentalmente dai costi che derivano dal commettere un errore di prima specie. Una volta specificato il valore di α, si ottiene anche la regione di rifiuto perché è la probabilità che la statistica test cada nella regione di rifiuto quando l ipotesi nulla è vera. Il valore critico che separa la regione di accettazione da quella di rifiuto viene determinato di conseguenza. 30

31 ERRORE DI PRIMO E DI SECONDO TIPO Il coefficiente di confidenza, indicato con (1 α), rappresenta la probabilità che l ipotesi nulla non sia rifiutata quando è vera (quindi non dovrebbe essere rifiutata). Il livello di confidenza di un test di ipotesi è dato da (1 α) 100%. A differenza dell errore di prima specie, che controlliamo fissando α, la probabilità di commettere un errore di seconda specie dipende dalla differenza tra il valore ipotizzato e il vero valore del parametro della popolazione: se la differenza è grande, è probabile che β sia piccolo. La potenza del test, indicata con (1 β), rappresenta la probabilità di rifiutare l ipotesi nulla quando è falsa (e quindi dovrebbe essere rifiutata). 31

32 VERIFICA DI IPOTESI AD UN CAMPIONE Un modo per controllare e ridurre l errore di seconda specie consiste nell aumentare la dimensione del campione perché un elevata dimensione del campione consente di individuare anche piccole differenze tra la statistica campionaria e il parametro della popolazione. Per un dato valore di α, l aumento della dimensione campionaria determina una riduzione di β e quindi un aumento della potenza del test per verificare se l ipotesi nulla H 0 èfalsa. Tuttavia per una data ampiezza campionaria dobbiamo tenere conto del trade-off tra i due possibili tipi di errori: possiamo fissare un valore piccolo per α, tuttavia al diminuire di α, β aumenta e pertanto una riduzione del rischio connesso all errore di prima specie si accompagna a un aumento di quello connesso a un errore di seconda specie. 32

33 VERIFICA DI IPOTESI AD UN CAMPIONE Tornando al problema di stabilire se il processo produttivo funziona in maniera adeguata, viene estrae un campione di 25 scatole, esse sono pesate e si confronta il peso medio delle scatole del campione (la statistica campionaria) con la media di 368 grammi (il valore ipotizzato del parametro). L ipotesi nulla e l ipotesi alternativa in questo esempio sono rispettivamente: H 0 : µ = 368 H 1 : µ 368 Se si assume che la popolazione abbia distribuzione normale e che scarto quadratico medio della popolazione σ sia noto, la verifica di ipotesi viene condotta utilizzando il cosiddetto test di ipotesi Z. Tale test può essere applicato anche se la distribuzione non è normale purché l ampiezza sia sufficientemente elevata (Teorema del Limite Centrale). 33

34 VERIFICA DI IPOTESI AD UN CAMPIONE L equazione illustra come si ottiene la statistica test Z. Il numeratore dell equazione misura di quanto la media osservata X differisce dalla media µ ipotizzata, mentre al denominatore troviamo l errore standard della media. Pertanto Z ci dice per quanti errori standard differisce da µ. Statistica Z per la verifica d ipotesi sulla media (σ noto) Z = X σ / µ Per definire le regioni di accettazione e di rifiuto è necessario determinare i valori critici della statistica test, facendo riferimento alla distribuzione normale standardizzata una volta fissato l errore di prima specie α. n X 34

35 VERIFICA DI IPOTESI AD UN CAMPIONE Ad esempio, se si fissa α=0.05, l area sottesa in corrispondenza della regione di rifiuto deve essere pari a Poiché la regione di rifiuto coincide con le due code della distribuzione (si parla di un test a due code), l area 0.05 viene divisa in due aree di Una regione di rifiuto di nelle due code della distribuzione normale dà luogo a un area cumulata di alla sinistra del valore critico più piccolo e a un area pari a alla sinistra del valore critico più grande. Cercando queste aree nella tavola della distribuzione normale [Tavola E.2b], troviamo che i valori critici che dividono la regione di rifiuto da quella di accettazione sono 1.96 e

36 VERIFICA DI IPOTESI AD UN CAMPIONE La Figura mostra che se la media µ ha valore 368, come ipotizza H 0, allora la statistica test Z ha una distribuzione normale standardizzata. Valori di Z maggiori di o minori di 1.96 indicano che X è così distante dal valore ipotizzato per µ (368) che non è probabile che questo valore si verifichi quando H 0 è vera. 36

37 VERIFICA DI IPOTESI AD UN CAMPIONE Pertanto la regola decisionale è la seguente: Rifiutare H 0 se Z α/2 < 1.96 oppure se Z α/2 >+1.96 Non rifiutare H 0 altrimenti Supponiamo che la media campionaria calcolata a partire dal campione di 25 scatole sia grammi e che σ sia 15 grammi, allora X µ Z = = = σ / n 15/ 25 e quindi non è possibile rifiutare l ipotesi nulla. 37

38 VERIFICA DI IPOTESI AD UN CAMPIONE Le 6 fasi della verifica di ipotesi utilizzando l approccio del valore critico: 1. Specificare l ipotesi nulla e l ipotesi alternativa. 2. Scegliere il livello di significatività α e l ampiezza campionaria n. Il livello di significatività viene fissato in base all importanza relativa che si accorda ai rischi derivanti dal commettere un errore di prima specie e dal commettere un errore di seconda specie. 3. Individuare la tecnica statistica a cui fare riferimento e la corrispondente distribuzione campionaria

39 VERIFICA DI IPOTESI AD UN CAMPIONE Calcolare i valori critici che separano la regione di rifiuto da quella di accettazione. 5. Raccogliere i dati e calcolare il valore campionario della statistica test. 6. Prendere la decisione statistica. Se la statistica test cade nella regione di accettazione, l ipotesi nulla H 0 non può essere rifiutata. Se la statistica test cade nella regione di rifiuto, l ipotesi nulla H 0 viene rifiutata. Esprimere la decisione statistica con riferimento al problema che si sta affrontando. 39

40 APPROCCIO DEL P-VALUE ALLA VERIFICA DI IPOTESI Esiste un altro approccio alla verifica di ipotesi: l approccio del p-value. Il p-value rappresenta la probabilità di osservare un valore della statistica test uguale o più estremo del valore che si calcola a partire dal campione, quando l ipotesi H 0 è vera. Un p-value basso porta a rifiutare l ipotesi nulla H 0. Il p-value è anche chiamato livello di significatività osservato, in quanto coincide con il più piccolo livello di significatività in corrispondenza del quale H 0 è rifiutata. In base all approccio del p-value, la regola decisionale per rifiutare H 0 è la seguente: Se il p-value è α, l ipotesi nulla non è rifiutata. Se il p-value è < α, l ipotesi nulla è rifiutata. 40

41 APPROCCIO DEL P-VALUE ALLA VERIFICA DI IPOTESI Torniamo ancora una volta all esempio relativo alla produzione delle scatole di cereali. Nel verificare se il peso medio dei cereali contenuti nelle scatole è uguale a 368 grammi, abbiamo ottenuto un valore di Z uguale a 1.50 e non abbiamo rifiutato l ipotesi, perché 1.50 è maggiore del valore critico più piccolo 1.96 e minore di quello più grande Risolviamo, ora, questo problema di verifica di ipotesi facendo ricorso all approccio del p-value. Per questo test a due code, dobbiamo, in base alla definizione del p-value, calcolare la probabilità di osservare un valore della statistica test uguale o più estremo di

42 APPROCCIO DEL P-VALUE ALLA VERIFICA DI IPOTESI Si tratta, più precisamente, di calcolare la probabilità che Z assuma un valore maggiore di 1.50 oppure minore di In base alla Tavola E.2, la probabilità che Z assuma un valore minore di 1.50 è , mentre la probabilità che Z assuma un valore minore di è , quindi la probabilità che Z assuma un valore maggiore di è = Pertanto il p-value per questo test a due code è =

43 Legame tra intervalli di confid. e verifica di ipotesi Finora abbiamo preso in considerazione i due elementi principali dell inferenza statistica gli intervalli di confidenza e la verifica di ipotesi. Sebbene abbiano una stessa base concettuale, essi sono utilizzati per scopi diversi: gli intervalli di confidenza sono stati usati per stimare i parametri della popolazione, mentre la verifica di ipotesi viene impiegata per poter prendere delle decisioni che dipendono dai valori dei parametri. Tuttavia è importante sottolineare che anche gli intervalli di confidenza possono consentire di valutare se un parametro è minore, maggiore o diverso da un certo valore: anziché sottoporre a verifica l ipotesi µ=368 possiamo risolvere il problema costruendo un intervallo di confidenza per la media µ. In questo caso accettiamo l ipotesi nulla se il valore ipotizzato è compreso nell intervallo costruito, 43

44 Legame tra intervalli di confid. e verifica di ipotesi perché tale valore non può essere considerato insolito alla luce dei dati osservati. D altronde, l ipotesi nulla va rifiutata se il valore ipotizzato non cade nell intervallo costruito, perché tale valore risulta insolito alla luce dei dati. Con riferimento al problema considerato, l intervallo di confidenza è costruito ponendo: n=25, X =372.5 grammi, σ = 15 grammi. Per un livello di confidenza del 95% (corrispondente al livello di significatività del test α=0.05), avremo: X ± Zα /2 σ / n ± (1.96) 15/ µ Poiché l intervallo comprende il valore ipotizzato di 368 grammi, non rifiutiamo l ipotesi nulla e concludiamo che non c è motivo per ritenere che il peso medio dei cereali contenuti nelle scatole sia diverso da 368 grammi. 44

45 I test ad una coda Fin qui abbiamo considerato i cosiddetti test a due code, ad esempio abbiamo contrapposto all ipotesi nulla μ=368 grammi l ipotesi alternativa μ 368. Tale ipotesi si riferisce a due eventualità: o il peso medio è minore di 368 oppure è maggiore di 368. Per questo motivo, la regione critica si divide nelle due code della distribuzione della media campionaria. In alcune situazioni, tuttavia, l ipotesi alternativa presuppone che il parametro sia maggiore o minore di un valore specificato (ci si focalizza in una direzione particolare). Per esempio, si potrebbe essere interessati all eventualità che il peso dei cereali contenuti ecceda i 368 grammi, perché in tal caso, essendo il prezzo delle scatole basato su un peso di 368 grammi, la società subirebbe delle perdite. In questo caso si intende stabilire se il peso medio è superiore a 368 grammi. 45

46 I test ad una coda L ipotesi nulla e l ipotesi alternativa in questo caso sono specificate rispettivamente: H 0 : µ 368 H 1 : µ >368 La regione di rifiuto in questo caso è interamente racchiusa nella coda destra della distribuzione della media campionaria, perché rifiutiamo l ipotesi nulla H 0 solo se la media è significativamente superiore a 368 grammi. Quando la regione di rifiuto è contenuta per intero in una coda della distribuzione della statistica test, si parla di test a una coda. Fissato il livello di significatività α, possiamo individuare, anche in questo caso, il valore critico di Z α. Nel caso H 0 : µ 368 contro H 1 : µ<368 possiamo individuare il valore critico di Z α come segue. 46

47 I test ad una coda Come si può osservare dalla tabella e dalla figura, poiché la regione critica è contenuta nella coda di sinistra della distribuzione normale standardizzata e corrisponde a un area di 0.05, il valore critico lascia alla sua sinistra una massa pari a 0.05; pertanto tale valore è (media di 1.64 e 1.65). 47

48 I test ad una coda Nell approccio del p-value al test a una coda, si calcola la probabilità di ottenere o un valore della statistica test più grande di quello osservato o un valore più piccolo a seconda della direzione dell ipotesi alternativa. Se la regione di rifiuto risulta contenuta per intero nella coda di sinistra della distribuzione della statistica test Z, dobbiamo calcolare la probabilità che Z assuma un valore minore di Z osservato, ad esempio Tale probabilità, in base alle tavole risulta

49 Il test di ipotesi t per la media (σ non noto) In molte applicazioni lo scarto quadratico medio della popolazione σ non è noto ed è quindi necessario stimarlo con lo campionarie scarto quadratico medio S. Se si assume che la popolazione abbia distribuzione normale allora la media campionaria si distribuisce secondo una t di Student con (n 1) gradi di libertà. Statistica t per la verifica d ipotesi sulla media (σ non noto) t = X S µ n Se variabile casuale X non ha una distribuzione normale la statistica t ha comunque approssimativamente una distribuzione t di Student in virtù del Teorema del Limite Centrale. 49

50 Il test di ipotesi t per la media (σ non noto) Per illustrare l uso del test t si consideri un campione di fatture per valutare se l ammontare medio delle fatture è stato uguale a $ H 0 : µ = 120 H 1 : µ α=0.05 e n=12 3. poiché σ non è noto la statistica test è t con n 1 gradi di libertà 4. il test è a due code e i valori critici si determinano dalla Tav. E3. 50

51 Il test di ipotesi t per la media (σ non noto) 5. dati i valori delle 12 fatture campionate si ottiene X = e S= e quindi X µ t = = = 1.19 S/ n 20.80/ poiché < t = 1.19 < l ipotesi nulla non va rifiutata 51

52 Il test di ipotesi Z per la proporzione In alcuni casi si è interessati a verificare ipotesi su π, la proporzione di unità nella popolazione che possiedono una certa caratteristica. A tale scopo, per un campione casuale estratto dalla popolazione, si deve calcolare la proporzione campionaria p=x/n. Se il numero di successi X e di insuccessi (n X) sono entrambi >5, la distribuzione della proporzione di successi può essere approssimata dalla distribuzione normale e, quindi, si può ricorrere alla statistica Z per la proporzione. Statistica test Z per la verifica d ipotesi sulla proporzione Z = p π π(1 π) La statistica test Z ha approssimativamente una distribuzione normale standard n 52

53 Il test di ipotesi Z per la proporzione Esempio: dato un campione casuale di 899 persone che lavorano a casa, 369 delle quali sono donne, si è interessati a stabilire se la proporzione di donne è il 50%, cioè H 0 : π=0.5. Si ha quindi p=x/n=369/899=0.41. Fissato un livello di significatività α=0.05, le regioni di accettazione e rifiuto sono illustrate in figura (dalle tavole il valore critico è Z =1.96). 53

54 Il test di ipotesi Z per la proporzione Z p π = = = = 5.37 π(1 π) n 0.50(1 0.50) Poiché 5.37 < 1.96 l ipotesi nulla va rifiutata. Possiamo quindi concludere che a livello di significatività α=0.05 la proporzione di donne che lavorano da casa non è pari a

55 Confronto tra medie di due pop. indipendenti Consideriamo due popolazioni indipendenti e supponiamo di estrarre un campione di ampiezza n 1 dalla prima popolazione di ampiezza n 2 dalla seconda popolazione. Siano µ 1 e µ 2 le medie che caratterizzano rispettivamente la prima e la seconda popolazione e si assumano i due scarti quadratici medi σ 1 e σ 2 come noti. Si vuole verificare l ipotesi nulla che le medie delle due popolazioni (indipendenti) sono uguali tra loro: H 0 : µ 1 = µ 2 (µ 1 µ 2 = 0) contro l ipotesi alternativa H 1 : µ 1 µ 2 (µ 1 µ 2 0) A questo scopo viene definita la statistica test Z per la differenza tra le due medie. 55

56 Confronto tra medie di due pop. indipendenti 56

57 Confronto tra medie di due pop. indipendenti Se si assume che i due campioni siano estratti casualmente ed indipendentemente da due popolazioni normali la statistica Z ha distribuzione normale. Se le due popolazioni non hanno distribuzione normale il test Z può essere utilizzato con ampiezza campionarie sufficientemente elevate (in virtù del teorema del limite centrale). In molti casi le varianze delle due popolazioni non sono note. Se si assume l ipotesi di omogeneità della varianze (σ 2 1=σ 2 2), per verificare se c è una differenza significativa tra le medie delle due popolazioni è possibile utilizzare il test t basato sulle varianze campionarie combinate. Il test t è appropriato se le popolazioni hanno distribuzione normale oppure, in caso contrario, se le ampiezze campionarie sono sufficientemente elevate. 57

58 Confronto tra medie di due pop. indipendenti 58

59 Confronto tra medie di due pop. indipendenti Regione di rifiuto e di accettazione per la differenza tra due medie utilizzando la statistica test t basata sulle varianze combinate (test a due code). Quando l assunzione dell omogeneità delle varianze non è plausibile occorre fare riferimento al test t con varianze diverse (ricorrendo all Excel o ad altri software statistici). 59

60 Confronto tra medie di due pop. indipendenti Esempio: confronto tra le vendite settimanali (numero di pezzi venduti) della BLK cola in due gruppi di supermercati, dove il primo adotta la collocazione a scaffale mentre il secondo utilizza uno spazio dedicato 60

61 Confronto tra medie di due pop. indipendenti 61

62 Confronto tra medie di due pop. indipendenti In base al fatto che l ipotesi alternativa sia nella forma A: H 1 :µ 1 µ 2 oppure B: H 1 :µ 1 <µ 2 o C: H 1 :µ 1 >µ 2 si parla di test ad una coda e test a due code. 62

63 Intervallo di confidenza per la differenza tra le medie di due pop. indipendenti Anziché (o oltre a) sottoporre a verifica l ipotesi nulla secondo la quale due medie sono uguali, possiamo utilizzare l equazione (10.3) per ottenere un intervallo di confidenza per la differenza tra le medie µ 1 e µ 2 delle due popolazioni: Intervallo di confidenza per la differenza (µ 1 µ 2 ) ( X X ) t S 1 n + 1 n µ µ ( ) n n 1; α /2 p ( X X ) + t S 1 n + 1 n ( ) n n 1; α /2 p 1 2 dove t n1 n2 2;α/2 è il valore critico a cui corrisponde un area cumulata pari a (1 α/2) della distribuzione t di Student con (n 1 n 2 2) gradi di libertà. 63

64 Confronto tra le proporzioni di due popolazioni Spesso si è interessati a effettuare confronti e ad analizzare differenze tra due popolazioni con riferimento alla proporzione di casi con una certa caratteristica Per confrontare due proporzioni sulla base dei risultati di due campioni si può ricorrere al test Z per la differenza tra due proporzioni, la cui statistica test ha distribuzione approssimativamente normale quando le ampiezza campionarie sono sufficientemente elevate Statistica Z per la differenza tra due proporzioni ( p p ) ( π π ) X Z = con p = + X, p X =, p X = 1 1 p(1 p) + n1 n n1+ n2 n1 n2 64

65 Confronto tra le proporzioni di due popolazioni A seconda di come è formulata l ipotesi alternativa avremo un test a due code (H 1 : π 1 π 2 (π 1 π 2 0)) o un test a una coda (ipotesi direzionali: H 1 : π 1 > π 2 (π 1 π 2 > 0) oppure H 1 : π 1 < π 2 (π 1 π 2 < 0)). Esempio La catena di alberghi TC Resort è interessata a valutare se esiste differenza tra la proporzione di clienti che intendono visitare nuovamente due dei suoi alberghi. Vengono campionati 227 clienti nel primo albergo e 262 dal secondo di cui 163 si dicono disposti a ritornare nel primo campione, 154 nel secondo. Adottando un livello di significatività pari a 0.05 si può affermare che nei due alberghi esiste una differenza tra la proporzione di coloro che sono disposti a ritornare? 65

66 Confronto tra le proporzioni di due popolazioni Z= + 3,01 > +1,96 perciò si rifiuta H 0 concludendo che le percentuali sono diverse. 66

67 Intervallo di conf. per la differ. tra due proporzioni Anziché (o oltre a) sottoporre a verifica l ipotesi nulla secondo la quale due proporzioni sono uguali, possiamo utilizzare la seguente equazione per ottenere un intervallo di confidenza per la differenza tra le due proporzioni. Intervallo di confidenza per la differenza tra due proporzioni p (1 p ) p (1 p ) ( p p ) Z + ( π π ) α /2 1 2 n1 n2 p1(1 p1) p2(1 p2) ( p1 p2 ) + Zα /2 + n n

68 Test F per il rapporto tra due varianze Talvolta si pone il problema di valutare l ipotesi di omogeneità delle varianze e a questo scopo è possibile considerare un test statistico per verificare H 0 : σ 2 1 = σ 2 2 contro l ipotesi alternativa H 1 : σ 2 1 σ 2 2. Questo test è basato sul rapporto delle due varianze campionarie: F = S 2 1 / S 2 2 La statistica test F segue una distribuzione F con (n 1 1) e (n 2 1) gradi di libertà rispettivamente a numeratore e a denominatore. 68

69 Test F per il rapporto tra due varianze Esempio: determinazione del valore critico superiore F U di una distribuzione F con 9 e 9 gradi di libertà corrispondente a un area nella coda destra pari a Esiste un modo molto semplice per determinare il valore critico inferiore F L : F L =1/F U*, dove F * U è il valore critico superiore delle distribuzione F con gradi di libertà invertiti, cioè (n 2 1) a numeratore e (n 1 1) a denominatore. 69

70 Test F per il rapporto tra due varianze Regioni di rifiuto e di accettazione per un test F a due code sull uguaglianza tra due varianze a un livello di significatività pari a 0.05, con 9 e 9 gradi di libertà. Nella verifica di ipotesi sulla omogeneità delle varianze si ipotizza che le due popolazioni siano normali. La statistica F non è robusta rispetto a violazioni di questa assunzione. 70

71 Analisi della varianza (ANOVA) ad una via Finora abbiamo descritto test di ipotesi finalizzati alla verifica di ipotesi sulla differenza tra parametri di due popolazioni Spesso si presenta la necessità di prendere in considerazione esperimenti od osservazioni relative a più di due gruppi individuati sulla base di un fattore di interesse. I gruppi sono quindi formati secondo i livelli assunti da un fattore, ad esempio la temperatura di cottura di un oggetto in ceramica che assume diversi livelli numerici come 300, 350,400,450 oppure il fornitore che serve una azienda può assumere diversi livelli qualitativi come Fornitore 1, Fornitore 2, Fornitore 3, Fornitore 4. 71

72 Analisi della varianza (ANOVA) ad una via L analisi della varianza (o ANOVA, ANalysis Of VAriance) è una tecnica che consente di confrontare da un punto di vista inferenziale le medie di più di due gruppi (popolazioni). Quando i gruppi sono definiti sulla base di un singolo fattore si parla di analisi della varianza a un fattore o a una via. Questa procedura, basata su un test F, è una estensione a più gruppi del test t per verificare l ipotesi sulla differenza tra le medie di due popolazioni indipendenti. Anche se si parla di analisi della varianza in realtà l oggetto di interesse sono le differenze tra medie nei diversi gruppi e proprio tramite l analisi della variabilità all interno dei gruppi e tra gruppi che siamo in grado di trarre delle conclusioni sulla differenza delle medie. 72

73 Analisi della varianza (ANOVA) ad una via La variabilità all interno dei gruppi è considerata un errore casuale, mentre la variabilità tra i gruppi è attribuibile alle differenza tra i gruppi, ed è anche chiamata effetto del trattamento. Ipotizziamo che c gruppi rappresentino popolazioni con distribuzione normale, caratterizzate tutte dalla stessa varianza e che le osservazioni campionarie siano estratte casualmente ed indipendentemente dai c gruppi. In questo contesto l ipotesi nulla che si è interessati a verificare è che le medie di tutti gruppi siano uguali tra loro H 0 : µ 1 = µ 2 = = µ c contro l ipotesi alternativa H 1 : non tutte le µ j sono uguali tra loro (con j=1,,c) 73

74 Analisi della varianza (ANOVA) ad una via Per verificare le due ipotesi considerate, la variabilità totale (misurata dalla somma dei quadrati totale SST) viene scomposta in due componenti: una componente attribuibile alla differenza tra i gruppi (misurata dalla somma dei quadrati tra i gruppi SSA) e una seconda componente che si riferisce alle differenze riscontrare all interno del gruppi (misurata dalla somma dei quadrati all interno dei gruppi SSW). 74

75 Analisi della varianza (ANOVA) ad una via Poiché sotto l ipotesi nulla si assume che le medie dei gruppi siano tutti uguali, la variabilità totale SST si ottiene sommando le differenze al quadrato di ciascuna osservazione e la media complessiva, indicata con. X Variabilità totale nell ANOVA a una via dove c c n j j= 1 i= 1 ( ) 2 ij SST = X X n j X ij c j= 1 i= 1 X = = media complessiva, n= n n SST è caratterizzata da (n 1) gradi di libertà poiché ciascuna osservazione X ij viene confrontata con la media campionaria complessiva X. j= 1 j 75

76 Analisi della varianza (ANOVA) ad una via La variabilità tra gruppi SSA si ottiene sommando le differenze al quadrato tra le medie campionarie di ciascun gruppo, X j, e la media complessiva, X, dove ogni differenza è ponderata con l ampiezza campionaria n j del gruppo a cui è riferita. Variabilità tra gruppi nell ANOVA a una via X n j ij c = j j= 1 ( ) 2 j SSA n X X i= 1 dove media campionaria nel j-esimo campione j = n X j Poiché si tratta di confrontare c gruppi, SSA sarà caratterizzata da (c 1) gradi di libertà. 76

77 Analisi della varianza (ANOVA) ad una via Infine, la variabilità nei gruppi SSW si ottiene sommando le differenze al quadrato tra ciascuna osservazione e la media campionaria del gruppo a cui appartiene. Variabilità all interno dei gruppi nell ANOVA a una via c n j j= 1 i= 1 ( ) 2 ij j SSW = X X Poiché ciascuno dei c gruppi contribuisce con (n j 1) gradi di libertà, SSW avrà complessivamente (n c)= = (n j 1) gradi di libertà. Dividendo ciascuna somma dei quadrati per i rispettivi gradi di libertà, si ottengono tre varianze, o medie dei quadrati MSA (la media dei quadrati tra gruppi), MSW (la media dei quadrati all interno dei gruppi) e MST (la media dei quadrati totale). 77

78 Analisi della varianza (ANOVA) ad una via Se l ipotesi nulla è vera e non ci sono differenze significative tra le medie dei gruppi, le tre medie dei quadrati MSA, MSW e MST, che sono esse stesse delle stime di varianze e rappresentano tutte stime della varianza globale della popolazione sottostante. Quindi per verificare l ipotesi nulla contro l alternativa si fa riferimento alla statistica test F per l ANOVA a una via, ottenuta come rapporto tra MSA e MSW. Statistica test F per l ANOVA a una via SSA/( n c) MSA F = = SSW /( c 1) MSW Se l ipotesi nulla è vera, la realizzazione della statistica F dovrebbe essere approssimativamente 1, mentre se H 0 è falsa ci aspettiamo valori significativ. superiori all unità. 78

79 Analisi della varianza (ANOVA) ad una via La statistica F ha distribuzione F con (c 1) gradi di libertà al numeratore e (n c) gradi di libertà al denominatore. Quindi, fissato il livello di significatività α, l ipotesi nulla dovrà essere rifiutata se il valore osservato della statistica test è maggiore del valore critico F U di una distribuzione F con (c 1) e (n c) gradi di libertà. 79

80 Analisi della varianza (ANOVA) ad una via I risultati del test F per l ANOVA vengono solitamente riportati nella cosiddetta tabella dell ANOVA. Nella tabella dell ANOVA viene solitamente riportato anche il p-value, cioè la probabilità di osservare un valore di F maggiore o uguale a quello osservato, nel caso l ipotesi nulla sia vera. Come usuale, l ipotesi nulla di uguaglianza tra le medie dei gruppi deve essere rifiutata quando il p-value è inferiore al livello di significatività scelto. 80

81 Analisi della varianza (ANOVA) ad una via Esempio: una azienda produttrice di paracadute, vuole confrontare la resistenza dei paracadute prodotti con fibre sintetiche acquistate da quattro diversi fornitori. 81

82 Analisi della varianza (ANOVA) ad una via Fissiamo α=0.05 e identifichiamo nelle tavole il valore critico di interesse. 82

83 Analisi della varianza (ANOVA) ad una via Poiché il valore osservato della statistica test è F=3.46< 3.24=F U l ipotesi nulla deve essere rifiutata e si conclude che la resistenza media dei paracadute varia in modo significativo a seconda del fornitore. 83

84 Analisi della varianza (ANOVA) ad una via Procedura di Tukey-Cramer Quando si rifiuta l ipotesi nulla del F per l ANOVA, viene stabilito che ci sono almeno due medie significativamente diverse tra loro. Per identificare quali sono i gruppi che effettivamente differiscono tra loro si deve utilizzare una ulteriore procedura che rientra nei cosiddetti metodi dei confronti multipli. Tra questi metodi, la procedura di Tukey-Cramer consente di effettuare simultaneamente confronti a due a due tra tutti i gruppi. A questo scopo si deve innanzi tutto calcolare c (c 1)/2 differenze tra le medie campionarie di tutti i gruppi X (con j j ), quindi calcolare il range j X j' critico (ampiezza critica) della procedura di Tukey- Cramer. 84

85 Analisi della varianza (ANOVA) ad una via Procedura di Tukey-Cramer Se la differenza tra due medie campionarie è superiore al range critico, le corrispondenti medie dei gruppi (popolazioni) sono dichiarate significativamente diverse a livello di significatività α. Calcolo del range critico per la procedura di Tukey-Cramer Range critico MSW 1 1 = QU + 2 nj n dove Q U è il valore critico superiore della distribuzione del range studentizzato con c gradi di libertà al numeratore e n c gradi di libertà al denominatore. j' 85

86 Analisi della varianza (ANOVA) ad una via Esempio della procedura di Tukey-Cramer per il caso dei paracadute. 86

87 Analisi della varianza (ANOVA) ad una via Procedura di Tukey-Cramer 87

88 Analisi della varianza (ANOVA) ad una via Assunzioni alla base del test F per l ANOVA a una via Prima di applicare un test di ipotesi è sempre necessario valutare se le assunzioni di base del test possono o mene essere ragionevolmente soddisfatte. Le ipotesi alla base del test F per l ANOVA a una via sono essenzialmente tre: casualità e indipendenza; normalità; omogeneità delle varianze. L ultima ipotesi stabilisce che le varianze nei gruppi sono tra loro uguali (σ 2 1 = σ 2 2 = = σ 2 c). Nel caso di campioni con ampiezza simile le inferenze basate sulla distribuzione F non sono molto influenzate da eventuali differenze tra varianze, al contrario se le ampiezze sono diverse tra loro il problema potrebbe essere serio. 88

89 Analisi della varianza (ANOVA) ad una via Test di Levene per l omogeneità delle varianze Questa procedura inferenziale è stata sviluppata per verificare l ipotesi nulla H 0 : σ 2 1 = σ 2 2 = = σ 2 c contro l ipotesi alternativa H 1 : non tutte le varianze sono uguali. Per verificare tale ipotesi si calcola la differenza in valore assoluto tra ogni osservazione e la mediana campionaria del gruppo di appartenenza e su questi dati si conduce l ANOVA a una via. Per l esempio dei paracadute si considera: 89

90 Analisi della varianza (ANOVA) ad una via Test di Levene per l esempio dei paracadute 90

Il campionamento e l inferenza. Il campionamento e l inferenza

Il campionamento e l inferenza. Il campionamento e l inferenza Il campionamento e l inferenza Popolazione Campione Dai dati osservati mediante scelta campionaria si giunge ad affermazioni che riguardano la popolazione da cui essi sono stati prescelti Il campionamento

Dettagli

Capitolo 11 Test chi-quadro

Capitolo 11 Test chi-quadro Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 11 Test chi-quadro Insegnamento: Statistica Corsi di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara Docenti: Dott.

Dettagli

Capitolo 7. Distribuzioni campionarie. Statistica. Levine, Krehbiel, Berenson

Capitolo 7. Distribuzioni campionarie. Statistica. Levine, Krehbiel, Berenson Levine, Krehbiel, Berenson Statistica Capitolo 7 Distribuzioni campionarie Insegnamento: Statistica Applicata Corsi di Laurea in "Scienze e tecnologie Alimentari" Unità Integrata Organizzativa Agraria,

Dettagli

Capitolo 6. La distribuzione normale

Capitolo 6. La distribuzione normale Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 6 La distribuzione normale Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università

Dettagli

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria Civile A.A. 2009-10 Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain 1 STATISTICHE, DISTRIBUZIONI CAMPIONARIE

Dettagli

Statistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione.

Statistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione. Statistica inferenziale La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione. Verifica delle ipotesi sulla medie Quando si conduce una

Dettagli

Distribuzioni campionarie. Antonello Maruotti

Distribuzioni campionarie. Antonello Maruotti Distribuzioni campionarie Antonello Maruotti Outline 1 Introduzione 2 Concetti base Si riprendano le considerazioni fatte nella parte di statistica descrittiva. Si vuole studiare una popolazione con riferimento

Dettagli

Esercitazioni di statistica

Esercitazioni di statistica Esercitazioni di statistica Misure di associazione: Indipendenza assoluta e in media Stefania Spina Universitá di Napoli Federico II stefania.spina@unina.it 22 ottobre 2014 Stefania Spina Esercitazioni

Dettagli

Il test (o i test) del Chi-quadrato ( 2 )

Il test (o i test) del Chi-quadrato ( 2 ) Il test (o i test) del Chi-quadrato ( ) I dati: numerosità di osservazioni che cadono all interno di determinate categorie Prima di tutto, è un test per confrontare proporzioni Esempio: confronto tra numero

Dettagli

ˆp(1 ˆp) n 1 +n 2 totale di successi considerando i due gruppi come fossero uno solo e si costruisce z come segue ˆp 1 ˆp 2. n 1

ˆp(1 ˆp) n 1 +n 2 totale di successi considerando i due gruppi come fossero uno solo e si costruisce z come segue ˆp 1 ˆp 2. n 1 . Verifica di ipotesi: parte seconda.. Verifica di ipotesi per due campioni. Quando abbiamo due insiemi di dati possiamo chiederci, a seconda della loro natura, se i campioni sono simili oppure no. Ci

Dettagli

Carta di credito standard. Carta di credito business. Esercitazione 12 maggio 2016

Carta di credito standard. Carta di credito business. Esercitazione 12 maggio 2016 Esercitazione 12 maggio 2016 ESERCIZIO 1 Si supponga che in un sondaggio di opinione su un campione di clienti, che utilizzano una carta di credito di tipo standard (Std) o di tipo business (Bsn), si siano

Dettagli

Distribuzioni di probabilità

Distribuzioni di probabilità Distribuzioni di probabilità Distribuzioni di probabilità L analisi statistica spesso studia i fenomeni collettivi confrontandoli con modelli teorici di riferimento. Tra di essi, vedremo: la distribuzione

Dettagli

STATISTICHE DESCRITTIVE Parte II

STATISTICHE DESCRITTIVE Parte II STATISTICHE DESCRITTIVE Parte II INDICI DI DISPERSIONE Introduzione agli Indici di Dispersione Gamma Differenza Interquartilica Varianza Deviazione Standard Coefficiente di Variazione introduzione Una

Dettagli

a) Usando i seguenti livelli di significatività, procedere alla verifica di ipotesi, usando come ipotesi alternativa un'ipotesi unidirezionale:

a) Usando i seguenti livelli di significatività, procedere alla verifica di ipotesi, usando come ipotesi alternativa un'ipotesi unidirezionale: ESERCIZIO 1 Da studi precedenti, il responsabile del rischio di una grande banca sa che l'ammontare medio di denaro che deve essere corrisposto dai correntisti che hanno il conto scoperto è pari a 240.

Dettagli

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n.

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n. 5 STIMA PUNTUALE DEI PARAMETRI [Adattato dal libro Excel per la statistica di Enzo Belluco] Sia θ un parametro incognito della distribuzione di un carattere in una determinata popolazione. Il problema

Dettagli

Proprietà della varianza

Proprietà della varianza Proprietà della varianza Proprietà della varianza Proprietà della varianza Proprietà della varianza Intermezzo: ma perché dovremmo darci la pena di studiare come calcolare la varianza nel caso di somme,

Dettagli

Prova scritta di STATISTICA. CDL Biotecnologie. (Programma di Massimo Cristallo - A)

Prova scritta di STATISTICA. CDL Biotecnologie. (Programma di Massimo Cristallo - A) Prova scritta di STATISTICA CDL Biotecnologie (Programma di Massimo Cristallo - A) 1. Un associazione di consumatori, allo scopo di esaminare la qualità di tre diverse marche di batterie per automobili,

Dettagli

Esame di Statistica (10 o 12 CFU) CLEF 11 febbraio 2016

Esame di Statistica (10 o 12 CFU) CLEF 11 febbraio 2016 Esame di Statistica 0 o CFU) CLEF febbraio 06 Esercizio Si considerino i seguenti dati, relativi a 00 clienti di una banca a cui è stato concesso un prestito, classificati per età e per esito dell operazione

Dettagli

Statistica descrittiva e statistica inferenziale

Statistica descrittiva e statistica inferenziale Statistica descrittiva e statistica inferenziale 1 ALCUNI CONCETTI POPOLAZIONE E CAMPIONE Popolazione: insieme finito o infinito di unità statistiche classificate secondo uno o più caratteri Campione:

Dettagli

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 21/09/2011

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 21/09/2011 FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 1/9/11 ESERCIZIO 1 (+3++3) La seguente tabella riporta la distribuzione di frequenza dei valori di emoglobina nel sangue (espressi

Dettagli

Sintesi dei dati in una tabella. Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6)

Sintesi dei dati in una tabella. Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6) Sintesi dei dati in una tabella Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6) Sintesi dei dati Spesso si vuole effettuare una sintesi dei dati per ottenere indici

Dettagli

REGRESSIONE E CORRELAZIONE

REGRESSIONE E CORRELAZIONE REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.

Dettagli

Esercitazioni di statistica

Esercitazioni di statistica Esercitazioni di statistica Intervalli di confidenza Stefania Spina Universitá di Napoli Federico II stefania.spina@unina.it 10 Dicembre 2014 Stefania Spina Esercitazioni di statistica 1/43 Stefania Spina

Dettagli

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE 1 STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE La presentazione dei dati per molte ricerche mediche fa comunemente riferimento a frequenze, assolute o percentuali. Osservazioni cliniche conducono

Dettagli

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Un breve richiamo sul test t-student Siano A exp (a 1, a 2.a n ) e B exp (b 1, b 2.b m ) due set di dati i cui

Dettagli

Analisi della varianza

Analisi della varianza 1. 2. univariata ad un solo fattore tra i soggetti (between subjects) 3. univariata: disegni fattoriali 4. univariata entro i soggetti (within subjects) 5. : disegni fattoriali «misti» L analisi della

Dettagli

Schema lezione 5 Intervalli di confidenza

Schema lezione 5 Intervalli di confidenza Schema lezione 5 Intervalli di confidenza Non centrerò quella barca, ne sono convinto al 95% COMPRENDERE: Significato di intervallo di confidenza Uso degli stimatori come quantità di pivot per stime intervallari

Dettagli

1 L estrazione di radice

1 L estrazione di radice 1 L estrazione di radice Consideriamo la potenza 3 2 = 9 di cui conosciamo: Esponente 3 2 = 9 Valore della potenza Base L operazione di radice quadrata consiste nel chiedersi qual è quel numero x che elevato

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2013-2014 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

Lezione 4 a - Misure di dispersione o di variabilità

Lezione 4 a - Misure di dispersione o di variabilità Lezione 4 a - Misure di dispersione o di variabilità Abbiamo visto che la media è una misura della localizzazione centrale della distribuzione (il centro di gravità). Popolazioni con la stessa media possono

Dettagli

Il confronto fra medie

Il confronto fra medie L. Boni Obiettivo Verificare l'ipotesi che regimi alimentari differenti non producano mediamente lo stesso effetto sulla gittata cardiaca Ipotesi nulla IPOTESI NULLA La dieta non dovrebbe modificare in

Dettagli

STIMA DELLA VARIANZA CAMPIONARIA

STIMA DELLA VARIANZA CAMPIONARIA STIMA DELLA VARIANZA CAMPIONARIA Abbiamo visto che una stima puntuale corretta per il valore atteso µ delle variabili aleatorie X i è x n = (x 1 +.. + x n )/n. Una stima puntuale della varianza σ 2 delle

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative

Dettagli

Probabilità. Ing. Ivano Coccorullo

Probabilità. Ing. Ivano Coccorullo Ing. Ivano Coccorullo PROBABILITA Teoria della Eventi certi, impossibili e casuali Nella scienza e nella tecnologia è fondamentale il principio secondo il quale ogni volta che si realizza un insieme di

Dettagli

Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 15: Metodi non parametrici

Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 15: Metodi non parametrici Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 15: Metodi non parametrici 1 Metodi non parametrici Statistica classica La misurazione avviene con

Dettagli

Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill

Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill Es. Soluzione degli esercizi del capitolo 8 home - indice In base agli arrotondamenti effettuati nei calcoli, si

Dettagli

Campo di Variazione Costituisce la misura di

Campo di Variazione Costituisce la misura di Statistica2 22/09/2015 I Parametri di dispersione Campo di Variazione Costituisce la misura di PESO ALLA NASCITA DEI BOVINI matricola PESO SESSO 7 38,00 F 8 38,00 F 1 40,00 F 2 40,00 F 5 40,00 F 10 42,00

Dettagli

APPUNTI DI MATEMATICA ALGEBRA \ CALCOLO LETTERALE \ MONOMI (1)

APPUNTI DI MATEMATICA ALGEBRA \ CALCOLO LETTERALE \ MONOMI (1) LGEBR \ CLCOLO LETTERLE \ MONOMI (1) Un monomio è un prodotto di numeri e lettere; gli (eventuali) esponenti delle lettere sono numeri naturali (0 incluso). Ogni numero (reale) può essere considerato come

Dettagli

Concetti principale della lezione precedente

Concetti principale della lezione precedente Corso di Statistica medica e applicata 9 a Lezione Dott.ssa Donatella Cocca Concetti principale della lezione precedente I concetti principali che sono stati presentati sono: Variabili su scala nominale

Dettagli

LEZIONE 4. { x + y + z = 1 x y + 2z = 3

LEZIONE 4. { x + y + z = 1 x y + 2z = 3 LEZIONE 4 4.. Operazioni elementari di riga. Abbiamo visto, nella precedente lezione, quanto sia semplice risolvere sistemi di equazioni lineari aventi matrice incompleta fortemente ridotta per righe.

Dettagli

04 - Numeri Complessi

04 - Numeri Complessi Università degli Studi di Palermo Scuola Politecnica Dipartimento di Scienze Economiche, Aziendali e Statistiche Appunti del corso di Matematica 04 - Numeri Complessi Anno Accademico 2015/2016 M. Tumminello,

Dettagli

Corso di Psicometria Progredito

Corso di Psicometria Progredito Corso di Psicometria Progredito 5. La correlazione lineare Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014 Sommario 1 Tipi di relazione

Dettagli

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Regressione Lineare e Correlazione Argomenti della lezione Determinismo e variabilità Correlazione Regressione Lineare

Dettagli

Capitolo 2 Le misure delle grandezze fisiche

Capitolo 2 Le misure delle grandezze fisiche Capitolo 2 Le misure delle grandezze fisiche Gli strumenti di misura Gli errori di misura Il risultato di una misura Errore relativo ed errore percentuale Propagazione degli errori Rappresentazione di

Dettagli

Esercitazioni di Statistica

Esercitazioni di Statistica Esercitazioni di Statistica Indici di posizione e di variabilità Prof. Livia De Giovanni lstatistica@dis.uniroma1.it Esercizio 1 Data la seguente distribuzione unitaria del carattere X: X : 4 2 4 2 6 4

Dettagli

I RADICALI QUADRATICI

I RADICALI QUADRATICI I RADICALI QUADRATICI 1. Radici quadrate Definizione di radice quadrata: Si dice radice quadrata di un numero reale positivo o nullo a, e si indica con a, il numero reale positivo o nullo (se esiste) che,

Dettagli

CONFRONTI MULTIPLI TEST HSD DI TUKEY

CONFRONTI MULTIPLI TEST HSD DI TUKEY CONFRONTI MULTIPLI TEST HSD DI TUKEY Nel caso in cui i risultati dell analisi della varianza ad una via sono significativi, ovvero se il R.V. è risultato avere un F maggiore dell F critico, e quindi le

Dettagli

Variabili casuali ad una dimensione Testi degli esercizi. Variabili casuali ad una dimensione a.a. 2012/2013 1

Variabili casuali ad una dimensione Testi degli esercizi. Variabili casuali ad una dimensione a.a. 2012/2013 1 Variabili casuali ad una dimensione Testi degli esercizi 1 Costruzione di variabile casuale discreta Esercizio 1. Sia data un urna contenente 3 biglie rosse, 2 biglie bianche ed una biglia nera. Ad ogni

Dettagli

Teorema del limite centrale TCL

Teorema del limite centrale TCL Teorema del limite centrale TCL Questo importante teorema della statistica inferenziale si applica a qualsiasi variabile aleatoria che sia combinazione lineare di N variabili aleatorie le cui funzioni

Dettagli

MISURE DI SINTESI 54

MISURE DI SINTESI 54 MISURE DI SINTESI 54 MISURE DESCRITTIVE DI SINTESI 1. MISURE DI TENDENZA CENTRALE 2. MISURE DI VARIABILITÀ 30 0 µ Le due distribuzioni hanno uguale tendenza centrale, ma diversa variabilità. 30 0 Le due

Dettagli

L Analisi della Varianza ANOVA (ANalysis Of VAriance)

L Analisi della Varianza ANOVA (ANalysis Of VAriance) L Analisi della Varianza ANOVA (ANalysis Of VAriance) 1 CONCETTI GENERALI Finora abbiamo descritto test di ipotesi finalizzati alla verifica di ipotesi sulla differenza tra parametri di due popolazioni

Dettagli

Statistica Inferenziale

Statistica Inferenziale Statistica Inferenziale Prof. Raffaella Folgieri Email: folgieri@mtcube.com aa 2009/2010 Esercizio 1 (stima puntuale) In un processo di controllo di qualità, siamo interessati al numero mensile di guasti

Dettagli

STATISTICA DESCRITTIVA. Elementi di statistica medica GLI INDICI INDICI DI DISPERSIONE STATISTICA DESCRITTIVA

STATISTICA DESCRITTIVA. Elementi di statistica medica GLI INDICI INDICI DI DISPERSIONE STATISTICA DESCRITTIVA STATISTICA DESCRITTIVA Elementi di statistica medica STATISTICA DESCRITTIVA È quella branca della statistica che ha il fine di descrivere un fenomeno. Deve quindi sintetizzare tramite pochi valori(indici

Dettagli

ESERCIZI SVOLTI SUL CALCOLO INTEGRALE

ESERCIZI SVOLTI SUL CALCOLO INTEGRALE ESERCIZI SVOLTI SUL CALCOLO INTEGRALE * Tratti dagli appunti delle lezioni del corso di Matematica Generale Dipartimento di Economia - Università degli Studi di Foggia Prof. Luca Grilli Dott. Michele Bisceglia

Dettagli

CAMPIONAMENTO - ALCUNI TERMINI CHIAVE

CAMPIONAMENTO - ALCUNI TERMINI CHIAVE CAMPIONAMENTO - ALCUNI TERMINI CHIAVE POPOLAZIONE = qualsiasi insieme di oggetti (unità di analisi) di ricerca N = ampiezza della popolazione PARAMETRI = caratteristiche della popolazione [media, proporzione

Dettagli

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI I METODI PER IL CONFRONTO DI MEDIE (Campioni non indipendenti) Prof.ssa G. Serio, Prof. P. Trerotoli, Cattedra di Statistica Medica, Università di Bari

Dettagli

Modelli descrittivi, statistica e simulazione

Modelli descrittivi, statistica e simulazione Modelli descrittivi, statistica e simulazione Master per Smart Logistics specialist Roberto Cordone (roberto.cordone@unimi.it) Statistica inferenziale Cernusco S.N., giovedì 18 febbraio 2016 (9.00/13.00)

Dettagli

Campionamento La statistica media campionaria e la sua distribuzione

Campionamento La statistica media campionaria e la sua distribuzione Campionamento La statistica media campionaria e la sua distribuzione 1 Definisco il problema da studiare: es. tempo di percorrenza tra abitazione e università Carattere: tempo ossia v.s. continua Popolazione:

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Misura dell associazione tra due caratteri Uno store manager è interessato a studiare la relazione

Dettagli

Esercizi sui sistemi di equazioni lineari.

Esercizi sui sistemi di equazioni lineari. Esercizi sui sistemi di equazioni lineari Risolvere il sistema di equazioni lineari x y + z 6 x + y z x y z Si tratta di un sistema di tre equazioni lineari nelle tre incognite x, y e z Poichè m n, la

Dettagli

Graficazione qualitativa del luogo delle radici

Graficazione qualitativa del luogo delle radici .. 5.3 1 Graficazione qualitativa del luogo delle radici Esempio. Si faccia riferimento al seguente sistema retroazionato: d(t) G(s) r(t) e(t) K 1(s 1) s(s + 1)(s + 8s + 5) y(t) Per una graficazione qualitativa

Dettagli

ANOVA: ANALISI DELLA VARIANZA Prof. Antonio Lanzotti

ANOVA: ANALISI DELLA VARIANZA Prof. Antonio Lanzotti UNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II DIPARTIMENTO DI INGEGNERIA AEROSPAZIALE D.I.A.S. STATISTICA PER L INNOVAZIONE a.a. 007/008 ANOVA: ANALISI DELLA VARIANZA Prof. Antonio Lanzotti A cura di: Ing.

Dettagli

L indagine statistica

L indagine statistica 1 L indagine statistica DEFINIZIONE. La statistica è quella disciplina che si occupa della raccolta di dati quantitativi relativi a diversi fenomeni, della loro elaborazione e del loro utilizzo a fini

Dettagli

ESERCIZI. La seguente tabella riporta la classificazione delle famiglie italiane secondo il reddito dichiarato (in milioni di lire) nel 1983:

ESERCIZI. La seguente tabella riporta la classificazione delle famiglie italiane secondo il reddito dichiarato (in milioni di lire) nel 1983: ESERCIZI ESERCIZIO_1 La seguente tabella riporta la classificazione delle famiglie italiane secondo il reddito dichiarato (in milioni di lire) nel 1983: Reddito Numero di famiglie (in migliaia) 0 6 1.128

Dettagli

Esercizi sulla retta. Gruppo 1 (4A TSS SER, 4B TSS SER, 4A AM )

Esercizi sulla retta. Gruppo 1 (4A TSS SER, 4B TSS SER, 4A AM ) Esercizi sulla retta. Gruppo 1 (4A TSS SER, 4B TSS SER, 4A AM ) 1. Scrivere l'equazione della retta passante per i punti P1(-3,1), P2(2,-2). Dobbiamo applicare l'equazione di una retta passante per due

Dettagli

FUNZIONI ELEMENTARI, DISEQUAZIONI, NUMERI REALI, PRINCIPIO DI INDUZIONE Esercizi risolti

FUNZIONI ELEMENTARI, DISEQUAZIONI, NUMERI REALI, PRINCIPIO DI INDUZIONE Esercizi risolti FUNZIONI ELEMENTARI, DISEQUAZIONI, NUMERI REALI, PRINCIPIO DI INDUZIONE Esercizi risolti Discutendo graficamente la disequazione x > 3 + x, verificare che l insieme delle soluzioni è un intervallo e trovarne

Dettagli

Metodo dei minimi quadrati e matrice pseudoinversa

Metodo dei minimi quadrati e matrice pseudoinversa Scuola universitaria professionale della Svizzera italiana Dipartimento Tecnologie Innovative Metodo dei minimi quadrati e matrice pseudoinversa Algebra Lineare Semestre Estivo 2006 Metodo dei minimi quadrati

Dettagli

A1. La curva normale (o di Gauss)

A1. La curva normale (o di Gauss) Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 202/203 lezione n. 8 dell aprile 203 - di Massimo Cristallo - A. La curva normale (o di Gauss) La curva

Dettagli

CURRICOLO VERTICALE MATEMATICA RELAZIONI/ DATI E PREVISIONI/ MISURA

CURRICOLO VERTICALE MATEMATICA RELAZIONI/ DATI E PREVISIONI/ MISURA CURRICOLO VERTICALE MATEMATICA / DATI E PREVISIONI/ MISURA SCUOLA PRIMARIA CONOSCENZE (Concetti) ABILITA Classe 1^ - Classificazione - in situazioni concrete, classificare persone, oggetti, figure, numeri

Dettagli

( x) Definizione: si definisce dominio (o campo di esistenza) di una funzione f ( x) l insieme dei valori

( x) Definizione: si definisce dominio (o campo di esistenza) di una funzione f ( x) l insieme dei valori Definizione: si definisce dominio (o campo di esistenza) di una funzione f ( ) l insieme dei valori che la variabile può assumere affinché la funzione f ( ) abbia significato. Vediamo di individuare alcune

Dettagli

Esercizio 1 Questa tabella esprime i tempi di durata di 200 apparecchiature elettriche:

Esercizio 1 Questa tabella esprime i tempi di durata di 200 apparecchiature elettriche: Istituzioni di Statistica 1 Esercizi su indici di posizione e di variabilità Esercizio 1 Questa tabella esprime i tempi di durata di 200 apparecchiature elettriche: Durata (ore) Frequenza 0 100? 100 200

Dettagli

pluriparametrici di stima

pluriparametrici di stima I procedimenti pluriparametrici di stima 01.IV.2011 Perché impiegare modelli pluriparametrici p del valore? Il caso più importante stime in contesti in cui è impossibile pervenire ad un campione di transazioni

Dettagli

TEOREMA DEL RESTO E REGOLA DI RUFFINI

TEOREMA DEL RESTO E REGOLA DI RUFFINI TEOREMA DEL RESTO E REGOLA DI RUFFINI ALCUNI TEOREMI IMPORTANTI Prendiamo una divisione intera tra numeri: 6 : 3 = 2. Il resto di questa divisione è 0, e questo significa che moltiplicando il quoziente

Dettagli

Elementi di statistica

Elementi di statistica Scuola media G. Ungaretti Elementi di statistica Prof. Enrico Castello Ti insegnerò a conoscere i criteri organizzatori di una tabella di dati distinguere frequenze assolute e frequenze percentuali determinare

Dettagli

CORSO DI LAUREA IN MATEMATICA

CORSO DI LAUREA IN MATEMATICA CORSO DI LAUREA IN MATEMATICA ESERCITAZIONI DI ANALISI MATEMATICA I BREVI RICHIAMI DELLA TEORIA DEI LIMITI. Confronto di infinitesimi. Sia A sottoinsieme di R, sia 0 punto di accumulazione di A nella topologia

Dettagli

percorso 4 Estensione on line lezione 2 I fattori della produzione e le forme di mercato La produttività La produzione

percorso 4 Estensione on line lezione 2 I fattori della produzione e le forme di mercato La produttività La produzione Estensione on line percorso 4 I fattori della produzione e le forme di mercato lezione 2 a produzione a produttività Una volta reperiti i fattori produttivi necessari l imprenditore dovrà decidere come

Dettagli

Esercitazione # 6. a) Fissato il livello di significatività al 5% si tragga una conclusione circa l opportunità di avviare la campagna comparativa.

Esercitazione # 6. a) Fissato il livello di significatività al 5% si tragga una conclusione circa l opportunità di avviare la campagna comparativa. Statistica Matematica A Esercitazione # 6 DUE MEDIE CON VARIANZE NOTE: Esercizio # Le ditte A e B producono sfere luminose. Una volta attivata la reazione chimica che rende luminosa una di queste sfere,

Dettagli

FACOLTA DI SCIENZE STATISTICHE Corso di laurea in Statistica, Imprese e Mercati Statistica economica (Prof. Filippucci) Prova del 19/12/07

FACOLTA DI SCIENZE STATISTICHE Corso di laurea in Statistica, Imprese e Mercati Statistica economica (Prof. Filippucci) Prova del 19/12/07 FACOLTA DI SCIENZE STATISTICHE Corso di laurea in Statistica, Imprese e Mercati Statistica economica (Prof. Filippucci) Prova del 19/12/07 Nome e cognome N. di Matricola 1.) Quale delle seguenti affermazioni

Dettagli

Richiami di aritmetica(2)

Richiami di aritmetica(2) Richiami di aritmetica() Frazioni definizioni, operazioni, espressioni Numeri decimali Rapporti e proporzioni Percentuali Materia Matematica Autore Mario De Leo Le frazioni La frazione è un operatore che

Dettagli

Tema d esame del 15/02/12

Tema d esame del 15/02/12 Tema d esame del 15/0/1 Volendo aprire un nuovo locale, una catena di ristoranti chiede ad un consulente di valutare la posizione geografica ideale all interno di un centro abitato. A questo scopo, avvalendosi

Dettagli

LA LUNGHEZZA DEI GENI UMANI (Es4.1)

LA LUNGHEZZA DEI GENI UMANI (Es4.1) STATISTICA INFERENZIALE: le caratteristiche della popolazione complessiva sono indotte da quelle osservate su un campione estratto dalla popolazione stessa(esempio exit poll) PROBLEMA: dato un campione

Dettagli

la distribuzione di uomini e donne fra i diversi settori produttivi; la ripartizione dei due sessi fra le diverse qualifiche professionali 1.

la distribuzione di uomini e donne fra i diversi settori produttivi; la ripartizione dei due sessi fra le diverse qualifiche professionali 1. Differenziali retributivi fra uomini e donne nel lavoro interinale. Alcune evidenze ricavate dalla banca dati EBITEMP sui prestiti ai lavoratori per l anno 2004. 1. Premessa Attualmente non risulta disponibile

Dettagli

Test delle ipotesi. Le differenze che vengono riscontrate possono essere ovviamente ricondotte a due possibilità:

Test delle ipotesi. Le differenze che vengono riscontrate possono essere ovviamente ricondotte a due possibilità: Test delle ipotesi Test delle ipotesi Nel cercare di costruire un legame tra dati osservati e ipotesi teoriche sulle caratteristiche dell intera popolazione si deve, in genere, prendere una decisione per

Dettagli

Esempi di attribuzione dei seggi

Esempi di attribuzione dei seggi Esempi di attribuzione dei seggi Al fine di chiarire il funzionamento dei meccanismi previsti per l attribuzione dei seggi e l ordine delle relative operazioni, vengono presentati due esempi di attribuzione

Dettagli

Inferenza statistica

Inferenza statistica Inferenza statistica Marcella Montico e Lorenzo Monasta Servizio di epidemiologia e biostatistica Inferenza statistica: insieme di metodi che permette di generalizzare i risultati ottenuti dai dati raccolti

Dettagli

Lezione 4. Sommario. L artimetica binaria: I numeri relativi e frazionari. I numeri relativi I numeri frazionari

Lezione 4. Sommario. L artimetica binaria: I numeri relativi e frazionari. I numeri relativi I numeri frazionari Lezione 4 L artimetica binaria: I numeri relativi e frazionari Sommario I numeri relativi I numeri frazionari I numeri in virgola fissa I numeri in virgola mobile 1 Cosa sono inumeri relativi? I numeri

Dettagli

ESPONENZIALI E LOGARITMI. chiameremo logaritmica (e si legge il logaritmo in base a di c è uguale a b ).

ESPONENZIALI E LOGARITMI. chiameremo logaritmica (e si legge il logaritmo in base a di c è uguale a b ). ESPONENZIALI E LOGARITMI Data una espressione del tipo a b = c, che chiameremo notazione esponenziale (e dove a>0), stabiliamo di scriverla anche in un modo diverso: log a c = b che chiameremo logaritmica

Dettagli

Variabili aleatorie Parte I

Variabili aleatorie Parte I Variabili aleatorie Parte I Variabili aleatorie Scalari - Definizione Funzioni di distribuzione di una VA Funzioni densità di probabilità di una VA Indici di posizione di una distribuzione Indici di dispersione

Dettagli

ESTRAZIONE DI DATI 3D DA IMMAGINI DIGITALI. (Visione 3D)

ESTRAZIONE DI DATI 3D DA IMMAGINI DIGITALI. (Visione 3D) ESTRAZIONE DI DATI 3D DA IMMAGINI DIGITALI () Calibrazione intrinseca Spesso risulta utile calibrare la sola componente intrinseca di un sistema di visione (matrice K), e non si dispone di oggetti di forma

Dettagli

STATISTICA: esercizi svolti sulla MEDIA ARITMETICA

STATISTICA: esercizi svolti sulla MEDIA ARITMETICA STATISTICA: esercizi svolti sulla MEDIA ARITMETICA 1 1 MEDIA ARITMETICA 2 1 MEDIA ARITMETICA 1. La seguente tabella riporta il numero di persone divise per sesso che si sono presentate durante l anno 1997

Dettagli

12) Metodo dei minimi quadrati e linea di tendenza

12) Metodo dei minimi quadrati e linea di tendenza 12) Metodo dei minimi quadrati e linea di tendenza 43 Si supponga di avere una tabella di dati {y exp i} i=1,,n in funzione di altri dati {x i } i=1,,n che siano il risultato di una qualche misura sperimentale.

Dettagli

CURRICOLO VERTICALE PER COMPETENZE DISCIPLINARI. Scuola Secondaria di Primo Grado Matematica -

CURRICOLO VERTICALE PER COMPETENZE DISCIPLINARI. Scuola Secondaria di Primo Grado Matematica - CURRICOLO VERTICALE PER COMPETENZE DISCIPLINARI Scuola Secondaria di Primo Grado Matematica - Classe Prima COMPETENZA CHIAVE EUROPEA: COMPETENZA MATEMATICA Profilo dello studente al termine del Primo ciclo

Dettagli

EQUAZIONE DELLA RETTA

EQUAZIONE DELLA RETTA EQUAZIONE DELLA RETTA EQUAZIONE DEGLI ASSI L equazione dell asse x è 0. L equazione dell asse y è 0. EQUAZIONE DELLE RETTE PARALLELE AGLI ASSI L equazione di una retta r parallela all asse x è cioè è uguale

Dettagli

Lezioni di Ricerca Operativa 2 Dott. F. Carrabs

Lezioni di Ricerca Operativa 2 Dott. F. Carrabs Lezioni di Ricerca Operativa Dott. F. Carrabs.. 009/00 Lezione 6: - mmissibilità di un vincolo - Vincoli alternativi - Vincoli alternativi a gruppi - Rappresentazione di funzioni non lineari: Costi fissi

Dettagli

Metodi per la risoluzione di sistemi lineari

Metodi per la risoluzione di sistemi lineari Metodi per la risoluzione di sistemi lineari Sistemi di equazioni lineari. Rango di matrici Come è noto (vedi [] sez.0.8), ad ogni matrice quadrata A è associato un numero reale det(a) detto determinante

Dettagli

ESERCITAZIONI 1 e 2: calcoli

ESERCITAZIONI 1 e 2: calcoli ESERCITAZIONI 1 e 2: calcoli L uso del foglio elettronico nel laboratorio di ispezione degli alimenti. Funzioni utilizzate negli esercizi e traduzione in inglese americano per l utilizzo su computer con

Dettagli

Le equazioni di I grado

Le equazioni di I grado Le equazioni di I grado ITIS Feltrinelli anno scolastico 007-008 R. Folgieri 007-008 1 Le equazioni abbiamo una uguaglianza tra due quantità (espressioni algebriche, perché nei due termini ci possono essere

Dettagli

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill Statistica - metodologie per le scienze economiche e sociali /e S. Borra A. Di Ciaccio - McGraw Hill s. 9. Soluzione degli esercizi del capitolo 9 In base agli arrotondamenti effettuati nei calcoli si

Dettagli

LEZIONE N. 11 ( a cura di MADDALENA BEI)

LEZIONE N. 11 ( a cura di MADDALENA BEI) LEZIONE N. 11 ( a cura di MADDALENA BEI) F- test Assumiamo l ipotesi nulla H 0 :β 1,...,Β k =0 E diverso dal verificare che H 0 :B J =0 In realtà F - test è più generale H 0 :Aβ=0 H 1 :Aβ 0 A è una matrice

Dettagli

1 Definizione di sistema lineare omogeneo.

1 Definizione di sistema lineare omogeneo. Geometria Lingotto. LeLing1: Sistemi lineari omogenei. Ārgomenti svolti: Definizione di sistema lineare omogeneo. La matrice associata. Concetto di soluzione. Sistemi equivalenti. Operazioni elementari

Dettagli