Introduzione alla statistica non parametrica. Introduzione alla statistica non parametrica

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Introduzione alla statistica non parametrica. Introduzione alla statistica non parametrica"

Transcript

1

2 Statistica parametrica e non parametrica Premessa Esempio Metodi non parametrici Mediana e rango Metodi parametrici e non parametrici (1) I metodi parametrici utilizzati per la soluzione di problemi di carattere univariato e multivariato hanno, come limitazione, la necessità di dover ricorrere all introduzione di ipotesi molto restrittive, spesso ingiustificate se non impossibili da giustificare, irrealistiche, non sempre chiare, difficilmente interpretabili, formulate ad hoc per poter fare inferenza. A questo si deve aggiungere che le assunzioni che rendono valida l applicazione di tali metodi (normalità, omoschedasticità, indipendenza e identica distribuzione della componente stocastica erratica) sono di norma raramente soddisfatte e, quand anche soddisfatte, i risultati sono spesso ottenuti tramite approssimazione.

3 Statistica parametrica e non parametrica Premessa Esempio Metodi non parametrici Mediana e rango Metodi parametrici e non parametrici (2) Sempre più spesso, per problemi multivariati complessi studiati in ambito biomedico, ingegneristico, psicologico, farmacologico, negli esperimenti clinici, nel controllo della qualità, quando non è noto il modello distributivo, non si può invocare la normalità, l inferenza riguarda variabili di tipo qualitativo, la numerosità del campione è inferiore al numero di variabili, ci sono dati mancanti non a caso, si passa da un approccio parametrico ad uno non parametrico, ovviando così, senza perdita sostanziale di efficienza, le limitazioni sopra accennate.

4 Statistica parametrica e non parametrica Test parametrici Premessa Esempio Metodi non parametrici Mediana e rango Presentano la caratteristica comune di avere per oggetto ipotesi parametriche, cioè ipotesi riguardanti ad esempio il valore del parametro di una o più popolazioni come, per esempio la media e la varianza. La determinazione della zona di rifiuto è basata sulla distribuzione che la statistica test segue sotto l ipotesi nulla, distribuzione che dipende da un modello distributivo della popolazione (in generale la normale); solo per ampiezze campionarie elevate è svincolata da tale modello distributivo. Nella pratica, la natura della distribuzione non è verificata, mentre sarebbe bene sottoporre sempre i dati ad un test di normalità, controllando il valore assunto da parametri come simmetria e curtosi o verificando l adattamento dell istogramma alla curva di distribuzione.

5 Statistica parametrica e non parametrica Premessa Esempio Metodi non parametrici Mediana e rango Passaggio alla statistica non parametrica Tra i dati che non si adattano alla distribuzione normale vi sono i punteggi (score) e le votazioni utilizzati da osservatori, come medici, psicologi, insegnanti, giudici di gara, ecc., per valutare fenomeni come l intelligenza, la capacità di memoria, il rendimento a scuola, la produttività nel lavoro, la prestazione atletica, ecc. In tutti questi casi la scala non è riferita a grandezze fisiche, bensì a diversi livelli qualitativi di espressione del fenomeno, trasformati numericamente solo in base a convenzione. Ad esempio, nei licei si attribuisce 6 per indicare la sufficienza, mentre all università si attribuisce 18.

6 Statistica parametrica e non parametrica Parametri d interesse Premessa Esempio Metodi non parametrici Mediana e rango In ambito non parametrico, indicatore rappresentativo di una distribuzione è la mediana che, diversamente dalla media, è uno stimatore robusto. Sfruttando l informazione che, per una qualsiasi v.c. continua, Pr(X Me) = Pr(X Me) = 1 2, diventa più agevole derivare la distribuzione delle statistiche test. In alternativa, si possono utilizzare le v.c. rango (rank), definite come l intero corrispondente al posto che la v.c. occupa quando si passa dal campione casuale (X 1, X 2,..., X n ) al campione casuale ordinato in senso crescente (X (1), X (2),..., X (n) ). La v.c. rango per un campione di dimensione n costituisce una permutazione casuale degli interi (1, 2,..., n).

7 Test non parametrici Regione critica Conclusioni Test sui segni (1) Sia Me la mediana della v.c. continua X e si costruisca un test per verificare H 0 : Me = Me 0 contro H 1 : Me Me 0. Se è vera H 0 circa metà delle osservazioni dovrebbe essere superiore (inferiore) a Me 0, per cui la regola di decisione dovrà essere costruita in modo che si rifiuti H 0 se nel campione tale requisito non è soddisfatto. Per un campione casuale (X 1, X 2,..., X n ), il numero delle osservazioni T n superiori a Me 0 è una v.c. binomiale tale che T n Bi(n, θ). Quindi verificare l ipotesi nulla H 0 : Me = Me 0, equivale a verificare H 0 : θ = 1 vs. H 1 : θ

8 Test non parametrici Regione critica Conclusioni Test sui segni (2) Sotto H 0, T n Bi(n, θ), per cui in media, il campione conterrà n 2 osservazioni al di sopra (di sotto) di Me 0. Pertanto, si può definire la seguente RC(α): T n n/2 c α/2 ove il valore critico c α/2 è determinato in modo che α = Pr( T n n/2 c α 2 = 1 Pr(n/2 c α/2 < T n < n/2 + c α/2 ) 2 [ 1 Φ ( )] 2cα/2 + 1 n utilizzando l approssimazione alla normale della v.c. binomiale con la correzione per la continuità.

9 Test non parametrici Regione critica Conclusioni Test sui segni (3) Essendo Φ(z α/2) = 1 α/2, si ha che c α/2 z α/2 n 1. 2 Se T n è la statistica test definita come il numero di unità superiori alla mediana Me 0, la regione critica RC(α) diventa: { T n n+1 T n n+1 2 z α/2 n z α/2 n 2 Tale procedura è detta test dei segni perchè per il calcolo della statistica test si è soliti contrassegnare con + ( ) i valori superiori (non superiori) a Me 0 e poi contare il numero di segni positivi presenti nella sequenza.

10 Test non parametrici Regione critica Conclusioni Test sui segni (4) Questo test può essere utilizzato nel caso di dati appaiati. Supponiamo di voler verificare l effetto di un azione nota (medicinale, messaggio pubblicitario, ecc.) sulla stessa unità statistica: X i è la variabile rilevata prima dell esperimento e Y i è il risultato dell esperimento sullo stesso individuo. Supponendo che le variabili oggetto dell esperimento siano continue, possiamo indicare con + l evento {X i > Y i }; l evento {X i < Y i }; θ = Pr(X i > Y i ). Se è vera H 0 : X i = Y i, ovvero non vi è alcun effetto, si avrà θ = 1/2. Il numero dei segni + è equivalente al numero di successi in una successione di n prove indipendenti con probabilità costante pari a θ; quindi, è una v.c. Bi(n, θ).

11 Calcolo dei ranghi (1) Test sui ranghi Esempi Ipotesi e regioni critiche Statistica test Un altro test sui segni Si consideri il seguente vettore di dati: Si ordinino le osservazioni in una graduatoria crescente e si sostituisca poi ad ogni valore il posto occupato nella graduatoria, cioè 1 al valore più piccolo, 2 al successivo, e così via. Questi nuovi numeri sono i ranghi. Il vettore contenente i ranghi associato al vettore di dati sopra considerato sarà:

12 Calcolo dei ranghi (2) Test sui ranghi Esempi Ipotesi e regioni critiche Statistica test Un altro test sui segni Consideriamo ora alcune varianti: a) sostituiamo il valore 123 con il valore 1230 e i ranghi non cambiano, infatti si ha b) sostituiamo il valore 123 con il valore 12.3 e alcuni ranghi cambiano di una posizione, infatti c) sostituiamo infine il valore 123 con il valore 0 e si ottiene

13 Calcolo dei ranghi (3) Test sui ranghi Esempi Ipotesi e regioni critiche Statistica test Un altro test sui segni Questi esempi dimostrano come i ranghi siano molto robusti anche in presenza di variazioni notevoli nei dati. Nel caso in cui tutti i dati vengano trasformati in modo lineare (additivo o moltiplicativo) o non lineare (esponenziale o logaritimico), i ranghi non cambiano in quanto i dati mantengono la stessa posizione. In generale, qualsiasi trasformazione, purchè monotona, non altera i ranghi. Come ultimo esempio si consideri il caso in cui i dati sopra considerati sono tutti elevati al quadrato. I ranghi non cambiano e in particolare si ha:

14 Calcolo dei ranghi (4) Test sui ranghi Esempi Ipotesi e regioni critiche Statistica test Un altro test sui segni Con riferimento all ultimo esempio, bisogna prestare attenzione quando ci sono dei numeri negativi. Infatti in tal caso i quadrati dei valori negativi si rifletterebbero sulla scala dei valori positivi sconvolgendo completamente l ordine originario. Infine, quando esistono valori uguali, a ciascuno di essi si attribuisce la media dei ranghi che spetterebbero agli stessi valori se questi fossero diversi. per esempio, per il vettore di dati il vettore contentente i ranghi ad esso associato sarà:

15 Test sui ranghi Esempi Ipotesi e regioni critiche Statistica test Un altro test sui segni Test dei ranghi con segno di Wilcoxon (1) Questo test può essere utilizzato per verificare se un campione casuale possiede una certa mediana o se le differenze appaiate hanno mediana pari a 0. E l equivalente non parametrico del test t di Student per campioni appaiati (dipendenti). Se si considera il campione casuale (X 1, Y 1 ), (X 2, Y 2 ),..., (X n, Y n ) delle osservazioni appaiate, indichiamo con D i = (Y i X i ) le corrispondenti differenze, mentre se si tratta di un solo campione indichiamo con D i = (X i Me 0 ) le differenze rispetto ad un valore prefissato Me 0 per la mediana. Si assuma che le v.c. D i siano continue, simmetriche, indipendenti e tutte con la stessa mediana. Supponiamo che D i, i = 1, 2,..., n siano le differenze in valore assoluto non nulle a cui si attribuiscono i ranghi da 1 (per min D i ad n (per max D i ). Nel caso di ranghi coincidenti si provvede a sostituirle con la loro media artitmetica.

16 Test sui ranghi Esempi Ipotesi e regioni critiche Statistica test Un altro test sui segni Test dei ranghi con segno di Wilcoxon (2) Le ipotesi da verificare sono: 1 H 0 : Me(D i ) = 0 vs. H 1 : Me(D i ) > 0, 2 H 0 : Me(D i ) = 0 vs. H 1 : Me(D i ) < 0, 3 H 0 : Me(D i ) = 0 vs. H 1 : Me(D i ) 0, e le corrispondenti RC sono: 1 T n c α, 2 T n c α, 3 c α/2 T n c α/2.

17 Test sui ranghi Esempi Ipotesi e regioni critiche Statistica test Un altro test sui segni Test dei ranghi con segno di Wilcoxon (3) In tutti i casi, la statistica test è data dalla somma dei ranghi r( D i ) corrispondenti alle differenze D i > 0, ovvero n T n = r( D i )I(D i > 0), i=1 dove I( ) è la funzione indicatrice. Si può dimostrare che sotto l ipotesi nulla n(n + 1) n(n + 1)(2n + 1) E(T n ) = V(T n ) = Se n è abbastanza grande (n > 15), si può ricorrere all approssimazione normale (modificata per la correzione di continuità) T n n(n + 1)/4 1/2 d N (0, 1). n(n + 1)(2n + 1)/24

18 Test sui ranghi Test sui segni di McNemar Esempi Ipotesi e regioni critiche Statistica test Un altro test sui segni Consideriamo ancora il caso di dati appaiati. Siano U = #(D i > 0) = i I(D i > 0) il numero di differenze positive, ν = #(D i 0) il numero di differenze non nulle. Allora, sotto H 0, la statistica U ha distribuzione binomiale con parametri ν e 1/2, ovvero U Bin(ν, 1/2). Sotto l ipotesi alternativa H 1, U ha ancora distribuzione binomiale, ma con parametri ν e θ > 1/2. Per esempio, con ν = 20 e U = 17, si ha che Pr(U 17 D) = i 17 ( 20 i che è significativo a livello α = ) 2 20 = ,

19 Dati appaiati Esempio Ipotesi e modello Altri modelli Un problema con dati appaiati nel caso univariato (1) Consideriamo il caso in cui si vuole verificare l efficacia del trattamento nella riduzione dell ansia in campione di 9 soggetti. Si presuma che i soggetti siano omogenei rispetto ad altre importanti condizioni, quali età e stato di salute, che in genere sono le variabili esplicative in questo tipo di esperimenti. Si assuma poi che la v.c. risposta Y misuri l ansia: in particolare rappresenta il punteggio ottenuto in un test psicologico somministrato ai 9 soggetti. Ciascuna unità viene osservata prima del trattamento, al tempo A (baseline observation), e dopo il trattamento, al tempo B. Ci si aspetta che il trattamento riduca l ansia.

20 Dati appaiati Esempio Ipotesi e modello Altri modelli Un problema con dati appaiati nel caso univariato(2) Le risposte bivariate sono dipendenti con rispetto alle unità, dato che le misurazioni vengono fatte in tempi diversi ma negli stessi soggetti, mentre le n coppie di osservazioni sono indipendenti, in quanto relative ad unità diverse. Se si assume che gli individui siano omogenei in relazione alle condizioni sperimentali, l insieme dei dati appaiati {(Y Ai, Y Bi ), i = 1,..., n} può essere visto come un campione casuale di n coppie i.i.d. di osservazioni estratte da una variabile bivariata (Y A, Y B ). Sia X i = Y Ai Y Bi, i = 1, 2,..., 9, la differenza pre-post trattamento osservata.

21 I dati Dati appaiati Esempio Ipotesi e modello Altri modelli I valori osservati sono riportati nella tabella sottostante: i Y A Y B X

22 Dati appaiati Formalizzazione del problema Esempio Ipotesi e modello Altri modelli Le ipotesi d interesse sono H 0 : Y A d = YB vs. H 1 : Y A d > YB. dove H 1 rappresenta l ipotesi di dominanza stocastica. Uno dei modelli utilizzati per descrivere la variabile risposta osservata, è il modello con effetti additivi fissi, in cui Y Ai = µ + Z Ai e Y Bi = µ δ + Z Bi, i = 1,..., n, dove µ è la costante di popolazione; δ è l effetto del trattamento, assunto sotto H 1 finito e strettamente positivo, Z Ai e Z Bi sono componenti d errore casuali identicamente distribuite, indipendenti tra le unità, ma non necessariamente indipendenti entro le unità.

23 Dati appaiati Esempio Ipotesi e modello Altri modelli Modelli alternativi Tra i modelli più utilizzati per descrivere la variabile risposta osservata sono da citare: i modelli con effetti additivi fissi e unità non omogenee in cui Y Ai = µ + η i + Z Ai e Y Bi = µ + η i δ + Z Bi, i modelli con effetti additivi che variano da individuo a individuo del tipo Y Ai = µ + η i + Z Ai e Y Bi = µ + η i δ i + Z Bi, i modelli con effetti stocastici generalizzati dove Y Ai = µ + η i + Z Ai e Y Bi = µ + η i + Z Bi Bi.

24 Confronto tra modelli Dati appaiati Esempio Ipotesi e modello Altri modelli Prendendo come modello di riferimento il modello con effetti additivi fissi, sotto H 0 la variabile differenza X = δ + Z A Z B è simmetrica rispetto allo 0, mentre sotto H 1 è simmetrica rispetto al parametro δ, indicatore dell effetto del trattamento. Quando si usa come variabile di riferimento la variabile differenza X il modello a effetti additivi fissi e il modello ad effetti additivi fissi e unita non omogenee coincidono, infatti si ha che X i = Y Ai Y Bi = δ + Z Ai Z Bi. Dunque se non vi è un reale effetto del trattamento ed eventuali variazioni osservate sono apportate solo da η i, si dice che X è covariate-free.

25 Soluzioni del problema Soluzione parametrica Soluzione non parametrica Il test t di Student (1) Una soluzione al problema dei dati appaiati può essere ottenuta in un contesto parametrico solo se si assume che le variabili siano normalmente distribuite e abbiano varianza ignota. Il modello con effetti additivi fissi può essere scritto come {Y Ai = µ + σ Z Ai, Y Bi = µ σ δ + Z Bi, i = 1,..., n} in cui µ è la costante di popolazione, δ è l effetto del trattamento, σ la deviazione standard, ignota, indipendente dalle unità e dal livello del trattamento e tale che 0 < σ < +, Z ij N (0, 1) con i = 1,..., n, j = A, B indipendenti tra le unità ma non necessariamente entro le unità.

26 Soluzioni del problema Soluzione parametrica Soluzione non parametrica Il test t di Student (2) La statistica test più usata è data da T = X n in cui ˆσ 2 = i (X i X) 2 /(n 1) e X = i X ij/n con le X i N (δ, σ 2 X ). Sotto H 0 la statistica T ha distribuzione t di Student centrale con (n 1) g.d.l, mentre sotto H 1 è distribuita come una t di Student non centrale con un parametro di non centralità positivo così che valori grandi diventano significativi. Il parametro ignoto σ X è solo un parametro di disturbo e T è una statistica invariante rispetto al valore assunto da questa quantità. Per i dati dell esempio precedente, il valore della statistica è T 0 = e il p-value è pari a p = (test a una coda). σ

27 Soluzioni del problema Soluzione parametrica Soluzione non parametrica Metodi non parametrici di permutazione Caratteristica dei test di permutazione è il condizionamento all insieme dei dati osservati che è un insieme di statistiche sufficienti qualunque sia il modello sottostante di riferimento. I test di permutazioni vengono chiamati distribution free, ossia le distribuzioni dei test prescindono completamente dalla legge che governa la variabile aleatoria su cui si vuol fare inferenza e non è necessario fare assunzioni stringenti sulla distribuzione dei termini d errore. I metodi non parametrici di permutazione non sono una panacea per tutti i problemi inferenziali di interesse. Se, sotto H 0, 1 non ci si condiziona ad un insieme di statistiche sufficienti, 2 assume l ipotesi di scambiabilità dei dati, le soluzioni ottenute sono tutt altro che esatte.

28 Metodi non parametrici di permutazione Un pò di teoria Monte Carlo condizionato Step algoritmo Definizione dello spazio di permutazione campionario (1) d Si osservi innanzitutto che l ipotesi H 0 : {Y A = YB } implica la scambiabilità delle variabili Y A e Y B entro ciascuna unità rispetto ai due tempi di rilevazione A e B. Il segno di ciascuna differenza X i, per i = 1,..., n, si può pensare sia attribuito con probabilità 1/2. Si consideri inoltre la statistica test T = i X i. La distribuzione condizionata F T (t X) di T, quando i punti osservati X = {X i, i = 1,..., n} sono fissati, si ottiene sotto l ipotesi che H 0 sia vera, cioè attribuendo casualmente e in tutti i modi possibili i segni + e a ciascuna differenza con uguale probabilità. Per fare questo, si può considerare la distribuzione di T = i X i, in cui le Xi sono ottenute attribuendo casualmente il segno + o alla differenza X i, i = 1,..., n, con probabilità 1/2.

29 Metodi non parametrici di permutazione Un pò di teoria Monte Carlo condizionato Step algoritmo Definizione dello spazio di permutazione campionario (2) La distribuzione di probabilità di X = {Xi, i = 1,..., n}, condizionatamente a X, è uniforme dentro lo spazio di permutazione X /X, ovvero tutti i punti sono equiprobabili. In particolare, per il nostro problema, lo spazio campionario di permutazione X /X contiene M = 2 ν punti, perchè la permutazione dei segni sulle n ν differenze nulle non produce effetto. Sia F (z X) = Pr{T z X} la funzione di ripartizione condizionata (c.d.f.) ottenuta via permutazione, indotta da T dato X. Indicato T o = T (X) il valore osservato di T, se il p-value λ = Pr{T T o X} è superiore al livello di soglia fissato α, H 0 viene accettata, secondo le usuali regole dei test per la verifica d ipotesi.

30 Metodi non parametrici di permutazione Un pò di teoria Monte Carlo condizionato Step algoritmo Tecniche di ricampionamento condizionato Vi sono due criteri per permutare i dati: si permutano in modo sistematico tutti i dati o si prende in considerazione solo un campione estratto casualmente dallo spazio di permutazione. In genere, lo spazio di permutazione X /X ha cardinalità così grande che non si possono esaminare tutti i suoi punti. Quindi, la scelta del secondo metodo comporta una riduzione dei calcoli, senza perdita di attendibilità del risultato o potenza del test. Il metodo di simulazione di Monte Carlo Condizionato (C.M.C.) consente di effettuare, tramite simulazione, un campionamento di punti dall orbita di permutazione condizionale all insieme dei dati ossservati. Il campionamento C.M.C. altro non è se non la replicazione dei campionamenti senza reinserimento.

31 Metodi non parametrici di permutazione Un pò di teoria Monte Carlo condizionato Step algoritmo Descrizione dell algoritmo Il metodo C.M.C. opera secondo l algoritmo sotto riportato: s.1) calcolo del valore osservato T o della statistica T : T o = T (X), sull insieme X osservato; s.2) per ciascuna delle n differenze in X, si consideri un attribuzione casuale dei segni in modo tale da ottenere X ; s.3) calcolo di T = T (X ); s.4) si ripetano B volte, in maniera indipendente, i passi descritti in s.2) e s.3).

32 Metodi non parametrici di permutazione Un pò di teoria Monte Carlo condizionato Step algoritmo Conclusione dell algoritmo Per concludere, i B insiemi X contenenti le permutazioni, sono un campionamento casuale da X /X. I corrispondenti B valori T simulano la distribuzione nulla di permutazione di T e consentono di stimare la c.d.f. di permutazione F (z X) e la funzione del livello di significatività L(z X) = Pr{T z X} tramite la e.d.f. F B (z) = #(T z)/b e la funzione L B (z) = #(T z)/b rispettivamente. All aumentare del numero B di iterazioni Monte Carlo, migliorano le stime delle funzioni F ( X) e L( X). Il p-value stimato a partire dal valore osservato T o è dato da λ = L B(T o ) = #(T T o )/B. Se λ α, si rifiuta H 0 secondo le usuali regole della verifica d ipotesi.

Statistica Metodologica Avanzato Test 1: Concetti base di inferenza

Statistica Metodologica Avanzato Test 1: Concetti base di inferenza Test 1: Concetti base di inferenza 1. Se uno stimatore T n è non distorto per il parametro θ, allora A T n è anche consistente B lim Var[T n] = 0 n C E[T n ] = θ, per ogni θ 2. Se T n è uno stimatore con

Dettagli

Esercitazione 4 Distribuzioni campionarie e introduzione ai metodi Monte Carlo

Esercitazione 4 Distribuzioni campionarie e introduzione ai metodi Monte Carlo Esercitazione 4 Distribuzioni campionarie e introduzione ai metodi Monte Carlo 1. Gli studi di simulazione possono permetterci di apprezzare alcune delle proprietà di distribuzioni campionarie ricavate

Dettagli

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva Probabilità classica Distribuzioni e leggi di probabilità La probabilità di un evento casuale è il rapporto tra il numero dei casi favorevoli ed il numero dei casi possibili, purchè siano tutti equiprobabili.

Dettagli

STATISTICA ESERCITAZIONE

STATISTICA ESERCITAZIONE STATISTICA ESERCITAZIONE Dott. Giuseppe Pandolfo 1 Giugno 2015 Esercizio 1 Una fabbrica di scatole di cartone evade il 96% degli ordini entro un mese. Estraendo 300 campioni casuali di 300 consegne, in

Dettagli

Il campionamento e l inferenza. Il campionamento e l inferenza

Il campionamento e l inferenza. Il campionamento e l inferenza Il campionamento e l inferenza Popolazione Campione Dai dati osservati mediante scelta campionaria si giunge ad affermazioni che riguardano la popolazione da cui essi sono stati prescelti Il campionamento

Dettagli

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento. N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle abelle riportate alla fine del documento. Esercizio 1 La concentrazione media di sostanze inquinanti osservata nelle acque di un fiume

Dettagli

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17 C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica

Dettagli

Campionamento La statistica media campionaria e la sua distribuzione. Paola Giacomello Dip. Scienze Sociali ed Economiche Uniroma1

Campionamento La statistica media campionaria e la sua distribuzione. Paola Giacomello Dip. Scienze Sociali ed Economiche Uniroma1 Campionamento La statistica media campionaria e la sua distribuzione 1 Definisco il problema da studiare: es. tempo di percorrenza tra abitazione e università Carattere: tempo ossia v.s. continua Popolazione:

Dettagli

Distribuzioni e inferenza statistica

Distribuzioni e inferenza statistica Distribuzioni e inferenza statistica Distribuzioni di probabilità L analisi statistica spesso studia i fenomeni collettivi confrontandoli con modelli teorici di riferimento. Tra di essi, vedremo: la distribuzione

Dettagli

Premessa: la dipendenza in media

Premessa: la dipendenza in media Premessa: la dipendenza in media Supponiamo di avere K diversi livelli di un fattore che potrebbero influire su una determinata variabile. Per esempio supponiamo di domandarci se la diversificazione (intesa

Dettagli

UNIVERSITÀ DEGLI STUDI DI PERUGIA

UNIVERSITÀ DEGLI STUDI DI PERUGIA SIGI, Statistica II, esercitazione n. 3 1 UNIVERSITÀ DEGLI STUDI DI PERUGIA FACOLTÀ DI ECONOMIA CORSO DI LAUREA S.I.G.I. STATISTICA II Esercitazione n. 3 Esercizio 1 Una v.c. X si dice v.c. esponenziale

Dettagli

Ulteriori Conoscenze di Informatica e Statistica

Ulteriori Conoscenze di Informatica e Statistica ndici di forma Ulteriori Conoscenze di nformatica e Statistica Descrivono le asimmetrie della distribuzione Carlo Meneghini Dip. di fisica via della Vasca Navale 84, st. 83 ( piano) tel.: 06 55 17 72 17

Dettagli

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25 Sommario Presentazione dell edizione italiana Prefazione xv xiii Capitolo 1 I dati e la statistica 1 Statistica in pratica: BusinessWeek 1 1.1 Le applicazioni in ambito aziendale ed economico 3 Contabilità

Dettagli

Schema lezione 5 Intervalli di confidenza

Schema lezione 5 Intervalli di confidenza Schema lezione 5 Intervalli di confidenza Non centrerò quella barca, ne sono convinto al 95% COMPRENDERE: Significato di intervallo di confidenza Uso degli stimatori come quantità di pivot per stime intervallari

Dettagli

Teorema del limite centrale TCL

Teorema del limite centrale TCL Teorema del limite centrale TCL Questo importante teorema della statistica inferenziale si applica a qualsiasi variabile aleatoria che sia combinazione lineare di N variabili aleatorie le cui funzioni

Dettagli

Distribuzioni campionarie. Antonello Maruotti

Distribuzioni campionarie. Antonello Maruotti Distribuzioni campionarie Antonello Maruotti Outline 1 Introduzione 2 Concetti base Si riprendano le considerazioni fatte nella parte di statistica descrittiva. Si vuole studiare una popolazione con riferimento

Dettagli

Casa dello Studente. Casa dello Studente

Casa dello Studente. Casa dello Studente Esercitazione - 14 aprile 2016 ESERCIZIO 1 Di seguito si riporta il giudizio (punteggio da 0 a 5) espresso da un gruppo di studenti rispetto alle diverse residenze studentesche di un Ateneo: a) Si calcolino

Dettagli

Statistica Inferenziale

Statistica Inferenziale Statistica Inferenziale a) L Intervallo di Confidenza b) La distribuzione t di Student c) La differenza delle medie d) L intervallo di confidenza della differenza Prof Paolo Chiodini Dalla Popolazione

Dettagli

TEST NON PARAMETRICO DI MANN-WHITNEY

TEST NON PARAMETRICO DI MANN-WHITNEY TEST NON PARAMETRICO DI MANN-WHITNEY Questo test viene può essere utilizzato come test di confronto tra due campioni in maniera analoga ai test ipotesi parametrici di confronto medie (test Z se la varianza

Dettagli

PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 2006/07

PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 2006/07 PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 006/07 Esercizio 1 Prova scritta del 16/1/006 In un ufficio postale lavorano due impiegati che svolgono lo stesso compito in maniera indipendente, sbrigando

Dettagli

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni La statistica inferenziale Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni E necessario però anche aggiungere con

Dettagli

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)

Dettagli

Statistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi

Statistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi Esercitazione 14 Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () 1 / 14 Ex.1: Verifica Ipotesi sulla media (varianza nota) Le funi prodotte da un certo macchinario hanno una

Dettagli

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria Civile A.A. 2009-10 Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain 1 STATISTICHE, DISTRIBUZIONI CAMPIONARIE

Dettagli

Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii

Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii Sommario Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii xv Parte I Statistica descrittiva 1 Capitolo 1 Introduzione 3 Perché studiare statistica? 4

Dettagli

ANOVA: ANALISI DELLA VARIANZA Prof. Antonio Lanzotti

ANOVA: ANALISI DELLA VARIANZA Prof. Antonio Lanzotti UNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II DIPARTIMENTO DI INGEGNERIA AEROSPAZIALE D.I.A.S. STATISTICA PER L INNOVAZIONE a.a. 007/008 ANOVA: ANALISI DELLA VARIANZA Prof. Antonio Lanzotti A cura di: Ing.

Dettagli

Teoria e tecniche dei test

Teoria e tecniche dei test Teoria e tecniche dei test Lezione 9 LA STANDARDIZZAZIONE DEI TEST. IL PROCESSO DI TARATURA: IL CAMPIONAMENTO. Costruire delle norme di riferimento per un test comporta delle ipotesi di fondo che è necessario

Dettagli

STATISTICA: esercizi svolti sulle VARIABILI CASUALI

STATISTICA: esercizi svolti sulle VARIABILI CASUALI STATISTICA: esercizi svolti sulle VARIABILI CASUALI VARIABILI CASUALI 2 VARIABILI CASUALI. Variabili casuali generiche. Si supponga che un dado truccato, formato da sei facce contrassegnate dai numeri

Dettagli

Esercitazioni di Statistica

Esercitazioni di Statistica Esercitazioni di Statistica Stima Puntuale Prof. Livia De Giovanni statistica@dis.uniroma.it Esercizio In ciascuno dei casi seguenti determinare quale tra i due stimatori S e T per il parametro θ è distorto

Dettagli

C.I. di Metodologia clinica

C.I. di Metodologia clinica C.I. di Metodologia clinica Modulo 5. I metodi per la sintesi e la comunicazione delle informazioni sulla salute Quali errori influenzano le stime? L errore casuale I metodi per la produzione delle informazioni

Dettagli

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Strumenti statistici in Excell Pacchetto Analisi di dati Strumenti di analisi: Analisi varianza: ad un fattore Analisi

Dettagli

Esercitazione: La distribuzione NORMALE

Esercitazione: La distribuzione NORMALE Esercitazione: La distribuzione NORMALE Uno dei più importanti esempi di distribuzione di probabilità continua è dato dalla distribuzione Normale (curva normale o distribuzione Gaussiana); è una delle

Dettagli

PSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI

PSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI PSICOMETRIA Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI CAMPIONI INDIPENDENTI Campioni estratti casualmente dalla popolazione con caratteristiche omogenee Assegnazione

Dettagli

TOPOGRAFIA 2013/2014. Prof. Francesco-Gaspare Caputo

TOPOGRAFIA 2013/2014. Prof. Francesco-Gaspare Caputo TOPOGRAFIA 2013/2014 L operazione di misura di una grandezza produce un numero reale che esprime il rapporto della grandezza stessa rispetto a un altra, a essa omogenea, assunta come unità di misura. L

Dettagli

LE DISTRIBUZIONI CAMPIONARIE

LE DISTRIBUZIONI CAMPIONARIE LE DISTRIBUZIONI CAMPIONARIE Argomenti Principi e metodi dell inferenza statistica Metodi di campionamento Campioni casuali Le distribuzioni campionarie notevoli: La distribuzione della media campionaria

Dettagli

Analisi della varianza

Analisi della varianza Analisi della varianza Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona ANALISI DELLA VARIANZA - 1 Abbiamo k gruppi, con un numero variabile di unità statistiche.

Dettagli

Statistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione.

Statistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione. Statistica inferenziale La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione. Verifica delle ipotesi sulla medie Quando si conduce una

Dettagli

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla Introduzione E la generalizzazione del modello di regressione lineare semplice: per spiegare il fenomeno d interesse Y vengono introdotte p, con p > 1, variabili esplicative. Tale generalizzazione diventa

Dettagli

STATISTICA AZIENDALE Modulo Controllo di Qualità

STATISTICA AZIENDALE Modulo Controllo di Qualità STATISTICA AZIENDALE Modulo Controllo di Qualità A.A. 009/10 - Sottoperiodo PROA DEL 14 MAGGIO 010 Cognome:.. Nome: Matricola:.. AERTENZE: Negli esercizi in cui sono richiesti calcoli riportare tutte la

Dettagli

i dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente

i dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente TEST DI AUTOVALUTAZIONE - SETTIMANA 6 I diritti d autore sono riservati. Ogni sfruttamento commerciale non autorizzato sarà perseguito. Metodi statistici per la biologia Parte A. La retta di regressione.2

Dettagli

Intervallo di confidenza

Intervallo di confidenza Intervallo di confidenza Prof. Giuseppe Verlato, Prof. Roberto de Marco Sezione di Epidemiologia e Statistica Medica, Università di Verona campione inferenza popolazione Media Riportare sempre anche Stima

Dettagli

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill Statistica - metodologie per le scienze economiche e sociali /e S. Borra, A. Di Ciaccio - McGraw Hill Es.. Soluzione degli esercizi del capitolo 4 4. Il sistema d ipotesi è: μ 7, H : μ 7, Essendo 0 : t,

Dettagli

Intervalli di confidenza

Intervalli di confidenza Probabilità e Statistica Esercitazioni a.a. 2006/2007 C.d.L.: Ingegneria per l Ambiente ed il Territorio, Ingegneria Civile, Ingegneria Gestionale, Ingegneria dell Informazione C.d.L.S.: Ingegneria Civile

Dettagli

Esercizi di Probabilità e Statistica

Esercizi di Probabilità e Statistica Esercizi di Probabilità e Statistica Samuel Rota Bulò 6 giugno 26 Statistica Esercizio Sia {X n } n una famiglia di v.a. di media µ e varianza σ 2. Verificare che X = n n X i σ 2 = n (X i µ) 2 S 2 = n

Dettagli

Esercizi riassuntivi di Inferenza

Esercizi riassuntivi di Inferenza Esercizi riassuntivi di Inferenza Esercizio 1 Un economista vuole stimare il reddito medio degli abitanti di una cittadina mediante un intervallo al livello di confidenza del 95%. La distribuzione del

Dettagli

Strumenti di indagine per la valutazione psicologica

Strumenti di indagine per la valutazione psicologica Strumenti di indagine per la valutazione psicologica.3 - La distribuzione normale Tempi di reazione Registrati i tempi di reazione (in millisecondi) a uno stimolo (n = 30). Classe Freq Freq relative Densità

Dettagli

0 altimenti 1 soggetto trova lavoroentro 6 mesi}

0 altimenti 1 soggetto trova lavoroentro 6 mesi} Lezione n. 16 (a cura di Peluso Filomena Francesca) Oltre alle normali variabili risposta che presentano una continuità almeno all'interno di un certo intervallo di valori, esistono variabili risposta

Dettagli

Università degli studi della Tuscia. Principi di Statistica dr. Luca Secondi A.A. 2014/2015. Esercitazione di riepilogo Variabili casuali

Università degli studi della Tuscia. Principi di Statistica dr. Luca Secondi A.A. 2014/2015. Esercitazione di riepilogo Variabili casuali Università degli studi della Tuscia Principi di Statistica dr. Luca Secondi A.A. 014/015 Esercitazione di riepilogo Variabili casuali ESERCIZIO 1 Il peso delle compresse di un determinato medicinale si

Dettagli

Esercizio 1. Stima intervallare: IC per la media incognita (varianza ignota)

Esercizio 1. Stima intervallare: IC per la media incognita (varianza ignota) STATISTICA (2) ESERCITAZIONE 5 26.02.2014 Dott.ssa Antonella Costanzo Esercizio 1. Stima intervallare: IC per la media incognita (varianza ignota) Il responsabile del controllo qualità di un azienda che

Dettagli

Un esempio. Ipotesi statistica: supposizione riguardante: un parametro della popolazione. la forma della distribuzione della popolazione

Un esempio. Ipotesi statistica: supposizione riguardante: un parametro della popolazione. la forma della distribuzione della popolazione La verifica delle ipotesi In molte circostanze il ricercatore si trova a dover decidere quale, tra le diverse situazioni possibili riferibili alla popolazione, è quella meglio sostenuta dalle evidenze

Dettagli

Analisi della varianza: I contrasti e il metodo di Bonferroni

Analisi della varianza: I contrasti e il metodo di Bonferroni Analisi della varianza: I contrasti e il metodo di Bonferroni 1 Contrasti In molti problemi risulta importante stabilire, nel caso venga rifiutata l ipotesi nulla, di uguaglianza delle medie µ j delle

Dettagli

R 2 1 j /n j] 3(n+1)

R 2 1 j /n j] 3(n+1) L ANALISI DELLA VARIANZA A RANGHI AD UNA VIA DI KRUSKAL-WALLIS Quando le assunzioni per l analisi della varianza parametrica non sono soddisfatte si può ricorrere ad una alternativa non parametrica per

Dettagli

Variabile Casuale Normale

Variabile Casuale Normale Variabile Casuale Normale Variabile Casuale Normale o Gaussiana E una variabile casuale continua che assume tutti i numeri reali, è definita dalla seguente funzione di densità: 1 f( x) = e σ 2 π ( x µ

Dettagli

Distribuzioni campionarie

Distribuzioni campionarie 1 Inferenza Statistica Descrittiva Distribuzioni campionarie Statistica Inferenziale: affronta problemi di decisione in condizioni di incertezza basandosi sia su informazioni a priori sia sui dati campionari

Dettagli

DESCRITTIVE, TEST T PER IL CONFRONTO DELLE MEDIE DI CAMPIONI INDIPENDENTI.

DESCRITTIVE, TEST T PER IL CONFRONTO DELLE MEDIE DI CAMPIONI INDIPENDENTI. Corso di Laurea Specialistica in Biologia Sanitaria, Universita' di Padova C.I. di Metodi statistici per la Biologia, Informatica e Laboratorio di Informatica (Mod. B) Docente: Dr. Stefania Bortoluzzi

Dettagli

Statistica Un Esempio

Statistica Un Esempio Statistica Un Esempio Un indagine sul peso, su un campione di n = 100 studenti, ha prodotto il seguente risultato. I pesi p sono espressi in Kg e sono stati raggruppati in cinque classi di peso. classe

Dettagli

Calcolo delle Probabilità 2

Calcolo delle Probabilità 2 Prova d esame di Calcolo delle Probabilità 2 Maggio 2006 Sia X una variabile aleatoria distribuita secondo la densità seguente ke x 1 x < 0 f X (x) = 1/2 0 x 1. 1. Determinare il valore del parametro reale

Dettagli

Note sulla probabilità

Note sulla probabilità Note sulla probabilità Maurizio Loreti Dipartimento di Fisica Università degli Studi di Padova Anno Accademico 2002 03 1 La distribuzione del χ 2 0.6 0.5 N=1 N=2 N=3 N=5 N=10 0.4 0.3 0.2 0.1 0 0 5 10 15

Dettagli

Statistica. Matematica con Elementi di Statistica a.a. 2015/16

Statistica. Matematica con Elementi di Statistica a.a. 2015/16 Statistica La statistica è la scienza che organizza e analizza dati numerici per fini descrittivi o per permettere di prendere delle decisioni e fare previsioni. Statistica descrittiva: dalla mole di dati

Dettagli

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI I METODI PER IL CONFRONTO DI MEDIE (Campioni non indipendenti) Prof.ssa G. Serio, Prof. P. Trerotoli, Cattedra di Statistica Medica, Università di Bari

Dettagli

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura INDICE GENERALE Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura XI XIV XV XVII XVIII 1 LA RILEVAZIONE DEI FENOMENI

Dettagli

Ringraziamenti dell Editore

Ringraziamenti dell Editore Indice Elenco dei simboli e delle abbreviazioni in ordine di apparizione Ringraziamenti dell Editore XI XVII 1 Introduzione FAQ e qualcos altro, da leggere prima 1 1.1 QuestoèunlibrodiStatistica....................

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unina.it Università degli studi di Cassino () Statistica 1 / 27 Outline 1 () Statistica 2 / 27 Outline 1 2 () Statistica 2 / 27 Outline 1 2 3 () Statistica 2 /

Dettagli

Approssimazione normale alla distribuzione binomiale

Approssimazione normale alla distribuzione binomiale Approssimazione normale alla distribuzione binomiale P b (X r) costoso P b (X r) P(X r) per N grande Teorema: Se la variabile casuale X ha una distribuzione binomiale con parametri N e p, allora, per N

Dettagli

Teoria e tecniche dei test. Concetti di base

Teoria e tecniche dei test. Concetti di base Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi

Dettagli

standardizzazione dei punteggi di un test

standardizzazione dei punteggi di un test DIAGNOSTICA PSICOLOGICA lezione! Paola Magnano paola.magnano@unikore.it standardizzazione dei punteggi di un test serve a dare significato ai punteggi che una persona ottiene ad un test, confrontando la

Dettagli

Teoria e tecniche dei test

Teoria e tecniche dei test Teoria e tecniche dei test Lezione 10 LA TRASFORMAZIONE DEI PUNTEGGI LA TRASFORMAZIONE DEI PUNTEGGI Affinchè i punteggi ottenuti ad un test siano paragonabili a punteggi di altri test e interpretabili

Dettagli

Campionamento La statistica media campionaria e la sua distribuzione

Campionamento La statistica media campionaria e la sua distribuzione Campionamento La statistica media campionaria e la sua distribuzione 1 Definisco il problema da studiare: es. tempo di percorrenza tra abitazione e università Carattere: tempo ossia v.s. continua Popolazione:

Dettagli

Statistica ARGOMENTI. Calcolo combinatorio

Statistica ARGOMENTI. Calcolo combinatorio Statistica ARGOMENTI Calcolo combinatorio Probabilità Disposizioni semplici Disposizioni con ripetizione Permutazioni semplici Permutazioni con ripetizioni Combinazioni semplici Assiomi di probabilità

Dettagli

DISTRIBUZIONI DI PROBABILITA

DISTRIBUZIONI DI PROBABILITA DISTRIBUZIONI DI PROBABILITA Nell associare ai risultati di un esperimento un valore numerico si costruisce una variabile casuale (o aleatoria, o stocastica). Ogni variabile casuale ha una corrispondente

Dettagli

Esercitazioni di statistica

Esercitazioni di statistica Esercitazioni di statistica Misure di associazione: Indipendenza assoluta e in media Stefania Spina Universitá di Napoli Federico II stefania.spina@unina.it 22 ottobre 2014 Stefania Spina Esercitazioni

Dettagli

Prova scritta di STATISTICA. CDL Biotecnologie. (Programma di Massimo Cristallo - A)

Prova scritta di STATISTICA. CDL Biotecnologie. (Programma di Massimo Cristallo - A) Prova scritta di STATISTICA CDL Biotecnologie (Programma di Massimo Cristallo - A) 1. Un associazione di consumatori, allo scopo di esaminare la qualità di tre diverse marche di batterie per automobili,

Dettagli

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università

Dettagli

CON O SENZA REIMMISSIONE

CON O SENZA REIMMISSIONE CAMPIONAMENTO Per una buona inferenza o induzione statistica, bisogna affrontare il problema del campionamento, ovvero del come raccogliere un campione della popolazione affinché la si possa studiare induttivamente.

Dettagli

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi) CHEMIOMETRIA Applicazione di metodi matematici e statistici per estrarre (massima) informazione chimica (affidabile) da dati chimici INCERTEZZA DI MISURA (intervallo di confidenza/fiducia) CONFRONTO CON

Dettagli

Analisi della varianza

Analisi della varianza 1. 2. univariata ad un solo fattore tra i soggetti (between subjects) 3. univariata: disegni fattoriali 4. univariata entro i soggetti (within subjects) 5. : disegni fattoriali «misti» L analisi della

Dettagli

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 21/09/2011

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 21/09/2011 FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 1/9/11 ESERCIZIO 1 (+3++3) La seguente tabella riporta la distribuzione di frequenza dei valori di emoglobina nel sangue (espressi

Dettagli

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n.

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n. 5 STIMA PUNTUALE DEI PARAMETRI [Adattato dal libro Excel per la statistica di Enzo Belluco] Sia θ un parametro incognito della distribuzione di un carattere in una determinata popolazione. Il problema

Dettagli

Il confronto fra medie

Il confronto fra medie L. Boni Obiettivo Verificare l'ipotesi che regimi alimentari differenti non producano mediamente lo stesso effetto sulla gittata cardiaca Ipotesi nulla IPOTESI NULLA La dieta non dovrebbe modificare in

Dettagli

ES.2.3. è pari ad 1. Una variabile aleatoria X che assume valori su tutta la retta si dice distribuita

ES.2.3. è pari ad 1. Una variabile aleatoria X che assume valori su tutta la retta si dice distribuita ES.2.3 1 Distribuzione normale La funzione N(x; µ, σ 2 = 1 e 1 2( x µ σ 2 2πσ 2 si chiama densità di probabilità normale (o semplicemente curva normale con parametri µ e σ 2. La funzione è simmetrica rispetto

Dettagli

Inferenza statistica

Inferenza statistica Inferenza statistica Marcella Montico e Lorenzo Monasta Servizio di epidemiologia e biostatistica Inferenza statistica: insieme di metodi che permette di generalizzare i risultati ottenuti dai dati raccolti

Dettagli

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE La presentazione dei dati per molte ricerche mediche fa comunemente riferimento a frequenze, assolute o percentuali. Osservazioni cliniche conducono sovente

Dettagli

le scale di misura scala nominale scala ordinale DIAGNOSTICA PSICOLOGICA lezione si basano su tre elementi:

le scale di misura scala nominale scala ordinale DIAGNOSTICA PSICOLOGICA lezione si basano su tre elementi: DIAGNOSTICA PSICOLOGICA lezione! Paola Magnano paola.magnano@unikore.it si basano su tre elementi: le scale di misura sistema empirico: un insieme di entità non numeriche (es. insieme di persone; insieme

Dettagli

IL CRITERIO DELLA MASSIMA VEROSIMIGLIANZA

IL CRITERIO DELLA MASSIMA VEROSIMIGLIANZA Metodi per l Analisi dei Dati Sperimentali AA009/010 IL CRITERIO DELLA MASSIMA VEROSIMIGLIANZA Sommario Massima Verosimiglianza Introduzione La Massima Verosimiglianza Esempio 1: una sola misura sperimentale

Dettagli

Elementi di Statistica

Elementi di Statistica Università degli Studi di Palermo Dipartimento di Ingegneria Informatica Informatica ed Elementi di Statistica 3 c.f.u. Anno Accademico 2010/2011 Docente: ing. Salvatore Sorce Elementi di Statistica Statistica

Dettagli

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURA/TECNICA DI ANALISI DEI DATI SPECIFICAMENTE DESTINATA A STUDIARE LA RELAZIONE TRA UNA VARIABILE NOMINALE (ASSUNTA

Dettagli

Modelli descrittivi, statistica e simulazione

Modelli descrittivi, statistica e simulazione Modelli descrittivi, statistica e simulazione Master per Smart Logistics specialist Roberto Cordone (roberto.cordone@unimi.it) Statistica inferenziale Cernusco S.N., giovedì 18 febbraio 2016 (9.00/13.00)

Dettagli

DISTRIBUZIONE NORMALE (1)

DISTRIBUZIONE NORMALE (1) DISTRIBUZIONE NORMALE (1) Nella popolazione generale molte variabili presentano una distribuzione a forma di campana, bene caratterizzata da un punto di vista matematico, chiamata distribuzione normale

Dettagli

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva Fondamenti di Informatica Ester Zumpano Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva Lezione 5 Statistica descrittiva La statistica descrittiva mette a disposizione il calcolo di

Dettagli

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. La distribuzione t - student

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. La distribuzione t - student Università del Piemonte Orientale Corso di laurea in medicina e chirurgia Corso di Statistica Medica La distribuzione t - student 1 Abbiamo visto nelle lezioni precedenti come il calcolo del valore Z,

Dettagli

Facoltà di Economia - Università di Pavia Simulazione Prova Scritta di Statistica Sociale 19 dicembre 2012

Facoltà di Economia - Università di Pavia Simulazione Prova Scritta di Statistica Sociale 19 dicembre 2012 Facoltà di Economia - Università di Pavia Simulazione Prova Scritta di Statistica Sociale 19 dicembre 01 Esercizio 1. Con riferimento a due variabili dicotomiche X e Y (con valori possibili 0 o 1) si definisca

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 13-Il t-test per campioni indipendenti vers. 1.1 (12 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di

Dettagli

Il calcolo del VAR operativo mediante la metodologia stocastica parametrica. Simona Cosma

Il calcolo del VAR operativo mediante la metodologia stocastica parametrica. Simona Cosma Il calcolo del VAR operativo mediante la metodologia stocastica parametrica Simona Cosma Contenuti Il VAR operativo: inquadramento concettuale La metodologia attuariale EVT (Extreme Value Theory) Il VAR

Dettagli

COMPLEMENTI DI PROBABILITA E STATISTICA. 3 Crediti

COMPLEMENTI DI PROBABILITA E STATISTICA. 3 Crediti CMPLEMENTI DI PRBABILITA E STATISTICA 3 Crediti Docente : Elvira Di Nardo (dinardo@unibas.it, 097-05890) Modalità di esame: Prova scritta alla fine del corso + Tesina (facoltativa) Testi consigliati: Manuale

Dettagli

Test d Ipotesi Introduzione

Test d Ipotesi Introduzione Test d Ipotesi Introduzione Uno degli scopi più importanti di un analisi statistica è quello di utilizzare i dati provenienti da un campione per fare inferenza sulla popolazione da cui è stato estratto

Dettagli

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è

Dettagli

Statistica4-29/09/2015

Statistica4-29/09/2015 Statistica4-29/09/2015 Raccogliere i dati con il maggior numero di cifre significative ed arrotondare eventualmente solo al momento dei calcoli (min. 3); nella grande maggioranza delle ricerche biologiche

Dettagli

V.C. RETTANGOLARE o UNIFORME

V.C. RETTANGOLARE o UNIFORME V.C. RETTANGOLARE o UNIFORME La v.c. continua RETTANGOLARE o UNIFORME descrive il modello probabilistico dell equiprobabilità. [ a b] X, con densità di probabilità associata: P( x) 1 b a con P(x) costante.

Dettagli

Istituzioni di Statistica e Statistica Economica

Istituzioni di Statistica e Statistica Economica Istituzioni di Statistica e Statistica Economica Università degli Studi di Perugia Facoltà di Economia, Assisi, a.a. 2013/14 Esercitazione n. 1 A. I dati riportati nella seguente tabella si riferiscono

Dettagli

Inferenza statistica II parte

Inferenza statistica II parte Inferenza statistica II parte Marcella Montico Servizio di epidemiologia e biostatistica Test statistici II parte Variabili quantitative Caso 1 Variabile Dipendente = quantitativa Variabile Indipendente

Dettagli