Analisi Bivariata: Test Statistici
|
|
|
- Maurizio Salvadori
- 9 anni fa
- Visualizzazioni
Transcript
1 Analisi Bivariata: Test Statistici Metodi Quantitativi per Economia, Finanza e Management Esercitazione n 5
2 Prima di iniziare.. Controllare se sul pc su cui state lavorando esiste già una cartella C:\corso. In tal caso eliminare tutto il contenuto. In caso contrario creare la cartella corso all interno del disco C Andare sul disco condiviso F nel percorso F:\corsi\Metodi_Quantitativi_EFM_1516\esercitazione5 e copiare il contenuto nella cartella C:\corso Aprire il programma SAS (Start All Programs SAS SAS 9.3) Allocare la libreria corso, puntando il percorso fisico C:\corso, utilizzando l istruzione: libname corso 'C:\corso';
3 Metodi Quantitativi per Economia, Finanza e Management Obiettivi di questa esercitazione: Teoria dei Test Statistici Due qualitative: PROC FREQ Due quantitative: PROC CORR Qualitativa e quantitativa: PROC ANOVA
4 Scorsa lezione: Analisi Bivariata TIPO DI VARIABILI TIPO DI RELAZIONE INDAGATA INDICI DI DIPENDENZA PROCEDURA SAS Due Variabili Qualitative Indipendenza Statistica Chi Quadro, Cramer V PROC FREQ Due Variabili Quantitative Indipendenza Lineare coeff. di correlazione lineare PROC CORR Una Qualitative e Una Quantitativa continua Indipendenza in media indice eta-quadro PROC ANOVA
5 Teoria dei Test d Ipotesi (1/6) Cos è un test d ipotesi? Il ricercatore fornisce ipotesi riguardo la distribuzione di una o più variabili della popolazione Obiettivo del test: decidere se accettare o rifiutare l ipotesi statistica alla luce di un risultato campionario TEST PARAMETRICI Il ricercatore conosce la distribuzione delle variabili in analisi a meno di uno o più parametri e formula ipotesi sul valore dei parametri incogniti TEST NON PARAMETRICI Il ricercatore fornisce delle ipotesi sul comportamento delle variabili, indipendentemente dalla conoscenza della loro distribuzione TEST per l INDIPENDENZA DI DUE VARIABILI
6 Teoria dei Test d Ipotesi (2/6) Vengono formulate due ipotesi: H0 IPOTESI NULLA H1 IPOTESI ALTERNATIVA (rappresenta, di fatto, l ipotesi che il ricercatore sta cercando di dimostrare) Esempio (test d indipendenza) H0: X e Y sono indipendenti H1: X e Y non sono indipendenti L obiettivo è stabilire se, sulla base dei dati campionari osservati, l ipotesi nulla è «verosimile». Viene rifiutata se il campione osservato è «improbabile» ritenendo vera quell ipotesi.
7 Teoria dei Test d Ipotesi (3/6) Si possono commettere diversi tipi di errore: Le due variabili sono realmente indipendenti Esiste in natura una dipendenza tra le variabili STATO DI NATURA Sulla base del campione decido che c è indipendenza DECISIONE Accetto H 0 H 0 Vera No errore H 0 Falsa ERRORE SECONDO TIPO ( β ) Sulla base del campione decido che c è dipendenza Rifiuto H 0 ERRORE PRIMO TIPO (α) No errore
8 Teoria dei Test d Ipotesi (4/6) Si possono commettere diversi tipi di errore: ERRORE PRIMO TIPO Rifiutare un ipotesi nulla vera Considerato un tipo di errore molto serio La probabilità dell errore di primo tipo è Livello di significatività del test ERRORE SECONDO TIPO Non rifiutare un ipotesi nulla falsa La probabilità dell errore di secondo tipo è β (1 β) è definito come la potenza del test (probabilità che un ipotesi nulla falsa venga rifiutata)
9 Teoria dei Test d Ipotesi (5/6) Il ricercatore fissa a priori il livello di significatività del test (i valori comuni sono 0.01, 0.05, 0.10) L obiettivo è quello di scegliere una delle due ipotesi, in modo che la probabilità di commettere un errore del primo tipo, sulla base dei dati campionari, sia bassa, o meglio inferiore al livello di significatività scelto: P(rifiutare H0 H0 vera) < α P-value («livello di significatività osservato») - Viene determinato sulla base di una statistica calcolata sui dati campionari (statistica test), che dipende dal test che si sta conducendo - Rappresenta la probabilità di commettere l errore di primo tipo sulla base del campione - Deve essere confrontato con il valore di significatività scelto a monte
10 Teoria dei Test d Ipotesi (6/6) 1) Sistema di Ipotesi Formulazione ipotesi nulla e ipotesi alternativa Impostazione a priori del livello di significatività α 2) Calcolo Statistica test 3) Calcolo P-value Calcolo del valore della statistica test (specifica del test che si sta conducendo) sulla base dei dati campionari Calcolo del livello di significatività osservato Se p-value < α Se p-value α sulla base dei dati campionari, la probabilità di rifiutare H0 quando H0 è vera è inferiore alla soglia scelta rifiuto H0 accetto H0
11 Teoria dei Test d Ipotesi - Esempio 1) Sistema di Ipotesi H0: X e Y sono indipendenti H1: X e Y dipendenti Fissiamo α = ) Calcolo Statistica test 3) Calcolo P-value Se p-value < 0.05 rifiuto H0 concludo che X e Y sono dipendenti Se p-value 0.05 accetto H0 concludo che X e Y sono indipendenti
12 Test per l indipendenza statistica Il test per la valutazione dell indipendenza di due variabili dipende dalla natura delle variabili considerate: Due Variabili Qualitative Test per l Indipendenza Statistica PROC FREQ Due Variabili Quantitative Una Qualitative e Una Quantitativa continua Test per l Indipendenza Lineare Test per l Indipendenza in media PROC CORR PROC ANOVA
13 Metodi Quantitativi per Economia, Finanza e Management Obiettivi di questa esercitazione: Dipendenza tra due variabili (schema di analisi) Due qualitative: PROC FREQ Due quantitative: PROC CORR Qualitativa e quantitativa: PROC ANOVA
14 Test per l indipendenza statistica X e Y due variabili qualitative/quantitative discrete Ipotesi: H0: X e Y sono statisticamente indipendenti H1: X e Y sono statisticamente dipendenti Statistica test: Statistica Chi-Quadro Regola di decisione: Se p-value < α rigetto H0 X e Y sono statisticamente dipendenti Se p-value α accetto H0 X e Y sono statisticamente indipendenti
15 PROC FREQ Test d indipendenza statistica tra due variabili qualitative o quantitative discrete proc freq data= dataset; run; tables variabile1 * variabile2 /chisq; NB: tra le opzioni posso sempre inserire l opzione missing, per considerare anche i missing nel calcolo delle frequenze: tables variabile1 * variabile2 /missing chisq;
16 PROC FREQ Esempio C è indipendenza statistica tra le variabili sesso del rispondente (SESSO) e possesso del computer (COMPUTER)? proc freq data=corso.telefonia; tables sesso * computer /chisq; run;
17 Scorsa lezione: tabella di contingenza Femmine: - 16% computer=0-84% computer=1 Maschi: % computer= % computer=1 Le distribuzioni della variabile computer, condizionate al sesso, sono diverse (viceversa quelle del sesso condizionate al possesso del computer) ci fa pensare alla presenza di dipendenza tra le due variabili!
18 Scorsa lezione: Indici di connessione Come valutiamo la presenza di indipendenza a partire dagli indici calcolati? Chi-quadro lontano da 0, Cramer V vicino a 0 Vediamo cosa dice il Test d ipotesi
19 Risultato del Test P-value= Sia α =0.05: p-value < α rigetto H0 concludo che X e Y sono statisticamente dipendenti Se avessimo scelto un livello di significatività diverso? con α =0.01: p-value α accetto H0 X e Y sono statisticamente indipendenti A seconda del livello di significatività fissato possiamo raggiungere conclusioni differenti! NB. Se considerando i valori più comuni di α (0.01, 0.05, 0.1), si ottengono conclusioni diverse, si può dire che sulla base del campione la presunta relazione di dipendenza non è così forte.
20 PROC FREQ: Esempio 2 C è indipendenza statistica tra le variabili SESSO e MARCA? proc freq data=corso.telefonia; tables sesso * marca /chisq; run;
21 PROC FREQ: Esempio 2 Attenzione: molte celle con frequenze congiunte assolute molto basse (<5) test non affidabile
22 PROC FREQ: Esempio 2 Se più del 20% delle celle ha frequenza assoluta < 5, SAS lo segnala e il test non è affidabile!
23 Metodi Quantitativi per Economia, Finanza e Management Obiettivi di questa esercitazione: Dipendenza tra due variabili (schema di analisi) Due qualitative: PROC FREQ Due quantitative: PROC CORR Qualitativa e quantitativa: PROC ANOVA
24 Test per l indipendenza lineare X e Y due variabili quantitative Ipotesi: H0: X e Y sono linearmente indipendenti (ρ popolaz =0) H1: X e Y sono linearmente dipendenti (ρ popolaz 0) Statistica test: Regola di decisione: Statistica t di Student Se p-value < α rigetto H0 X e Y sono linearmente dipendenti Se p-value α accetto H0 X e Y sono linearmente indipendenti
25 PROC CORR Test per la correlazione tra due o più variabili quantitative proc corr data= dataset; var variabile1 variabile2 variabilen; run;
26 PROC CORR - Esempio Correlazione tra il numero medio di ore di utilizzo del telefono cellulare e del fisso al giorno proc corr data=corso.telefonia; var cell_h fisso_h; run;
27 Scorsa Lezione: Indice di correlazione 20 c e l l _ h f i s s o _ h Coefficiente di correlazione lineare ρ(x,y): presenza di relazione lineare positiva
28 Risultato del test P-value = Sia fissando α =0.05 che α =0.01 p-value < α rigetto H0 X e Y sono linearmente dipendenti Conclusione: esiste una relazione lineare tra le due variabili, anche se non molto forte (il coefficiente di correlazione lineare non è nullo, ma ha valore non molto elevato)
29 Metodi Quantitativi per Economia, Finanza e Management Obiettivi di questa esercitazione: Dipendenza tra due variabili (schema di analisi) Due qualitative: PROC FREQ Due quantitative: PROC CORR Qualitativa e quantitativa: PROC ANOVA
30 Test per l indipendenza in media X variabile qualitativa, Y variabile quantitativa Ipotesi: H0: X e Y sono indipendenti in media μ1 = μ2 = = μk (le medie di Y nei gruppi sono tutte uguali tra loro) H1: X e Y sono dipendenti in media le μi non sono tutte uguali (esistono almeno due medie diverse tra loro) Statistica test: Statistica F di Fisher Regola di decisione: Se p-value < α rigetto H0 X e Y sono dipendenti in media Se p-value α accetto H0 X e Y sono indipendenti in media
31 PROC ANOVA Test d indipendenza in media tra: Y variabile quantitativa e X variabile qualitativa PROC ANOVA DATA=dataset; CLASS X; MODEL Y=X; MEANS X; RUN;
32 PROC ANOVA - Esempio C è relazione tra la soddisfazione del cliente (SODDISFAZIONE_GLOBALE) e l operatore telefonico da lui scelto (OPERATORE)? PROC ANOVA DATA =corso.telefonia; CLASS operatore; MODEL soddisfazione_globale=operatore; MEANS operatore; RUN;
33 Scorsa lezione: considerazioni Level of N soddisfazione_globale operatore Mean Std Dev Tim Tre Vodafone Wind La media della soddisfazione globale sembra molto vicina tra i diversi gruppi R-Square Coeff Var Root MSE soddisfazione_globale Mean eta quadro Anche il valore di eta-quadro è molto vicino a 0 avvalora l ipotesi di indipendenza in media
34 Risultato del Test: P-value = Fissando α =0.05 p-value > α accetto H0 X e Y sono indipendenti in media
35 Approccio di analisi Test statistico Valutazione indice 1) Eseguire l opportuno test statistico in dipendenza dalla tipologia delle variabili poste a confronto; 2) Analizzare l esito del test (pvalue): a) Indipendenza tra le due variabili verificare se il valore dell indice conferma l esito del test; b) Dipendenza tra le due variabili valutare il valore dell indice per indagare la forza della relazione.
36 Dataset Il dataset DENTI contiene dati sul consumo di dentifricio (di marca A e di marca B). Le variabili sono: # Variable Type Label 1 CODCLI Num CODICE CLIENTE 2 SESSO Char SESSO 3 ETACLASS Char CLASSE DI ETA' 4 REGIONE Char REGIONE ITALIANA 5 PRESBAMB Char PRESENZA BAMBINI (1:SI / 2:NO) 6 TRATTOT Num CLIENTE ABITUALE DI DENTIFRICI SI/NO 7 ALTOCON Num ALTO CONSUMANTE SI/NO 8 CONSTOT Num TOTALE CONSUMO DI DENTIFRICI NEL PERIODO 9 ACQTOT Num TOTALE ACQUISTI DI DENTIFRICI NEL PERIODO 10 STOCKTOT Num TOTALE ACCUMULO DI DENTIFRICI NEL PERIODO 11 TATTITOT Num NUMERO DI CONTATTI PUBBLICITARI TOTALI 12 TRIP Num PERIODO OSSERVAZIONE 13 CITYSIZE Char DIMENSIONE CITTA' DI RESIDENZA IN CLASSI 14 AREA Char AREA GEOGRAFICA 15 ACQ_A Num ACQUISTI DI DENTIFRICI DELLA MARCA A NEL PERIODO 16 STOCK_A Num ACCUMULO DI DENTIFRICI DELLA MARCA A NEL PERIODO 17 CONS_A Num CONSUMO DI DENTIFRICI DELLA MARCA A NEL PERIODO 18 TRAT_A Num CLIENTE ABITUALE DI DENTIFRICI DELLA MARCA A SI/NO 19 TATTI_A Num NUMERO DI CONTATTI PUBBLICITARI (DENTIFRICI MARCA A) 20 ACQ_B Num ACQUISTI DI DENTIFRICI DELLA MARCA B NEL PERIODO 21 STOCK_B Num ACCUMULO DI DENTIFRICI DELLA MARCA B NEL PERIODO 22 CONS_B Num CONSUMO DI DENTIFRICI DELLA MARCA B NEL PERIODO 23 TRAT_B Num CLIENTE ABITUALE DI DENTIFRICI DELLA MARCA B SI/NO 24 TATTI_B Num NUMERO DI CONTATTI PUBBLICITARI (DENTIFRICI MARCA B)
37 Esercizi 1. Allocare la libreria ESER5, in modo che punti alla cartella fisica dove è contenuta la tabella SAS «DENTI_NEW» 2. Analizzare la relazione di indipendenza tra area geografica e sesso 3. Analizzare la relazione di indipendenza tra le variabili consumo di dentifrici della marca A e numero di contatti pubblicitari totali 4. Analizzare la relazione di indipendenza tra la variabile consumo di dentifrici della marca A e area geografica e confrontarla con quella tra consumo di dentifrici della marca A e dimensione della città di residenza.
Analisi Univariata & Esercizi
Analisi Univariata & Esercizi Metodi Quantitativi per Economia, Finanza e Management Esercitazione n 3 Lavoro di Gruppo Inviare entro oggi 16/10/2015, a [email protected] e [email protected]: nome,
Analisi della varianza a una via
Analisi della varianza a una via Statistica descrittiva e Analisi multivariata Prof. Giulio Vidotto PSY-NET: Corso di laurea online in Discipline della ricerca psicologico-sociale SOMMARIO Modelli statistici
Esercitazioni di statistica
Esercitazioni di statistica Misure di associazione: Indipendenza assoluta e in media Stefania Spina Universitá di Napoli Federico II [email protected] 22 ottobre 2014 Stefania Spina Esercitazioni
Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill
Statistica - metodologie per le scienze economiche e sociali /e S. Borra, A. Di Ciaccio - McGraw Hill Es.. Soluzione degli esercizi del capitolo 4 4. Il sistema d ipotesi è: μ 7, H : μ 7, Essendo 0 : t,
Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2010/2011 Statistica Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza
STATISTICA AZIENDALE Modulo Controllo di Qualità
STATISTICA AZIENDALE Modulo Controllo di Qualità A.A. 009/10 - Sottoperiodo PROA DEL 14 MAGGIO 010 Cognome:.. Nome: Matricola:.. AERTENZE: Negli esercizi in cui sono richiesti calcoli riportare tutte la
Test per la correlazione lineare
10 Test per la correlazione lineare Istituzioni di Matematica e Statistica 2015/16 E. Priola 1 Introduzione alla correlazione lineare Problema: In base ai dati che abbiamo possiamo dire che c è una qualche
Esercitazione 8 del corso di Statistica 2
Esercitazione 8 del corso di Statistica Prof. Domenico Vistocco Dott.ssa Paola Costantini 6 Giugno 8 Decisione vera falsa è respinta Errore di I tipo Decisione corretta non è respinta Probabilità α Decisione
Statistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2011/2012 Statistica Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate.
Gli errori nella verifica delle ipotesi
Gli errori nella verifica delle ipotesi Nella statistica inferenziale si cerca di dire qualcosa di valido in generale, per la popolazione o le popolazioni, attraverso l analisi di uno o più campioni E
STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE
STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE La presentazione dei dati per molte ricerche mediche fa comunemente riferimento a frequenze, assolute o percentuali. Osservazioni cliniche conducono sovente
Prova Scritta di METODI STATISTICI PER L AMMINISTRAZIONE DELLE IMPRESE (Milano, )
Università degli Studi di Milano Bicocca Scuola di Economia e Statistica Corso di Laurea in Economia e Amministrazione delle Imprese (ECOAMM) Prova Scritta di METODI STATISTICI PER L AMMINISTRAZIONE DELLE
3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17
C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica
Corso di Psicometria Progredito
Corso di Psicometria Progredito 5. La correlazione lineare Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014 Sommario 1 Tipi di relazione
Analisi della varianza: I contrasti e il metodo di Bonferroni
Analisi della varianza: I contrasti e il metodo di Bonferroni 1 Contrasti In molti problemi risulta importante stabilire, nel caso venga rifiutata l ipotesi nulla, di uguaglianza delle medie µ j delle
Statistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi
Esercitazione 14 Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () 1 / 14 Ex.1: Verifica Ipotesi sulla media (varianza nota) Le funi prodotte da un certo macchinario hanno una
Capitolo 9 Verifica di ipotesi: test basati su un campione
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 9 Verifica di ipotesi: test basati su un campione Insegnamento: Statistica Corsi di Laurea Triennale in Economia Facoltà di Economia, Università
STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE
1 STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE La presentazione dei dati per molte ricerche mediche fa comunemente riferimento a frequenze, assolute o percentuali. Osservazioni cliniche conducono
Premessa: la dipendenza in media
Premessa: la dipendenza in media Supponiamo di avere K diversi livelli di un fattore che potrebbero influire su una determinata variabile. Per esempio supponiamo di domandarci se la diversificazione (intesa
PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA
PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURA/TECNICA DI ANALISI DEI DATI SPECIFICAMENTE DESTINATA A STUDIARE LA RELAZIONE TRA UNA VARIABILE NOMINALE (ASSUNTA
Esercitazione di Statistica Indici di associazione
Esercitazione di Statistica Indici di associazione 28/10/2015 La relazione tra caratteri Indipendenza logica Quando si suppone che tra due caratteri non ci sia alcuna relazione di causa-effetto. Indipendenza
Capitolo 11 Test chi-quadro
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 11 Test chi-quadro Insegnamento: Statistica Corsi di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara Docenti: Dott.
Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni
La statistica inferenziale Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni E necessario però anche aggiungere con
Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura
INDICE GENERALE Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura XI XIV XV XVII XVIII 1 LA RILEVAZIONE DEI FENOMENI
Analisi della Varianza Fattoriale
Analisi della Varianza Fattoriale AMD Marcello Gallucci [email protected] Ripasso dell ANOVA Lo studio degli effetti di una serie di variabili indipendenti nominale (gruppi) su un variabile dipendente
STATISTICA. Esercizi vari
STATISTICA Esercizi vari Esercizio 5.6 p. 205 Variabile Coeff. Dev. std. Statistica t p-value Intercetta 23.384 1.592 14.691 0 Profondità -1.435 0.213-6.726 0 = 0.850 Esercizio 5.6 p. 205 Variabile Coeff.
ANOVA: ANALISI DELLA VARIANZA Prof. Antonio Lanzotti
UNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II DIPARTIMENTO DI INGEGNERIA AEROSPAZIALE D.I.A.S. STATISTICA PER L INNOVAZIONE a.a. 007/008 ANOVA: ANALISI DELLA VARIANZA Prof. Antonio Lanzotti A cura di: Ing.
Statistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione.
Statistica inferenziale La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione. Verifica delle ipotesi sulla medie Quando si conduce una
Proprietà della varianza
Proprietà della varianza Proprietà della varianza Proprietà della varianza Proprietà della varianza Intermezzo: ma perché dovremmo darci la pena di studiare come calcolare la varianza nel caso di somme,
STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo
STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)
LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell
LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Strumenti statistici in Excell Pacchetto Analisi di dati Strumenti di analisi: Analisi varianza: ad un fattore Analisi
Ulteriori applicazioni del test del Chi-quadrato (χ 2 )
Ulteriori applicazioni del test del Chi-quadrato (χ 2 ) Finora abbiamo confrontato con il χ 2 le numerosità osservate in diverse categorie in un campione con le numerosità previste da un certo modello
STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE
STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 2 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1.1
Corso di Psicometria Progredito
Corso di Psicometria Progredito 43 I principali test statistici per la verifica di ipotesi: Il test del χ 2 per tavole di contingenza a 2 vie Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia
Capitolo 10 Test delle ipotesi
Capitolo 10 Test delle ipotesi 1 Stima e verifica di ipotesi Modello di popolazione e campionamento: La popolazione viene descritta da una variabile aleatoria dipendente da un parametro incognito. Si ipotizza
Caratterizzazione dei consumi energetici (parte 3)
ESERCITAZIONE 4 Caratterizzazione dei consumi energetici (parte 3) 4.1 CuSum: elementi di analisi statistica Il diagramma delle somme cumulate dei residui in funzione del tempo (CuSum) può essere in generale
Un esempio. Ipotesi statistica: supposizione riguardante: un parametro della popolazione. la forma della distribuzione della popolazione
La verifica delle ipotesi In molte circostanze il ricercatore si trova a dover decidere quale, tra le diverse situazioni possibili riferibili alla popolazione, è quella meglio sostenuta dalle evidenze
Gestione ed Analisi Statistica dei dati
Master in Evidence Based Practice e Metodologia della Ricerca clinico-assistenziale assistenziale Gestione ed Analisi Statistica dei dati Daniela Fortuna 12 giugno 2014 TEST di ipotesi Finora abbiamo visto
X Lezione Analisi della varianza Esempi e esercizi CPS - Corso di studi in Informatica II parte: Statistica
Corso di Calcolo delle Probabilità e Statistica II Parte - STATISTICA X Lezione Analisi della varianza Esempi e esercizi 1 Argomenti della X Lezione Tests per il confronto di più medie: ANOVA Utilità e
LEZIONE N. 11 ( a cura di MADDALENA BEI)
LEZIONE N. 11 ( a cura di MADDALENA BEI) F- test Assumiamo l ipotesi nulla H 0 :β 1,...,Β k =0 E diverso dal verificare che H 0 :B J =0 In realtà F - test è più generale H 0 :Aβ=0 H 1 :Aβ 0 A è una matrice
Capitolo 8. Probabilità: concetti di base
1 Capitolo 8 Probabilità: concetti di base Statistica - Metodologie per le scienze economiche e sociali 2/ed S. Borra, A. Di Ciaccio Copyright 2008 The McGraw-Hill Companies srl 2 Concetti primitivi di
IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI
IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI Perchè confrontare le varianze stimate in due campioni? Torniamo all'esempio dei frinosomi Per poter applicare il test t avevamo detto che le varianze, e
Approssimazione normale alla distribuzione binomiale
Approssimazione normale alla distribuzione binomiale P b (X r) costoso P b (X r) P(X r) per N grande Teorema: Se la variabile casuale X ha una distribuzione binomiale con parametri N e p, allora, per N
Capitolo 12. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 12.1: Suggerimento
Capitolo Suggerimenti agli esercizi a cura di Elena Siletti Esercizio.: Suggerimento Per verificare se due fenomeni sono dipendenti in media sarebbe necessario confrontare le medie condizionate, in questo
Inferenza statistica II parte
Inferenza statistica II parte Marcella Montico Servizio di epidemiologia e biostatistica Test statistici II parte Variabili quantitative Caso 1 Variabile Dipendente = quantitativa Variabile Indipendente
CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)
CHEMIOMETRIA Applicazione di metodi matematici e statistici per estrarre (massima) informazione chimica (affidabile) da dati chimici INCERTEZZA DI MISURA (intervallo di confidenza/fiducia) CONFRONTO CON
Metodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2013-2014 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
Esercitazione del
Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36
Concetti principale della lezione precedente
Corso di Statistica medica e applicata 9 a Lezione Dott.ssa Donatella Cocca Concetti principale della lezione precedente I concetti principali che sono stati presentati sono: Variabili su scala nominale
Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill
Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill Es. Soluzione degli esercizi del capitolo 7 home - indice In base agli arrotondamenti effettuati nei calcoli,
ANALISI DELLA VARIANZA A DUE VIE CON INTERAZIONE Prof. Antonio Lanzotti
UNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II DIPARTIMENTO DI INGEGNERIA AEROSPAZIALE D.I.A.S. STATISTICA PER L INNOVAZIONE a.a. 2007/2008 ANALISI DELLA VARIANZA A DUE VIE CON INTERAZIONE Prof. Antonio
Test d ipotesi. Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona. Ipotesi alternativa (H 1 )
Test d ipotesi Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Nel 900 falsificazione di ipotesi (Karl Popper) TEST D IPOTESI Nell 800 dimostrazione di ipotesi
NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI
NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI I METODI PER IL CONFRONTO DI MEDIE (Campioni non indipendenti) Prof.ssa G. Serio, Prof. P. Trerotoli, Cattedra di Statistica Medica, Università di Bari
Elementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 13-Il t-test per campioni indipendenti vers. 1.1 (12 novembre 2014) Germano Rossi 1 [email protected] 1 Dipartimento di Psicologia, Università di
CAPITOLO 11 ANALISI DI REGRESSIONE
VERO FALSO CAPITOLO 11 ANALISI DI REGRESSIONE 1. V F Se c è una relazione deterministica tra due variabili,x e y, ogni valore dato di x,determinerà un unico valore di y. 2. V F Quando si cerca di scoprire
Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill
- metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill Es. Soluzione degli esercizi del capitolo 8 home - indice In base agli arrotondamenti effettuati nei calcoli, si
Istituzioni di Statistica e Statistica Economica
Istituzioni di Statistica e Statistica Economica Università degli Studi di Perugia Facoltà di Economia, Assisi, a.a. 2013/14 Esercitazione n. 1 A. I dati riportati nella seguente tabella si riferiscono
TEST NON PARAMETRICO DI MANN-WHITNEY
TEST NON PARAMETRICO DI MANN-WHITNEY Questo test viene può essere utilizzato come test di confronto tra due campioni in maniera analoga ai test ipotesi parametrici di confronto medie (test Z se la varianza
Analisi della varianza
1. 2. univariata ad un solo fattore tra i soggetti (between subjects) 3. univariata: disegni fattoriali 4. univariata entro i soggetti (within subjects) 5. : disegni fattoriali «misti» L analisi della
Distribuzioni e inferenza statistica
Distribuzioni e inferenza statistica Distribuzioni di probabilità L analisi statistica spesso studia i fenomeni collettivi confrontandoli con modelli teorici di riferimento. Tra di essi, vedremo: la distribuzione
Prova scritta di STATISTICA. CDL Biotecnologie. (Programma di Massimo Cristallo - A)
Prova scritta di STATISTICA CDL Biotecnologie (Programma di Massimo Cristallo - A) 1. Un associazione di consumatori, allo scopo di esaminare la qualità di tre diverse marche di batterie per automobili,
N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.
N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle abelle riportate alla fine del documento. Esercizio 1 La concentrazione media di sostanze inquinanti osservata nelle acque di un fiume
Z-test, T-test, χ 2 -test
Z-test, T-test, χ 2 -test Francesco Corrias Chiara Todaro DIMA 13 febbraio 2012 Francesco Corrias Chiara Todaro (DIMA) Z-test, T-test, χ 2 -test 13 febbraio 2012 1 / 19 Verifica d ipotesi Definizione (Test
Esercitazioni del corso: STATISTICA
A. A. 0-0 Esercitazioni del corso: STATISTICA Sommario Esercitazione 4: Medie e varianze marginali Medie e varianze condizionate Scomposizione della varianza Indipendenza in media ESERCIZIO UNIVERSITÀ
DIPENDENZA E ASSOCIAZIONE DISTRIBUZIONE CONGIUNTA DI DUE VARIABILI. Ci limiteremo a considerare il caso di due variabili.
DIPENDENZA E ASSOCIAZIONE DISTRIBUZIONE CONGIUNTA DI DUE VARIABILI Sinora abbiamo considerato l analisi di un unica variabile per volta Tuttavia, le rilevazioni su un unità statistica sono in generale
Esercitazione 8 maggio 2014
Esercitazione 8 maggio 2014 Esercizio 2 dal tema d esame del 13.01.2014 (parte II). L età media di n gruppo di 10 studenti che hanno appena conseguito la laurea triennale è di 22 anni. a) Costruire un
Statistica Metodologica Avanzato Test 1: Concetti base di inferenza
Test 1: Concetti base di inferenza 1. Se uno stimatore T n è non distorto per il parametro θ, allora A T n è anche consistente B lim Var[T n] = 0 n C E[T n ] = θ, per ogni θ 2. Se T n è uno stimatore con
Applicazioni statistiche e utilizzo del package statistico Spss - 7
Applicazioni statistiche e utilizzo del package statistico Spss - 7 CISI 27 gennaio 2005 [email protected] Illustrare le principali statistiche mono e bivariate. Valutare quando è opportuno
Giorno n. clienti di attesa
Esercizio 1 Un aspetto cruciale per la qualità del servizio ai clienti in un supermercato è il cosiddetto checkout (ovvero il tempo che il cliente impiega dal momento in cui si mette in fila alla cassa
Test d Ipotesi Introduzione
Test d Ipotesi Introduzione Uno degli scopi più importanti di un analisi statistica è quello di utilizzare i dati provenienti da un campione per fare inferenza sulla popolazione da cui è stato estratto
i dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente
TEST DI AUTOVALUTAZIONE - SETTIMANA 6 I diritti d autore sono riservati. Ogni sfruttamento commerciale non autorizzato sarà perseguito. Metodi statistici per la biologia Parte A. La retta di regressione.2
Il confronto fra medie
L. Boni Obiettivo Verificare l'ipotesi che regimi alimentari differenti non producano mediamente lo stesso effetto sulla gittata cardiaca Ipotesi nulla IPOTESI NULLA La dieta non dovrebbe modificare in
a) Usando i seguenti livelli di significatività, procedere alla verifica di ipotesi, usando come ipotesi alternativa un'ipotesi unidirezionale:
ESERCIZIO 1 Da studi precedenti, il responsabile del rischio di una grande banca sa che l'ammontare medio di denaro che deve essere corrisposto dai correntisti che hanno il conto scoperto è pari a 240.
Statistica di base per l analisi socio-economica
Laurea Magistrale in Management e comunicazione d impresa Statistica di base per l analisi socio-economica Giovanni Di Bartolomeo [email protected] Definizioni di base Una popolazione è l insieme
ˆp(1 ˆp) n 1 +n 2 totale di successi considerando i due gruppi come fossero uno solo e si costruisce z come segue ˆp 1 ˆp 2. n 1
. Verifica di ipotesi: parte seconda.. Verifica di ipotesi per due campioni. Quando abbiamo due insiemi di dati possiamo chiederci, a seconda della loro natura, se i campioni sono simili oppure no. Ci
Analisi della varianza
Analisi della varianza Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona ANALISI DELLA VARIANZA - 1 Abbiamo k gruppi, con un numero variabile di unità statistiche.
Prova d esame di Statistica - II canale - 10 CFU
Prova d esame di Statistica - II canale - 10 CFU Dott.ssa C. Conigliani 05/07/2010 Esercizio 1.[6 punti] Data la seguente tabella: Y 1 2 tot X 0-1 70 1-3 50 3-5 30 tot 100 50 150 a) riempirla in modo che
Test di ipotesi su due campioni
2/0/20 Test di ipotesi su due campioni Confronto tra due popolazioni Popolazioni effettive: unità statistiche realmente esistenti. Esempio: Confronto tra forze lavoro di due regioni. Popolazioni ipotetiche:
Esercizi di Probabilità e Statistica
Esercizi di Probabilità e Statistica Samuel Rota Bulò 6 giugno 26 Statistica Esercizio Sia {X n } n una famiglia di v.a. di media µ e varianza σ 2. Verificare che X = n n X i σ 2 = n (X i µ) 2 S 2 = n
REGRESSIONE E CORRELAZIONE
REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.
Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25
Sommario Presentazione dell edizione italiana Prefazione xv xiii Capitolo 1 I dati e la statistica 1 Statistica in pratica: BusinessWeek 1 1.1 Le applicazioni in ambito aziendale ed economico 3 Contabilità
Strumenti informatici Realizzare un test z, un test t e un test F per campioni indipendenti con Excel e SPSS
Strumenti informatici 5.2 - Realizzare un test z, un test t e un test F per campioni indipendenti con Excel e SPSS Sia Excel che SPSS consentono di realizzare in modo abbastanza rapido il test sulle medie
FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 21/09/2011
FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 1/9/11 ESERCIZIO 1 (+3++3) La seguente tabella riporta la distribuzione di frequenza dei valori di emoglobina nel sangue (espressi
La dipendenza. Antonello Maruotti
La dipendenza Antonello Maruotti Outline 1 Distribuzioni doppie 2 Medie e varianze condizionate 3 Indici di associazione Distribuzione doppia Definizione Una distribuzione doppia si ha quando su di uno
PROVA SCRITTA DI STATISTICA. cod CLEA-CLAPI-CLEFIN-CLELI cod CLEA-CLAPI-CLEFIN-CLEMIT. 5 Novembre 2003 SOLUZIONI MOD.
PROVA SCRITTA DI STATISTICA cod. 4038 CLEA-CLAPI-CLEFIN-CLELI cod. 5047 CLEA-CLAPI-CLEFIN-CLEMIT 5 Novembre 003 SOLUZIONI MOD. A In 8 facoltà di un ateneo italiano vengono rilevati i seguenti dati campionari
ESERCIZI SVOLTI Giuliano Bonollo - Michele Bonollo
ESERCIZI SVOLTI Giuliano Bonollo - Michele Bonollo 1 La seguente tabella riporta le frequenze relative riguardanti gli studenti di un università e gli esiti dell esame da essi sostenuto. Qual è la percentuale
