Analisi dei dati qualitativi: omogeneità/eterogeneità, test del chi quadrato, analisi delle corrispondenze semplici e multiple

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Analisi dei dati qualitativi: omogeneità/eterogeneità, test del chi quadrato, analisi delle corrispondenze semplici e multiple"

Transcript

1 Analisi dei dati qualitativi: omogeneità/eterogeneità, test del chi quadrato, analisi delle corrispondenze semplici e multiple

2 La distribuzione di frequenza La prima è più elementare delle analisi è la distribuzione di frequenza. Essa consiste in un conteggio delle modalità di una variabile. 2

3 LA MATRICE DEI DATI: CASI PER VARIABILI data<-read.table("c:/temp/descrittive.csv", header=true, sep=";") data sesso eta nazionalita sodd 1 M 18 italiani si 2 M 20 italiani si 3 M 21 italiani si 4 M 22 italiani si 5 M 23 italiani si 6 M 19 italiani si 7 M 18 italiani si 8 M 52 italiani si 3

4 conteggio dei casi osservati Distribuzioni di frequenza: sesso attach(data) table(sesso) sesso F M table(sesso)/length(sesso) sesso F M frequenza relativa dei casi osservati (table(sesso)/length(sesso))*100 sesso F M percentua li dei casi osservati 4

5 Tre gruppi di comandi grafici 1. Funzioni di alto livello: creano un nuovo grafico sul device grafico 2. Funzioni di basso livello: aggiungono altre parti ad un grafico esistente (ad es: nuove linee, punti o oggetti grafici) 3. Funzioni interattive: consentono di aggiungere o estrarre interattivamente informazioni grafiche da un grafico esistente. Per un esempio di funzioni grafiche in R si esegua: demo(graphics)

6 Comandi ad alto livello grafico

7 Diagramma a barre e torta plot(sesso) pie(table(sesso))

8 L analisi monovariata: le statistiche Le statistiche servono a dare una descrizione sintetica del fenomeno. Esse si applicano in modo diverso secondo la scala di misurazione con la quale sono rilevate le variabili. 8

9 L analisi monovariata: le statistiche Esistono misure di tendenza centrale che sintetizzano l informazione contenuta nella variabile in un valore caratteristico. Esistono misure di dispersione che indicano la varietà delle informazioni presenti in una variabile. 9

10 Le misure di tendenza centrale su variabili NOMINALI LA MODA: E la modalità più frequente. 10

11 MODA in una distribuzione di frequenza table(nazionalita) nazionalita francesi inglesi italiani spagnoli tedeschi

12 Le misure di dispersione su variabili NOMINALI L indice di omogeneità 12

13 100 Situazione di omogeneità induisti musulmani altre cristiani sikh buddisti Composizione religiosa in India

14 100 Situazione di eterogeneità CDU/CSU SPD Liberali Linke Grunen altri Risultati elezioni in Germania 2009, percentuali 14

15 Indice di omogeneità Misura la dispersione in una variabile nominale O k i1 2 f i k O 1_ rel k 1 O Dove k è il numero di modalità e f i è la proporzione di casi che si trovano nella categoria i-esima. L indice di omogeneità O è dato quindi dalla somma dei quadrati delle frequenze proporzionali. E 1 k i1 f 2 i 1 O Indice di eterogeneità 15

16 Indice di omogeneità O k i1 2 p i È massimo (=1) quando tutti i casi assumono la stessa modalità. È minimo (=1/k) quando la distribuzione è massimamente eterogenea, i casi si distribuiscono ugualmente nelle diverse modalità. O 1 1/2 ESEMPIO con due modalità (p,1- p) O min = 0, ,50 2 = 0,50 O max = = 1 0 1/2 1 p 16

17 Indice di omogeneità O<-(table(nazionalita)/length(nazionalita))^2 nazionalita francesi inglesi italiani spagnoli tedeschi O<-(table(nazionalita)/length(nazionalita))^2 Omogen=sum(O) [1] Omogen.r=Omogen*(5/4) Omogen.r [1]

18 Test di significatività VARIABILI CATEGORIALI Test del Chi-quadrato (MONOVARIATA) 18

19 In un convegno internazionale una sessione è composta da scienziati delle seguenti nazionalità. N % Italiani 75 31,3 Francesi 29 12,1 Inglesi 36 15,0 Tedeschi 19 7,9 Spagnoli 81 33, ,0 19

20 Test di significatività Poniamo l ipotesi che la composizione dei membri del convegno non sia distribuita ugualmente secondo la nazionalità. Infatti, se fosse vero il contrario, considerate cinque le nazioni che partecipano al convegno, avremmo dovuto avere che alla sessione partecipassero il 20 % di scienziati per nazione. 20

21 Hp di lavoro: Vi sono differenze nella partecipazione al convegno secondo la nazionalità. Hp 0 nulla: Non vi sono differenze. 20% per nazione. 21

22 Calcoliamo le differenze per misurare quanto il fenomeno osservato si discosta dalla situazione ipotizzata: O N % Hp 0 N/5 (O-E) 2 (O-E) 2 /E Italiani 75 31, ,2 Francesi 29 12, ,5 Inglesi 36 15, Tedeschi 19 7, ,5 Spagnoli 81 33, ,7 E ,0 240 Ipotesi nulla Totale 65,9

23 Chi-Quadrato χ ,9 Il chi-quadrato che abbiamo osservato costituisce una misura della distanza dall ipotesi nulla di equidistribuzione (20% di scienziati per nazione). Maggiore è il valore di χ 2, più siamo lontani dall ipotesi di equidistribuzione. 23

24 Test del Chi-Quadrato χ 2 Quando N è abbastanza ampio (N>100) è possibile effettuare un test di significatività ricorrendo alla distribuzione nota del Chi-Quadrato. Dunque, considerando il numero di gradi di libertà, è possibile sottoporre a test di significatività l ipotesi nulla.

25 Distribuzione del Chi-Quadrato χ 2 Il chi-quadrato ha una funzione di densità nota, ma variabile secondo i gradi di libertà. I gradi di libertà, nell esempio proposto, sono k-1, dove k sono le modalità. I gradi di libertà rappresentano le frequenze di cella che possiamo liberamente inserire dato il totale. Oppure, costituiscono i vincoli minimi necessari a riempire tutte le celle. 25

26 Gradi di libertà = k 1 Italiani Francesi Inglesi Tedeschi Spagnoli N 100 Molto Abbastanza Poco Per niente N 100 Maschi Femmine N 100 gdl = 4 gdl = 3 gdl = 1 26

27 φ(χ 2 ) Funzione di densità di χ 2 φ(χ 2 ) ( ) g 2 2 g g 2 e 0 2 ( ) d χ 2 27

28 Il χ 2 E FUNZIONE DEI GRADI DI LIBERTA φ(χ 2 ) g=1 g=4 ( ) g 2 g g 2 e g= ( ) d 1 g= χ 2 28

29 p Distribuzione nota della v.c. χ 2 T 13,44 0,8 2 d 1 t 0 φ(χ 2 ) Funzione di densità di χ 2 con gl=10 AREA di NON Rifiuto di H 0 AREA di Rifiuto di H ,44 χ 2 29

30 Logica falsificazionista, errori Realtà del fenomenmo H 0 vera H 0 falsa Esito del test H 0 non rifiutata H 0 rifiutata No errore Errore I tipo (α) Errore II tipo (β) No errore 30

31 p RifiutoH H vera 0 0 α è la probabilità teorica di rifiutare a priori l H 0 quando questa è vera. α viene fissata arbitrariamente, solitamente si utilizza una soglia del 5 %. α = 0,05 31

32 Livello di significatività α ; costituisce l area di RIFIUTO di H 0, ossia l area di ACCETTAZIONE di H 1 g 2 2 g g 2 e d g = gradi di libertà α χ 2 α χ 2 32

33 Ricapitolando Il chi-quadrato osservato è uguale a 65,9. I gradi di libertà sono 4. Hp nulla: Non vi sono differenze: 20% per nazione Livello di significatività alfa=0,05 33

34 Valore critico del Chi-quadro 0 α 34

35 Rifiutiamo H 0. Respingiamo l ipotesi nulla di equidistribuzione. Con una significatività statistica dello 0,05 accettiamo che gli scienziati non rappresentano allo stesso modo le nazioni che partecipano alla sessione. φ(χ 2 ) Funzione di densità di χ 2 con gl=4 AREA di Rifiuto di H 0 e accettazione di H ,49 χ 2 α ,9 35 χ 2

36 Lavoriamo in R ## importiamo il dataset, che abbiamo copiato nella ## cartella C:/temp data<-read.table("c:/temp/lumsa/descrittive.csv", header=true, sep=";") data ## vogliamo lavorare con le singole variabili del dataset attach(data) ## costruiamo una tabella di frequenza table(nazionalita) francesi inglesi italiani spagnoli tedeschi ## test del chi quadrato (ipotesi nulla: equidistribuzione dei partecipanti per ## nazionalità) chisq.test(table(nazionalita)) Chi-squared test for given probabilities data: table(naz) X-squared = , df = 4, p-value = 1.649e-13

37 Le tabelle di contingenza sono tabelle doppie di frequenza di dati. Le modalità delle variabili di riga danno il nome alle righe della tabella, mentre quelle di colonna danno il nome alle colonne.

38 Schema distribuzione doppia di frequenza

39 Lavoriamo con due variabili table(nazionalita, sodd) sodd nazionalita no si francesi inglesi italiani spagnoli tedeschi 16 3

40 Test del chi quadrato chisq.test(table(nazionalita, sodd)) Pearson's Chi-squared test data: table(nazionalita, sodd) X-squared = , df = 4, p-value =

materiale didattico II incontro

materiale didattico II incontro Piano Nazionale Lauree Scientifiche (PLS 016-017) Statistica Laboratorio di Statistica Le relazioni tra variabili. L indipendenza prof.ssa Angela Maria D'Uggento angelamaria.duggento@uniba.it materiale

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2017-2018 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

Statistica. Capitolo 13. Test sulla Bontà di Adattamento e Tabelle di Contingenza. Cap. 16-1

Statistica. Capitolo 13. Test sulla Bontà di Adattamento e Tabelle di Contingenza. Cap. 16-1 Statistica Capitolo 13 Test sulla Bontà di Adattamento e Tabelle di Contingenza Cap. 16-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Usare il test sulla bontà di adattamento

Dettagli

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 5 Test d Ipotesi

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 5 Test d Ipotesi Metodi Quantitativi per Economia, Finanza e Management Lezione n 5 Test d Ipotesi Test per lo studio dell associazione tra variabili Nella teoria dei test, il ricercatore fornisce ipotesi riguardo la distribuzione

Dettagli

Il test del χ 2. Federico Plazzi. 24 Novembre 2015

Il test del χ 2. Federico Plazzi. 24 Novembre 2015 Il test del χ 2 Federico Plazzi 24 Novembre 2015 A che cosa serve? A che cosa serve? Condizioni Variabili qualitative: il test del χ 2 si usa quando si ha a che fare con delle variabili qualitative, ossia

Dettagli

Soggetto Genere Costo del soggiorno Titolo di studio

Soggetto Genere Costo del soggiorno Titolo di studio Esercitazione n. 1 Corso di Statistica Università della Basilicata Prof. Roberta Siciliano La tabella seguente raccoglie i dati grezzi, relativamente ad un gruppo di 30 turisti per i quali sono state osservate

Dettagli

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Quesito: Posso stimare il numero di ore passate a studiare statistica sul voto conseguito all esame? Potrei calcolare il coefficiente di correlazione.

Dettagli

VARIETÀ. zona geografica A B C D

VARIETÀ. zona geografica A B C D Anova a 2 vie con repliche (( chiarire che non devono essere esattamente nello stesso numero per ogni cella ovvero per le ripetizioni dei de fattori ma che excel li legge così) Esercizio-esempio 1 Il valore

Dettagli

Esercizi di statistica

Esercizi di statistica Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..

Dettagli

Dr. Marco Vicentini Anno Accademico Rev 20/04/2011

Dr. Marco Vicentini Anno Accademico Rev 20/04/2011 Università degli Studi di Padova Facoltà di Psicologia, L4, Psicometria, Modulo B Dr. Marco Vicentini marco.vicentini@unipd.it Anno Accademico 2010 2011 Rev 20/04/2011 La distribuzione χ 2 Tabelle di contingenza

Dettagli

Statistica bivariata Relazione tra variabili

Statistica bivariata Relazione tra variabili Relazione tra variabili Date due variabili x e y, rilevate ad un qualsiasi livello di scala, possiamo affermare che tra loro esiste una relazione se i valori dell una variano in modo sistematico al variare

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2016-2017 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

Dispense Associazione PRELIMINARY DRAFT

Dispense Associazione PRELIMINARY DRAFT Dispense Associazione PRELIMINARY DRAFT Cristina Mollica & Jan Martin Rossi January 3, 2019 1 Esercizio 3 - Prova scritta 12-01-2018 Esercizio 3. Si consideri la distribuzione doppia di un campione di

Dettagli

Distribuzioni di frequenza di due variabili

Distribuzioni di frequenza di due variabili Distribuzioni di frequenza di due variabili Esercizio In un collettivo di studenti è stato rilevato il voto riportato all esame di statistica e quello riportato all esame di fisica Studente 1 2 3 4 5 6

Dettagli

STATISTICA. Federico M. Stefanini. e.mail: a.a (3 CFU)

STATISTICA. Federico M. Stefanini. e.mail: a.a (3 CFU) STATISTICA a.a. 2001-2002 (3 CFU) Federico M. Stefanini Dipartimento di Statistica G.Parenti viale Morgagni 59, 50134 Firenze, tel. 055-4237211 PARTE 5-3.12.2001 e.mail: stefanin@ds.unifi.it http://www.ds.unifi.it/ricerca/pagperson/docenti/stefanini.htm

Dettagli

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill Statistica - metodologie per le scienze economiche e sociali /e S. Borra, A. Di Ciaccio - McGraw Hill Es.. Soluzione degli esercizi del capitolo 4 4. Il sistema d ipotesi è: μ 7, H : μ 7, Essendo 0 : t,

Dettagli

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI VERIFICA DI IPOTESI SUL LEGAME TRA VARIABILI QUALITATIVE Profssa G Serio, Prof P Trerotoli, Cattedra di Statistica Medica, Università di Bari 1/1 IL

Dettagli

STATISTICA 1 ESERCITAZIONE 2

STATISTICA 1 ESERCITAZIONE 2 Frequenze STATISTICA 1 ESERCITAZIONE 2 Dott. Giuseppe Pandolfo 7 Ottobre 2013 RAPPRESENTAZIONE GRAFICA DEI DATI Le rappresentazioni grafiche dei dati consentono di cogliere la struttura e gli aspetti caratterizzanti

Dettagli

Il questionario per rilevare informazioni

Il questionario per rilevare informazioni Il questionario per rilevare informazioni Informazioni non scolastiche Non esistono solo le variabili relative all apprendimento o le variabili scolastiche Informazioni relative alle condizioni socio-culturali

Dettagli

Esercizio 1. soddisfazione

Esercizio 1. soddisfazione Esercizio 1 Un campione di trenta impiegati viene intervistato sulla soddisfazione verso il proprio lavoro. Nella tabella di seguito sono riportate le risposte date suddivise secondo il sesso dei soggetti.

Dettagli

Capitolo 11 Test chi-quadro

Capitolo 11 Test chi-quadro Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 11 Test chi-quadro Insegnamento: Statistica Corsi di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara Docenti: Dott.

Dettagli

(f o -f a ) f a fo = frequenza osservata fa = frequenza attesa per effetto del caso (cioè se è vera l'ipotesi nulla) DISEGNI CON UNA SOLA VARIABILE

(f o -f a ) f a fo = frequenza osservata fa = frequenza attesa per effetto del caso (cioè se è vera l'ipotesi nulla) DISEGNI CON UNA SOLA VARIABILE IL TEST DEL CHI 2 (2) Consente di verificare ipotesi su: a) relazioni tra variabili nella popolazione b) differenze tra popolazioni relative a: distribuzioni di frequenza Livello di misura dei dati: scala

Dettagli

I test statistici sulle frequenze

I test statistici sulle frequenze I test statistici sulle frequenze test ² (chi quadrato) test esatto di Fisher test di McNemar Camillo Pieramati Facoltà di Medicina Veterinaria di Perugia Perugia, 9 settembre 011 chi quadrato (indice

Dettagli

Statistica (parte II) Esercitazione 4

Statistica (parte II) Esercitazione 4 Statistica (parte II) Esercitazione 4 Davide Passaretti 03/03/016 Test sulla differenza tra medie (varianze note) Un negozio di scarpe è interessato a capire se le misure delle scarpe acquistate da adulti

Dettagli

Livello di esposizione. animale Basso Moderato Alto

Livello di esposizione. animale Basso Moderato Alto Esercizio -Esempio 1 (anova 2 vie con blocchi) I tassi respiratori (ispirazioni al minuto) sono stati misurati in otto animali usati per un esperimento, con tre livelli di esposizione al monossido di carbonio.

Dettagli

LEZIONI DI STATISTICA MEDICA

LEZIONI DI STATISTICA MEDICA LEZIONI DI STATISTICA MEDICA Lezione n.3 - Analisi di dati qualitativi -test per l analisi di tabelle di contingenza Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona Sotto

Dettagli

Analisi dell associazione tra due caratteri

Analisi dell associazione tra due caratteri Analisi dell associazione tra due caratteri Non ci accontentiamo di analizzare il singolo fenomeno, considerato indipendentemente da altri fenomeni Ci interessano le relazioni che possono esistere tra

Dettagli

Statistica Misure di eterogeneità. alessandro polli facoltà di scienze politiche, sociologia, comunicazione

Statistica Misure di eterogeneità. alessandro polli facoltà di scienze politiche, sociologia, comunicazione Statistica alessandro polli facoltà di scienze politiche, sociologia, comunicazione Definizione Nel caso di variabili qualitative, sappiamo che è possibile sintetizzarne le principali caratteristiche attraverso

Dettagli

STATISTICA. Regressione-4 ovvero Macron!

STATISTICA. Regressione-4 ovvero Macron! STATISTICA Regressione-4 ovvero Macron! Eravamo partiti da qui Stipendio medio orario 2013 Voto per Le Pen Stipendio medio orario (2013) [11,12) [12,13) [13,14) [14,15) [15,23] Eravamo partiti da qui Stipendio

Dettagli

Statistica per le le ricerche ricerche di mercato 9.b 9.b Analisi Analisi preliminari preliminari Verifica di ipotesi: test test di indipendenza

Statistica per le le ricerche ricerche di mercato 9.b 9.b Analisi Analisi preliminari preliminari Verifica di ipotesi: test test di indipendenza Statistica per le ricerche di mercato a.a. 014/15 9.b Analisi preliminari Verifica di ipotesi: test di indipendenza Test di indipendenza Permette di verificare se tra due variabili X e Y esiste o meno

Dettagli

LABORATORIO DI PROBABILITA E STATISTICA

LABORATORIO DI PROBABILITA E STATISTICA UNIVERSITA DEGLI STUDI DI VERONA LABORATORIO DI PROBABILITA E STATISTICA Docente: Bruno Gobbi 5 ESERCIZI RIEPILOGATIVI PRIME 3 LEZIONI ES. LAUREATI PER FACOLTA E LAVORO ESERCIZIO 5: La tabella presenta

Dettagli

Introduzione alla statistica con Excel

Introduzione alla statistica con Excel Introduzione alla statistica con Excel Davide Sardina davidestefano.sardina@unikore.it Università degli studi di Enna Kore Corso di Laurea in Servizio Sociale A.A. 2017/2018 Variabili quantitative e qualitative

Dettagli

Rappresentazioni Tabellari e Grafiche. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica

Rappresentazioni Tabellari e Grafiche. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica Rappresentazioni Tabellari e Grafiche Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica Vocabolario Essenziale Unità Statistica Unità elementare

Dettagli

IPOTESI SULLA FORMA DELLA DISTRIBUZIONE CASO DI UN CAMPIONE

IPOTESI SULLA FORMA DELLA DISTRIBUZIONE CASO DI UN CAMPIONE IPOTESI SULLA FORMA DELLA DISTRIBUZIONE CASO DI UN CAMPIONE Questo tipo di ipotesi non è fondata su un parametro PROBLEMA (1) Si vuole verificare se in una certa fascia oraria, dalle 18:00 alle 19:00,

Dettagli

Tecniche statistiche di analisi del cambiamento

Tecniche statistiche di analisi del cambiamento Tecniche statistiche di analisi del cambiamento 05-Ripasso inferenziale: Chi quadro (v. 1.0, 15 ottobre 2018) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)

Dettagli

Capitolo 12 La regressione lineare semplice

Capitolo 12 La regressione lineare semplice Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università

Dettagli

Data set relativo a 40 titolari di esercizi commerciali. Durata del percorso casa lavoro (in minuti) Numero dipendenti che lavorano nel negozio

Data set relativo a 40 titolari di esercizi commerciali. Durata del percorso casa lavoro (in minuti) Numero dipendenti che lavorano nel negozio ESERCITAZIONE 1: VARIABILI E DISTRIBUZIONI 1.TIPOLOGIA DEI DATI 2. CALCOLO DI FREQUENZE 3. RAPPRESENTAZIONE GRAFICA DI UNA VARIABILE A Roma nel 2006 è stata effettuata un indagine, tramite questionario,

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 10-Significatività statistica per la correlazione vers. 1.0 (5 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università

Dettagli

Test per l indipendenza

Test per l indipendenza Test per l indipendenza 1 I test che sono stati passati in rassegna finora sono tutti di tipo parametrico (essi infatti si occupano della verifica di ipotesi su un parametro di una popolazione oppure del

Dettagli

ANALISI STATISTICHE BIVARIATE. Tabelle di contingenza

ANALISI STATISTICHE BIVARIATE. Tabelle di contingenza ANALISI STATISTICHE BIVARIATE Tabelle di contingenza 1 Analisi Statistica Bivariata Generalmente, lo studio quantitativo di un fenomeno di interesse si svolge rilevando contemporaneamente più caratteri

Dettagli

SOLUZIONE. a) Calcoliamo il valore medio delle 10 misure effettuate (media campionaria):

SOLUZIONE. a) Calcoliamo il valore medio delle 10 misure effettuate (media campionaria): ESERCIZIO SU TEST STATISTICO (Z, T e χ ) Da una ditta di assemblaggio di PC ci viene chiesto di controllare la potenza media dissipata da un nuovo processore, che causa a volte problemi di sovraccarico

Dettagli

Ulteriori applicazioni del test del Chi-quadrato (χ 2 )

Ulteriori applicazioni del test del Chi-quadrato (χ 2 ) Ulteriori applicazioni del test del Chi-quadrato (χ 2 ) Finora abbiamo confrontato con il χ 2 le numerosità osservate in diverse categorie in un campione con le numerosità previste da un certo modello

Dettagli

Elaborazione statistica di dati

Elaborazione statistica di dati Elaborazione statistica di dati CONCETTI DI BASE DI STATISTICA ELEMENTARE Taratura strumenti di misura IPOTESI: grandezza da misurare identica da misura a misura Collaudo sistemi di produzione IPOTESI:

Dettagli

Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 15: Metodi non parametrici

Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 15: Metodi non parametrici Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 15: Metodi non parametrici 1 Metodi non parametrici Statistica classica La misurazione avviene con

Dettagli

Esercitazione 8 del corso di Statistica 2

Esercitazione 8 del corso di Statistica 2 Esercitazione 8 del corso di Statistica Prof. Domenico Vistocco Dott.ssa Paola Costantini 6 Giugno 8 Decisione vera falsa è respinta Errore di I tipo Decisione corretta non è respinta Probabilità α Decisione

Dettagli

Applicazioni statistiche e utilizzo del package statistico Spss - 7

Applicazioni statistiche e utilizzo del package statistico Spss - 7 Applicazioni statistiche e utilizzo del package statistico Spss - 7 CISI 27 gennaio 2005 ricercapsicologica@tiscali.it Illustrare le principali statistiche mono e bivariate. Valutare quando è opportuno

Dettagli

STATISTICA A K (60 ore)

STATISTICA A K (60 ore) STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Esercizio Il contenuto di nicotina di una certa marca di sigarette è 0,25 milligrammi con una deviazione standard di 0,015. Un associazione

Dettagli

Statistica. Lezione 8

Statistica. Lezione 8 Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 8 a.a 2011-2012 Dott.ssa Daniela

Dettagli

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE La presentazione dei dati per molte ricerche mediche fa comunemente riferimento a frequenze, assolute o percentuali. Osservazioni cliniche conducono sovente

Dettagli

La variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

La variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Introduzione [1/2] Gli indici di variabilità consentono di riassumere le principali caratteristiche di una distribuzione (assieme alle medie) Le

Dettagli

STATISTICA MULTIVARIATA SSD MAT/06

STATISTICA MULTIVARIATA SSD MAT/06 Università degli studi di Ferrara Dipartimento di Matematica A.A. 2018/2019 I semestre STATISTICA MULTIVARIATA SSD MAT/06 LEZIONE 4 - Questioni di analisi e applicazione della regressione lineare Pratica

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 13-Il t-test per campioni indipendenti vers. 1.1 (12 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di

Dettagli

IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI

IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI Perchè confrontare le varianze stimate in due campioni? Torniamo all'esempio dei frinosomi Per poter applicare il test t avevamo detto che le varianze, e

Dettagli

SOLUZIONI ESERCITAZIONE NR. 8 Test statistici

SOLUZIONI ESERCITAZIONE NR. 8 Test statistici SOLUZIONI ESERCITAZIONE NR. 8 Test statistici ESERCIZIO nr. 1 Un campione casuale di dieci pazienti di sesso maschile in cura per comportamenti aggressivi nell ambito del contesto familiare è stato classificato

Dettagli

per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione

per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione Rapporti statistici di composizione la parte rispetto al tutto percentuali di derivazione per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione di frequenza (tassi) rapporti

Dettagli

Fonti e strumenti statistici per la comunicazione

Fonti e strumenti statistici per la comunicazione Fonti e strumenti statistici per la comunicazione Introduzione all analisi bivariata: il caso di caratteri qualitativi Prof.ssa Isabella Mingo A.A. 016-017 Che cosa è l analisi bivariata? E lo studio congiunto

Dettagli

La verifica delle ipotesi

La verifica delle ipotesi La verifica delle ipotesi Se abbiamo un idea di quale possa essere il valore di un parametro incognito possiamo sottoporlo ad una verifica, che sulla base di un risultato campionario, ci permetta di decidere

Dettagli

STATISTICA ESERCITAZIONE 13

STATISTICA ESERCITAZIONE 13 STATISTICA ESERCITAZIONE 13 Dott. Giuseppe Pandolfo 9 Marzo 2015 Errore di I tipo: si commette se l'ipotesi nulla H 0 viene rifiutata quando essa è vera Errore di II tipo: si commette se l'ipotesi nulla

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 14-Il test del chi-quadro (provvisorio) vers. 1.1 (26 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di

Dettagli

1. variabili dicotomiche: 2 sole categorie A e B

1. variabili dicotomiche: 2 sole categorie A e B Variabile X su scala qualitativa (due categorie) modello di regressione: variabili quantitative misurate almeno su scala intervallo (meglio se Y è di questo tipo e preferibilmente anche le X i ) variabili

Dettagli

Esercitazioni di statistica

Esercitazioni di statistica Esercitazioni di statistica Stefania Spina Universitá di Napoli Federico II stefania.spina@unina.it 1 Ottobre 2014 Stefania Spina Esercitazioni di statistica 1/42 Introduzione Descrivere insieme di dati

Dettagli

Tecniche statistiche di analisi del cambiamento

Tecniche statistiche di analisi del cambiamento Tecniche statistiche di analisi del cambiamento 07a-Ripasso: Anova ad un fattore (v. 1.9a, 29 dicembre 2018) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

Test F per la significatività del modello

Test F per la significatività del modello Test F per la significatività del modello Per verificare la significatività dell intero modello si utilizza il test F Si vuole verificare l ipotesi H 0 : β 1 = 0,, β k = 0 contro l alternativa che almeno

Dettagli

Effettuazione di un TEST D IPOTESI. = stima del parametro di interesse calcolata sui dati campionari

Effettuazione di un TEST D IPOTESI. = stima del parametro di interesse calcolata sui dati campionari Effettuazione di un TEST D IPOTESI 1. Formulazione H 0 e H 1 2. Scelta del test statistico 3. Calcolo del test statistico ˆ 0 test ES[ˆ] dove ˆ = stima del parametro di interesse calcolata sui dati campionari

Dettagli

Test di ipotesi (a due code, σ nota)

Test di ipotesi (a due code, σ nota) Test di ipotesi (a due code, σ nota) Assumiamo nota la deviazione standard σ = 43.3 mesi vogliamo sapere se esiste un intervallo I di confidenza al 95% tale che µ 0 I? Ovvero esiste ε tale che P ( X µ

Dettagli

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli. Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:

Dettagli

Contenuti: Capitolo 14 del libro di testo

Contenuti: Capitolo 14 del libro di testo Test d Ipotesi / TIPICI PROBLEMI DI VERIFICA DI IPOTESI SONO Test per la media Test per una proporzione Test per la varianza Test per due campioni indipendenti Test di indipendenza Contenuti Capitolo 4

Dettagli

si tratta del test del chi-quadro di adattamento e di quello di indipendenza. 1 l ipotesi che la popolazione segua una legge fissata;

si tratta del test del chi-quadro di adattamento e di quello di indipendenza. 1 l ipotesi che la popolazione segua una legge fissata; di : dado : normale Finora abbiamo visto test d ipotesi per testare ipotesi differenti, ma tutte concernenti il valore atteso di una o due popolazioni. In questo capitolo vediamo come testare 1 l ipotesi

Dettagli

Cognome e nome Tempo disponibile: 75 minuti

Cognome e nome Tempo disponibile: 75 minuti Corso di Laurea in Biotecnologia Statistica medica. A.A. 2010-2011 21 giugno 2011 Cognome e nome Tempo disponibile: 75 minuti 1. Immaginate di condurre uno studio sperimentale in cui si confronta l effetto

Dettagli

Corso di Psicometria Progredito

Corso di Psicometria Progredito Corso di Psicometria Progredito 43 I principali test statistici per la verifica di ipotesi: Il test del χ 2 per tavole di contingenza a 2 vie Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia

Dettagli

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURA/TECNICA DI ANALISI DEI DATI SPECIFICAMENTE DESTINATA A STUDIARE LA RELAZIONE TRA UNA VARIABILE NOMINALE (ASSUNTA

Dettagli

MODELLI QUANTITATIVI. f x r = c

MODELLI QUANTITATIVI. f x r = c MODELLI QUANTITATIVI Qualunque sia il modello di estrazione di regolarità o di conoscenze dai dati empirici, esiste sempre una base statistica da cui occorre partire. Un fenomeno linguistico specifico

Dettagli

LEZIONI DI STATISTICA MEDICA

LEZIONI DI STATISTICA MEDICA LEZIONI DI STATISTICA MEDICA Lezione n.12 - Test statistico Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona IPOTESI SCIENTIFICA Affermazione che si può sottoporre a verifica

Dettagli

Esercizi di statistica inferenziale

Esercizi di statistica inferenziale Dipartimento di Fisica SMID a.a. 004/005 Esercizi di statistica inferenziale Prof. Maria Antonietta Penco tel. 0103536404 penco@fisica.unige.it 6/1/005 Esercizio1 E noto che un grande numero di pazienti

Dettagli

STATISTICA PSICOMETRICA a.a. 2004/2005 Corsi di laurea Scienze e tecniche neuropsicologiche. Modulo 1. Modulo 1 Statistica descrittiva Monovariata

STATISTICA PSICOMETRICA a.a. 2004/2005 Corsi di laurea Scienze e tecniche neuropsicologiche. Modulo 1. Modulo 1 Statistica descrittiva Monovariata STATISTICA PSICOMETRICA a.a. 004/005 Corsi di laurea Scienze e tecniche neuropsicologiche Modulo Modulo Distribuzioni semplici di frequenza e loro rappresentazioni Operatori di tendenza centrale Operatori

Dettagli

Corso di Statistica Esercitazione 1.8

Corso di Statistica Esercitazione 1.8 Corso di Statistica Esercitazione.8 Test su medie e proporzioni Prof.ssa T. Laureti a.a. 202-203 Esercizio Un produttore vuole monitorare i valori dei livelli di impurità contenute nella merce che gli

Dettagli

L'analisi monovariata

L'analisi monovariata L'analisi monovariata Prof. Stefano Nobile Corso di Metodologia della ricerca sociale Concetti introduttivi: analisi mono-, bi- e multivariata ANALISI MONOVARIATA Una tecnica di analisi di dice monovariata

Dettagli

LABORATORIO DI PROBABILITA E STATISTICA

LABORATORIO DI PROBABILITA E STATISTICA UNIVERSITA DEGLI STUDI DI VERONA LABORATORIO DI PROBABILITA E STATISTICA Docente: Bruno Gobbi 4 ESERCIZI RIEPILOGATIVI PRIME 3 LEZIONI 1 - STATISTICA DESCRITTIVA VENDITE PC ESERCIZIO 1: La seguente tabella

Dettagli

Metodi statistici per lo studio dei fenomeni biologici

Metodi statistici per lo studio dei fenomeni biologici Metodi statistici per lo studio dei fenomeni biologici Alla fine di questa lezione dovreste essere in grado di: descrivere la distribuzione di campionamento della differenza di due medie costruire gli

Dettagli

LABORATORIO DI PROBABILITA E STATISTICA

LABORATORIO DI PROBABILITA E STATISTICA UNIVERSITA DEGLI STUDI DI VERONA LABORATORIO DI PROBABILITA E STATISTICA Docente: Bruno Gobbi 3 TEST DI INDIPENDENZA NELLE TABELLE A DOPPIA ENTRATA ESEMPIO DI TABELLA A DOPPIA ENTRATA CAPELLI BIONDI NERI

Dettagli

Introduzione alla statistica per la ricerca in sanità

Introduzione alla statistica per la ricerca in sanità Introduzione alla statistica per la ricerca in sanità Modulo La verifica delle ipotesi: il test statistico dott. Eugenio Traini eugenio.traini@burlo.trieste.it Verifica d Ipotesi - 1 Che cos è un ipotesi

Dettagli

VERIFICA DELLE IPOTESI

VERIFICA DELLE IPOTESI VERIFICA DELLE IPOTESI Ipotesi statistica parametrica non parametrica una qualunque affermazione che specifica completamente o parzialmente la distribuzione di probabilità di una v.c. X. semplice: se la

Dettagli

STATISTICA. Esercitazione 5

STATISTICA. Esercitazione 5 STATISTICA Esercitazione 5 Esercizio 1 Ad un esame universitario sono stati assegnati in modo casuale due compiti diversi con i seguenti risultati: Compito A Compito B Numero studenti 102 105 Media dei

Dettagli

Casa dello Studente. Casa dello Studente

Casa dello Studente. Casa dello Studente Esercitazione - 14 aprile 2016 ESERCIZIO 1 Di seguito si riporta il giudizio (punteggio da 0 a 5) espresso da un gruppo di studenti rispetto alle diverse residenze studentesche di un Ateneo: a) Si calcolino

Dettagli

Strumenti informatici Realizzare un test z, un test t e un test F per campioni indipendenti con Excel e SPSS

Strumenti informatici Realizzare un test z, un test t e un test F per campioni indipendenti con Excel e SPSS Strumenti informatici 5.2 - Realizzare un test z, un test t e un test F per campioni indipendenti con Excel e SPSS Sia Excel che SPSS consentono di realizzare in modo abbastanza rapido il test sulle medie

Dettagli

ESPLORAZIONE DEI DATI (parte 1) 1 / 21

ESPLORAZIONE DEI DATI (parte 1) 1 / 21 ESPLORAZIONE DEI DATI (parte 1) 1 / 21 Variabili 2 / 21 Una variabile è una caratteristica oggetto di osservazione in uno studio. Variabili 2 / 21 Una variabile è una caratteristica oggetto di osservazione

Dettagli

LEZIONE N. 11 ( a cura di MADDALENA BEI)

LEZIONE N. 11 ( a cura di MADDALENA BEI) LEZIONE N. 11 ( a cura di MADDALENA BEI) F- test Assumiamo l ipotesi nulla H 0 :β 1,...,Β k =0 E diverso dal verificare che H 0 :B J =0 In realtà F - test è più generale H 0 :Aβ=0 H 1 :Aβ 0 A è una matrice

Dettagli

Minimi quadrati vincolati e test F

Minimi quadrati vincolati e test F Minimi quadrati vincolati e test F Impostazione del problema Spesso, i modelli econometrici che stimiamo hanno dei parametri che sono passibili di interpretazione diretta nella teoria economica. Consideriamo

Dettagli

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VI

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VI Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VI Test del χ 2 (il file Excel test_chi.xls mostra possibili sviluppi degli esercizi proposti) Esercizio 1a) un

Dettagli

ANALISI DEI DATI con EXCEL

ANALISI DEI DATI con EXCEL ANALISI DEI DATI con EXCEL Distribuzione della frequenza per variabili qualitative 1) conteggio del numero delle osservazioni della variabile (funzione CONTA.VALORI) 2) definizione delle CATEGORIE (tramite

Dettagli

normopeso <=25 sovrappeso 25-29.9 obesità I 30-34.9 obesità II 35-39.9 obesità III >=40

normopeso <=25 sovrappeso 25-29.9 obesità I 30-34.9 obesità II 35-39.9 obesità III >=40 E stato condotto uno studio relativo all effetto di una dieta sul BMI Body mass index in relazione al grado di obesità in un campione di adulti maschi avente le seguenti classi normopeso

Dettagli

Analisi della varianza

Analisi della varianza Analisi della varianza Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona ANALISI DELLA VARIANZA - 1 Abbiamo k gruppi, con un numero variabile di unità statistiche.

Dettagli

Statistica Inferenziale La verifica di ipotesi. Davide Barbieri

Statistica Inferenziale La verifica di ipotesi. Davide Barbieri Statistica Inferenziale La verifica di ipotesi Davide Barbieri Inferenza statistica Inferenza: procedimento di induzione, dal particolare al generale. Stima di un parametro della popolazione partendo da

Dettagli

Analisi congiunta di più fenomeni

Analisi congiunta di più fenomeni Analisi congiunta di più fenomeni Dati relativi al disastro del Titanic: Morti Sopravvissuti Classe Sesso Età 1 a Uomini Bambini 0 5 Adulti 118 57 Donne Bambini 0 1 Adulti 4 140 2 a Uomini Bambini 0 11

Dettagli

Inferenza statistica

Inferenza statistica Inferenza statistica Marcella Montico e Lorenzo Monasta Servizio di epidemiologia e biostatistica Inferenza statistica: insieme di metodi che permette di generalizzare i risultati ottenuti dai dati raccolti

Dettagli

Modelli e procedure per l educazione degli adulti

Modelli e procedure per l educazione degli adulti CdL SEAFC a.a. 2016-2017 II semestre Pedagogia sperimentale. Modelli e procedure per l educazione degli adulti francesco.agrusti@uniroma3.it T6. Modelli e procedure di valutazione Ultimo appuntamento con

Dettagli

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 21/09/2011

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 21/09/2011 FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 1/9/11 ESERCIZIO 1 (+3++3) La seguente tabella riporta la distribuzione di frequenza dei valori di emoglobina nel sangue (espressi

Dettagli

L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale

L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile Corso di Metodologia della ricerca sociale L analisi della varianza (ANOVA) La tecnica con cui si esplorano le relazioni

Dettagli

Scale di Misurazione Lezione 2

Scale di Misurazione Lezione 2 Last updated April 26, 2016 Scale di Misurazione Lezione 2 G. Bacaro Statistica CdL in Scienze e Tecnologie per l'ambiente e la Natura II anno, II semestre Tipi di Variabili 1 Scale di Misurazione 1. Variabile

Dettagli