Facoltà di Farmacia Corso di Matematica con elementi di Statistica Docente: Riccardo Rosso. Il test del chi quadrato
|
|
- Oreste Renzi
- 7 anni fa
- Visualizzazioni
Transcript
1 Facoltà di Farmacia Corso di Matematica con elementi di Statistica Docente: Riccardo Rosso Il test del chi quadrato Si tratta di un test molto importante che ha trovato innumerevoli applicazioni da quando Pearson lo introdusse nel L uso che faremo di questo test è collegato alla verifica di ipotesi riguardanti l indipendenza tra due eventi. Per illustrare le peculiarità del test, procediamo con un esempio. Gli individui di un campione composto da N = 501 pazienti affetti da un certo disturbo vengono sottoposti ad uno tra due possibili trattamenti che indicheremo in modo neutro come trattamento A e trattamento B. 257 pazienti sono trattati con il metodo A, i restanti 244 con il metodo B. Tra i pazienti trattati con A, 216 hanno beneficio dal trattamento, mentre tra i pazienti trattati con B, 180 traggono beneficio. Ci chiediamo se le differenze negli esiti sono ascrivibili a fluttuazioni statistiche o se sono dovute ad una diversa efficacia dei metodi. Detto in altri termini, vogliamo verificare la validità dell ipotesi di indipendenza dell esito della terapia dal tipo di trattamento. A questo scopo, costruiamo la tabella di contingenza del problema. Osserviamo che gli individui del campione possono essere ripartiti sulla base di due criteri, a seconda del trattamento subìto e dell esito della terapia. Possiamo pertanto costruire la seguente tabella composta da quattro celle, in ciascuna delle quali inseriamo le frequenze assolute osservate, relativamente alle quattro ripartizioni possibili degli individui: se trattati con A e migliorati, se trattati con A e non migliorati, se trattati con B e migliorati, se trattati con B e non migliorati. In sintesi, abbiamo la seguente tabella di contingenza: migliora non migliora A B La parte importante della tabella è quella centrale, dove sono stati ripartiti gli individui del campione sulla base degli eventi realizzati. Così, all incrocio tra la prima riga e la prima colonna è stata riportata la frequenza 216 degli individui che sono stati trattati con A e sono migliorati, all incrocio tra la
2 prima riga e la seconda colonna si trova invece la frequenza 41 degli individui trattati con A e che non sono migliorati e così via. Ai margini della tabella sono state riportate le frequenze marginali, le somme cioè delle frequenze contenute in una riga od in una colonna. In termini generali, possiamo dire che la tabella ha la forma seguente O 11 O 12 r 1 O 21 O 22 r 2 c 1 c 2 N dove i numeri O ij sono stati contraddistinti da una coppia ordinata di indici, il primo indicante la riga, il secondo la colonna in cui compare O ij. La tabella di contingenza appena costruita si riferisce alle frequenze osservate nel corso dell esperimento condotto. Poniamoci ora una domanda. Se l esito della terapia fosse indipendente dal tipo di trattamento A o B, non importa quale tabella di contingenza ci potremmo aspettare? Ricordiamo che due eventi E 1 ed E 2 si dicono indipendenti se o, in modo equivalente P(E 1 E 2 ) = P(E 1 ) P(E 2 E 1 ) = P(E 2.) In altre parole, due eventi sono tra loro indipendenti se il realizzarsi di uno non modifica la probabilità che l altro evento ha di realizzarsi. Come conseguenza della formula della probabilità condizionata, se due eventi sono indipendenti si ha P(E 1 E 2 ) = P(E 1 )P(E 2 ). Tornando al nostro problema, se l esito del trattamento non dipende dal tipo di trattamento possiamo aspettarci che P(paziente migliora paziente sottoposto a trattamento A) = P(paziente migliora)p(paziente sottoposto a trattamento A) = : 396 infatti, 501 è la probabilità che un paziente scelto a caso sia migliorato dopo la terapia (non importa di quale tipo) e è la probabilità che un paziente scelto a caso nel campione sia stato sottoposto al trattamento A. Analogamente, P(paziente non migliora paziente sottoposto a trattamento A) = P(paziente non migliora)p(paziente sottoposto a trattamento A) = in quanto 105 pazienti dei 501 non sono migliorati a fronte del trattamento. Infine, P(paziente migliora paziente sottoposto a trattamento B) = P(paziente migliora)p(paziente sottoposto a trattamento B) =
3 e P(paziente non migliora paziente sottoposto a trattamento B) = P(paziente non migliora)p(paziente sottoposto a trattamento B) = Accettando l ipotesi di indipendenza dell esito dal tipo di trattamento possiamo aspettarci una tabella di contingenza di questo tipo: N (pazienti migliorati pazienti sottoposti a trattamento A) = N P(paziente migliora paziente sottoposto a trattamento A) = 501, N (pazienti non migliorati pazienti sottoposti a trattamento A) = N P(paziente non migliora paziente sottoposto a trattamento A) = 501, N (pazienti migliorati pazienti sottoposti a trattamento B) = N P(paziente migliora paziente sottoposto a trattamento B) = 501, N (pazienti non migliorati pazienti sottoposti a trattamento B) = N P(paziente non migliora paziente sottoposto a trattamento B) = 501. Sinteticamente, la tabella di contingenza sotto l ipotesi di indipendenza è migliora non migliora A 203,138 53, B 192,862 51, Osserviamo che le frequenze marginali non sono state toccate. In effetti, le frequenze ora ottenute sono state calcolate sui dati dell esperimento e dunque non possono produrre un alterazione delle marginali. In termini astratti, la tabella delle frequenze attese è indicata in questo modo E 11 E 12 r 1 E 21 E 22 r 2 c 1 c 2 N dove le frequenze sono indicate con la lettera E dall inglese expected, cioè attese. Tornando al nostro esempio, vediamo che la tabella di contingenza attesa sotto l ipotesi di indipendenza tra esito e tipo di trattamento e la tabella osservata sul campo sono diverse. Il punto cruciale è ora il seguente: le differenze tra le tabelle sono frutto di inevitabili fluttuazioni casuali, oppure riflettono l inattendibilità dell ipotesi di indipendenza? Per rispondere alla domanda occorre anzitutto quantificare in modo soddisfacente le discrepanze tra le tabelle, definendo un indicatore numerico 3
4 opportuno. Si potrebbe pensare a formare la somma delle differenze degli scarti tra gli elementi O ij e quelli attesi E ij : (O 11 E 11 ) + (O 12 E 12 ) + (O 21 E 21 ) + (O 22 E 22 ). Purtroppo questa strada non è percorribile in quanto si può dimostrare che l indicatore è identicamente nullo: fissate le marginali, gli scarti tra le tabelle si compensano. Per evitare questo inconveniente si può considerare come indicatore la somma dei quadrati degli scarti tra frequenze osservate ed attese, vale a dire (O 11 E 11 ) 2 + (O 12 E 12 ) 2 + (O 21 E 21 ) 2 + (O 22 E 22 ) 2. Se certamente questo indicatore non si annulla identicamente, esso ha un altro difetto un po più nascosto. Infatti, considerando l esempio svolto sinora, le differenze tra le celle O 11 ed E 11 e tra O 12 ed E 12 sono identiche, in valore assoluto. Tuttavia, la stessa differenza numerica ha maggior rilievo se riscontrata su celle con frequenze piccole che su celle con frequenze grandi perché ha un peso percentuale superiore nel primo rispetto al secondo caso. Questa osservazione giustifica la scelta del seguente indicatore per misurare lo scostamento tra la tabella di contingenza attesa e quella osservata: χ 2 := (O 11 E 11 ) 2 E 11 + (O 12 E 12 ) 2 E 12 + (O 21 E 21 ) 2 E 21 + (O 22 E 22 ) 2 E 22. Inserendo i dati del problema in esame, otteniamo χ 2 = 7, 978. Come interpretare questo dato? È significativo per l ipotesi che stiamo studiando e se sì, a quale livello? Per rispondere a queste domande bisogna osservare che l indicatore χ 2 ora costruito, non solo è appropriato dal punto di vista intuitivo per mettere in luce differenze tra le due tabelle di contingenza, ma ha il pregio di seguire, sotto opportune ipotesi, una distribuzione precisa detta distribuzione di χ 2. Senza darne una rappresentazione analitica, la figura mostra la curva f(χ 2 ) di distribuzione delle frequenze per χ 2, in funzione dei valori di χ 2. Per leggere il grafico e trarne profitto occorre notare la seguente proprietà, che giustifica l importanza dell indicatore χ 2. Se l ipotesi di indipendenza tra gli eventi usati per costruire le tabelle di contingenza è vera allora, immaginando di ripetere il test clinico più volte a parità di grandezza del campione che deve essere sempre numeroso e di frequenze marginali, i valori di χ 2 costruiti secondo lo schema illustrato tendono a seguire la distribuzione indicata in figura. Come per la distribuzione gaussiana, possiamo chiederci quali siano i valori di χ 2 corrispondenti alla coda della curva di distribuzione delle frequenze: in questo caso vi è una sola coda perchè, per definizione, χ 2 non può essere negativo. Ora, per tabelle di contingenza 2 2 come quelle considerate sinora si può mostrare che il 95% dei valori di χ 2 non supera il 4
5 f(χ 2 ) χ χ χ 2 Figura 1: La curva di distribuzione delle frequenze di χ 2, sotto l ipotesi di indipendenza statistica degli eventi che entrano nella definizione della tabella di contingenza. Il 95% dei valori di χ 2 è compreso nella regione colorata in grigio chiaro e delimitata da χ 2 = 0 a sinistra e da χ a destra. Se si aggiunge la regione in grigio scuro si ottiene la zona che comprende il 99% dei valori di χ 2. Anche se i valori χ e χ cambiano al cambiare delle dimensioni della tabella di contingenza, il comportamento qualitativo di f(χ 2 ) non subisce modifiche apprezzabili. valore limite χ = 3, 841 e che il 99% dei valori di χ2 è inferiore al valore limite χ = 6, 635. Se in un test che coinvolge tabelle di contingenza 2 2 si ottiene un valore di χ 2 superiore a χ o a χ si può concludere che a) o il campione era così particolare da appartenere al residuo di campioni per i quali χ 2 > χ o χ2 > χ , oppure b) l ipotesi di indipendenza tra gli eventi che compaiono nelle tabelle di contingenza è poco attendibile. L atteggiamento che si prende in questi casi è di privilegiare la seconda opzione e concludere che gli eventi utilizzati nella costruzione delle tabelle di contingenza non sono indipendenti. Al solito, vi è un margine di rischio nell assumere questo atteggiamento che è proprio quello di avere scelto un campione molto particolare, anche se una tale eventualità è ridotta al 5% od all 1%, a seconda del livello di significatività prescelto. Nell esempio esaminato, poiché il valore χ 2 = 7, 978 supera sia χ che χ2 0.99, l esito del test di chi quadrato è significativo sia al 5% che all 1% e possiamo di conseguenza rigettare l ipotesi di indipendenza: l esito della cura dipende dal trattamento prescelto, se A o B; i dati in possesso consentono di affermare, con un margine di rischio al più dell 1% che uno dei trattamenti è più efficace dell altro ed un confronto delle frequenze relative di guarigione 216/257 = 0.84 per il trattamento A contro 180/244 = 0.74 per B suggerisce che è il primo trattamento ad essere più efficace. Esempio 1. Un sondaggio politico vuole vedere se le preferenze per i due candidati B e K alle elezioni presidenziali statunitensi dipendono dalle città in cui si vota. Per questo si considerano tre grandi centri, New York, Chicago e Los Angeles, dove vengono effettuate delle interviste a campioni casuali di 5
6 elettori, ottenendo i seguenti risultati New York: 130 favorevoli a B, 70 favorevoli a K; Chicago: 180 favorevoli a B, 120 favorevoli a K; Los Angeles: 210 favorevoli a B, 290 favorevoli a K. Dopo aver costruito le tabelle di contingenza 2 3 osservata ed attesa, dire se le differenze riscontrate sono significative sapendo che per tabelle 2 3 i valori critici per χ 2 sono χ = 5, 991 e χ = La tabella di contingenza osservata è NY Chi L.A. B K mentre, seguendo le linee indicate nell esempio precedente, la tabella attesa, sotto l ipotesi di indipendenza tra esito della votazione e luogo dove essa si tiene, è NY Chi L.A. B K Il valore di χ 2 è χ 2 = 2.917, inferiore sia a χ che a χ Non abbiamo dunque elementi per concludere che vi sia dipendenza tra l esito della votazione e la località in cui questa si tiene. Esempio 2. Si vuole vedere se c è un legame tra il tipo di mezzo di trasoporto utilizzato da lavoratori pendolari ed il numero di giorni di malattia che questi accumulano durante un anno lavorativo. Si esaminano tre tipi di mezzi di trasporto, auto, bus e treno e si ripartiscono in tre categorie i giorni di malattia: meno di 5 giorni, tra 5 e 15 e più di 15 giorni. L esito del test è il seguente < 5 : 117 in auto, 41 in bus, 82 in treno; [5, 15] : 211 in auto, 81 in bus, 108 in treno; > 15: 102 in auto, 38 in bus e 20 in treno. Costruire la tabella di contingenza 3 3 osservata e quella attesa nell ipotesi che non vi sia alcun legame tra tipo di mezzo di trasporto usato e numero di giorni di malattia. Dire se il valore di χ 2 ottenuto è significativo sapendo che ora χ = 9.488, mentre χ = La tabella osservata è 6
7 mentre quella attesa è Auto Bus Treno < [5, 15] > Auto Bus Treno < [5, 15] > Poiché il valore di χ 2 è χ 2 = 23, 666, possiamo respingere l ipotesi che non ci sia legame alcuno tra il mezzo di trasporto usato dai pendolari ed il numero di giorni di malattia annualmente registrato. Esercizi 1. Un campione di 200 pazienti affetti da una stessa malattia viene suddiviso in due gruppi A e B, composti entrambi da 100 individui. Ai pazienti in A viene somministrato un siero mentre ai pazienti in B non viene effettuato alcun trattamento (il gruppo B è detto gruppo di controllo). Al termine dell esperimento si riscontra che 75 persone di A e 65 di B sono guarite. Cosa possiamo concludere circa l efficacia del trattamento al 5% di significatività ed all 1% si significatività? (Si ricorda che χ = 3, 841 e χ = 6, 635) 2. Ad un esame frequentato da molti studenti vengono fromate tre commissioni presiedute dai professori Tizio, Caio e Sempronio. In una sessione Tizio promuove 50 studenti e ne respinge 5, Caio ne promuove 47 e ne respinge 14 mentre Sempronio ne promuove 56 e ne respinge 8. Possiamo affermare che l esito della prova non dipende dal presidente della commissione? (Ricordiamo che ora occorre usare i valori χ = 5, 991 e χ = 9.210) 3. Un gruppo di pazienti affetti da turbe del sonno viene trattato in parte somministrando un sonnifero, in parte sommministrando una compressa zuccherina (placebo). Al termine del trattamento 44 pazienti trattati con sonnifero ed 81 trattati con il placebo dichiarano di avere avuto una migliore qualità del sonno, mentre 10 tra i pazienti trattati con il sonnifero e 35 tra quelli trattati con il placebo dichiarano di non aver riscontrato alcuna differenza. Cosa si può concludere circa l efficacia del sonnifero? (Si ricorda che χ = 3, 841 e χ = 6, 635) 7
8 4. Si vuole vedere se i voti riportati dagli studenti nell esame di Matematica ed in quello di Fisica sono indipendenti. Per questo si considera un campione di studenti e si ripartiscono i voti in alti, medi e bassi. L esito è riportato nella tabella in figura Alto (M) Medio (M) Basso (M) Alto (F) Medio (F) Basso (F) Dopo aver completato la tabella di contingenza con le frequenze marginali, si costruisca la tabella corrispondente all ipotesi di indipendenza tra gli esiti nei due esami discutendo la significatività del risultato al 5% e all 1%. (I valori di χ 2 critici sono χ = e χ = ) 8
Statistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi
Esercitazione 14 Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () 1 / 14 Ex.1: Verifica Ipotesi sulla media (varianza nota) Le funi prodotte da un certo macchinario hanno una
DettagliSTATISTICA INFERENZIALE PER VARIABILI QUALITATIVE
STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE La presentazione dei dati per molte ricerche mediche fa comunemente riferimento a frequenze, assolute o percentuali. Osservazioni cliniche conducono sovente
DettagliCorso di Psicometria Progredito
Corso di Psicometria Progredito 43 I principali test statistici per la verifica di ipotesi: Il test del χ 2 per tavole di contingenza a 2 vie Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia
DettagliIndicatori di Posizione e di Variabilità. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica
Indicatori di Posizione e di Variabilità Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica Indici Sintetici Consentono il passaggio da una pluralità
Dettagliˆp(1 ˆp) n 1 +n 2 totale di successi considerando i due gruppi come fossero uno solo e si costruisce z come segue ˆp 1 ˆp 2. n 1
. Verifica di ipotesi: parte seconda.. Verifica di ipotesi per due campioni. Quando abbiamo due insiemi di dati possiamo chiederci, a seconda della loro natura, se i campioni sono simili oppure no. Ci
DettagliDIPENDENZA E ASSOCIAZIONE DISTRIBUZIONE CONGIUNTA DI DUE VARIABILI. Ci limiteremo a considerare il caso di due variabili.
DIPENDENZA E ASSOCIAZIONE DISTRIBUZIONE CONGIUNTA DI DUE VARIABILI Sinora abbiamo considerato l analisi di un unica variabile per volta Tuttavia, le rilevazioni su un unità statistica sono in generale
DettagliTest d Ipotesi Introduzione
Test d Ipotesi Introduzione Uno degli scopi più importanti di un analisi statistica è quello di utilizzare i dati provenienti da un campione per fare inferenza sulla popolazione da cui è stato estratto
DettagliCasa dello Studente. Casa dello Studente
Esercitazione - 14 aprile 2016 ESERCIZIO 1 Di seguito si riporta il giudizio (punteggio da 0 a 5) espresso da un gruppo di studenti rispetto alle diverse residenze studentesche di un Ateneo: a) Si calcolino
DettagliAnalisi congiunta di più fenomeni
Analisi congiunta di più fenomeni Dati relativi al disastro del Titanic: Morti Sopravvissuti Classe Sesso Età 1 a Uomini Bambini 0 5 Adulti 118 57 Donne Bambini 0 1 Adulti 4 140 2 a Uomini Bambini 0 11
DettagliCorso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII
Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Un breve richiamo sul test t-student Siano A exp (a 1, a 2.a n ) e B exp (b 1, b 2.b m ) due set di dati i cui
DettagliN.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.
N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle abelle riportate alla fine del documento. Esercizio 1 La concentrazione media di sostanze inquinanti osservata nelle acque di un fiume
DettagliIl χ 2 (Pearson, 1900)
Il χ 2 (Pearson, 1900) Relazioni tra variabili: le tabelle di contingenza "The Physicians' Health Study" è uno studio clinico randomizzato condotto allo scopo di valutare il possibile eetto di riduzione
DettagliEsercitazioni di statistica
Esercitazioni di statistica Misure di associazione: Indipendenza assoluta e in media Stefania Spina Universitá di Napoli Federico II stefania.spina@unina.it 22 ottobre 2014 Stefania Spina Esercitazioni
DettagliAmericani Inglesi Firenze Roma Provare l ipotesi che la nazionalità non influisca sulla scelta della meta.
TEST D IPOTESI 1 Le resistenze alla rottura delle funi prodotte da una fabbrica hanno una media pari a µ = 1800N ed uno scarto quadratico medio di σ = 100N Immettendo una nuova tecnica nel processo produttivo,
Dettagli1 4 Esempio 2. Si determini la distribuzione di probabilità della variabile casuale X = punteggio ottenuto lanciando un dado. Si ha immediatamente:
CAPITOLO TERZO VARIABILI CASUALI. Le variabili casuali e la loro distribuzione di probabilità In molte situazioni, dato uno spazio di probabilità S, si è interessati non tanto agli eventi elementari (o
DettagliUlteriori applicazioni del test del Chi-quadrato (χ 2 )
Ulteriori applicazioni del test del Chi-quadrato (χ 2 ) Finora abbiamo confrontato con il χ 2 le numerosità osservate in diverse categorie in un campione con le numerosità previste da un certo modello
DettagliSTATISTICA INFERENZIALE PER VARIABILI QUALITATIVE
1 STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE La presentazione dei dati per molte ricerche mediche fa comunemente riferimento a frequenze, assolute o percentuali. Osservazioni cliniche conducono
DettagliDistribuzione Gaussiana - Facciamo un riassunto -
Distribuzione Gaussiana - Facciamo un riassunto - Nell ipotesi che i dati si distribuiscano seguendo una curva Gaussiana è possibile dare un carattere predittivo alla deviazione standard La prossima misura
DettagliPROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE
PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE 1. Distribuzione congiunta Ci sono situazioni in cui un esperimento casuale non si può modellare con una sola variabile casuale,
DettagliPSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI
PSICOMETRIA Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI CAMPIONI INDIPENDENTI Campioni estratti casualmente dalla popolazione con caratteristiche omogenee Assegnazione
DettagliEsercitazione 8 maggio 2014
Esercitazione 8 maggio 2014 Esercizio 2 dal tema d esame del 13.01.2014 (parte II). L età media di n gruppo di 10 studenti che hanno appena conseguito la laurea triennale è di 22 anni. a) Costruire un
DettagliNOZIONI DI CALCOLO DELLE PROBABILITÀ
NOZIONI DI CALCOLO DELLE PROBABILITÀ ESPERIMENTO CASUALE: un esperimento si dice casuale quando gli esiti (manifestazioni o eventi) non possono essere previsti con certezza. PROVA: le ripetizioni, o occasioni
DettagliEsercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale)
Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale) Esercizio 1: Un indagine su 10.000 famiglie ha dato luogo, fra le altre, alle osservazioni riportate nella
DettagliSTATISTICA: esercizi svolti sulla DIPENDENZA IN MEDIA
STATISTICA: esercizi svolti sulla DIPEDEZA I MEDIA 1 1 LA DIPEDEZA I MEDIA 2 1 LA DIPEDEZA I MEDIA 1. La popolazione in migliaia di unità occupata in Piemonte nel 1985 per reddito annuo Y (migliaia di
DettagliAnno 4 Matrice inversa
Anno 4 Matrice inversa 1 Introduzione In questa lezione parleremo della matrice inversa di una matrice quadrata: definizione metodo per individuarla Al termine della lezione sarai in grado di: descrivere
DettagliDistribuzioni secondo due caratteri. Rappresentazioni e prime sintesi
Distribuzioni secondo due caratteri Rappresentazioni e prime sintesi Rappresentazioni delle distribuzioni doppie Quando per ogni unità del collettivo rileviamo due caratteri otteniamo una Esempio. Ad alcuni
DettagliEsercitazione di Statistica Indici di associazione
Esercitazione di Statistica Indici di associazione 28/10/2015 La relazione tra caratteri Indipendenza logica Quando si suppone che tra due caratteri non ci sia alcuna relazione di causa-effetto. Indipendenza
DettagliPremessa: la dipendenza in media
Premessa: la dipendenza in media Supponiamo di avere K diversi livelli di un fattore che potrebbero influire su una determinata variabile. Per esempio supponiamo di domandarci se la diversificazione (intesa
DettagliESERCIZI SVOLTI Giuliano Bonollo - Michele Bonollo
ESERCIZI SVOLTI Giuliano Bonollo - Michele Bonollo 1 La seguente tabella riporta le frequenze relative riguardanti gli studenti di un università e gli esiti dell esame da essi sostenuto. Qual è la percentuale
DettagliStatistica. Lezione 8
Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 8 a.a 2011-2012 Dott.ssa Daniela
DettagliEsercizi riassuntivi di Inferenza
Esercizi riassuntivi di Inferenza Esercizio 1 Un economista vuole stimare il reddito medio degli abitanti di una cittadina mediante un intervallo al livello di confidenza del 95%. La distribuzione del
DettagliESEMPI DI DOMANDE PER TUTTE E DUE LE TIPOLOGIE DI PARTECIPANTI
ESEMPI DI DOMANDE PER TUTTE E DUE LE TIPOLOGIE DI PARTECIPANTI Esercizio 1 L elevata densità di popolazione di un paese (rapporto tra numero di abitanti e superficie) indica che: a. l'ammontare della popolazione
DettagliStatistica ARGOMENTI. Calcolo combinatorio
Statistica ARGOMENTI Calcolo combinatorio Probabilità Disposizioni semplici Disposizioni con ripetizione Permutazioni semplici Permutazioni con ripetizioni Combinazioni semplici Assiomi di probabilità
Dettagli1. equivalenze e implicazioni logiche. Esercizio 1.2. Trovare le implicazioni che legano i seguenti enunciati (x, y R):
. equivalenze e implicazioni logiche Esercizio.. Trovare le implicazioni che legano i seguenti enunciati (x, y R): () x < y, () x = y, () x y, () x y, () (x y) > 0. Osserviamo subito che (x y) > 0 equivale
DettagliLa distribuzione delle frequenze. T 10 (s)
1 La distribuzione delle frequenze Si vuole misurare il periodo di oscillazione di un pendolo costituito da una sferetta metallica agganciata a un filo (fig. 1). A Figura 1 B Ricordiamo che il periodo
DettagliSTATISTICA DESCRITTIVA (canale B)
STATISTICA DESCRITTIVA (canale B) compito n. 1 del 28 marzo 2008 nome e cognome: corso di laurea: Astronomia matricola: Parte teorica Si ricorda che la corretta risposta ai quesiti della parte teorica
DettagliA proposito di valutazione scolastica
A proposito di valutazione scolastica Livello scolare: 2 biennio Abilità interessate Identificare situazioni che richiedono di rilevare lo stesso carattere su una unità statistica formata da 2 elementi,
DettagliFACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 21/09/2011
FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 1/9/11 ESERCIZIO 1 (+3++3) La seguente tabella riporta la distribuzione di frequenza dei valori di emoglobina nel sangue (espressi
DettagliInferenza su indipendenza e causalità
Inferenza su indipendenza e causalità Eugenio Buzzoni 22 dicembre 2011 Struttura 1 Test sull indipendenza di due variabili aleatorie Variabili aleatorie binarie Caso discreto Caso di una variabile discreta
DettagliIstituzioni di Statistica 1 Esercizi su tabelle di contingenza
Istituzioni di Statistica 1 Esercizi su tabelle di contingenza Esercizio 1 Per stimare la percentuale di fumatori nella popolazione italiana adulta viene intervistato un campione di 60 donne e uno di 40
DettagliSintesi dei dati in una tabella. Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6)
Sintesi dei dati in una tabella Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6) Sintesi dei dati Spesso si vuole effettuare una sintesi dei dati per ottenere indici
DettagliSTATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE
STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 2 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1.1
DettagliStatistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione.
Statistica inferenziale La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione. Verifica delle ipotesi sulla medie Quando si conduce una
DettagliL affondamento del Titanic
L affondamento del Titanic Livello scolare: biennio Abilità interessate Identificare situazioni che richiedono di rilevare lo stesso carattere su una unità statistica formata da elementi, o caratteri diversi
DettagliLa statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci
La statistica Elaborazione e rappresentazione dei dati Gli indicatori statistici Introduzione La statistica raccoglie ed analizza gruppi di dati (su cose o persone) per trarne conclusioni e fare previsioni
DettagliNOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI VERIFICA DI IPOTESI PER IL CONFRONTO TRA DUE PROPORZIONI
NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI VERIFICA DI IPOTESI PER IL CONFRONTO TRA DUE PROPORZIONI IL PROBLEMA Si vuole verificare se un nuovo trattamento per la cura dell otite è più efficace
DettagliStatistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill
Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill Es. Soluzione degli esercizi del capitolo 7 home - indice In base agli arrotondamenti effettuati nei calcoli,
Dettaglia) Usando i seguenti livelli di significatività, procedere alla verifica di ipotesi, usando come ipotesi alternativa un'ipotesi unidirezionale:
ESERCIZIO 1 Da studi precedenti, il responsabile del rischio di una grande banca sa che l'ammontare medio di denaro che deve essere corrisposto dai correntisti che hanno il conto scoperto è pari a 240.
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative
DettagliProgrammazione con Foglio di Calcolo Cenni di Statistica Descrittiva
Fondamenti di Informatica Ester Zumpano Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva Lezione 5 Statistica descrittiva La statistica descrittiva mette a disposizione il calcolo di
DettagliDati campionari:media, varianza, bruchi
Dati campionari:media, varianza, bruchi Un entomologo sta studiando un bruco divoratore di foglie; esaminando 300 foglie ha trovato presenti dei bruchi, secondo i numeri riportati nella seguente tabella:
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 41 Outline 1 2 3 4 5 () Statistica 2 / 41 Misura del legame Data una variabile doppia (X, Y ), la
DettagliIl test (o i test) del Chi-quadrato ( 2 )
Il test (o i test) del Chi-quadrato ( ) I dati: numerosità di osservazioni che cadono all interno di determinate categorie Prima di tutto, è un test per confrontare proporzioni Esempio: confronto tra numero
DettagliSTATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo
STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)
DettagliEsercitazione II Statistica e Calcolo delle Probabilità (con soluzioni)
Esercitazione II Statistica e Calcolo delle Probabilità (con soluzioni) Esercizio 1: Alla fine di una giornata di lavoro un intervistatore si accorge di aver perso i dati raccolti su un certo numero di
DettagliStatistica Compito A
Statistica Compito A Prova scritta del 3 Luglio 2015 1. Il seguente campione casuale si riferisce al numero di difetti riscontrati su 1 metro-quadrato di stoffa: 0 7 1 5 2 6 3 4 4 3 5 2 6 1 7 2 (a) Cosa
DettagliDalla tabella alla funzione canonica
Dalla tabella alla funzione canonica La funzione canonica è la funzione logica associata alla tabella di verità del circuito che si vuole progettare. Essa è costituita da una somma di MinTerm con variabili
DettagliX Lezione Analisi della varianza Esempi e esercizi CPS - Corso di studi in Informatica II parte: Statistica
Corso di Calcolo delle Probabilità e Statistica II Parte - STATISTICA X Lezione Analisi della varianza Esempi e esercizi 1 Argomenti della X Lezione Tests per il confronto di più medie: ANOVA Utilità e
DettagliC.I. di Metodologia clinica
C.I. di Metodologia clinica Modulo 5. I metodi per la sintesi e la comunicazione delle informazioni sulla salute Quali errori influenzano le stime? L errore casuale I metodi per la produzione delle informazioni
DettagliIstituzioni di Statistica e Statistica Economica
Istituzioni di Statistica e Statistica Economica Università degli Studi di Perugia Facoltà di Economia, Assisi, a.a. 2013/14 Esercitazione n. 1 A. I dati riportati nella seguente tabella si riferiscono
DettagliSTATISTICA AZIENDALE Modulo Controllo di Qualità
STATISTICA AZIENDALE Modulo Controllo di Qualità A.A. 009/10 - Sottoperiodo PROA DEL 14 MAGGIO 010 Cognome:.. Nome: Matricola:.. AERTENZE: Negli esercizi in cui sono richiesti calcoli riportare tutte la
DettagliAnalisi della varianza a una via
Analisi della varianza a una via Statistica descrittiva e Analisi multivariata Prof. Giulio Vidotto PSY-NET: Corso di laurea online in Discipline della ricerca psicologico-sociale SOMMARIO Modelli statistici
DettagliEsame di Statistica (10 o 12 CFU) CLEF 11 febbraio 2016
Esame di Statistica 0 o CFU) CLEF febbraio 06 Esercizio Si considerino i seguenti dati, relativi a 00 clienti di una banca a cui è stato concesso un prestito, classificati per età e per esito dell operazione
DettagliPROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA
PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURA/TECNICA DI ANALISI DEI DATI SPECIFICAMENTE DESTINATA A STUDIARE LA RELAZIONE TRA UNA VARIABILE NOMINALE (ASSUNTA
DettagliNOTE SULLE FUNZIONI CONVESSE DI UNA VARIABILE REALE
NOTE SULLE FUNZIONI CONVESSE DI UNA VARIABILE REALE ROBERTO GIAMBÒ 1. DEFINIZIONI E PRIME PROPRIETÀ In queste note saranno presentate alcune proprietà principali delle funzioni convesse di una variabile
DettagliEsercitazione: La kappa di Cohen
Esercitazioni Stat Med per Metodologia Clinica Esercitazione: La kappa di Cohen Maria Pia Sormani mariapia.sormani@unige.it Obiettivi 1. Come si calcola la kappa 2. Significato della concordanza casuale
DettagliVariabili aleatorie. Variabili aleatorie e variabili statistiche
Variabili aleatorie Variabili aleatorie e variabili statistiche Nelle prime lezioni, abbiamo visto il concetto di variabile statistica : Un oggetto o evento del mondo reale veniva associato a una certa
Dettagli5. Massimi, minimi e flessi
1 5. Massimi, minimi e flessi Funzioni crescenti e decrescenti A questo punto dovremmo avere imparato come si calcolano le derivate di una funzione razionale fratta, ma dobbiamo capire in che modo queste
DettagliDESCRITTIVE, TEST T PER IL CONFRONTO DELLE MEDIE DI CAMPIONI INDIPENDENTI.
Corso di Laurea Specialistica in Biologia Sanitaria, Universita' di Padova C.I. di Metodi statistici per la Biologia, Informatica e Laboratorio di Informatica (Mod. B) Docente: Dr. Stefania Bortoluzzi
DettagliNumeri interi relativi
Numeri interi relativi 2 2.1 I numeri che precedono lo zero Con i numeri naturali non sempre è possibile eseguire l operazione di sottrazione. In particolare, non è possibile sottrarre un numero più grande
DettagliDistribuzione Normale
Distribuzione Normale istogramma delle frequenze di un insieme di misure di una grandezza che può variare con continuità popolazione molto numerosa, costituita da una quantità praticamente illimitata di
DettagliEsercitazioni del corso: RELAZIONI TRA VARIABILI
A. A. 009 010 Esercitazioni del corso: RELAZIONI TRA VARIABILI Isabella Romeo: i.romeo@campus.unimib.it ommario Esercitazione 1: Tabelle a doppia entrata Distribuzioni marginali e condizionate Indipendenza
DettagliEsercitazione n. 3 - Corso di STATISTICA - Università della Basilicata - a.a. 2011/12 Prof. Roberta Siciliano
Esercitazione n. 3 - Corso di STATISTICA - Università della Basilicata - a.a. 2011/12 Prof. Roberta Siciliano Esercizio 1 Una moneta viene lanciata 6 volte. Calcolare a) La probabilità che escano esattamente
DettagliEsercitazioni del corso: STATISTICA
A. A. 0-0 Esercitazioni del corso: STATISTICA Sommario Esercitazione 4: Medie e varianze marginali Medie e varianze condizionate Scomposizione della varianza Indipendenza in media ESERCIZIO UNIVERSITÀ
DettagliTEORIA DEGLI ERRORI DI MISURA, IL CALCOLO DELLE INCERTEZZE
TEORIA DEGLI ERRORI DI MISURA, IL CALCOLO DELLE INCERTEZZE Errore di misura è la differenza fra l indicazione fornita dallo strumento e la dimensione vera della grandezza. Supponendo che la grandezza vera
DettagliGara Matematica. Dipartimento di Matematica Ulisse Dini. Viale Morgagni 67/a Firenze. Soluzioni edizione 2011
Gara Matematica Dipartimento di Matematica Ulisse Dini Viale Morgagni 67/a - 50134 Firenze Soluzioni edizione 011 Esercizio 1. Determinare tutti gli interi positivi non nulli n che sono uguali alla somma
DettagliStrumenti di indagine per la valutazione psicologica
Strumenti di indagine per la valutazione psicologica 1.1 - Misurare in psicologia Davide Massidda davide.massidda@gmail.com Che cosa è la misura Misurare significa assegnare dei valori numerici a oggetti
DettagliCapitolo 2 Le misure delle grandezze fisiche
Capitolo 2 Le misure delle grandezze fisiche Gli strumenti di misura Gli errori di misura Il risultato di una misura Errore relativo ed errore percentuale Propagazione degli errori Rappresentazione di
DettagliIl Corso di Fisica per Scienze Biologiche
Il Corso di Fisica per Scienze Biologiche Ø Prof. Attilio Santocchia Ø Ufficio presso il Dipartimento di Fisica (Quinto Piano) Tel. 75-585 278 Ø E-mail: attilio.santocchia@pg.infn.it Ø Web: http://www.fisica.unipg.it/~attilio.santocchia/
DettagliIndice. 1. Premessa Le relazioni tra coppie di caratteri L analisi della contingenza L analisi della correlazione...
INSEGNAMENTO DI STATISTICA DEL TURISMO LEZIONE IX LE RELAZIONI TRA CARATTERI PROF. GIOVANNI DI TRAPANI Indice 1. Premessa.... 3 2. Le relazioni tra coppie di caratteri.... 4 3. L analisi della contingenza....
DettagliLE DISTRIBUZIONI CAMPIONARIE
LE DISTRIBUZIONI CAMPIONARIE Argomenti Principi e metodi dell inferenza statistica Metodi di campionamento Campioni casuali Le distribuzioni campionarie notevoli: La distribuzione della media campionaria
DettagliAnalisi degli Errori di Misura. 08/04/2009 G.Sirri
Analisi degli Errori di Misura 08/04/2009 G.Sirri 1 Misure di grandezze fisiche La misura di una grandezza fisica è descrivibile tramite tre elementi: valore più probabile; incertezza (o errore ) ossia
Dettagli3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17
C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica
DettagliUNIVERSITÀ di ROMA TOR VERGATA
UNIVERSITÀ di ROMA TOR VERGATA Corso di Statistica, anno 2010-11 P.Baldi Lista di esercizi 3. Corso di Laurea in Biotecnologie Esercizio 1 Una v.a. X segue una legge N(2, ). Calcolare a1) P(X 1) a2) P(2
DettagliPossibile applicazione
p. 1/4 Assegnamento Siano dati due insiemi A e B entrambi di cardinalità n. Ad ogni coppia (a i,b j ) A B è associato un valore d ij 0 che misura la "incompatibilità" tra a i e b j, anche interpretabile
DettagliL indagine campionaria Lezione 3
Anno accademico 2007/08 L indagine campionaria Lezione 3 Docente: prof. Maurizio Pisati Variabile casuale Una variabile casuale è una quantità discreta o continua il cui valore è determinato dal risultato
DettagliLanciando un dado, il tuo compagno esclama: uscirà 1, 2, 3, 4, 5 o 6 oppure: uscirà il numero 4. uscirà il numero 9
Lanciando un dado, il tuo compagno esclama: uscirà 1, 2, 3, 4, 5 o 6 oppure: uscirà il numero 4 o ancora: uscirà il numero 9 Possiamo dire che le previsione del tuo compagno sono la prima certa, la seconda
DettagliMa quali fenomeni sono da intendersi per fenomeni collettivi?
La statistica è la scienza che studia i fenomeni collettivi di vario genere. Essa raccoglie, analizza e interpreta, utilizzando metodi e strumenti matematici, le informazioni riguardanti il particolare
DettagliDISTRIBUZIONE NORMALE (1)
DISTRIBUZIONE NORMALE (1) Nella popolazione generale molte variabili presentano una distribuzione a forma di campana, bene caratterizzata da un punto di vista matematico, chiamata distribuzione normale
DettagliL indagine statistica
1 L indagine statistica DEFINIZIONE. La statistica è quella disciplina che si occupa della raccolta di dati quantitativi relativi a diversi fenomeni, della loro elaborazione e del loro utilizzo a fini
DettagliDistribuzioni e inferenza statistica
Distribuzioni e inferenza statistica Distribuzioni di probabilità L analisi statistica spesso studia i fenomeni collettivi confrontandoli con modelli teorici di riferimento. Tra di essi, vedremo: la distribuzione
DettagliUNIVERSITÀ di ROMA TOR VERGATA
UNIVERSITÀ di ROMA TOR VERGATA Corso di Laurea Magistrale in Scienze della Nutrizione Umana Corso di Statistica Medica, anno 2015-16 P.Baldi Lista di esercizi 4, 11 febbraio 2016. Esercizio 1 Una v.a.
DettagliESERCIZIO 1. b) E' necessario formulare ipotesi per procedere al test richiesto al punto a? (motivare brevemente la risposta)
ESERCIZIO 1 Da studi precedenti, il responsabile del rischio di una grande banca sa che l'ammontare medio di denaro che deve essere corrisposto dai correntisti che hanno il conto scoperto è pari a 240.
DettagliNo 8 Si 12 20. Y Scadente Buono Ottimo f i. Francia 3 1 3 7 Germania 1 0 4 5 Inghilterra 3 4 1 8 Norvegia 2 1 7 10 f j 9 6 15 30
Capitolo 9 Soluzione degli esercizi a cura di Rosa Falotico Esercizio 9.1 Esercizio 9.2 Y Centro ord Sud f i o 4 0 4 8 Si 0 6 6 12 4 6 10 20 f i o 8 Si 12 20 f i Y Centro 4 ord 6 Sud 10 20 Y Scadente Buono
DettagliOlimpiadi di Statistica Classe V - Fase Eliminatoria
Olimpiadi di Statistica 2016 - Classe V - Fase Eliminatoria Domanda 1 Alla fine del torneo di calcetto organizzato dalla scuola, è stata analizzata la classifica dei marcatori dalla quale risulta la seguente
Dettaglisi tratta del test del chi-quadro di adattamento e di quello di indipendenza. 1 l ipotesi che la popolazione segua una legge fissata;
di : dado : normale Finora abbiamo visto test d ipotesi per testare ipotesi differenti, ma tutte concernenti il valore atteso di una o due popolazioni. In questo capitolo vediamo come testare 1 l ipotesi
DettagliCOMPLEMENTI DI PROBABILITA E STATISTICA. 3 Crediti
CMPLEMENTI DI PRBABILITA E STATISTICA 3 Crediti Docente : Elvira Di Nardo (dinardo@unibas.it, 097-05890) Modalità di esame: Prova scritta alla fine del corso + Tesina (facoltativa) Testi consigliati: Manuale
DettagliANOVA: ANALISI DELLA VARIANZA Prof. Antonio Lanzotti
UNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II DIPARTIMENTO DI INGEGNERIA AEROSPAZIALE D.I.A.S. STATISTICA PER L INNOVAZIONE a.a. 007/008 ANOVA: ANALISI DELLA VARIANZA Prof. Antonio Lanzotti A cura di: Ing.
DettagliStatistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione
Statistica Esercitazione alessandro polli facoltà di scienze politiche, sociologia, comunicazione Obiettivo Esercizio 1. Questo e alcuni degli esercizi che proporremo nei prossimi giorni si basano sul
DettagliGestione ed Analisi Statistica dei dati
Master in Evidence Based Practice e Metodologia della Ricerca clinico-assistenziale assistenziale Gestione ed Analisi Statistica dei dati Daniela Fortuna 12 giugno 2014 TEST di ipotesi Finora abbiamo visto
Dettagli