LABORATORIO DI PROBABILITA E STATISTICA
|
|
|
- Ambra Zani
- 9 anni fa
- Visualizzazioni
Transcript
1 UNIVERSITA DEGLI STUDI DI VERONA LABORATORIO DI PROBABILITA E STATISTICA Docente: Bruno Gobbi 2 SIMMETRIA, APPIATTIMENTO E MISURA DELLA CONNESSIONE NELLE TABELLE A DOPPIA ENTRATA
2 INDICI DI SIMMETRIA
3
4 INDICE DI SIMMETRIA γ (gamma) DI FISHER Se γ = 0 allora la distribuzione è simmetrica Se γ < 0 allora la distribuzione è asimmetrica negativa Se γ > 0 allora la distribuzione è asimmetrica positiva
5 γ > 0 γ = 0 γ < 0
6 SIMMETRIA (O SKEWNESS) IN R In R esistono diversi pacchetti aggiuntivi che aiutano a calcolare la simmetria di una distribuzione. ES. moment e1071 futilities
7 CREAZIONE DI UNA FUNZIONE PER GAMMA gamma = function(x) { m3 = mean((x-mean(x))^3) skew = m3/(sd(x)^3) skew } { = AltGr + 7 } = AltGr + 0 NO tastiera numerica
8 SIMMETRIA (O SKEWNESS) IN R ES. x = c(0, 1, 1, 2, 2, 3, 4, 5) Valutare la simmetria di tale distribuzione.
9 SIMMETRIA (O SKEWNESS) IN R ES. x = c(0, 1, 1, 2, 2, 3, 4, 5) gamma(x) = C è asimmetria positiva, la distribuzione presenta una coda più lunga a destra.
10 VERIFICA GRAFICO SIMMETRIA hist(x, freq=true, breaks=length(x))
11 INDICI DI APPIATTIMENTO
12 INDICI DI APPIATTIMENTO (CURTOSI) Leptocurtica Mesocurtica Platicurtica
13 INDICE DI CURTOSI β (beta) DI PEARSON Se β = 3 allora la distribuzione è MESOCURTICA Se β < 3 allora la distribuzione è PLATICURTICA Se β > 3 allora la distribuzione è LEPTOCURTICA
14 INDICE DI CURTOSI γ 2 (gamma2) DI FISHER - 3 Se γ 2 = 0 allora la distribuzione è MESOCURTICA Se γ 2 < 0 allora la distribuzione è PLATICURTICA Se γ 2 > 0 allora la distribuzione è LEPTOCURTICA
15 INDICI DI APPIATTIMENTO (CURTOSI) Leptocurtica β > 3 γ 2 > 0 Mesocurtica β = 3 γ 2 = 0 Platicurtica β < 3 γ 2 < 0
16 APPIATTIMENTO (O CURTOSI) IN R Anche per misurare la curtosi di una distribuzione sin possono usare dei pacchetti aggiuntivi, che sono gli stessi per la simmetria: ES. moment e1071 futilities
17 CREAZIONE DI UNA FUNZIONE PER BETA beta = function(x) { m4 = mean((x-mean(x))^4) curt = m4/(sd(x)^4) curt }
18 APPIATTIMENTO (O CURTOSI) IN R ES. x = c(0, 1, 1, 2, 2, 3, 4, 5) Misurare la curtosi di x.
19 APPIATTIMENTO (O CURTOSI) IN R ES. x = c(0, 1, 1, 2, 2, 3, 4, 5) beta(x) = La distribuzione presenta un andamento schiacciato ovvero platicurtico.
20 CREAZIONE DI UNA FUNZIONE PER GAMMA2-3 gamma2 = function(x) { m4 = mean((x-mean(x))^4) curt = m4/(sd(x)^4) curt - 3 }
21 APPIATTIMENTO (O CURTOSI) IN R ES. x = c(0, 1, 1, 2, 2, 3, 4, 5) Misurare l appiattimento di x con γ 2
22 APPIATTIMENTO (O CURTOSI) IN R ES. x = c(0, 1, 1, 2, 2, 3, 4, 5) gamma2(x) = Essendo negativo, γ 2 conferma la forma platicurtica della distribuzione. Altro metodo per calcolare gamma2: > beta(x) - 3
23 VERIFICA GRAFICO APPIATTIMENTO hist(x, freq=true, breaks=length(x))
24 TABELLE A DOPPIA ENTRATA E MISURA DELLA CONNESSIONE FRA DUE FENOMENI
25 ESEMPIO DI TABELLA A DOPPIA ENTRATA CAPELLI BIONDI NERI AZZURRI OCCHI SCURI 15 60
26 CREAZIONE TABELLA A DOPPIA ENTRATA # CREIAMO INNANZITUTTO LA MATRICE DEI DATI CON IL COMANDO matrix: > colore=matrix(c(25, 10, 15, 60), nrow=2, byrow=true) # nrow=2 E IL NUMERO DI RIGHE, byrow=true INDICA CHE I DATI VANNO LETTI PER RIGA
27 CREAZIONE TABELLA A DOPPIA ENTRATA # CREIAMO LE ETICHETTE PER LE RIGHE E LE COLONNE: > occhi=c("azzurri", "scuri") > capelli=c("biondi", "neri")
28 CREAZIONE TABELLA A DOPPIA ENTRATA # ASSEGNIAMO LE ETICHETTE ALLA MATRICE CON IL COMANDO: > dimnames(colore)=list(occhi, capelli) > colore biondi neri azzurri scuri 15 60
29 DISEGNO GRAFICO MOSAICPLOT # DISEGNAMO IL GRAFICO AD AREE CHE RAPPRESENTA LA TABELLA: > mosaicplot(colore)
30 neri biondi eyehair colore azzurri scuri # IL GRAFICO RIPORTA LA RELAZIONE CHE ESISTE FRA I CARATTERI DEGLI OCCHI (AZZURRI O SCURI) E QUELLO DEI CAPELLI (BIONDI O NERI). L AREA PIÙ GRANDE È QUELLA RELATIVA AGLI OCCHI SCURI E AI CAPELLI NERI, MENTRE SONO POCHI QUELLI CHE HANNO I CAPELLI NERI E GLI OCCHI AZZURRI. QUESTO GRAFICO PERMETTE DI AVERE SUBITO UN IDEA DEI RAPPORTI DI FORZA CHE CI SONO FRA LE VARIABILI.
31 CALCOLO DEL CHI-QUADRATO Il test del chi-quadrato consiste in un test che mette a confronto le seguenti due ipotesi: ipotesi nulla H0: afferma che c è indipendenza fra i due fenomeni; ipotesi alternativa H1: che invece dice che c è una connessione fra i caratteri.
32 CALCOLO DEL CHI-QUADRATO In R il test del chi-quadrato viene condotto molto semplicemente con il comando: chisq.test > testchiq=chisq.test(colore) > testchiq
33 CALCOLO DEL CHI-QUADRATO > testchiq Pearson's Chi-squared test with Yates' continuity correction X-squared = , df = 1, p-value = 5.448e-07 X-squared è il chi-quadrato calcolato df sono i degrees of freedom, i gradi di libertà, dati dal prodotto: df=(n. Righe-1)*(n. Colonne-1) p-value è il livello di significatività. Questo valore deve essere inferiore al 5% (ovvero 0,05) per considerare valido il risultato trovato con il test.
34 TAVOLA DEL CHI-QUADRATO alpha (significatività) g.d.l. 1% 5% 1 6,64 3,84 2 9,21 5, ,35 7, ,28 9, ,09 11, ,81 12, ,48 14, ,09 15, ,67 16, ,21 18,31
35 CONFRONTO DEL CHI-QUADRATO CALCOLATO CON LA SOGLIA TEORICA Il valore del chi quadrato (X-squared) così calcolato va confrontato con un valore teorico per poter accettare o meno l ipotesi nulla H0. In particolare le soglie critiche del chi-quadrato con 1 g.d.l. (grado di libertà) sono: 3.84 per un livello di significatività del 5% 6.64 per un livello di significatività dell 1% Questi valori sono le soglie oltre le quali si rifiuta l ipotesi nulla sbagliando rispettivamente al massimo nel 5% dei casi o solo nell 1%.
36 CONFRONTO CHI-QUADRATO CON SOGLIA TEORICA 3.84 per un livello di significatività del 5% e 1 g.d.l per un livello di significatività dell 1% e 1 g.d.l. In questo caso abbiamo , che è abbondantemente superiore non solo a 3.84, che è la soglia critica per sbagliare al massimo nel 5% dei casi, ma addirittura a 6.64, che è la soglia critica oltre la quale si rifiuta l ipotesi nulla di indipendenza sbagliando solo nell 1% dei casi. Quindi il test rifiuta l ipotesi nulla H0 di indipendenza e quindi conferma che al 99% c è connessione fra i fenomeni.
37 CALCOLO DEL "V" DI CRAMER Una volta che abbiamo rilevato che c è una connessione fra i 2 fenomeni, possiamo misurare quanto sono connessi fra di loro con un opportuno indice, il V di Cramer. Questo indicatore assume: valore 0 nel caso di perfetta indipendenza; valore 1 quando invece c è la massima connessione fra i due fenomeni.
38 CALCOLO DEL "V" DI CRAMER colore
39 ES. tabella 2 x 2: BIONDI NERI n. righe = 2 n. colonne = 2 AZZURRI SCURI In questo caso il numero di righe e di colonne è lo stesso, quindi scelgo 2. Da 2 sottraggo 1: 2-1 = 1
40 ALTRO ES. tabella 4 x 3: n. righe = 4 n. colonne = 3 ALPHA BETA GAMMA TIPO A TIPO B TIPO AB TIPO In questo caso il minore fra il numero di righe e di colonne è 3. Da 3 sottraggo 1: 3-1 = 2
41 CALCOLO DEL "V" DI CRAMER PER CALCOLARE IL COEFFICIENTE V DI CRAMER, DEVO QUINDI PRIMA RICAVARMI LE SINGOLE COMPONENTI: IL CHI QUADRATO E LA NUMEROSITA TOTALE N # IL VALORE DEL CHI-QUADRATO SI RICAVA DA: > chiquadrato= testchiq$statistic > chiquadrato X-squared
42 CALCOLO DEL "V" DI CRAMER # IL TOTALE DI ELEMENTI PRESENTI SI OTTIENE COSÌ: > N = sum(colore) > N [1] 110
43 CALCOLO DEL "V" DI CRAMER # IL VALORE DEL CHI QUADRATO SI CALCOLA COSI : > V=sqrt( chiquadrato / (N*(2-1)) ) > V X-squared
44 CALCOLO DEL "V" DI CRAMER ESEMPI DI COMMENTI AL V DI CRAMER: DA 0 A 0,2: BASSA CONNESSIONE DA 0,2 A 0,4: DISCRETA CONNESSIONE DA 0,4 A 0,6: BUONA CONNESSIONE DA 0,6 IN SU: ALTA CONNESSIONE (VARIABILI RIDONDANTI)
45 CALCOLO DEL "V" DI CRAMER # IL VALORE DEL V DI CRAMER ( ) PORTA A RITENERE CHE C E UNA BUONA CONNESSIONE FRA I DUE CARATTERI COLORE DEI CAPELLI E COLORE DEGLI OCCHI, NEL SENSO CHE E CORRETTO IPOTIZZARE CHE DI SOLITO AD UN CERTO COLORE DEI CAPELLI CORRISPONDE UN CERTO COLORE DEGLI OCCHI.
46 ES. FARMACO Ipotizziamo di avere i risultati di un test sull efficacia di un nuovo farmaco su N=400 pazienti. TRATTA MENTO EFFETTO MIGLIORAMENTO PEGGIORAMENTO FARMACO PLACEBO alpha (significatività) g.d.l. 1% 5% 1 6,64 3,84 2 9,21 5, ,35 7, ,28 9, ,09 11, ,81 12, ,48 14, ,09 15, ,67 16, ,21 18,31
47 ES. FARMACO > farmaco=matrix(c(250, 50, 50, 50), nrow=2, byrow=true) > trattamento=c("farmaco", "placebo") > effetto=c("miglioramento", "peggioramento") > dimnames(farmaco)=list(trattamento, effetto) > farmaco miglioramento peggioramento farmaco placebo 50 50
48 peggioramento miglioramento > mosaicplot(farmaco) farmaco farmaco placebo
49 ES. FARMACO # CALCOLIAMO IL TEST DEL CHI QUADRATO > testchiq=chisq.test(farmaco) > testchiq Pearson's Chi-squared test with Yates' continuity correction data: farmaco X-squared = , df = 1, p-value = 6.432e-11 # POICHE IL VALORE CALCOLATO DEL CHI-QUADRATO E , BEN SUPERIORE ALLA SOGLIA CRITICA DI 6.64 VALIDO ALL 1% CON 1 GRADO DI LIBERTA (G.D.L.)(O DF=DEGREES OF FREEDOM NELL OUTPUT), SI RIFIUTA L IPOTESI NULLA DI INDIPENDENZA E SI CONFERMA LA CONNESSIONE FRA I FENOMENI
50 # CALCOLO IL V DI CRAMER > chiquadrato= testchiq$statistic > chiquadrato X-squared # IL TOTALE DI ELEMENTI PRESENTI E : > N = sum(farmaco) > N [1] 400 > V=sqrt( chiquadrato / (N*(2-1)) ) > V X-squared # IL RISULTATO PORTA AD AFFERMARE CHE C È UNA DISCRETA CONNESSIONE FRA I DUE FENOMENI
51 ES. SOPRAVVISSUTI DEL TITANIC La tabella riporta i sopravvissuti e i deceduti fra i passeggeri del STAGE a seconda della classe di appartenenza. CLASSE ESITO DECEDUTI SOPRAVVISSUTI PRIMA SECONDA TERZA EQUIPAGGIO alpha (significatività) g.d.l. 1% 5% 1 6,64 3,84 2 9,21 5, ,35 7, ,28 9, ,09 11, ,81 12, ,48 14, ,09 15, ,67 16, ,21 18,31
52 ES. TITANIC > titanic=matrix(c(122, 203, 167, 118, 528, 178, 673, 212), nrow=4, byrow=true) > classe=c("prima", "seconda", "terza", "equipaggio") > esito=c("deceduti", "sopravvissuti") > dimnames(titanic)=list(classe, esito) > titanic Deceduti Sopravvissuti Prima Seconda Terza Equipaggio
53 Sopravvissuti Deceduti > mosaicplot(titanic) titanic Prima Seconda Terza Equipaggio
54 ES. TITANIC # CALCOLIAMO IL TEST DEL CHI QUADRATO > testchiq=chisq.test(titanic) > testchiq Pearson's Chi-squared test data: STAGE X-squared = , df = 3, p-value < 2.2e-16 # POICHE IL VALORE CALCOLATO DEL CHI-QUADRATO E , BEN SUPERIORE ALLA SOGLIA CRITICA DI VALIDO ALL 1% CON 3 GRADI DI LIBERTA, SI RIFIUTA L IPOTESI NULLA DI INDIPENDENZA E SI CONFERMA LA CONNESSIONE FRA I FENOMENI, OVVERO FAR PARTE DELLA PRIMA, SECONDA, TERZA CLASSE O DELL EQUIPAGGIO FACEVA DIFFERENZA FRA LA VITA E LA MORTE. I GRADI DI LIBERTA SONO 3 PERCHE DATI DA (R-1)*(C*1)=(4-1)*(2-1)
55 # CALCOLO IL V DI CRAMER > chiquadrato= testchiq$statistic > chiquadrato X-squared # IL TOTALE DI ELEMENTI PRESENTI E : > N = sum(titanic) > N [1] 2201 # CALCOLO IL V DI CRAMER CONSIDERANDO IL MINORE FRA IL N. DI RIGHE E COLONNE > V=sqrt( chiquadrato / (N*(2-1)) ) > V X-squared # IL RISULTATO PORTA AD AFFERMARE CHE C È UNA DISCRETA CONNESSIONE FRA I DUE FENOMENI
56 STAGE? ES. STAGE E ASSUNZIONE (CASO NORMALE) Si vuole verificare se esiste una relazione fra il fatto di svolgere uno stage presso un importante istituto di credito e la successiva eventuale assunzione. Sono stati così presi in considerazione 200 ragazzi così distribuiti: ASSUNZIONE? SI NO Totale SI NO Totale alpha (significatività) g.d.l. 1% 5% 1 6,64 3,84 2 9,21 5, ,35 7, ,28 9, ,09 11, ,81 12, ,48 14, ,09 15, ,67 16, ,21 18,31
57 > stage_lavoro=matrix(c(80, 20, 25, 75), nrow=2, byrow=true) > stage=c("sì stage", "no stage") > lavoro=c("sì assunzione", "No assunzione") > dimnames(stage_lavoro)=list(stage, lavoro) > stage_lavoro ES. STAGE Sì assunzione No assunzione sì stage no stage 25 75
58 > mosaicplot(stage_lavoro) Sì assunzione No assunzione stage_lavoro sì stage no stage
59 ES. STAGE # CALCOLIAMO IL TEST DEL CHI QUADRATO > testchiq=chisq.test(stage_lavoro) > testchiq Pearson's Chi-squared test with Yates' continuity correction data: stage_lavoro X-squared = , df = 1, p-value = 2.068e-14 # POICHE IL VALORE CALCOLATO DEL CHI-QUADRATO E , BEN SUPERIORE ALLA SOGLIA CRITICA DI 6.64 VALIDO ALL 1%, SI RIFIUTA L IPOTESI NULLA DI INDIPENDENZA E SI CONFERMA LA CONNESSIONE FRA I FENOMENI, OVVERO FARE UNO STAGE COMPORTA MAGGIORI PROBABILITA DI ESSERE ASSUNTI. I GRADI DI LIBERTA SONO 1 PERCHE DATI DA (R-1)*(C*1)=(2-1)*(2-1)
60 # CALCOLO IL V DI CRAMER > chiquadrato= testchiq$statistic > chiquadrato X-squared # IL TOTALE DI ELEMENTI PRESENTI E : > N = sum(stage_lavoro) > N [1] 200 > V=sqrt( chiquadrato / (N*(2-1)) ) > V X-squared # IL RISULTATO PORTA AD AFFERMARE CHE C È UNA BUONA CONNESSIONE FRA I DUE FENOMENI
61 SO computer ES. S.O. PC E S.O. SMARTPHONE La seguente tabella riporta la distribuzione dei sistemi operativi di computer e smartphone di un campione di persone. SO smartphone Windows ios Android TOTALE Windows Mac OS Linux TOTALE alpha (significatività) g.d.l. 1% 5% 1 6,64 3,84 2 9,21 5, ,35 7, ,28 9, ,09 11, ,81 12, ,48 14, ,09 15, ,67 16, ,21 18,31
62 ES. S.O. PC E S.O. SMARTPHONE > SO=matrix(c(100, 180, 320, 60, 120, 50, 50, 60, 60), nrow=3, byrow=true) > SOpc=c("Windows", "Mac OS", "Linux") > SOsmart=c("Windows", "ios", "Android") > dimnames(so)=list(sopc, SOsmart) > SO Windows ios Android Windows Mac OS Linux > mosaicplot(so)
63 ES. S.O. PC E S.O. SMARTPHONE > testchiq=chisq.test(so) > testchiq Pearson's Chi-squared test data: SO X-squared = , df = 4, p-value = 4.424e-16 # POICHE IL VALORE CALCOLATO DEL CHI-QUADRATO E , BEN SUPERIORE ALLA SOGLIA CRITICA DI 13,28 VALIDO ALL 1% PER 4 G.D.L., SI RIFIUTA L IPOTESI NULLA DI INDIPENDENZA E SI CONFERMA LA CONNESSIONE FRA I FENOMENI, OVVERO AVERE IL COMPUTER CON UN CERTO SISTEMA OPERATIVO INFLUENZA LA SCELTA DEL SISTEMA OPERATIVO DELLO SMARTPHONE. I GRADI DI LIBERTA SONO 4 PERCHE DATI DA (r-1)*(c*1)=(3-1)*(3-1) alpha (significatività) g.d.l. 1% 5% 1 6,64 3,84 2 9,21 5, ,35 7, ,28 9, ,09 11, ,81 12, ,48 14, ,09 15, ,67 16, ,21 18,31
64 ES. S.O. PC E S.O. SMARTPHONE # CALCOLIAMO IL VALORE DELLA STATISTICA V DI CRAMER > chiquadrato=testchiq$statistic > chiquadrato X-squared # IL TOTALE DI ELEMENTI PRESENTI SI OTTIENE IN QUESTO MODO: > N = sum(so) > N [1] 1000 # SI SCEGLIE IL MINORE FRA IL NUMERO DI RIGHE E DI COLONNE E SI SOTTRAE 1 > V=sqrt( chiquadrato / (N*(3-1)) ) > V X-squared # IL RISULTATO PORTA AD AFFERMARE CHE C È UNA BASSA CONNESSIONE FRA I DUE FENOMENI
LABORATORIO DI PROBABILITA E STATISTICA
UNIVERSITA DEGLI STUDI DI VERONA LABORATORIO DI PROBABILITA E STATISTICA Docente: Bruno Gobbi Corso di laurea in Informatica e Bioinformatica 9 ESERCIZI DI RIPASSO FINALE (1 di 2) 1 - STATISTICA DESCRITTIVA
STATISTICA DESCRITTIVA. Elementi di statistica medica GLI INDICI INDICI DI DISPERSIONE STATISTICA DESCRITTIVA
STATISTICA DESCRITTIVA Elementi di statistica medica STATISTICA DESCRITTIVA È quella branca della statistica che ha il fine di descrivere un fenomeno. Deve quindi sintetizzare tramite pochi valori(indici
Sintesi dei dati in una tabella. Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6)
Sintesi dei dati in una tabella Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6) Sintesi dei dati Spesso si vuole effettuare una sintesi dei dati per ottenere indici
Prova di Laboratorio di Probabilità e Statistica - Soluzione traccia A
Prova di Laboratorio di Probabilità e Statistica - Soluzione traccia A 17 luglio 2015 ################### ESERCIZIO 1 ################### # CREO I VETTORI E LA TABELLA marca=c("hp", "Lenovo", "Apple")
N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.
N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle abelle riportate alla fine del documento. Esercizio 1 La concentrazione media di sostanze inquinanti osservata nelle acque di un fiume
Statistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi
Esercitazione 14 Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () 1 / 14 Ex.1: Verifica Ipotesi sulla media (varianza nota) Le funi prodotte da un certo macchinario hanno una
Esercitazione di Statistica Indici di associazione
Esercitazione di Statistica Indici di associazione 28/10/2015 La relazione tra caratteri Indipendenza logica Quando si suppone che tra due caratteri non ci sia alcuna relazione di causa-effetto. Indipendenza
Capitolo 11 Test chi-quadro
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 11 Test chi-quadro Insegnamento: Statistica Corsi di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara Docenti: Dott.
Corso di Psicometria Progredito
Corso di Psicometria Progredito 43 I principali test statistici per la verifica di ipotesi: Il test del χ 2 per tavole di contingenza a 2 vie Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia
LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell
LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Strumenti statistici in Excell Pacchetto Analisi di dati Strumenti di analisi: Analisi varianza: ad un fattore Analisi
Statistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2011/2012 Statistica Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate.
Statistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 1 Outline () Statistica 2 / 1 La curtosi La curtosi è la caratteristica della forma della distribuzione
Statistica. Lezione 8
Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 8 a.a 2011-2012 Dott.ssa Daniela
STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo
STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)
A1. La curva normale (o di Gauss)
Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 202/203 lezione n. 8 dell aprile 203 - di Massimo Cristallo - A. La curva normale (o di Gauss) La curva
le scale di misura scala nominale scala ordinale DIAGNOSTICA PSICOLOGICA lezione si basano su tre elementi:
DIAGNOSTICA PSICOLOGICA lezione! Paola Magnano [email protected] si basano su tre elementi: le scale di misura sistema empirico: un insieme di entità non numeriche (es. insieme di persone; insieme
Ulteriori applicazioni del test del Chi-quadrato (χ 2 )
Ulteriori applicazioni del test del Chi-quadrato (χ 2 ) Finora abbiamo confrontato con il χ 2 le numerosità osservate in diverse categorie in un campione con le numerosità previste da un certo modello
ˆp(1 ˆp) n 1 +n 2 totale di successi considerando i due gruppi come fossero uno solo e si costruisce z come segue ˆp 1 ˆp 2. n 1
. Verifica di ipotesi: parte seconda.. Verifica di ipotesi per due campioni. Quando abbiamo due insiemi di dati possiamo chiederci, a seconda della loro natura, se i campioni sono simili oppure no. Ci
Analisi della varianza
Analisi della varianza Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona ANALISI DELLA VARIANZA - 1 Abbiamo k gruppi, con un numero variabile di unità statistiche.
STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE
STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE La presentazione dei dati per molte ricerche mediche fa comunemente riferimento a frequenze, assolute o percentuali. Osservazioni cliniche conducono sovente
Applicazioni statistiche e utilizzo del package statistico Spss - 7
Applicazioni statistiche e utilizzo del package statistico Spss - 7 CISI 27 gennaio 2005 [email protected] Illustrare le principali statistiche mono e bivariate. Valutare quando è opportuno
IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI
IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI Perchè confrontare le varianze stimate in due campioni? Torniamo all'esempio dei frinosomi Per poter applicare il test t avevamo detto che le varianze, e
STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE
1 STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE La presentazione dei dati per molte ricerche mediche fa comunemente riferimento a frequenze, assolute o percentuali. Osservazioni cliniche conducono
NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI VERIFICA DI IPOTESI PER IL CONFRONTO TRA DUE PROPORZIONI
NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI VERIFICA DI IPOTESI PER IL CONFRONTO TRA DUE PROPORZIONI IL PROBLEMA Si vuole verificare se un nuovo trattamento per la cura dell otite è più efficace
Statistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione.
Statistica inferenziale La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione. Verifica delle ipotesi sulla medie Quando si conduce una
Test di ipotesi su due campioni
2/0/20 Test di ipotesi su due campioni Confronto tra due popolazioni Popolazioni effettive: unità statistiche realmente esistenti. Esempio: Confronto tra forze lavoro di due regioni. Popolazioni ipotetiche:
Variabili aleatorie Parte I
Variabili aleatorie Parte I Variabili aleatorie Scalari - Definizione Funzioni di distribuzione di una VA Funzioni densità di probabilità di una VA Indici di posizione di una distribuzione Indici di dispersione
Teoria e tecniche dei test. Concetti di base
Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi
Test per la correlazione lineare
10 Test per la correlazione lineare Istituzioni di Matematica e Statistica 2015/16 E. Priola 1 Introduzione alla correlazione lineare Problema: In base ai dati che abbiamo possiamo dire che c è una qualche
Proprietà della varianza
Proprietà della varianza Proprietà della varianza Proprietà della varianza Proprietà della varianza Intermezzo: ma perché dovremmo darci la pena di studiare come calcolare la varianza nel caso di somme,
Concetti principale della lezione precedente
Corso di Statistica medica e applicata 9 a Lezione Dott.ssa Donatella Cocca Concetti principale della lezione precedente I concetti principali che sono stati presentati sono: Variabili su scala nominale
Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill
Statistica - metodologie per le scienze economiche e sociali /e S. Borra, A. Di Ciaccio - McGraw Hill Es.. Soluzione degli esercizi del capitolo 4 4. Il sistema d ipotesi è: μ 7, H : μ 7, Essendo 0 : t,
Statistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 41 Outline 1 2 3 4 5 () Statistica 2 / 41 Misura del legame Data una variabile doppia (X, Y ), la
Il test (o i test) del Chi-quadrato ( 2 )
Il test (o i test) del Chi-quadrato ( ) I dati: numerosità di osservazioni che cadono all interno di determinate categorie Prima di tutto, è un test per confrontare proporzioni Esempio: confronto tra numero
Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2010/2011 Statistica Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza
1/55. Statistica descrittiva
1/55 Statistica descrittiva Organizzare e rappresentare i dati I dati vanno raccolti, analizzati ed elaborati con le tecniche appropriate (organizzazione dei dati). I dati vanno poi interpretati e valutati
PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA
PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURA/TECNICA DI ANALISI DEI DATI SPECIFICAMENTE DESTINATA A STUDIARE LA RELAZIONE TRA UNA VARIABILE NOMINALE (ASSUNTA
Facoltà di Economia - Università di Pavia Simulazione Prova Scritta di Statistica Sociale 19 dicembre 2012
Facoltà di Economia - Università di Pavia Simulazione Prova Scritta di Statistica Sociale 19 dicembre 01 Esercizio 1. Con riferimento a due variabili dicotomiche X e Y (con valori possibili 0 o 1) si definisca
Gestione ed Analisi Statistica dei dati
Master in Evidence Based Practice e Metodologia della Ricerca clinico-assistenziale assistenziale Gestione ed Analisi Statistica dei dati Daniela Fortuna 12 giugno 2014 TEST di ipotesi Finora abbiamo visto
Statistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione
Statistica Esercitazione alessandro polli facoltà di scienze politiche, sociologia, comunicazione Obiettivo Esercizio 1. Questo e alcuni degli esercizi che proporremo nei prossimi giorni si basano sul
Esercizi riassuntivi di Inferenza
Esercizi riassuntivi di Inferenza Esercizio 1 Un economista vuole stimare il reddito medio degli abitanti di una cittadina mediante un intervallo al livello di confidenza del 95%. La distribuzione del
PSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI
PSICOMETRIA Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI CAMPIONI INDIPENDENTI Campioni estratti casualmente dalla popolazione con caratteristiche omogenee Assegnazione
Elementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 13-Il t-test per campioni indipendenti vers. 1.1 (12 novembre 2014) Germano Rossi 1 [email protected] 1 Dipartimento di Psicologia, Università di
Esercitazione 8 maggio 2014
Esercitazione 8 maggio 2014 Esercizio 2 dal tema d esame del 13.01.2014 (parte II). L età media di n gruppo di 10 studenti che hanno appena conseguito la laurea triennale è di 22 anni. a) Costruire un
lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1
lezione n. 6 (a cura di Gaia Montanucci) METODO MASSIMA VEROSIMIGLIANZA PER STIMARE β 0 E β 1 Distribuzione sui termini di errore ε i ε i ~ N (0, σ 2 ) ne consegue : ogni y i ha ancora distribuzione normale,
NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI
NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI I METODI PER IL CONFRONTO DI MEDIE (Campioni non indipendenti) Prof.ssa G. Serio, Prof. P. Trerotoli, Cattedra di Statistica Medica, Università di Bari
SISTEMI LINEARI. x y + 2t = 0 2x + y + z t = 0 x z t = 0 ; S 3 : ; S 5x 2y z = 1 4x 7y = 3
SISTEMI LINEARI. Esercizi Esercizio. Verificare se (,, ) è soluzione del sistema x y + z = x + y z = 3. Trovare poi tutte le soluzioni del sistema. Esercizio. Scrivere un sistema lineare di 3 equazioni
Gli errori nella verifica delle ipotesi
Gli errori nella verifica delle ipotesi Nella statistica inferenziale si cerca di dire qualcosa di valido in generale, per la popolazione o le popolazioni, attraverso l analisi di uno o più campioni E
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3 Dott.ssa Antonella Costanzo [email protected] Esercizio 1. Sintesi a cinque e misure di variabilità rispetto ad un centro Una catena di fast-food ha selezionato
Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica
Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università
Il teorema di Rouché-Capelli
Luciano Battaia Questi appunti (1), ad uso degli studenti del corso di Matematica (A-La) del corso di laurea in Commercio Estero dell Università Ca Foscari di Venezia, campus di Treviso, contengono un
Statistica. Alfonso Iodice D Enza
Statistica Il e Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 21 Outline Il e 1 2 3 Il 4 e 5 () Statistica 2 / 21 Il e Due distribuzioni aventi stessa posizione
Teoria e tecniche dei test
Teoria e tecniche dei test Lezione 9 LA STANDARDIZZAZIONE DEI TEST. IL PROCESSO DI TARATURA: IL CAMPIONAMENTO. Costruire delle norme di riferimento per un test comporta delle ipotesi di fondo che è necessario
Distribuzioni di Probabilità
Distribuzioni di Probabilità Distribuzioni discrete Distribuzione uniforme discreta Distribuzione di Poisson Distribuzioni continue Distribuzione Uniforme Distribuzione Gamma Distribuzione Esponenziale
I TEST STATISTICI. dott.ssa Gabriella Agrusti
I TEST STATISTICI dott.ssa Gabriella Agrusti Dulcis in fundo.. come scegliere un test statistico in base all ipotesi come stabilire se due variabili sono associate (correlazione di Pearson) come stabilire
Esercitazioni di statistica
Esercitazioni di statistica Boxplot e numeri indici Stefania Spina Universitá di Napoli Federico II [email protected] 14 Ottobre 014 Stefania Spina Esercitazioni di statistica 1/37 Definizioni La
5. Test per proporzioni: confronto tra campioni e associazione
BIOSTATISTICA 5. Test per proporzioni: confronto tra campioni e associazione Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health [email protected] MARTA BLANGIARDO
DISTRIBUZIONI DI PROBABILITA
DISTRIBUZIONI DI PROBABILITA Nell associare ai risultati di un esperimento un valore numerico si costruisce una variabile casuale (o aleatoria, o stocastica). Ogni variabile casuale ha una corrispondente
Appunti ed esercizi sulle coniche
1 LA CIRCONFERENZA 1 Appunti ed esercizi sulle coniche Versione del 1 Marzo 011 1 La circonferenza Nel piano R, fissati un punto O = (a, b) e un numero r > 0, la circonferenza (o cerchio) C di centro O
Una statistica è una quantità numerica il cui valore è determinato dai dati.
STATISTICHE CAMPIONARIE Quando i dati sono molti e illeggibili nella forma grezza, si rende necessario introdurre quantità numeriche che possano essere usate per sintetizzarli. Queste misure riassuntive
Esercitazione 8 del corso di Statistica 2
Esercitazione 8 del corso di Statistica Prof. Domenico Vistocco Dott.ssa Paola Costantini 6 Giugno 8 Decisione vera falsa è respinta Errore di I tipo Decisione corretta non è respinta Probabilità α Decisione
b) Calcolare la devianza tra i gruppi (devianza esterna), la devianza entro i gruppi (devianza interna) e la devianza totale
ESERCIZIO 1 La tendenza recente del mercato dell auto vede i veicoli SUV ed i fuoristrada sempre di più soppiantare le macchine tradizionali. Il loro utilizzo, soprattutto nei centri cittadini, viene criticato
Elementi di Psicometria
Elementi di Psicometria 20-Chi quadro vers. 1.0 (27 aprile 2011) Germano Rossi 1 [email protected] 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2010-2011 G. Rossi (Dip. Psicologia)
LE MISURE DI TENDENZA CENTRALE. Dott. Giuseppe Di Martino Scuola di Specializzazione in Igiene e Medicina Preventiva
LE MISURE DI TENDENZA CENTRALE Dott. Giuseppe Di Martino Scuola di Specializzazione in Igiene e Medicina Preventiva Individuare un indice che rappresenti significativamente un insieme di dati statistici
ESERCIZIO 1. Di seguito vengono riportati i risultati di un modello fattoriale di analisi della varianza con 3 fattori tra i soggetti.
ESERCIZIO. Di seguito vengono riportati i risultati di un modello fattoriale di analisi della varianza con fattori tra i soggetti. Variabile dipendente: PERF Sorgente Modello corretto Intercept SEX_96
CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)
CHEMIOMETRIA Applicazione di metodi matematici e statistici per estrarre (massima) informazione chimica (affidabile) da dati chimici INCERTEZZA DI MISURA (intervallo di confidenza/fiducia) CONFRONTO CON
Approssimazione normale alla distribuzione binomiale
Approssimazione normale alla distribuzione binomiale P b (X r) costoso P b (X r) P(X r) per N grande Teorema: Se la variabile casuale X ha una distribuzione binomiale con parametri N e p, allora, per N
Z-test, T-test, χ 2 -test
Z-test, T-test, χ 2 -test Francesco Corrias Chiara Todaro DIMA 13 febbraio 2012 Francesco Corrias Chiara Todaro (DIMA) Z-test, T-test, χ 2 -test 13 febbraio 2012 1 / 19 Verifica d ipotesi Definizione (Test
Esercitazioni di statistica
Esercitazioni di statistica Misure di associazione: Indipendenza assoluta e in media Stefania Spina Universitá di Napoli Federico II [email protected] 22 ottobre 2014 Stefania Spina Esercitazioni
PROVA SCRITTA DI STATISTICA. cod CLEA-CLAPI-CLEFIN-CLELI cod CLEA-CLAPI-CLEFIN-CLEMIT. 5 Novembre 2003 SOLUZIONI MOD.
PROVA SCRITTA DI STATISTICA cod. 4038 CLEA-CLAPI-CLEFIN-CLELI cod. 5047 CLEA-CLAPI-CLEFIN-CLEMIT 5 Novembre 003 SOLUZIONI MOD. A In 8 facoltà di un ateneo italiano vengono rilevati i seguenti dati campionari
STATISTICA AZIENDALE Modulo Controllo di Qualità
STATISTICA AZIENDALE Modulo Controllo di Qualità A.A. 009/10 - Sottoperiodo PROA DEL 14 MAGGIO 010 Cognome:.. Nome: Matricola:.. AERTENZE: Negli esercizi in cui sono richiesti calcoli riportare tutte la
Università di Cassino. Esercitazione di Statistica 1 del 28 novembre Dott.ssa Paola Costantini
Università di Cassino Esercitazione di Statistica del 28 novembre 2007 Dott.ssa Paola Costantini Esercizio Considerando il DATASET DIPENDENTI, si calcoli la correlazione tra i caratteri STIPENDIO PERCEPITO
Vedi: Probabilità e cenni di statistica
Vedi: http://www.df.unipi.it/~andreozz/labcia.html Probabilità e cenni di statistica Funzione di distribuzione discreta Istogrammi e normalizzazione Distribuzioni continue Nel caso continuo la probabilità
Lezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo
UIVERSITA DEGLI STUDI DI BASILICATA FACOLTA DI ECOOMIA Corso di laurea in Economia Aziendale anno accademico 2012/2013 Lezioni di Statistica del 15 e 18 aprile 2013 Docente: Massimo Cristallo LA RELAZIOE
Metodi per la risoluzione di sistemi lineari
Metodi per la risoluzione di sistemi lineari Sistemi di equazioni lineari. Rango di matrici Come è noto (vedi [] sez.0.8), ad ogni matrice quadrata A è associato un numero reale det(a) detto determinante
Note sulla probabilità
Note sulla probabilità Maurizio Loreti Dipartimento di Fisica Università degli Studi di Padova Anno Accademico 2002 03 1 La distribuzione del χ 2 0.6 0.5 N=1 N=2 N=3 N=5 N=10 0.4 0.3 0.2 0.1 0 0 5 10 15
MATRICI. 1. Esercizi
MATICI Esercizio Siano A = 0, B = Esercizi 2, C = 0 2 2 Calcolare: a2a B; b3a + 2B 4C; c 2A + B + 2C 2B; d3b + 2(2A C (A + B + 2C isolvere, se possibile: ( 3X + 2(A X + B + 2(C + 2X = 0; (2 4A + 2(B +
L affondamento del Titanic
L affondamento del Titanic Livello scolare: biennio Abilità interessate Identificare situazioni che richiedono di rilevare lo stesso carattere su una unità statistica formata da elementi, o caratteri diversi
ANOVA: ANALISI DELLA VARIANZA Prof. Antonio Lanzotti
UNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II DIPARTIMENTO DI INGEGNERIA AEROSPAZIALE D.I.A.S. STATISTICA PER L INNOVAZIONE a.a. 007/008 ANOVA: ANALISI DELLA VARIANZA Prof. Antonio Lanzotti A cura di: Ing.
Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII
Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Un breve richiamo sul test t-student Siano A exp (a 1, a 2.a n ) e B exp (b 1, b 2.b m ) due set di dati i cui
Esercitazioni del corso: STATISTICA
A. A. 0-0 Esercitazioni del corso: STATISTICA Sommario Esercitazione 4: Medie e varianze marginali Medie e varianze condizionate Scomposizione della varianza Indipendenza in media ESERCIZIO UNIVERSITÀ
