CONFRONTO DIDUE CAMPIONI CASUALI
|
|
- Gilberta Ruggeri
- 7 anni fa
- Visualizzazioni
Transcript
1 CONFRONTO DIDUE CAMPIONI CASUALI ( x, x,, x ) ( y, y,, y ) 1 n 1 n POPOLAZIONE 1 POPOLAZIONE Le due popolazioni hanno lo stesso modello stocastico? Le due popolazioni hanno la stessa media? Le due popolazioni hanno la stessa varianza? Tra le due popolazioni c è una qualche legge di DIPENDENZA l una dall altra oppure sono indipendenti? 1
2 Esempio: La tabella riporta la lunghezza e la larghezza della conchiglia di brachiopoli Composita. LUNGHEZZA LARGHEZZA Scatter diagram(o diagramma di dispersione)
3 CONSIDERAZIONI SULLO SCATTER DIAGRAM Le correlazioni, possibilmente positiva o possibilmente, negativa si hanno quando i punti rappresentativi delle coppie di dati, pur disponendosi attorno ad una delle due diagonali del diagramma, presentano una dispersionepiuttosto accentuata tale da far presumere l esistenza di altre cause che intervengono a determinare l'effetto studiato. 3
4 Come si misura il grado di correlazione tra due campioni casuali? Il coefficiente di correlazione è una misura del grado di linearità della distribuzione dei punti nel diagramma x-y. SOMMA CORRETTA DEI PRODOTTI n i= 1 ( )( ) SCP = x x y y i i Dipende da n COVARIANZA SCP Dipende dalle unità di misura COV = n 1 CORRELAZIONE DI PEARSON r xy COV = S S x y Misura adimensionale IN STATVIEW 4
5 Il coefficiente di correlazione non è una misura generale della relazione tra due variabili, ma esprime solo il grado di linearità della correlazione in un grafico a dispersione. Gli outlierspossono modificare significativamente il valore del coefficiente di correlazione. 5
6 6
7 Il coefficiente di correlazione misura solo il grado di relazione lineare 7
8 Essendo il valore del coefficiente di correlazione piuttosto elevato, ed avendo provato con un test di ipotesi la bontà dell ipotesi di re.- lazione lineare tra i due campioni, determiniamo i coefficienti della retta che descrive tale relazione. Warning: Trasformazioni sui dati possono indurre correlazioni! Coefficiente corr. Spearman R( x i ) n [ R x ] i R yi 6 ( ) ( ) i= 1 r = 1 n( n 1) = posizione nel campione ordinato Si usa quando una delle due popolazioni non è gaussiana Quanto è appropriato scegliere una funzione monotona per descrivere la dipendenza dei dati 8
9 Due parole sulla popolazione gaussiana bidimensionale e il concetto di indipendenza Coppie di variabili aleatorie Definizione: Si definisce vettore aleatorio la coppia (,) dove,, sono definite sullo stesso spazio campione : S R, : S R (, ) : S R Esempio: peso-altezza di una persona (, ) random vector 9
10 Variabili discrete { } (, ) ω / ( ω), ( ω) = x = y = S = x = y { ω / ( ω) } ω / ( ω) { } = S = x S = y ( ) ω = y ( ) ω = x { ( ) ( ) } ( ) { } { ( ) } ω S : ω x, ω y = ω S : ω x ω S : ω y (ω) = y ω S { ω : ( ω), ( ω) } P S x y = F, ( x, y) Funzione di ripartizione doppia (ω) = x 10
11 B f ( x, y) d x dy f ( x, y) x y P ( x) Esempio : La f ( x, y) = πσ for ( x, y) R funzione densità di probabilità di una normale bivariata è : 1 1 exp 1 σ ρ (1 ρ ),( µ, µ ) R Gaussiana (congiunta) bidimensionale, con parametri σ ( x µ ) ρ( x µ )( y µ ) ( y µ ) σ > 0, σ σ σ > 0 e ρ (-1,1). + σ µ = E µ = E [ ] [ ] [ ] [ ] σ = Var σ = Var ρ ( 1,1) 11
12 σ = 1, σ = 1, µ = 0, µ = 0, ρ = 0 Contour plots σ = 1, σ = 1, µ = 0, µ = 0, ρ = 0.9 σ = 1, σ = 1, µ = 0, µ = 0, ρ = 0 1 (1 ρ ) dove Gaussiana bidimensionale ( x µ ) ρ( x µ )( y µ ) ( y µ ) σ x x =, y σ σ + σ µ σ µ = Σ = µ cov(, ) = cov(,) σ T 1 ( x µ ) Σ ( x µ ) Il coefficiente di correlazione (o la covarianza) è l unico strumento che consente di analizzare le relazioni esistenti tra due variabili aleatorie? Teorema : Due variabili aleatorie congiuntamente gaussiane sono indipendenti se e solo se ρ = 0. IPOTESI FONDAMENTALE IN MOLTI DEI TEST CHE VEDREMO 1
13 Effettuare previsioni, mediante - INTERPOLAZIONE - ESTRAPOLAZIONE Indica la percentuale di variabilità della che è spiegata dalla Coefficiente di determinazione Come si calcolano i coefficienti? IL METODO DEI MINIMI QUADRATI Minimizzare la distanza tra i punti delle osservazioni e la retta stessa. 13
14 residui Si cerca il minimo della funzione rispetto a e b L a b y ax b n = i i i= 1 (, ) ( ) Stima della variabilità degli stimatori INTERCETTA E LUNGHEZZA. Sono i valori dei coefficienti sui dati standardizzati. Se la retta di regressione è y= α x+ β H H 0 1 : β = 0 : β 0 H H 0 1 : α = 0 : α 0 14
15 ANALISI DEI RESIDUI Perché il modello sia valido è necessario che i residui abbiano legge gaussiana: 1) Normplot ) Test di Kolmogorov-Smirnov 1,5 1 0,5 0-1,5-1 -0,5 0 0,5 1 1,5-0,5 Serie1-1 -1,5 - Il quantile di riferimento è TEST DI KOLMOGOROV-SMIRNOV 15
16 Con Statview Un valore pari a indica che non è presente alcuna autocorrelazione. Valori piccoli di d indi canoche i residui successivi sono, in media, vicini in valore l'uno all'altro, o correlati positivamente. Valori grandi di dindicano che i residui successivi sono, in media, molto diffe rentiin valore l'uno dall'altro, o correlati negativamente. Altri tipi di funzioni 16
17 esponenziale logaritmica potenza growth Assumiamo che dall esperimento casuale non si evinca se i due campioni casuali siano correlati o meno, siano indipendenti o meno. Molti dei test per il confronto di due popolazioni si basano sull ipotesi che i due campioni casuali provengano da popolazioni indipendenti. TEST CHI-QUADRATO PER L INDIPENDENZA TAVOLA DI CONTINGENZA DATI NOMINALI 17
18 COSTRUZIONE DI UNA TAVOLA DI CONTINGENZA IN STATVIEW 18
19 H 0 : la popolazione età e la popolazione "smoking history" sono indipendenti H1 : la popolazione età e la popolazione "smoking history" non sono indipendenti STATISTICA TEST χ( s 1) ( r 1) Essendo maggiore di 0.05 l ipotesi nulla non si rigetta Variabili continue? Meglio Hoeffdingtest Misure di correlazione tra variabili nominali Coeff. di contingenza: quando le modalità sono maggiori di. Tavole quadrate. Coeff. di Cramer: quando le modalità sono maggiori di. Tavole rettangolari. Grado di associazione tra variabili 19
20 H 0 : la popolazione età e la popolazione "smoking history" sono indipendenti H1 : la popolazione età e la popolazione "smoking history" non sono indipendenti STATISTICA TEST Usa il logaritmo delle frequenze osservate. Non applicabile quando una cella è vuota. Strategia maximum likelihood. Confronto di due popolazioni gaussiane indipendenti. Esempio: Misure di porosità(%) di campioni di arenaria A B
21 Hanno la stessa media? H H : µ = µ 0 1 : µ µ 1 1 T -TEST Per effettuare questo test è necessario definire una variabile nominale etichetta che suddivide i dati nei gruppi, e poi una variabile che contiene l unione dei due campioni. 1
22 Selezionando T-testunpaired in ANALZED.
23 Statistica descrittiva dei due gruppi La statistica test è una variabile aleatoria T-student con gradi di libertà DF = n1 + n Essendo il p-value= > 0.005, non si rigetta l ipotesi nulla che i due campioni provengano da due popolazioni aventi la stessa media. H H Hanno la stessa varianza? : σ = σ 0 1 : σ σ 1 1 F -TEST Omogeneità della varianza 3
24 Distribuzione di Fisher S La statistica test è F= e dipende da gradi di libertà: la taglia S del numeratore n e quella del denominatore n 1 1 NB Entrambi questi TEST possono essere effettuati solo se le popolazioni da cui provengono i campioni sono GAUSSIANE (quindi è necessario verificare questa ipotesi con un test). Abbiamo visto come usare il test di Kolmogorov Smirnov per una distribuzione QUALSIASI in Excel. Solo per la distribuzione gaussiana, STATVIEW ha a disposizione una procedura che simula il KS test univariato, usando il KS test per il confronto di due campioni. 4
25 KS TEST PER IL CONFRONTO DELLE DISTRIBUZIONI DI DUE POPOLAZIONI L idea è quella di costruire le funzioni di ripartizioni empiriche per i due campioni e poi di valutare la distanza massima tra queste ultime 5
26 Anche per effettuare questo test è necessario definire una variabile nominale etichetta che suddivide i dati nei gruppi, e poi una variabile che contiene l unione dei due campioni. Essendo il p-value= > 0.005, non si rigetta l ipotesi nulla che i due campioni provengano da due popolazioni aventi la stessa distribuzione. Normality test 6
27 ? SIMULIAMO LA MEDESIMA PROCEDURA Generiamo un campione casuale da una legge gaussiana standard lo trasformiamo in un campione casuale proveniente da una popolazionegaussiana con media e varianza campionaria. 7
28 doppio click. 8
29 TRASFORMAZIONE DEL CAMPIONE GAUSSIANO STANDARD Si definisce una formula per la trasformazione del campione E infine si confrontano i due campioni così ottenuti con un KS normale 9
30 PER IL PRIMO GRUPPO. PER IL SECONDO GRUPPO. 30
31 T-paired test Campioni di calcare estratti da una cava sottoposti a un procedimento di purificazione. Si vuole determinare se il procedimento ha ridotto la gravità specifica (rapporto tra volumi rispetto a una sostanza presa come riferimento). La caratteristica di questo test è che vengono impiegate le STESSE unità statistiche. IN STATVIEW 31
32 Se una delle due popolazioni non è gaussiana e i dati sono unpaired MANN WHITNE TEST H : M = M Vengono confrontate le mediane H : M M Esempio: Osservazioni di Cu(Rame) in campioni di creta e pietra verde. Pietra verde Creta 791(1) 648() 536(3) 118(5) 501(4) 104(6) 7(7) 36(8) 0(9) Le osservazioni dei due campioni vengono combinate e ordinate dalla osservazione più piccola a quella più grande. Se i due campioni sono stati estratti casualmente dalla stessa popolazione ci si aspetta che rispetto alla sequenza dei ranghi, gli elementi di un campione appaiano distribuiti uniformemente. n1, ( n1, + 1) La statistica test è min{ Rx, R y} con Rx, y = n1n + Wx, y W = somma dei ranghi del I campione e W = somma dei ranghi del II campione x y Pesati rispetto alla legge uniforme { x, y } min { x, y} R U R U prime, Z-value R R stand. 3
33 Se una delle due popolazioni non è gaussiana e i dati sono paired WILCOON TEST Esempio: Contenuto di metallo in 13 cloni di pioppo che crescono in una zona inquinata, mi- Surato in agosto e novembre. Obbiettivo POP. GAUSSIANE POP. NON GAUSSIANE Descrivere un campione Media Confrontare un campione con un modello teorico Confrontare campioni paired Confrontare campioni unpaired Confrontare 3 o più campioni unmatched Confrontare 3 o più campioni matched Associazioni tra campioni Predizione deivalori tra due campioni Test T (un campione) Test T (paired) Test T (unpaired) One-way ANOVA Repeated Measure ANOVA Mediana Test dei segni Wilcoxon test Mann-Whitney Test Kruskal-Wallis test Friedman Test Correlazione di Pearson Correlazione di Spearman Regressione Regressione non parametrica 33
Statistica di base per l analisi socio-economica
Laurea Magistrale in Management e comunicazione d impresa Statistica di base per l analisi socio-economica Giovanni Di Bartolomeo gdibartolomeo@unite.it Definizioni di base Una popolazione è l insieme
DettagliStatistica multivariata Donata Rodi 17/10/2016
Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare
Dettagli3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17
C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica
DettagliPROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA
PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURA/TECNICA DI ANALISI DEI DATI SPECIFICAMENTE DESTINATA A STUDIARE LA RELAZIONE TRA UNA VARIABILE NOMINALE (ASSUNTA
DettagliEsercitazione del
Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36
DettagliUniversità del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica
Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Regressione Lineare e Correlazione Argomenti della lezione Determinismo e variabilità Correlazione Regressione Lineare
DettagliPresentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii
Sommario Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii xv Parte I Statistica descrittiva 1 Capitolo 1 Introduzione 3 Perché studiare statistica? 4
DettagliEsercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale)
Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale) Esercizio 1: Un indagine su 10.000 famiglie ha dato luogo, fra le altre, alle osservazioni riportate nella
DettagliMetodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale
DIPARTIMENTO DI SCIENZE AGRARIE E AMBIENTALI PRODUZIONE, TERRITORIO, AGROENERGIA Marco Acutis marco.acutis@unimi.it www.acutis.it CdS Scienze della Produzione e Protezione delle Piante (g59) CdS Biotecnologie
DettagliSommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25
Sommario Presentazione dell edizione italiana Prefazione xv xiii Capitolo 1 I dati e la statistica 1 Statistica in pratica: BusinessWeek 1 1.1 Le applicazioni in ambito aziendale ed economico 3 Contabilità
DettagliUniversità del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare
Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione
DettagliStatistica Compito A
Statistica Compito A Prova scritta del 3 Luglio 2015 1. Il seguente campione casuale si riferisce al numero di difetti riscontrati su 1 metro-quadrato di stoffa: 0 7 1 5 2 6 3 4 4 3 5 2 6 1 7 2 (a) Cosa
DettagliProva scritta di STATISTICA. CDL Biotecnologie. (Programma di Massimo Cristallo - A)
Prova scritta di STATISTICA CDL Biotecnologie (Programma di Massimo Cristallo - A) 1. Un associazione di consumatori, allo scopo di esaminare la qualità di tre diverse marche di batterie per automobili,
DettagliTest di ipotesi su due campioni
2/0/20 Test di ipotesi su due campioni Confronto tra due popolazioni Popolazioni effettive: unità statistiche realmente esistenti. Esempio: Confronto tra forze lavoro di due regioni. Popolazioni ipotetiche:
DettagliCOMPLEMENTI DI PROBABILITA E STATISTICA. 3 Crediti
CMPLEMENTI DI PRBABILITA E STATISTICA 3 Crediti Docente : Elvira Di Nardo (dinardo@unibas.it, 097-05890) Modalità di esame: Prova scritta alla fine del corso + Tesina (facoltativa) Testi consigliati: Manuale
DettagliRingraziamenti dell Editore
Indice Elenco dei simboli e delle abbreviazioni in ordine di apparizione Ringraziamenti dell Editore XI XVII 1 Introduzione FAQ e qualcos altro, da leggere prima 1 1.1 QuestoèunlibrodiStatistica....................
DettagliREGRESSIONE E CORRELAZIONE
REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.
DettagliSTATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo
STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)
DettagliSoluzione degli esercizi di riepilogo sul controllo statistico di qualità e sull ANOVA.
Soluzione degli esercizi di riepilogo sul controllo statistico di qualità e sull ANOVA.. Si tratta di un ANOVA a due fattori senza repliche. Gli effetti sono fissi sia sulle righe che sulle colonne. Effettuiamo
DettagliPrefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura
INDICE GENERALE Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura XI XIV XV XVII XVIII 1 LA RILEVAZIONE DEI FENOMENI
DettagliCorso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII
Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Un breve richiamo sul test t-student Siano A exp (a 1, a 2.a n ) e B exp (b 1, b 2.b m ) due set di dati i cui
DettagliTest per la correlazione lineare
10 Test per la correlazione lineare Istituzioni di Matematica e Statistica 2015/16 E. Priola 1 Introduzione alla correlazione lineare Problema: In base ai dati che abbiamo possiamo dire che c è una qualche
DettagliDistribuzioni e inferenza statistica
Distribuzioni e inferenza statistica Distribuzioni di probabilità L analisi statistica spesso studia i fenomeni collettivi confrontandoli con modelli teorici di riferimento. Tra di essi, vedremo: la distribuzione
DettagliAnalisi della varianza
Analisi della varianza Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona ANALISI DELLA VARIANZA - 1 Abbiamo k gruppi, con un numero variabile di unità statistiche.
DettagliUlteriori Conoscenze di Informatica e Statistica
ndici di forma Ulteriori Conoscenze di nformatica e Statistica Descrivono le asimmetrie della distribuzione Carlo Meneghini Dip. di fisica via della Vasca Navale 84, st. 83 ( piano) tel.: 06 55 17 72 17
DettagliProva scritta di Complementi di Probabilità e Statistica. 7 Dicembre 2012
Prova scritta di Complementi di Probabilità e Statistica 7 Dicembre. Un ingegnere vuole investigare se le caratteristiche di una superficie metallica sono influenzate dal tipo di pittura usata e dal tempo
DettagliMetodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo
Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è
DettagliStatistica Applicata all edilizia: il modello di regressione
Statistica Applicata all edilizia: il modello di regressione E-mail: orietta.nicolis@unibg.it 27 aprile 2009 Indice Il modello di Regressione Lineare 1 Il modello di Regressione Lineare Analisi di regressione
DettagliCorso di Psicometria Progredito
Corso di Psicometria Progredito 5. La correlazione lineare Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014 Sommario 1 Tipi di relazione
DettagliLEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell
LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Strumenti statistici in Excell Pacchetto Analisi di dati Strumenti di analisi: Analisi varianza: ad un fattore Analisi
DettagliApplicazioni statistiche e utilizzo del package statistico Spss - 7
Applicazioni statistiche e utilizzo del package statistico Spss - 7 CISI 27 gennaio 2005 ricercapsicologica@tiscali.it Illustrare le principali statistiche mono e bivariate. Valutare quando è opportuno
DettagliEsplorazione dei dati
Esplorazione dei dati Introduzione L analisi esplorativa dei dati evidenzia, tramite grafici ed indicatori sintetici, le caratteristiche di ciascun attributo presente in un dataset. Il processo di esplorazione
DettagliTeoria e tecniche dei test. Concetti di base
Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi
Dettagliviii Indice generale
Indice generale 1 Introduzione al processo di ricerca 1 Sommario 1 Il processo di ricerca 3 Concetti e variabili 5 Scale di misura 8 Test di ipotesi 10 Evidenza empirica 10 Disegni di ricerca 11 Sintesi
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri
DettagliStatistica descrittiva: misure di associazione
Statistica descrittiva: misure di associazione L analisi di regressione permette di esplorare le relazioni tra due insiemi di valori (p.e. i valori di due attributi di un campione) alla ricerca di associazioni.
DettagliFACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 21/09/2011
FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 1/9/11 ESERCIZIO 1 (+3++3) La seguente tabella riporta la distribuzione di frequenza dei valori di emoglobina nel sangue (espressi
DettagliΣ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica
13. Regressione lineare parametrica Esistono numerose occasioni nelle quali quello che interessa è ricostruire la relazione di funzione che lega due variabili, la variabile y (variabile dipendente, in
DettagliLezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo
UIVERSITA DEGLI STUDI DI BASILICATA FACOLTA DI ECOOMIA Corso di laurea in Economia Aziendale anno accademico 2012/2013 Lezioni di Statistica del 15 e 18 aprile 2013 Docente: Massimo Cristallo LA RELAZIOE
DettagliStatistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2010/2011 Statistica Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza
DettagliREGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori
REGRESSIONE lineare e CORRELAZIONE Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori Y X La NATURA e la FORZA della relazione tra variabili si studiano con la REGRESSIONE
DettagliDistribuzioni di probabilità
Distribuzioni di probabilità Distribuzioni di probabilità L analisi statistica spesso studia i fenomeni collettivi confrontandoli con modelli teorici di riferimento. Tra di essi, vedremo: la distribuzione
DettagliMETODO DEI MINIMI QUADRATI
METODO DEI MINIMI QUADRATI Torniamo al problema della crescita della radice di mais in funzione del contenuto di saccarosio nel terreno di coltura. Ripetendo varie volte l esperimento con diverse quantità
DettagliSTATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE
STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 2 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1.1
DettagliCAPITOLO 11 ANALISI DI REGRESSIONE
VERO FALSO CAPITOLO 11 ANALISI DI REGRESSIONE 1. V F Se c è una relazione deterministica tra due variabili,x e y, ogni valore dato di x,determinerà un unico valore di y. 2. V F Quando si cerca di scoprire
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative
DettagliIl modello di regressione lineare multipla. Il modello di regressione lineare multipla
Introduzione E la generalizzazione del modello di regressione lineare semplice: per spiegare il fenomeno d interesse Y vengono introdotte p, con p > 1, variabili esplicative. Tale generalizzazione diventa
DettagliEsercitazione di Statistica Indici di associazione
Esercitazione di Statistica Indici di associazione 28/10/2015 La relazione tra caratteri Indipendenza logica Quando si suppone che tra due caratteri non ci sia alcuna relazione di causa-effetto. Indipendenza
DettagliESERCITAZIONE IV - Soluzioni
umero di omicidi ESERCITAZIOE IV - Soluzioni Esercizio I. a),00 12,00 10,00 8,00 6,00 4,00 2,00 0,00 0 5 10 15 20 25 Popolazione povera (%) b) Poiché i due caratteri in analisi sono quantitativi per calcolare
DettagliDistribuzioni di Probabilità
Distribuzioni di Probabilità Distribuzioni discrete Distribuzione uniforme discreta Distribuzione di Poisson Distribuzioni continue Distribuzione Uniforme Distribuzione Gamma Distribuzione Esponenziale
DettagliAnalisi della varianza a una via
Analisi della varianza a una via Statistica descrittiva e Analisi multivariata Prof. Giulio Vidotto PSY-NET: Corso di laurea online in Discipline della ricerca psicologico-sociale SOMMARIO Modelli statistici
DettagliANOVA: ANALISI DELLA VARIANZA Prof. Antonio Lanzotti
UNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II DIPARTIMENTO DI INGEGNERIA AEROSPAZIALE D.I.A.S. STATISTICA PER L INNOVAZIONE a.a. 007/008 ANOVA: ANALISI DELLA VARIANZA Prof. Antonio Lanzotti A cura di: Ing.
DettagliSTATISTICA (modulo I - Statistica Descrittiva) Soluzione Esercitazione I
2. e 3. STATISTICA (modulo I - Statistica Descrittiva) Soluzione Esercitazione I 1. Le unità statistiche sono costituite dai singoli ristoranti, mentre la popolazione è costituita da tutte le unità del
DettagliVariabili aleatorie continue
Variabili aleatorie continue Per descrivere la distribuzione di una variabile aleatoria continua, non si può più assegnare una probabilità positiva ad ogni valore possibile. Si assume allora di poter specificare
DettagliCapitolo 6 La distribuzione normale
Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 6 La distribuzione normale Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università
DettagliProva scritta Affidabilità dei sistemi stocastici e controllo statistico di qualità 28 Marzo 2013
Prova scritta Affidabilità dei sistemi stocastici e controllo statistico di qualità 28 Marzo 2013 1. Un azienda che produce batterie per cellulari sta effettuando dei test per confrontare tre tipi diversi
DettagliUNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2013/2014. I Esonero - 29 Ottobre Tot.
UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2013/2014 I Esonero - 29 Ottobre 2013 1 2 3 4 5 6 7 8 Tot. Avvertenza: Svolgere ogni esercizio nello spazio assegnato,
Dettaglile scale di misura scala nominale scala ordinale DIAGNOSTICA PSICOLOGICA lezione si basano su tre elementi:
DIAGNOSTICA PSICOLOGICA lezione! Paola Magnano paola.magnano@unikore.it si basano su tre elementi: le scale di misura sistema empirico: un insieme di entità non numeriche (es. insieme di persone; insieme
DettagliCasa dello Studente. Casa dello Studente
Esercitazione - 14 aprile 2016 ESERCIZIO 1 Di seguito si riporta il giudizio (punteggio da 0 a 5) espresso da un gruppo di studenti rispetto alle diverse residenze studentesche di un Ateneo: a) Si calcolino
DettagliVariabili casuali multidimensionali
Probabilità e Statistica Esercitazioni a.a. 2006/2007 C.d.L.: Ingegneria per l Ambiente ed il Territorio, Ingegneria Civile, Ingegneria Gestionale, Ingegneria dell Informazione C.d.L.S.: Ingegneria Civile
DettagliEsercitazioni di Statistica
Esercitazioni di Statistica Stima Puntuale Prof. Livia De Giovanni statistica@dis.uniroma.it Esercizio In ciascuno dei casi seguenti determinare quale tra i due stimatori S e T per il parametro θ è distorto
DettagliCorso di Laurea in Ingegneria Informatica e Automatica (M-Z) Università di Roma La Sapienza
Corso di Laurea in Ingegneria Informatica e Automatica (M-Z) Università di Roma La Sapienza CALCOLO DELLE PROBABILITÀ E STATISTICA ESAME DEL 16/06/2016 NOME: COGNOME: MATRICOLA: Esercizio 1 Cinque lettere
DettagliProbabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva
Probabilità classica Distribuzioni e leggi di probabilità La probabilità di un evento casuale è il rapporto tra il numero dei casi favorevoli ed il numero dei casi possibili, purchè siano tutti equiprobabili.
DettagliSCOPO DELL ANALISI DI CORRELAZIONE
CORRELAZIONE 1 SCOPO DELL ANALISI DI CORRELAZIONE STUDIARE LA RELAZIONE TRA DUE VARIABILI X E Y 2 diagrammi di dispersione un diagramma di dispersione (o grafico di dispersione) èuna rappresentazione grafica
DettagliCapitolo 6. La distribuzione normale
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 6 La distribuzione normale Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università
DettagliRegressione lineare multipla CORSO DI ANALISI DEI DATI Anno Accademico 2009/2010, I ciclo
Regressione lineare multipla CORSO DI ANALISI DEI DATI Anno Accademico 2009/2010, I ciclo 1 Controllo di ipotesi sui parametri In questo contesto risulta necessario avvalersi dell assunzione di normalita
DettagliAssociazione tra caratteri quantitativi: gli indici di correlazione
Associazione tra caratteri quantitativi: gli indici di correlazione Per correlazione si intende una relazione tra due variabili tale che a ciascun valore della prima variabile corrisponda con una certa
DettagliMatricola: Corso: 1. (4 Punti) Stimare la variazione del reddito quando il prezzo del prodotto finale raddoppia.
Facoltà di Economia Statistica Esame 3-12/04/2010: A Cognome, Nome: Matricola: Corso: Problema 1. Per 5 imprese imprese è stato rilevato il reddito quinquennale medio (in milioni di euro), y, e il corrispondente
DettagliRELAZIONE FINALE DEL DOCENTE. Materia: MATEMATICA E COMPLEMENTI DI MATEMATICA Classe 4BPT A. S. 2015/2016
RELAZIONE FINALE DEL DOCENTE Materia: MATEMATICA E COMPLEMENTI DI MATEMATICA Classe 4BPT A. S. 2015/2016 In relazione alla programmazione curricolare sono stati conseguiti, in termini di livello medio,
DettagliVariabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.
Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:
DettagliStudio dell aleatorietà: : proprietà di indipendenza ed uniformità. Daniela Picin
Studio dell aleatorietà: : proprietà di indipendenza ed uniformità Daniela Picin TEST TEORICI: studio della media, della varianza e della correlazione del primo ordine, studio della struttura reticolare.
DettagliCalcolo delle Probabilità 2
Prova d esame di Calcolo delle Probabilità 2 Maggio 2006 Sia X una variabile aleatoria distribuita secondo la densità seguente ke x 1 x < 0 f X (x) = 1/2 0 x 1. 1. Determinare il valore del parametro reale
DettagliPROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE
PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE 1. Distribuzione congiunta Ci sono situazioni in cui un esperimento casuale non si può modellare con una sola variabile casuale,
DettagliIl confronto fra medie
L. Boni Obiettivo Verificare l'ipotesi che regimi alimentari differenti non producano mediamente lo stesso effetto sulla gittata cardiaca Ipotesi nulla IPOTESI NULLA La dieta non dovrebbe modificare in
DettagliTEST NON PARAMETRICO DI MANN-WHITNEY
TEST NON PARAMETRICO DI MANN-WHITNEY Questo test viene può essere utilizzato come test di confronto tra due campioni in maniera analoga ai test ipotesi parametrici di confronto medie (test Z se la varianza
DettagliInferenza statistica II parte
Inferenza statistica II parte Marcella Montico Servizio di epidemiologia e biostatistica Test statistici II parte Variabili quantitative Caso 1 Variabile Dipendente = quantitativa Variabile Indipendente
DettagliEsercitazione 4 Distribuzioni campionarie e introduzione ai metodi Monte Carlo
Esercitazione 4 Distribuzioni campionarie e introduzione ai metodi Monte Carlo 1. Gli studi di simulazione possono permetterci di apprezzare alcune delle proprietà di distribuzioni campionarie ricavate
DettagliStatistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2011/2012 Statistica Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate.
DettagliSintesi dei dati in una tabella. Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6)
Sintesi dei dati in una tabella Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6) Sintesi dei dati Spesso si vuole effettuare una sintesi dei dati per ottenere indici
DettagliIL CRITERIO DELLA MASSIMA VEROSIMIGLIANZA
Metodi per l Analisi dei Dati Sperimentali AA009/010 IL CRITERIO DELLA MASSIMA VEROSIMIGLIANZA Sommario Massima Verosimiglianza Introduzione La Massima Verosimiglianza Esempio 1: una sola misura sperimentale
DettagliStatistiche e relazioni
tatistiche descrittive per frequenze e misure Frequenze e misure Per le frequenze e le misure, molte di queste statistiche perdono senso. In compenso, esistono indici appropriati, inutilizzabili per i
DettagliPremessa: la dipendenza in media
Premessa: la dipendenza in media Supponiamo di avere K diversi livelli di un fattore che potrebbero influire su una determinata variabile. Per esempio supponiamo di domandarci se la diversificazione (intesa
DettagliIl campionamento e l inferenza. Il campionamento e l inferenza
Il campionamento e l inferenza Popolazione Campione Dai dati osservati mediante scelta campionaria si giunge ad affermazioni che riguardano la popolazione da cui essi sono stati prescelti Il campionamento
DettagliSerie storiche Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007
Serie storiche Introduzione Per alcuni dataset, l attributo target è soggetto ad un evoluzione temporale e risulta associato ad istanti di tempo successivi. I modelli di analisi delle serie storiche si
DettagliCaratterizzazione dei consumi energetici (parte 3)
ESERCITAZIONE 4 Caratterizzazione dei consumi energetici (parte 3) 4.1 CuSum: elementi di analisi statistica Il diagramma delle somme cumulate dei residui in funzione del tempo (CuSum) può essere in generale
DettagliSTATISTICA Disciplina scien tifica che fornisce strumenti per l interpretazione delle informazioni contenute in insiemi di dati relativi a
STATISTICA Disciplina scien tifica che fornisce strumenti per l interpretazione delle informazioni contenute in insiemi di dati relativi a VARIABILI CASUALI VARIABILE Qualunque fenomeno espri mibile numericamente
DettagliLezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria
Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata Prof. Massimo Aria aria@unina.it Il concetto di interpolazione In matematica, e in particolare in
DettagliCapitolo 12. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 12.1: Suggerimento
Capitolo Suggerimenti agli esercizi a cura di Elena Siletti Esercizio.: Suggerimento Per verificare se due fenomeni sono dipendenti in media sarebbe necessario confrontare le medie condizionate, in questo
DettagliAnalisi della correlazione canonica
Analisi della correlazione canonica Su un collettivo di unità statistiche si osservano due gruppi di k ed m variabili L analisi della correlazione canonica ha per obiettivo lo studio delle relazioni di
DettagliStatistica Descrittiva III
Serie Bi-variate Statistica Descrittiva III Definizioni Serie statistiche bi-variate Rappresentazioni tabellari e grafiche Indici di posizione e di variabilità Dipendenza lineare: retta di regressione
DettagliCampionamento La statistica media campionaria e la sua distribuzione. Paola Giacomello Dip. Scienze Sociali ed Economiche Uniroma1
Campionamento La statistica media campionaria e la sua distribuzione 1 Definisco il problema da studiare: es. tempo di percorrenza tra abitazione e università Carattere: tempo ossia v.s. continua Popolazione:
DettagliStatistica. Esercitazione 16. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice
Esercitazione 16 Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () 1 / 24 Studio della relazione tra due variabili Commonly Asked Questions Qual è la relazione tra la spesa
DettagliCORSO INTENSIVO ESTIVO DI ALBA DI CANAZEI STATISTICA. A. A. 2013/2014 (Prof. Marco Minozzo;
CORSO INTENSIVO ESTIVO DI ALBA DI CANAZEI STATISTICA A. A. 2013/2014 (Prof. Marco Minozzo; marco.minozzo@univr.it) Il corso intensivo di "Statistica" (14E07) che si terrà dal 27 luglio al 9 agosto 2014
DettagliStatistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill
Statistica - metodologie per le scienze economiche e sociali /e S Borra, A Di Ciaccio - McGraw Hill Es 6 Soluzione degli esercizi del capitolo 6 In base agli arrotondamenti effettuati nei calcoli, si possono
DettagliIl metodo dei minimi quadrati. Molto spesso due grandezze fisiche x e y, misurabili direttamente, sono legate tra loro da una legge del tipo:
Il metodo dei minimi quadrati Molto spesso due grandezze fisiche x e y, misurabili direttamente, sono legate tra loro da una legge del tipo: Dove A e B sono costanti y = A + Bx (ad esempio in un moto uniformemente
DettagliSTATISTICA DESCRITTIVA (variabili quantitative)
STATISTICA DESCRITTIVA (variabili quantitative) PRIMO ESEMPIO: Concentrazione di un elemento chimico in una roccia. File di lavoro di STATVIEW Cliccando sul tasto del pane control si ottiene il cosiddetto
Dettaglilezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1
lezione n. 6 (a cura di Gaia Montanucci) METODO MASSIMA VEROSIMIGLIANZA PER STIMARE β 0 E β 1 Distribuzione sui termini di errore ε i ε i ~ N (0, σ 2 ) ne consegue : ogni y i ha ancora distribuzione normale,
DettagliTest F per la significatività del modello
Test F per la significatività del modello Per verificare la significatività dell intero modello si utilizza il test F Si vuole verificare l ipotesi H 0 : β 1 = 0,, β k = 0 contro l alternativa che almeno
DettagliScheda Corso di STATISTICA (D.M. 270 per 9 CFU) Anno Accademico 2014/2015 (versione in Italiano)
Scheda Corso di STATISTICA (D.M. 270 per 9 CFU) Anno Accademico 2014/2015 (versione in Italiano) FACOLTA :ECONOMIA CORSI DI LAUREA: Economia e Commercio, Psicoeconomia e Scienze Bancarie ed Assicurative
DettagliProva scritta di Affidabilità dei sistemi e controllo statistico di qualità
Prova scritta di Affidabilità dei sistemi e controllo statistico di qualità 18 Febbraio 2016 1. La probabilità di errore nella trasmissione di una cifra binaria attraverso un certo canale di comunicazione
Dettagli