Statistica descrittiva in due variabili
|
|
- Cosimo Petrucci
- 5 anni fa
- Visualizzazioni
Transcript
1 Statistica descrittiva in due variabili Dott Nicola Pintus AA
2 Indichiamo con U la popolazione statistica e con u i le unità statistiche Ad ogni unità statistica associamo i caratteri osservati x i, y i u i (x i, y i ) Otteniamo quindi due serie di n-uple ordinate X = (x 1, x 2, ) Y = (y 1, y 2, )
3 Fino ad ora ad ogni unità statistica associavamo un solo carattere osservato Ora consideriamo due caratteri per ogni unità statistica Primo problema Come estendere la rappresentazione tabellare a questa situazione? Secondo problema Con quale probabilità posso affermare che i due caratteri dipendono? Terzo problema Quale tipo di dipendenza sussiste fra le due variabili?
4 Tabelle a due entrate Esempio Abbiamo misurato altezza e peso in un gruppo di 10 bambini che frequentano un corso di arti marziali: (u 1, 91, 17) (u 2, 95, 19) (u 3, 99, 27) (u 4, 100, 29) (u 5, 94, 21) (u 6, 96, 19) (u 7, 110, 22) (u 8, 99, 25) (u 9, 127, 32) (u 10, 92, 17) Costruiamo le modalità per l altezza e le modalità per il peso M 1 = [90, 110) M 2 = [110, 130) N 1 = [15, 25) N 2 = [25, 35)
5 Tabelle a due entrate Distribuzioni di frequenze assolute Coloriamo i caratteri a seconda della modalità di appartenenza: (u 1, 91, 17) (u 2, 95, 19) (u 3, 99, 27) (u 4, 100, 29) (u 5, 94, 21) (u 6, 96, 19) (u 7, 110, 22) (u 8, 99, 25) (u 9, 127, 32) (u 10, 92, 17) Creiamo la tabella a due entrate, detta tabella di contingenza: P A [90, 110) [110, 130) [15, 25) 5 1 [25, 35) 3 1 Le entrate di questa tabella sono le frequenze assolute osservate Attenzione! La rappresentazione tabellare dipende dalle modalità scelte per i due caratteri
6 Tabelle a due entrate Distribuzioni marginali P A [90, 110) [110, 130) [15, 25) [25, 35) In rosso abbiamo indicato la distribuzione marginale orizzontale
7 Tabelle a due entrate Distribuzioni condizionate P A [90, 110) [110, 130) [15, 25) [25, 35) In rosso abbiamo indicato la distribuzione di A condizionata ad avere la variabile P nell intervallo [15, 25)
8 Variabili indipendenti Definizione Due variabili sono indipendenti se le distribuzioni orizzontali relative (eventualmente trasformate in percentuali) coincidono con la distribuzione marginale orizzontale P A [90, 110) [110, 130) [15, 25) 83% 17% [25, 35) 75% 25% 80% 20%
9 Variabili indipendenti Se alle variabili X e Y si associano rispettivamente le modalità {N 1, } e {M 1, } allora Definizione X Y M 1 M 2 M h N 1 f 11 f 12 f 1h f 1 N 2 f 21 f 22 f 2h f 2 N k f k1 f k2 f kh f k f 1 f 2 f h N X e Y sono indipendenti se f 1 (f 11, ), f 2 (f 21, ), f k (f k1, ) e 1 N (f 1, f 2, ) coincidono
10 Variabili indipendenti Se X e Y sono indipendenti allora ovvero f ij = f j f i N f ij = f i f j N i, j i, j Definizione Indichiamo con ν ij = f i f j N le frequenze attese Ne discende che due variabili sono indipendenti se le frequenze osservate coincidono con quelle attese
11 Dipendenza fra variabili Il test χ 2 Problema: capire se le variabili X e Y dipendono Le variabili X e Y dipendono se le frequenze ottenute f ij sono molto differenti da quelle attese ν ij Una proposta per misurare quanto le frequenze osservate sono diverse dalle frequenze attese è il calcolo di χ 2 = k h i=1 j=1 (f ij ν ij ) 2 ν ij La quantità χ 2 è proporzionale allo scarto quadratico medio fra le frequenze osservate e le frequenze attese pesato rispetto alle frequenze attese
12 Dipendenza fra variabili Il test χ 2 : l esempio guida Esempio Dobbiamo studiare una macchina diagnostica sui tumori Consideriamo un campione di 30 persone di cui 15 sane e 15 malate Abbiamo ottenuto i seguenti risultati: Positivo Negativo Malato Sano Ricaviamo la tabella delle frequenze attese: Positivo Negativo Malato Sano 85 65
13 Dipendenza fra variabili Il test χ 2 : l esempio guida Calcoliamo χ 2 : χ 2 = (12 85) (3 65) (5 85) (10 65) Abbiamo calcolato χ 2 Come procediamo adesso? Da un punto di vista qualitativo se χ 2 è grande allora X e Y sono dipendenti Al contrario se χ 2 è vicino a 0 allora X e Y sono indipendenti Il test χ 2 ci permette di calcolare con che fiducia si può affermare che le due variabili sono dipendenti
14 Dipendenza fra variabili Il test χ 2 : l esempio guida Prima dobbiamo calcolare il numero dei gradi di libertà: df = (h 1)(k 1) Per l esempio che stiamo considerando abbiamo che df = 1
15 Dipendenza fra variabili Il test χ 2 : l esempio guida Per il calcolo di valore di fiducia dobbiamo consultare la tabella dei valori critici Concentriamoci alla riga per cui si ha df = 1 Abbiamo ottenuto χ 2 665: in tale riga consideriamo il più grande valore minore di χ 2 α df Nella tabella si ha 6635 a cui corrisponde α = 001 Il valore α% è la percentuale di errore che si commette nell affermare che due variabili sono dipendenti
16 Dipendenza fra variabili Il test χ 2 : l esempio guida α% è la percentuale di sfiducia, allora (1 α)% è la percentuale di fiducia di dipendenza delle due variabili Per l esempio che stiamo considerando abbiamo che F = = 99% Dunque possiamo affermare che le due variabili sono dipendenti con una fiducia del 99%
17 Dipendenza fra variabili Il test χ 2 Esempio Vogliamo confrontare l efficacia di due farmaci che curano la stessa malattia I due farmaci hanno diversi prezzi Vogliamo capire se il prezzo del farmaco sia dipendente dall efficacia del farmaco Su un campione di 250 malati otteniamo i seguenti risultati: Farmaco caro Farmaco economico Guarigione Non guarigione 5 46
18 Dipendenza fra variabili Il test χ 2 Determiniamo le frequenze attese: Farmaco caro Farmaco economico Guarigione Non guarigione Calcoliamo χ 2 : χ 2 = (398 45) ( ) Il numero dei gradi di libertà è 1 + (102 5) (408 46)
19 Dipendenza fra variabili Il test χ 2 Per il calcolo di valore di fiducia dobbiamo consultare la tabella dei valori critici Concentriamoci alla riga per cui si ha df = 1 Abbiamo ottenuto χ 2 416: in tale riga consideriamo il più grande valore minore di χ 2 α df Il livello di fiducia è F = = 95%
20 Dipendenza fra variabili Il test χ 2 Esempio Sono dati i vettori X = (3, 0, 3, 4, 9, 9, 2, 2) Y = (2, 1, 1, 4, 4, 8, 2, 2) Calcolare media, mediana e varianza Calcolare con che fiducia le variabili sono dipendenti dividendo l ampiezza di X e Y nei due sottointervalli: valori minori della media; valori maggiori o uguali della media
21 Dipendenza fra variabili Il test χ 2 Avremo e X = 4 mediana(x ) = 3 Var(X ) = 95 Y = 3 mediana(y ) = 2 Var(Y ) = 475 Per il calcolo della fiducia tramite il test χ 2 abbiamo le seguenti modalità: per la variabile X per la variabile Y M 1 = {X < 4}, M 2 = {X 4} N 1 = {X < 3}, N 2 = {X 3}
22 Dipendenza fra variabili Il test χ 2 Ricaviamo la tabella di contingenza: Y X M 1 M 2 N N Ricaviamo la tabella delle frequenza attese: Y X M 1 M 2 N N
23 Dipendenza fra variabili Il test χ 2 Ricaviamo il valore di χ 2 : χ 2 = (5 3125) (0 1875) (0 1875) (3 1125) = 8 Il numero dei gradi di libertà è 1 Consultiamo la tabella dei valori critici nella riga in cui si ha df = 1 α df Il valore più grande minore di χ 2 è nella colonna per cui α = 0005 Quindi il livello di fiducia è F = 1 α = 995%
24 Diagramma di dispersione Supponiamo di aver misurato su un campione statistico U due variabili statistiche X e Y di tipo quantitativo X = (x 1, x 2,, x N ) Y = (y 1, y 2,, y N ) Vogliamo capire se è possibile determinare una funzione y = f (x) tale che approssimi bene l associazione x i y i
25 Diagramma di dispersione Consideriamo l insieme delle coppie {(x i, y i )} e disegnamo questi punti in un piano cartesiano Esempio sull altezza e peso dei 10 bambini del corso di arti marziali y x
26 La regressione lineare Il diagramma di dispersione può farci intuire che tipo di funzione f i dati seguono Andremo ad analizzare una situazione particolare, cercando di capire come risolvere i due seguenti problemi: trovare un modo quantitativo per decidere quanto il diagramma di dispersione sia sufficientemente vicino a seguire un andamento di una retta; se il diagramma di dispersione è sufficientemente vicino a seguire l andamento di una retta allora trovare l equazione di questa retta Quindi il caso particolare che stiamo analizzando è quello per cui f è l equazione di una retta
27 La covarianza Definizione Date due serie di dati X = (x 1,, x N ) e Y = (y 1,, y N ) definiamo covarianza di X e Y Cov(X, Y ) = 1 N N (x i X )(y i Y ) = XY X Y i=1 La covarianza di X e Y è un numero che fornisce una misura di quanto le due varino assieme (ossia è una misura della loro dipendenza) Cov(X, Y ) > 0 significa che all aumentare (rispettivamente diminuire) di una variabile anche l altra aumenta (risp diminuisce) Cov(X, Y ) < 0 significa che all aumentare (rispettivamente diminuire) di una variabile anche l altra diminuisce (risp aumenta)
28 Diagramma di dispersione Covarianza positiva
29 Diagramma di dispersione Covarianza negativa
30 Diagramma di dispersione Covarianza nulla
31 Diagramma di dispersione Covarianza Esempio Calcoliamo Cov(X, Y ) in cui Le medie sono X = 4 e Y = 5 X = (8, 3, 4, 1) Y = (2, 9, 6, 3) x k y k x k X y k Y (x k X )(y k Y ) Cov(X, Y ) = i=1 (x i X )(y i Y ) = 10 4 = 25
32 Diagramma di dispersione Coefficiente di correlazione lineare Definizione Date due serie di dati X = (x 1,, x N ) e Y = (y 1,, y N ) definiamo il coefficiente di correlazione lineare di X e Y A volte viene indicato anche con r ρ(x, Y ) = Cov(X, Y ) σ X σ Y ρ(x, Y ) è un numero compreso fra 1 e 1 Questo coefficiente è un indice che esprime un eventuale relazione di linearità fra X e Y Se ρ 1 allora fra i caratteri sussiste un legame lineare Teorema Se X e Y sono variabili indipendenti allora ρ(x, Y ) = 0
33 Diagramma di dispersione Coefficiente di correlazione lineare 4 2 ρ = ρ = ρ = ρ = ρ =
34 Diagramma di dispersione La retta di regressione lineare Dobbiamo cercare di risolvere il problema di individuare quanto due variabili dipendano da una legge di tipo lineare Quale è la migliore retta y = mx + q che approssima i dati? y x
35 Diagramma di dispersione La retta di regressione lineare y (x k, mx k + q) P k = (x k, y k ) x Per ogni punto del diagramma di dispersione misuriamo la differenza fra l ordinata del punto P k = (x k, y k ) e l ordinata del punto sulla retta di ascissa x k Otteniamo il vettore ɛ in cui ɛ k = y k (mx k + q) ɛ = (ɛ 1,, ɛ N )
36 Diagramma di dispersione La retta di regressione lineare La migliore retta, ovvero quella che chiameremo retta di regressione, sarà quella per cui il vettore degli errori verticali ɛ è tale che ɛ = 0; Var(ɛ) è la più piccola possibile Si può dimostrare che tale retta ha equazione: y Y = Cov(X, Y ) Var(X ) ( x X )
37 Diagramma di dispersione La retta di regressione lineare Questione: ma se calcolassimo la retta considerando gli errori orizzontali, la retta di regressione che otteniamo è uguale? Non necessariamente Si può dimostrare che la retta che rende nulla la media degli errori orizzontali e la varianza la più piccola ha equazione y Y = Var(Y ) ( ) x X Cov(X, Y )
38 Diagramma di dispersione La retta di regressione lineare Dunque, otteniamo due rette di regressione, l una che utilizza gli errori verticali e l altra che utilizza gli errori orizzontali retta sulla X y Y = m X ( x X ) m X = Cov(X,Y ) Var(X ) retta sulla Y y Y = m Y ( x X ) my = Var(Y ) Cov(X,Y )
39 Diagramma di dispersione La retta di regressione lineare Esempio Consideriamo i due vettori X = (1, 2, 1, 3, 2, 1) Y = (1, 3, 2, 3, 2, 3) Trovare le rette di regressione Facilmente troviamo che X = 5 3 Y = 7 3
40 Diagramma di dispersione La retta di regressione lineare Esempio Calcoliamo Var(X ), Var(Y ) e Cov(X, Y ) Quindi abbiamo che x k x k X y k y k Y = = = = = = = = = = = = 2 3 Cov(X, Y ) = 5 18, Var(X ) = 5 9, Var(Y ) = 5 9
41 Diagramma di dispersione La retta di regressione lineare La retta di regressione sulla X è y 7 3 = 5 12 La retta di regressione sulla Y è y 7 3 = 12 5 ( x 5 ) 3 ( x 5 ) y r Y r X x
42 Diagramma di dispersione La retta di regressione lineare Ritorniamo al problema che stiamo risolvendo: quando il diagramma di dispersione è sufficientemente vicino ad essere il grafico di una retta? Quando le due rette di regressione approssimativamente coincidono Come troviamo una misura di ciò? Andremo a misurare l angolo θ che le due rette formano: 4 y r Y 3 2 θ r X 1 x
43 Diagramma di dispersione La retta di regressione lineare Se θ 0 allora le due rette hanno i coefficienti angolari quasi uguali (m X m Y ), la nuvola dei dati può essere ben rappresentata dall unica retta di regressione Più θ è maggiore di 0 più la nuvola dei dati non può essere rappresentata dalle rette di regressione lineare θ 0 θ
44 Diagramma di dispersione La retta di regressione lineare Consideriamo la quantità: Allora m X m Y m X m Y = Cov(X, Y ) Var(X ) Var(Y ) Cov(X, Y ) = Cov(X, Y )2 Var(X )Var(Y ) = ( ) Cov(X, Y ) 2 σ X σ Y Quindi m X m Y = ( ) Cov(X, Y ) 2 = ρ(x, Y ) 2 σ X σ Y
45 Diagramma di dispersione La retta di regressione lineare Definizione Date due serie di dati X = (x 1,, x N ) e Y = (y 1,, y N ) definiamo l indice di determinazione o coefficiente di determinazione di X e Y la quantità ρ(x, Y ) 2 Il valore ρ(x, Y ) 2 rappresenta una percentuale di quanta parte di variazione di un carattere è spiegata dal legame lineare con l altro carattere
46 Diagramma di dispersione La retta di regressione lineare Esempio Sono dati i vettori X = (1, 2, 3, 4) Y = (05, 2, 27, 3) Disegnare in un diagramma di dispersione i dati Ricavare le rette di regressione di X Ricavare il coefficiente di determinazione e dire se i dati seguono una legge di tipo lineare
47 Diagramma di dispersione La retta di regressione lineare Il diagramma di dispersione è y x Abbiamo che X = 5 2 Y = Var(X ) = 5 4 Var(Y ) = Cov(X, Y ) = 41 40
48 Diagramma di dispersione La retta di regressione lineare Da cui abbiamo che y = (x 5 2 ) e y = (x 5 2 ) y r Y r X x Poi abbiamo che ρ(x, Y ) 2 90%
49 Diagramma di dispersione La retta di regressione lineare Esempio Sono dati i vettori X = (0, 1, 2) Y = (01, 09, 22) Disegnare in un diagramma di dispersione i dati Ricavare le rette di regressione Ricavare il coefficiente di determinazione e dire se i dati seguono una legge di tipo lineare
50 Diagramma di dispersione La retta di regressione lineare Il diagramma di dispersione è 2 y x Abbiamo che X = 1 Y = Var(X ) = 2 3 Var(Y ) = Cov(X, Y ) = 21 20
51 Diagramma di dispersione La retta di regressione lineare Da cui abbiamo che y = 21 (x 1) 20 e 16 y 15 = 337 (x 1) y r Y r X Poi abbiamo che ρ(x, Y ) 2 98% x
52 Esercizio Un ricercatore era interessato a studiare l effetto di diverse dosi di un farmaco sulla frequenza delle pulsazioni umane Nell esperimento sono state usate quattro dosi A ognuna delle dosi erano state abbinate in modo casuale tre persone Dopo aver registrato le pulsazioni di ogni individuo a priori, ai soggetti è stata somministrata la dose prevista Le pulsazioni furono registrate dopo un ora I cambiamenti nelle pulsazioni in battiti al minuto sono riportati nella tabella qui sotto Dose (ml/kg peso corporeo) Cambiamento pulsazioni (bpm) Dose (ml/kg peso corporeo) Cambiamento pulsazioni (bpm) Per semplicità di esposizione la tabella è stata divisa in due 1 Calcolare l equazione delle rette di regressione del cambiamento delle pulsazioni in funzione della dose assunta 2 Calcolare l indice di determinazione e commentare il risultato
Statistica descrittiva in due variabili
Statistica descrittiva in due variabili 1 / 65 Statistica descrittiva in due variabili 1 / 65 Supponiamo di misurare su un campione statistico due diverse variabili X e Y. Indichiamo come al solito con
DettagliStatistica descrittiva in due variabili
1 / 69 Statistica descrittiva in due variabili Supponiamo di misurare su un campione statistico due diverse variabili X e Y. Indichiamo come al solito con X = (x 1,...,x N ) Y = (y 1,...,y N ) i valori
Dettagli7. STATISTICA DESCRITTIVA
7. STATISTICA DESCRITTIVA Quando si effettua un indagine statistica si ha a che fare con un numeroso insieme di oggetti, detto popolazione del quale si intende esaminare una o più caratteristiche (matricole
DettagliSCOPO DELL ANALISI DI CORRELAZIONE
CORRELAZIONE 1 SCOPO DELL ANALISI DI CORRELAZIONE STUDIARE LA RELAZIONE TRA DUE VARIABILI X E Y 2 diagrammi di dispersione un diagramma di dispersione (o grafico di dispersione) èuna rappresentazione grafica
DettagliEsercizi di statistica
Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..
DettagliMatematica Lezione 22
Università di Cagliari Corso di Laurea in Farmacia Matematica Lezione 22 Sonia Cannas 14/12/2018 Indici di posizione Indici di posizione Gli indici di posizione, detti anche misure di tendenza centrale,
DettagliSTATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE
STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 2 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1.1
DettagliLa media e la mediana sono indicatori di centralità, che indicano un centro dei dati.
La media e la mediana sono indicatori di centralità, che indicano un centro dei dati. Un indicatore che sintetizza in un unico numero tutti i dati, nascondendo quindi la molteplicità dei dati. Per esempio,
DettagliREGRESSIONE E CORRELAZIONE
REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.
DettagliCOME SI STUDIANO MOLTISSIME MISURE?
COME SI STUDIANO MOLTISSIME MISURE? Pb1 In una indagine sanitaria si riscontrano i seguenti dati, relativamente ad un certo tipo di infezione batterica: Area immuni a rischio infetti Nord 46 12 25 Centro
DettagliDispensa di Statistica
Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza
DettagliStatistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2010/2011 Statistica Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza
DettagliRegressione & Correlazione
Regressione & Correlazione Monia Ranalli Ranalli M. Dipendenza Settimana # 4 1 / 20 Sommario Regressione Modello di regressione lineare senplice Stima dei parametri Adattamento del modello ai dati Correlazione
DettagliVogliamo determinare una funzione lineare che meglio approssima i nostri dati sperimentali e poter decidere sulla bontà di questa approssimazione.
S.S.I.S. TOSCANA F.I.M. II anno FUNZIONI DI REGRESSIONE E METODO DEI MINIMI QUADRATI Supponiamo di star conducendo uno studio sulla crescita della radice di mais in funzione del contenuto di saccarosio
DettagliMETODO DEI MINIMI QUADRATI
METODO DEI MINIMI QUADRATI Torniamo al problema della crescita della radice di mais in funzione del contenuto di saccarosio nel terreno di coltura. Ripetendo varie volte l esperimento con diverse quantità
DettagliFondamenti e metodi analisi empirica nelle scienze sociali
CORSO DI FONDAMENTI E METODI PER L'ANALISI EMPIRICA NELLE SCIENZE SOCIALI Distribuzioni statistiche multiple AA 2017/2018 1. Introduzione: il processo di rilevazione e le distribuzioni statistiche. 2.
DettagliCorso in Statistica Medica
Corso in Statistica Medica Introduzione alle tecniche statistiche di elaborazione dati Regressione e correlazione Dott. Angelo Menna Università degli Studi di Chieti G. d Annunziod Annunzio Anno Accademico
DettagliTest per la correlazione lineare
10 Test per la correlazione lineare Istituzioni di Matematica e Statistica 2015/16 E. Priola 1 Introduzione alla correlazione lineare Problema: In base ai dati che abbiamo possiamo dire che c è una qualche
DettagliCORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Associazione, correlazione e dipendenza tra caratteri In un collettivo di 11 famiglie è stata
DettagliEsercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale)
Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale) Esercizio 1: Un indagine su 10.000 famiglie ha dato luogo, fra le altre, alle osservazioni riportate nella
DettagliCorso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010.
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010 Statistica Esercitazione 4 12 maggio 2010 Dipendenza in media. Covarianza e
DettagliLa regressione lineare. Rappresentazione analitica delle distribuzioni
La regressione lineare Rappresentazione analitica delle distribuzioni Richiamiamo il concetto di dipendenza tra le distribuzioni di due caratteri X e Y. Ricordiamo che abbiamo definito dipendenza perfetta
DettagliPROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE
Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) PROBABILITÀ SCHEDA
DettagliCORSO DI STATISTICA (parte 2) - ESERCITAZIONE 3
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 3 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. La variabile casuale normale Da un analisi di bilancio è emerso che, durante i giorni feriali
DettagliDistribuzioni secondo due caratteri. Rappresentazioni e prime sintesi
Distribuzioni secondo due caratteri Rappresentazioni e prime sintesi Rappresentazioni delle distribuzioni doppie Quando per ogni unità del collettivo rileviamo due caratteri otteniamo una Esempio. Ad alcuni
DettagliRegressione Lineare Semplice e Correlazione
Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri
DettagliLa media e la mediana sono indicatori di centralità, che indicano un centro dei dati.
La media e la mediana sono indicatori di centralità, che indicano un centro dei dati. Un indicatore che sintetizza in un unico numero tutti i dati, nascondendo quindi la molteplicità dei dati. Per esempio,
DettagliCapitolo 2. Cenni di geometria analitica nel piano
Capitolo Cenni di geometria analitica nel piano 1 Il piano cartesiano Il piano cartesiano è una rappresentazione grafica del prodotto cartesiano R = R R La rappresentazione grafica è possibile se si crea
DettagliEsercizi su Regressione e Connessione
Esercizi su Regressione e Connessione Stefano Cabras 31 marzo 2009 Sommario Questa serie di esercizi è principalmente incentrata sulla regressione e la connessione, tuttavia in alcuni esercizi le soluzioni
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative
DettagliArgomenti della lezione:
Lezione 7 Argomenti della lezione: La regressione semplice Il modello teorico Il calcolo dei parametri Regressione lineare Esamina la relazione lineare tra una o più variabili esplicative (o indipendenti,
DettagliVariabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.
Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:
DettagliSTATISTICA. Esercitazione 5
STATISTICA Esercitazione 5 Esercizio 1 Ad un esame universitario sono stati assegnati in modo casuale due compiti diversi con i seguenti risultati: Compito A Compito B Numero studenti 102 105 Media dei
DettagliLa statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci
La statistica Elaborazione e rappresentazione dei dati Gli indicatori statistici Introduzione La statistica raccoglie ed analizza gruppi di dati (su cose o persone) per trarne conclusioni e fare previsioni
DettagliESERCITAZIONI N. 3 corso di statistica
ESERCITAZIONI N 3corso di statistica p 1/18 ESERCITAZIONI N 3 corso di statistica Marco Picone Università Roma Tre ESERCITAZIONI N 3corso di statistica p 2/18 Introduzione Decomposizione della devianza
DettagliStatistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2011/2012 Statistica Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate.
DettagliIndipendenza, Dipendenza e interdipendenza
Indipendenza, Dipendenza e interdipendenza In analisi bivariata la tabella di contingenza consente di esaminare congiuntamente due variabili consente di rilevare le relazioni esistenti tra le variabili
DettagliPROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE
PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE 1. Distribuzione congiunta Ci sono situazioni in cui un esperimento casuale non si può modellare con una sola variabile casuale,
DettagliMateriale didattico per il corso di Statistica I Quinta esercitazione SOLUZIONI
Materiale didattico per il corso di Statistica I Quinta esercitazione SOLUZIONI Claudia Furlan Anno Accademico 006-007 Ringrazio Carlo Gaetan, Nicola Sartori e Aldo Solari per il materiale, aggiunte e
DettagliSTATISTICA DESCRITTIVA BIVARIATA
STATISTICA DESCRITTIVA BIVARIATA Si parla di Analisi Multivariata quando su ogni unità statistica, appartenente ad una determinata popolazione, si rileva un certo numero s di caratteri X, X 2,,X s. Si
DettagliRappresentazioni grafiche di distribuzioni doppie
Rappresentazioni grafiche di distribuzioni doppie Distribuzione doppia di frequenze Tabella di contingenza Tabella di correlazione Stereogramma Distribuzione unitaria doppia di 2 caratteri quantitativi
DettagliCORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Misura dell associazione tra due caratteri Uno store manager è interessato a studiare la relazione
DettagliCorrelazione lineare e regressione
7c e regressione Se i due caratteri sono entrambi quantitativi, X e Y, possiamo studiare la loro correlazione lineare. Prima di tutto cerchiamo di capire di cosa si tratta. Se elenchiamo le N osservazioni
DettagliStatistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione
Statistica Esercitazione alessandro polli facoltà di scienze politiche, sociologia, comunicazione Obiettivo I due semplici esercizi seguenti hanno l obiettivo di consolidare le nostre nozioni in tema di
DettagliAnalisi dell associazione tra due caratteri
Analisi dell associazione tra due caratteri Non ci accontentiamo di analizzare il singolo fenomeno, considerato indipendentemente da altri fenomeni Ci interessano le relazioni che possono esistere tra
DettagliAPPLICAZIONE DELLA DEVIATA GAUSSIANA STANDARD
APPLICAZIONE DELLA DEVIATA GAUSSIANA STANDARD In una popolazione di ragazze di età inclusa tra i 18 e i 25 anni, la concentrazione di emoglobina nel sangue (x) approssima la distribuzione gaussiana con
DettagliIl problema lineare dei minimi quadrati
Il problema lineare dei minimi quadrati APPLICAZIONE: Il polinomio di migliore approssimazione nel senso dei minimi quadrati Felice Iavernaro Dipartimento di Matematica Università di Bari 15 Gennaio 2009
DettagliCapitolo 12. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 12.1: Suggerimento
Capitolo Suggerimenti agli esercizi a cura di Elena Siletti Esercizio.: Suggerimento Per verificare se due fenomeni sono dipendenti in media sarebbe necessario confrontare le medie condizionate, in questo
DettagliPiano cartesiano e Retta
Piano cartesiano e Retta 1 Piano cartesiano e Retta 1. Richiami sul piano cartesiano 2. Richiami sulla distanza tra due punti 3. Richiami punto medio di un segmento 4. La Retta (funzione lineare) 5. L
DettagliBLAND-ALTMAN PLOT. + X 2i 2 la differenza ( d ) tra le due misure per ognuno degli n campioni; d i. X i. = X 1i. X 2i
BLAND-ALTMAN PLOT Il metodo di J. M. Bland e D. G. Altman è finalizzato alla verifica se due tecniche di misura sono comparabili. Resta da comprendere cosa si intenda con il termine metodi comparabili
DettagliProva d esame di Statistica - II canale - nuovo ordinamento Dott.ssa C. Conigliani 19/06/2003
19/06/2003 Compito A Esercizio 1. [14 punti] Data la seguente distribuzione doppia secondo i caratteri reddito familiare mensile () e spesa alimentare mensile (): 0 300 300 600 600 e più tot 0 1000 25
DettagliTecniche di sondaggio
SMID a.a. 2005/2006 Corso di Statistica per la Ricerca Sperimentale Tecniche di sondaggio 24/1/2006 Nomenclatura Indicheremo con P una popolazione, con N la sua numerosità, con k la sua etichetta e con
DettagliCorso di Psicometria Progredito
Corso di Psicometria Progredito 5. La correlazione lineare Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014 Sommario 1 Tipi di relazione
DettagliDISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a Prerequisiti Popolazione, unità, carattere Come nascono i dati:
DISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a. 2007-2008 Prerequisiti Popolazione, unità, carattere Come nascono i dati: osservazione e sperimentazione Popolazione: reale e virtuale Classificazione
DettagliDipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli
Dipartimento di Sociologia e Ricerca Sociale Corso di Laurea in Sociologia Insegnamento di Statistica (a.a. 2018-2019) dott.ssa Gaia Bertarelli Esercitazione n. 6 1. Si consideri un campione di 69 persone
DettagliE la rappresentazione grafica, in questo caso, è la dispersione x,y, cioè una nuvola di punti nel piano cartesiano
Capitolo uno STATISTICA DESCRITTIVA BIVARIATA La statistica bidimensionale o bivariata si occupa dello studio del grado di dipendenza di due caratteri distinti della stessa unità statistica. E possibile,
DettagliEsercizi Svolti. 2. Costruire la distribuzione delle frequenze cumulate del tempo di attesa
Esercizi Svolti Esercizio 1 Per una certa linea urbana di autobus sono state effettuate una serie di rilevazioni sui tempi di attesa ad una determinata fermata; la corrispondente distribuzione di frequenza
DettagliElaborazione statistica di dati
Elaborazione statistica di dati CONCETTI DI BASE DI STATISTICA ELEMENTARE Taratura strumenti di misura IPOTESI: grandezza da misurare identica da misura a misura Collaudo sistemi di produzione IPOTESI:
DettagliConsideriamo due variabili quantitative Y e X, e supponiamo di essere interessati a comprendere come la Y
1 Analisi della interdipendenza lineare Quando si analizzano due o più caratteri quantitativi si può cercare di individuare una funzione che descriva in modo dettagliato la relazione che emerge dai dati,
DettagliMetodi Quantitativi per Economia, Finanza e Management. Lezione n 4 Analisi Bivariata I Parte
Metodi Quantitativi per Economia, Finanza e Management Lezione n 4 Analisi Bivariata I Parte Statistica descrittiva bivariata Indaga la relazione tra due variabili misurate. Si distingue rispetto alla
DettagliL'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale
L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile Corso di Metodologia della ricerca sociale L analisi della varianza (ANOVA) La tecnica con cui si esplorano le relazioni
DettagliStatistica Elementare
Statistica Elementare 1. Frequenza assoluta Per popolazione si intende l insieme degli elementi che sono oggetto di una indagine statistica, ovvero l insieme delle unità, dette unità statistiche o individui
DettagliESEMPI DI DOMANDE PER LA PROVA SCRITTA DI STATISTICA SOCIALE
ESERCITAZIONE DI FINE CORSO ESEMPI DI DOMANDE PER LA PROVA SCRITTA DI STATISTICA SOCIALE 1. Si prenda in esame la seguente tabella che riporta la suddivisione di una popolazione femminile per titolo di
DettagliEsercitazione III Soluzione
Esercitazione III Soluzione Esercizio 1 a) Frequenze congiunte assolute: n ij Reddito mensile Titolo di studio 1000-000 000-5000 5000-8000 Totale Laurea triennale 4 1 0 5 Laurea magistrale 1 4 7 Dottorato
DettagliCognome e Nome:... Corso di laurea:...
Statistica - corso base Prof. B. Liseo Prova di esame dell 8 gennaio 201 Cognome e Nome:................................................................... Corso di laurea:.......................................................................
DettagliAnalisi bivariata. Il caso di caratteri quantitativi
Analisi bivariata Il caso di caratteri quantitativi Pagina 382 Rappresentazioni grafiche di distribuzioni doppie Distribuzione doppia di frequenze Tabella di contingenza Tabella di correlazione Stereogramma
Dettagliassuma valori in un determinato intervallo è data dall integrale della sua densità ( = )=
VARIABILI ALEATORIE CONTINUE Esistono parecchi fenomeni reali per la cui descrizione le variabili aleatorie discrete non sono adatte. Per esempio è necessaria una variabile aleatoria continua ovvero una
Dettagliper togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione
Rapporti statistici di composizione la parte rispetto al tutto percentuali di derivazione per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione di frequenza (tassi) rapporti
DettagliMETODO DEI MINIMI QUADRATI
Vogliamo determinare una funzione lineare che meglio approssima i nostri dati sperimentali e poter decidere sulla bontà di questa approssimazione. Sia f(x) = mx + q, la coppia di dati (x i, y i ) appartiene
DettagliCorso di Laurea in Ingegneria Informatica e Automatica (M-Z) Università di Roma La Sapienza
Corso di Laurea in Ingegneria Informatica e Automatica (M-Z) Università di Roma La Sapienza CALCOLO DELLE PROBABILITÀ E STATISTICA ESAME DEL 16/06/2016 NOME: COGNOME: MATRICOLA: Esercizio 1 Cinque lettere
DettagliCasa dello Studente. Casa dello Studente
Esercitazione - 14 aprile 2016 ESERCIZIO 1 Di seguito si riporta il giudizio (punteggio da 0 a 5) espresso da un gruppo di studenti rispetto alle diverse residenze studentesche di un Ateneo: a) Si calcolino
DettagliDipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli
Dipartimento di Sociologia e Ricerca Sociale Corso di Laurea in Sociologia Insegnamento di Statistica (a.a. 2018-2019) dott.ssa Gaia Bertarelli Esercitazione n. 4 1. La seguente tabella riporta la distribuzione
DettagliModelli probabilistici variabili casuali
Modelli probabilistici variabili casuali Le variabili casuali costituiscono il legame tra il calcolo della probabilità e gli strumenti di statistica descrittiva visti fino ad ora. Idea: pensiamo al ripetersi
DettagliEsercitazione: 16 novembre 2009 SOLUZIONI
Esercitazione: 16 novembre 009 SOLUZIONI Esercizio 1 Scrivere [ ] equazione vettoriale, parametrica [ ] e cartesiana della retta passante 1 per il punto P = e avente direzione d =. 1 x 1 Soluzione: Equazione
DettagliEsercizi di statistica descrittiva. Giulia Simi (Università di Siena) Istituzione di matematica e fondamenti di Biostatistica Siena / 30
Esercizi di statistica descrittiva Giulia Simi (Università di Siena) Istituzione di matematica e fondamenti di Biostatistica Siena 2015-2016 1 / 30 Esercizio 1 Nel rilevare l altezza di un gruppo di reclute,
DettagliL analisi dei dati. Primi elementi. EEE- Cosmic Box proff.: M.Cottino, P.Porta
L analisi dei dati Primi elementi Metodo dei minimi quadrati Negli esperimenti spesso si misurano parecchie volte due diverse variabili fisiche per investigare la relazione matematica tra le due variabili.
Dettagli1 Fit di dati sperimentali: il χ 2. Il metodo dei minimi quadrati.
1 Fit di dati sperimentali: il χ 2. Il metodo dei minimi quadrati. Per comprendere dei fenomeni fisici, non basta raccogliere buoni dati sperimentali, occorre anche interpretarli. Molto spesso lo scopo
DettagliDistribuzioni Doppie e Relazioni tra Variabili Esercitazione n 03
Distribuzioni Doppie e Relazioni tra Variabili Esercitazione n 03 ESERCIZIO 1 Tra le famiglie del Comune di Vigata sono stati rilevati congiuntamente la PROFESSIONE DEL CA- POFAMIGLIA () e l AMMONTARE
DettagliAnalisi congiunta di più fenomeni
Analisi congiunta di più fenomeni Dati relativi al disastro del Titanic: Morti Sopravvissuti Classe Sesso Età 1 a Uomini Bambini 0 5 Adulti 118 57 Donne Bambini 0 1 Adulti 4 140 2 a Uomini Bambini 0 11
DettagliSTATISTICA. Regressione-1
STATISTICA Regressione-1 Associazione Voto per Macron e tasso di disoccupazione Appartenenza etnica e preferenze politiche Esposizione ad una data sostanza e insorgenza di malattie Livello sociale della
DettagliStatistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione
Statistica Esercitazione alessandro polli facoltà di scienze politiche, sociologia, comunicazione Obiettivo Questa esercitazione ha l obiettivo di consolidare ulteriormente gli strumenti di analisi bivariata
DettagliLa variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali
Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Introduzione [1/2] Gli indici di variabilità consentono di riassumere le principali caratteristiche di una distribuzione (assieme alle medie) Le
DettagliEsercizio 1 Questa tabella esprime i tempi di durata di 200 apparecchiature elettriche:
Istituzioni di Statistica 1 Esercizi su indici di posizione e di variabilità Esercizio 1 Questa tabella esprime i tempi di durata di 200 apparecchiature elettriche: Durata (ore) Frequenza 0 100? 100 200
DettagliLa statistica descrittiva seconda parte. a cura della prof.ssa Anna Rita Valente
La statistica descrittiva seconda parte a cura della prof.ssa Anna Rita Valente INDICI DI POSIZIONE CENTRALE Sono dei valori che descrivono in modo sintetico una serie di dati raccolti. I più semplici
DettagliParametri statistici
SMID a.a. 2004/2005 Corso di Metodi Statistici in Biomedicina Parametri statistici 24/1/2005 Deviazione standard della media La variabilità di una distribuzione può quindi essere espressa da un indice
DettagliStatistica di base per l analisi socio-economica
Laurea Magistrale in Management e comunicazione d impresa Statistica di base per l analisi socio-economica Giovanni Di Bartolomeo gdibartolomeo@unite.it Definizioni di base Una popolazione è l insieme
DettagliESERCITAZIONI N. 3 corso di statistica
ESERCITAZIONI N. 3corso di statistica p. 1/18 ESERCITAZIONI N. 3 corso di statistica Marco Picone Università Roma Tre ESERCITAZIONI N. 3corso di statistica p. 2/18 Introduzione Media e Varianza Covarianza
DettagliRicordiamo. 1. Tra le equazioni delle seguenti rette individua e disegna quelle parallele all asse delle ascisse:
La retta Retta e le sue equazioni Equazioni di rette come luogo geometrico y = h h R equazione di una retta parallela all asse delle ascisse x = 0 equazione dell asse delle ordinate y = h h R equazione
DettagliSperimentazioni di Fisica I mod. A Statistica - Lezione 2
Sperimentazioni di Fisica I mod. A Statistica - Lezione 2 A. Garfagnini M. Mazzocco C. Sada Dipartimento di Fisica G. Galilei, Università di Padova AA 2014/2015 Elementi di Statistica Lezione 2: 1. Istogrammi
DettagliUNIVERSITÀ di ROMA TOR VERGATA
UNIVERSITÀ di ROMA TOR VERGATA Corso di Statistica, anno 2010-11 P.Baldi Lista di esercizi 3. Corso di Laurea in Biotecnologie Esercizio 1 Una v.a. X segue una legge N(2, ). Calcolare a1) P(X 1) a2) P(2
DettagliStatistica descrittiva III
Probabilità e Statistica Esercitazioni a.a. 2009/2010 C.d.L.: Ingegneria Elettronica e delle Telecomunicazioni, Ingegneria Informatica Statistica descrittiva III Ines Campa Probabilità e Statistica - Esercitazioni
DettagliESAME. 9 Gennaio 2017 COMPITO B
ESAME 9 Gennaio 2017 COMPITO B Cognome Nome Numero di matricola 1) Approssimare tutti i calcoli alla quarta cifra decimale. 2) Ai fini della valutazione si terrà conto solo ed esclusivamente di quanto
DettagliSTATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo
STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)
DettagliSi assuma di avere portato a termine le seguenti rilevazioni di produzione e di alimento somministrato
Regressione Lineare Semplice Si assuma di avere portato a termine le seguenti rilevazioni di produzione e di alimento somministrato QUANTITA' DI ALIMENTO PRODUZIONE 2 10 2 9 1.5 5 1 2 1 3 1.5 4 2 7 2 9
DettagliNel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0.
Regressione [] el modello di regressione lineare si assume una relazione di tipo lineare tra il valore medio della variabile dipendente Y e quello della variabile indipendente X per cui Il modello si scrive
Dettagli3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17
C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica
Dettagli