Capitolo uno STATISTICA DESCRITTIVA BIVARIATA
|
|
- Irene Calabrese
- 7 anni fa
- Visualizzazioni
Transcript
1 Capitolo uno STATISTICA DESCRITTIVA BIVARIATA La statistica unidimensionale si occupa di studiare una sola variabile statistica. La statistica bidimensionale o bivariata si occupa dello studio congiunto di due caratteri distinti della stessa unità statistica. Si costruisce una tabella a doppia entrata Dette ed Y le due variabili statistiche, la distribuzione delle frequenze delle loro modalità sono x 1, x 2,.x q e y 1, y 2, y p. Si ottiene la seguente tabella a doppia entrata Y y 1 y 2 y 3 Totale x f(x1,y1) f(x1,y2) 1 f(x1,y3) f(x1) somma x f(x2,y1) delle 2 f(x2) righe : x f(x3,y1) 3 f(x3) freq. x f(x4,y1) 4 f(x4) marg. di Totale f(y1) f(y2) f(y3) f(yi) n Somma delle colonne: frequenze marginali di Y La colonna dei totali e la riga dei totali sono le frequenze marginali della variabile e della variabile Y, sono dette distribuzioni marginali e rappresentano le distribuzioni di ognuno dei due caratteri considerati singolarmente (distribuzioni univariate). f(xi,yj)sono le frequenze congiunte. Le colonne e le righe interne della tabella sono le distribuzioni condizionate. Esempio 1 Sono stati classificati 205 appartamenti secondo il numero dei locali e il numero delle persone che li abitano. I risultati sono riassunti nella seguente tabella a doppia entrata 1 Y Dalla tabella si possono ricavare le due distribuzioni marginali ( UNIVARIATE) : varabile Y: distribuzione delle yj ( numero locali): y j f (yj) variabile :distribuzione delle xi ( numero di abitanti): x i f (xi)
2 2 LE DISTRIBUZIONI CONDIZIONATE in una tabella a doppia entrata + 90]/500= 1,0496 Y=Lunghezza auto ( m) =Capacità bagagliaio (dm 3 ) y1=[33,50[ y2=[3,50-4[ y3=[4-4,5] Totale x1=[90-160[ x2=[ [ x3=[ [ x4=[ ] Totale la riga colorata, interna alla tabella, rappresenta la distribuzione di Y condizionata alla modalità x1 cioè f(y x1) Y=Lunghezza auto ( m) =Capacità bagagliaio (dm 3 ) [3-3,50[ [3,50-4[ [4-4,5] Totale 1=[90-160[ allo stesso modo, fissando il valore di y1, si puo considerare la distribuzione condizionata di rispetto alla modalità y1 cioè f( y1) Y=Lunghezza auto ( m) =Capacità bagagliaio (dm 3 ) y1=[3-3,50[ 1=[90-160[ 8 2=[ [ 3 3=[ [ 1 4=[ ] 0 Totale 12
3 3 Come si rappresenta una tabella bivariata Classe birth weight madri non fumatrici madri fumatrici Frequenza marginale NON Fum. % Fum.% 1= ,13 0,21 2= ,40 0,62 3= ,08 2,27 4= ,75 5,17 5= ,18 12,40 6= ,24 19,42 7= ,37 22,31 8= ,68 18,60 9= ,87 9,92 10= ,36 6,20 11= ,64 2,07 12= ,48 0,83 13= ,81 0,00 Freq. Marg % 100% Si costruisce un diagramma a barre per ogni riga (o colonna) interna alla tabella, differenziando i diversi diagrammi per colore. Si affiancano, poi, le barre di diverso colore che corrispondono alla stessa modalità dell altro carattere. L ISTOGRAMMA A FIANCO,ottenuto considerando le percentuali di madri fumatrici e non fumatrici, mostra che le madri fumatrici hanno generato figli con peso basso alla nascita ( classi di peso 1,2,3,4,5,6), più spesso di quelle non fumatrici. ESERCIZI 1) La seguente tabella riporta la distribuzione di un gruppo di auto secondo lunghezza e dimensione del bagagliaio Y=Lunghezza auto ( m) =Capacità bagagliaio 3-3,50 3, ,5 Totale (dm 3 ) Totale Calcolare la varianza della distribuzione marginale delle xi [σ 2 =4486,2] 2) la seguente tabella riporta le età degli sposi per 100 coppie Età sposa Età Totale sposo Totale Determina la media aritmetica e la varianza della distribuzione marginale dell età della sposa [σ 2 =22,527] [M=26,15]
4 4 3)La seguente tabella riporta l esito di fine anno degli alunni di un Istituto scolastico divisi per classi = esito Y=classe 1=promossi 2=Respinti 3=con debito 1=prima =seconda =terza =quarta a.rappresentare la distribuzione dei dati b. Scrivere le frequenze marginali delle righe e delle colonne c. Calcolare la media e la varianza della distribuzione marginale degli esiti. [M=1,40 σ 2 =0,54] d. Calcolare la media e la varianza della distribuzione marginale delle classi [M=2,39 σ 2 =1,234] 4) Data la seguente tabella Y Tot Tot a. Rappresentarla graficamente b. Scrivere la distribuzione marginale di xi c. Calcolare la media aritmetica della distribuzione marginale delle yi [c. 2,37] 5) Sono state intervistate 100 donne, divise per età, sulla bontà di un certo prodotto ottenendo le seguenti risposte Risposta Età Positiva Negativa Non so a. Rappresenta la distribuzione dei dati b. Scrivi le frequenze marginali delle righe e delle colonne c. Attribuendo i valori 1,2,3 ai caratteri della risposta(positiva, negativa, non so) e i valori 2,3,4,5 ai caratteri dell età, calcolare le medie aritmetiche [Mx=1,72 ; My=3,57] 6) Sia Y la variabile voto dello scrutinio ed la variabile studente pendolare, studente residente, determinare Mx, My, σ 2 x, σ 2 y y: tot Pendol.= Residen.= tot [My=5,18 Mx=1,68 σ 2 y =1,01 σ 2 x=0,21]
5 INDIPENDENZA E DIPENDENZA STATISTICA DI DUE VARIABILI o MUTABILI Per determinare se due variabili statistiche sono dipendenti o indipendenti bisogna utilizzare le distribuzioni marginali delle frequenze della tabella a doppia entrata. La variabile x e la variabile y sono indipendenti se la frequenza congiunta f(x i,y,j ) ( quella interna alla tabella), è il prodotto delle corrispondenti frequenze marginali, divise per in numero di dati n f(x i,y,j ) = [f(x i ) * f(y j )]/n 5 Per verificare se le variabili sono indipendenti si può costruire la tabella partendo dalle frequenze marginali, utilizzando la formula f(x i,y,j ) = [f(x i ) * f(y j )]/n, se tale tabella coincide con quella data, le due variabili sono perfettamente indipendenti *20/200= 6 60*60/200= 18 60*120/200= le variabili ed Y sono 8 40*20/200= 4 40*60/200= 12 40*120/200= indipendenti *20/200= *60/200=30 100*120/200= Y La tabella così costruita si chiama tabella teorica di indipendenza Esercizi: determinare se le variabili delle seguenti tabelle sono indipendenti. ESERCIZIO SVOLTO tot Y tot Si costruisce la tabella teorica di indipendenza e si verifica se coincide con quella dei dati reali Y tot 4 7*8/56= 1 7*16/56=2 7*32/56= *8/56=3 16*21/56=6 21*32/56= *8/56=4 28*16/56=8 28*32/56=16 28 tot
6 6 Esercizi n La situazione di perfetta indipendenza statistica si verifica raramente, la tabella teorica di indipendenza rappresenta un situazione ideale, quello che serve è valutare quanto la tabella dei dati reali si discosta da quella di perfetta indipendenza per capire in che misura le due variabili sono dipendenti. CONTINGENZA e INDICE DI CONNESSIONE La contingenza permette di misurare il grado di dipendenza, la connessione, di due mutabili. 1)Data la tabella dei dati reali osservati: 2) si costruisce la tabella teorica di indipendenza: y 1 y 2 y y 1 y 2 y x x 1 30*25/50=15 20*25/50=10 25 x x 2 30*15/50=9 =6 15 x x 3 =6 =4 10 x x Le variabili x ed y non sono indipendenti poiché le due tabelle sono diverse, quindi si cerca di misurare il grado di dipendenza o CONNESSIONE delle due mutabili. Si dice contingenza la differenza tra le frequenze osservate e quelle teoriche. C(xi;yj) = f(xi,yj) - f (xi,yj) contingenza freq. osserv. freq. teorica Nel caso di indipendenza le contingenze sono tutte nulle, mentre cresceranno, in valore assoluto, al crescere del grado di dipendenza tra i caratteri. Indice di connessione di Pearson ( χ 2 chi quadro): χ 2 = Riprendendo la tabella iniziale si ha χ 2 = 50( )=25/9=2,8
7 7 χ 2 deve essere normalizzato in modo da variare tra 0 ed 1 compresi (k è il numero di righe interne della tabella e h è il numero di colonne interne della tabella) χ 2 = = = = = 0,056 Il grado di connessione è 5,6 %, è un grado di connessione molto basso. Un caso di perfetta connessione: χ 2 normalizzato =1. Si chiede a 70 persone, 30 donne e 40 uomini, che visitano una concessionaria di auto se preferirebbero acquistare una utilitaria a bassa emissione di gas inquinanti o un auto di cilindrata superiore a 1800 cc. Il risultato è riassunto nella seguente tabella bivariata Y M F Fr.marg utilitaria Cil. >1800cc Fr. marg χ 2 = 70[ /(30*30)+40 2 /(40*40) +0-1]=70 χ 2 norm.= = 70/(70*1)= 1 Il grado di connessione tra la variabile (sesso ) e la variabile Y ( tipo di auto preferita) è del 100% Esercizio Si sa che le variabili ed Y sono indipendenti e si conoscono le distribuzioni marginali delle variabili (sesso) ed Y( auto preferita tra utilitaria ed auto di grande cilindrata). Y M F Fr.marg utilitaria 80 Cil. >1800cc. 120 Fr. marg Quanti sono gli uomini che preferirebbero acquistare un utilitaria?... E le donne?... Quanti sono gli uomini che preferirebbero acquistare un auto di grande cil.?... E le donne? Qual è la percentuale di uomini che preferirebbe comprare un utilitaria?... Qual è la percentuale di donne che preferirebbe acquistare un utilitaria?... Calcola 2 norm. :.. CORRELAZIONE E REGRESSIONE LINEARE Si dice correlazione la dipendenza di due caratteri quantitativi, la correlazione viene misurata con la COVARIANZA. La correlazione
8 Per analizzare la correlazione lineare tra due variabili statistiche, si calcola il coefficiente di BRAVAIS-PEARSON: r = Se r=1 tutti i dati sono allineati su di una retta con coefficiente angolare positivo PERFETTA CORRELAZIONE POSITIVA Se r=-1 tutti i dati sono allineati su di una retta con coefficiente angolare negativo PERFETTA CORRELAZIONE NEGATIVA Se r=0 non c è correlazione lineare tra le due variabili, i punti ( x i,y i ) sono disposti casualmente nel piano Attenzione : -1<r<+1 Quanto più r è vicino ad 1 o a -1 tanto più è forte la correlazione tra le variabili, quanto più r è vicino a zero tanto più è debole la correlazione tra le variabili. ESEMPIO A una visita di leva vengono rilevati i seguenti dati = Statura (cm) Y=Circ.toracica (cm) Calcola il coefficiente di correlazione di Bravais-Pearson r. SVOLGIMENTO La seguente tabella è stata costruita con ECEL. Per calcolare il coefficiente di correlazione r basta utilizzare i risultati contenuti nelle ultime tre celle in neretto xi yj xi*yj (xi)^2 (yj)^2 xm=1384/8= ym=684/8= σ 2 x=240452/8-(173)^2= σ 2 Y=58714/8-(85.5)^2= σ xy = /8-173*85.5= coefficiente di correlazione lineare: r = /( * 29)= Tra le due variabili c è una buona correlazione lineare positiva perché r è vicino ad 1. 8 Rappresentando graficamente i punti (xi,yi) nel piano cartesiano ( diagramma di dispersione), relativi alla tabella precedente (statura-cassa toracica) si vede che essi possono essere approssimati con una retta
9 ESERCIZI 1)Data la tabella seguente xi yi a)traccia il diagramma di dispersione b)calcola il coefficiente di correlazione lineare di Bravais-Pearson [r=0,99] 2)La seguente tabella rappresenta il reddito annuo e le spese annue per l abbigliamento di 5 persone. Reddito (migliaia di euro) Spese (migliaia di euro) 1,5 2,5 2 2,2 1,8 Determina il coefficiente di correlazione r [r=0,422] 3)Dallo studio della caduta di un grave si ottengono i seguenti dati Tempo ( s ) Spazio ( m) 3,8 8,2 14,6 22,2 34,4 Calcola il coefficiente di correlazione lineare r [r=0,98] LA REGRESSIONE LINEARE. Quando si evidenzia una relazione tra due variabili quantitative, si dovrebbe valutare a quale re funzione matematica descrive meglio i dati, se di tipo lineare, quadratico, esponenziale,ecc. Quando il diagramma di dispersione evidenzia una possibile relazione lineare tra due variabili statistiche x ed y, la funzione interpolatrice che approssima meglio la distribuzione dei dati può essere una retta di equazione y=mx+q Si può scrivere la retta di regressione lineare che approssima i dati, ricorrendo al metodo dei minimi quadrati. Tale metodo consiste nel rendere minima la somma dei quadrati delle distanze d i come si vede nel grafico seguente. La distanza d i tra i punti di coordinate (4;6) (5;6) (6;5) (8;1) e i punti della retta aventi le stesse ascisse, è misurata nella direzione dell asse y Equazione della retta: y-μ y =m(x-μ x ) m è il coefficiente di regressione e il coefficiente angolare della retta m=σ xy /(σ x ) 2 =59.375/127.5=0.466 y-85,5 = 0,466(x-173) 9 La retta di regressione è y=0,466x+4,882 L approssimazione è buona infatti il coefficiente di Bravais-Pearson r=0,97645 è molto prossimo ad 1
10 ATTENZIONE: per scrivere l equazione della retta di regressione si può utilizzare la stessa tabella vista per il coefficiente di correlazione di Bravais-Pearson ESERCIZI. 1)Nella seguente tabella sono riportati i dati relativi all impiego di un fertilizzante in un terreno e alle quantità di cereali raccolti in quintali. fertilizzanti Cereali soluzione a) determina l equazione della retta di regressione e rappresentala y=-31,43+11,49x b) determina il coefficiente di correlazione 2) La seguente tabella riporta la quantità di merce venduta in relazione al prezzo: prezzo ( euro) Quantità ( t.) a. rappresenta graficamente i dati rilevati b. determina con il metodo dei minimi quadrati la retta interpolatrice c. rappresentare la funzione calcolata [y=69,2 0,039x] Determina la retta di regressione con il metodo dei minimi quadrati: 3) 4) 5) [ y= 11,285 1,142x ] y [y=80,43-0,825x] y [y=1, ,805x] y 1,2 3,7 5,9 11,6 15,3 6) Nella seguente tabella sono riportati i pesi in relazione alla statura di un gruppo di persone. Peso ( Kg) Altezza (cm) a. calcolare l equazione della retta di regressione b. calcolare il coefficiente di correlazione c. Per un peso di 65 kg quale altezza si può prevedere? [y=97,64+1,062x] 7) Nei primi 5 mesi dell anno un azienda ha prodotto le seguenti quantità di un prodotto in relazione ai costi di elettricità Produzione Mensile (t.) Costi mensili elettricità (migliaia di euro) a. Calcola l equazione della retta di regressione dei costi sulla produzione b. Calcola la retta di regressione della produzione sui costi c. Calcola il coefficiente di correlazione [y=0,289+0,299x y=3,21x 0,5542] 10
11 11 LE FORMULE DELLA STATISTICA BIVARIATA Indice chi-quadro χ 2 CONTINGENZA χ 2 = n ( bisogna sommare tutte le frequenze congiunte al quadrato, divise per i prodotti delle corrispondenti frequenze marginali, sottrarre 1 e moltiplicare il risultato per il numero dei dati n. K= numero di righe interne h= numero di colonne interne Covarianza σ x,y = (Ʃ x i* y i )/n - μ x* μ y CORRELAZIONE Coefficiene di correlazione lineare di Bravais-Pearson : r = REGRESSIONE LINEARE Baricentro della distribuzione di dati G(μ x, μ y ) = ( ; ) il coefficiente di regressione m = σ xy /(σ x ) 2 Miglior retta di regressione di y in x y-μ y =m(x-μ x )
E la rappresentazione grafica, in questo caso, è la dispersione x,y, cioè una nuvola di punti nel piano cartesiano
Capitolo uno STATISTICA DESCRITTIVA BIVARIATA La statistica bidimensionale o bivariata si occupa dello studio del grado di dipendenza di due caratteri distinti della stessa unità statistica. E possibile,
DettagliStatistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2011/2012 Statistica Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate.
DettagliStatistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2010/2011 Statistica Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza
DettagliREGRESSIONE E CORRELAZIONE
REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.
DettagliANALISI STATISTICHE BIVARIATE. Tabelle di contingenza
ANALISI STATISTICHE BIVARIATE Tabelle di contingenza 1 Analisi Statistica Bivariata Generalmente, lo studio quantitativo di un fenomeno di interesse si svolge rilevando contemporaneamente più caratteri
DettagliEsercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale)
Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale) Esercizio 1: Un indagine su 10.000 famiglie ha dato luogo, fra le altre, alle osservazioni riportate nella
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative
DettagliSTATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE
STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 2 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1.1
DettagliSTATISTICA DESCRITTIVA BIVARIATA
STATISTICA DESCRITTIVA BIVARIATA Si parla di Analisi Multivariata quando su ogni unità statistica, appartenente ad una determinata popolazione, si rileva un certo numero s di caratteri X, X 2,,X s. Si
DettagliDistribuzioni secondo due caratteri. Rappresentazioni e prime sintesi
Distribuzioni secondo due caratteri Rappresentazioni e prime sintesi Rappresentazioni delle distribuzioni doppie Quando per ogni unità del collettivo rileviamo due caratteri otteniamo una Esempio. Ad alcuni
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri
DettagliEsercitazioni del corso: RELAZIONI TRA VARIABILI
A. A. 009 010 Esercitazioni del corso: RELAZIONI TRA VARIABILI Isabella Romeo: i.romeo@campus.unimib.it ommario Esercitazione 1: Tabelle a doppia entrata Distribuzioni marginali e condizionate Indipendenza
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 41 Outline 1 2 3 4 5 () Statistica 2 / 41 Misura del legame Data una variabile doppia (X, Y ), la
DettagliESERCIZI SVOLTI Giuliano Bonollo - Michele Bonollo
ESERCIZI SVOLTI Giuliano Bonollo - Michele Bonollo 1 La seguente tabella riporta le frequenze relative riguardanti gli studenti di un università e gli esiti dell esame da essi sostenuto. Qual è la percentuale
DettagliCapitolo 12. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 12.1: Suggerimento
Capitolo Suggerimenti agli esercizi a cura di Elena Siletti Esercizio.: Suggerimento Per verificare se due fenomeni sono dipendenti in media sarebbe necessario confrontare le medie condizionate, in questo
DettagliDISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a Prerequisiti Popolazione, unità, carattere Come nascono i dati:
DISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a. 2007-2008 Prerequisiti Popolazione, unità, carattere Come nascono i dati: osservazione e sperimentazione Popolazione: reale e virtuale Classificazione
DettagliEsercitazione di Statistica Indici di associazione
Esercitazione di Statistica Indici di associazione 28/10/2015 La relazione tra caratteri Indipendenza logica Quando si suppone che tra due caratteri non ci sia alcuna relazione di causa-effetto. Indipendenza
DettagliSTATISTICA: esercizi svolti sulla DIPENDENZA IN MEDIA
STATISTICA: esercizi svolti sulla DIPEDEZA I MEDIA 1 1 LA DIPEDEZA I MEDIA 2 1 LA DIPEDEZA I MEDIA 1. La popolazione in migliaia di unità occupata in Piemonte nel 1985 per reddito annuo Y (migliaia di
DettagliEsercitazioni di statistica
Esercitazioni di statistica Misure di associazione: Indipendenza assoluta e in media Stefania Spina Universitá di Napoli Federico II stefania.spina@unina.it 22 ottobre 2014 Stefania Spina Esercitazioni
DettagliAssociazione tra caratteri quantitativi: gli indici di correlazione
Associazione tra caratteri quantitativi: gli indici di correlazione Per correlazione si intende una relazione tra due variabili tale che a ciascun valore della prima variabile corrisponda con una certa
Dettagli3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17
C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica
DettagliLa regressione lineare. Rappresentazione analitica delle distribuzioni
La regressione lineare Rappresentazione analitica delle distribuzioni Richiamiamo il concetto di dipendenza tra le distribuzioni di due caratteri X e Y. Ricordiamo che abbiamo definito dipendenza perfetta
DettagliMETODO DEI MINIMI QUADRATI
METODO DEI MINIMI QUADRATI Torniamo al problema della crescita della radice di mais in funzione del contenuto di saccarosio nel terreno di coltura. Ripetendo varie volte l esperimento con diverse quantità
DettagliEsercizi Svolti. 2. Costruire la distribuzione delle frequenze cumulate del tempo di attesa
Esercizi Svolti Esercizio 1 Per una certa linea urbana di autobus sono state effettuate una serie di rilevazioni sui tempi di attesa ad una determinata fermata; la corrispondente distribuzione di frequenza
DettagliStatistica descrittiva in due variabili
Statistica descrittiva in due variabili 1 / 65 Statistica descrittiva in due variabili 1 / 65 Supponiamo di misurare su un campione statistico due diverse variabili X e Y. Indichiamo come al solito con
DettagliLezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo
UIVERSITA DEGLI STUDI DI BASILICATA FACOLTA DI ECOOMIA Corso di laurea in Economia Aziendale anno accademico 2012/2013 Lezioni di Statistica del 15 e 18 aprile 2013 Docente: Massimo Cristallo LA RELAZIOE
DettagliSTATISTICA 1 ESERCITAZIONE 6
STATISTICA 1 ESERCITAZIONE 6 Dott. Giuseppe Pandolfo 5 Novembre 013 CONCENTRAZIONE Osservando l ammontare di un carattere quantitativo trasferibile su un collettivo statistico può essere interessante sapere
DettagliEsercitazioni del corso: STATISTICA
A. A. 0-0 Esercitazioni del corso: STATISTICA Sommario Esercitazione 4: Medie e varianze marginali Medie e varianze condizionate Scomposizione della varianza Indipendenza in media ESERCIZIO UNIVERSITÀ
DettagliSTATISTICA (modulo I - Statistica Descrittiva) Soluzione Esercitazione I
2. e 3. STATISTICA (modulo I - Statistica Descrittiva) Soluzione Esercitazione I 1. Le unità statistiche sono costituite dai singoli ristoranti, mentre la popolazione è costituita da tutte le unità del
Dettaglidocente: J. Mortera/P. Vicard Nome
A opportuni passaggi). Verrà accettato in consegna solo il presente plico. 2. [9] Una certa zona è servita da 4 compagnie telefoniche. Per ciascuna compagnia è stato rilevato il costo al minuto (in centesimi
DettagliEsercizio 1 Nella seguente tabella sono riportate le lunghezze in millimetri di 40 foglie di platano:
4. STATISTICA DESCRITTIVA ESERCIZI Esercizio 1 Nella seguente tabella sono riportate le lunghezze in millimetri di 40 foglie di platano: 138 164 150 132 144 125 149 157 146 158 140 147 136 148 152 144
DettagliSCOPO DELL ANALISI DI CORRELAZIONE
CORRELAZIONE 1 SCOPO DELL ANALISI DI CORRELAZIONE STUDIARE LA RELAZIONE TRA DUE VARIABILI X E Y 2 diagrammi di dispersione un diagramma di dispersione (o grafico di dispersione) èuna rappresentazione grafica
DettagliΣ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica
13. Regressione lineare parametrica Esistono numerose occasioni nelle quali quello che interessa è ricostruire la relazione di funzione che lega due variabili, la variabile y (variabile dipendente, in
DettagliStatistiche e relazioni
tatistiche descrittive per frequenze e misure Frequenze e misure Per le frequenze e le misure, molte di queste statistiche perdono senso. In compenso, esistono indici appropriati, inutilizzabili per i
DettagliDIPENDENZA E ASSOCIAZIONE DISTRIBUZIONE CONGIUNTA DI DUE VARIABILI. Ci limiteremo a considerare il caso di due variabili.
DIPENDENZA E ASSOCIAZIONE DISTRIBUZIONE CONGIUNTA DI DUE VARIABILI Sinora abbiamo considerato l analisi di un unica variabile per volta Tuttavia, le rilevazioni su un unità statistica sono in generale
DettagliLa dipendenza. Antonello Maruotti
La dipendenza Antonello Maruotti Outline 1 Distribuzioni doppie 2 Medie e varianze condizionate 3 Indici di associazione Distribuzione doppia Definizione Una distribuzione doppia si ha quando su di uno
DettagliStatistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill
Statistica - metodologie per le scienze economiche e sociali /e S Borra, A Di Ciaccio - McGraw Hill Es 6 Soluzione degli esercizi del capitolo 6 In base agli arrotondamenti effettuati nei calcoli, si possono
DettagliEsercizi di statistica descrittiva. Giulia Simi (Università di Siena) Istituzione di matematica e fondamenti di Biostatistica Siena / 30
Esercizi di statistica descrittiva Giulia Simi (Università di Siena) Istituzione di matematica e fondamenti di Biostatistica Siena 2015-2016 1 / 30 Esercizio 1 Nel rilevare l altezza di un gruppo di reclute,
DettagliSTATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo
STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)
DettagliIstituzioni di Statistica 1 Esercizi su tabelle di contingenza
Istituzioni di Statistica 1 Esercizi su tabelle di contingenza Esercizio 1 Per stimare la percentuale di fumatori nella popolazione italiana adulta viene intervistato un campione di 60 donne e uno di 40
DettagliCORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Misura dell associazione tra due caratteri Uno store manager è interessato a studiare la relazione
DettagliAnalisi congiunta di più fenomeni
Analisi congiunta di più fenomeni Dati relativi al disastro del Titanic: Morti Sopravvissuti Classe Sesso Età 1 a Uomini Bambini 0 5 Adulti 118 57 Donne Bambini 0 1 Adulti 4 140 2 a Uomini Bambini 0 11
DettagliMETODO DEI MINIMI QUADRATI
Vogliamo determinare una funzione lineare che meglio approssima i nostri dati sperimentali e poter decidere sulla bontà di questa approssimazione. Sia f(x) = mx + q, la coppia di dati (x i, y i ) appartiene
DettagliIstituzioni di Statistica e Statistica Economica
Istituzioni di Statistica e Statistica Economica Università degli Studi di Perugia Facoltà di Economia, Assisi, a.a. 2013/14 Esercitazione n. 1 A. I dati riportati nella seguente tabella si riferiscono
DettagliRegressione e correlazione
Regressione e correlazione Quando l osservazione statistica porta alla rilevazionedi dati esprimibili come coppie ordinate di numeri (x i ;y i ) si pone sia il problema di trovare, ammesso che ci sia,
DettagliCapacità: Analizzare un problema semplice. Valutare la congruenza dei risultati con i dati e le informazioni iniziali.
MATEMATICA: PROGRAMMAZIONE CLASSE QUINTA LICEO TURISTICO A.S. 2011-2012 A) OBIETTIVI Conoscenze: Le caratteristiche di una funzione lineare in due variabili reali. Gli scopi e i metodi della ricerca operativa.
DettagliEsercizi in preparazione all esame di. Laboratorio del corso di Principi di Informatica. Prof.sse M. Anselmo e R. Zizza. a.a.
Esercizi in preparazione all esame di Laboratorio del corso di Principi di Informatica Prof.sse M. Anselmo e R. Zizza a.a. 2012/13 NOTA: E necessario salvare il file come .xlsx e inserire
DettagliEsercizi riepilogativi (dai compiti dell A.A. 2001/02 IV canale)
Esercizi riepilogativi (dai compiti dell A.A. 2001/02 IV canale) Grafici e distribuzioni univariate 1. Da un campione di 100 aziende agricole della provincia di Bologna è stata rilevata la classe di superficie
DettagliStatistica Descrittiva Soluzioni 6. Indici di variabilità, asimmetria e curtosi
ISTITUZIONI DI STATISTICA A A 2007/2008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona
DettagliUniversità del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica
Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Regressione Lineare e Correlazione Argomenti della lezione Determinismo e variabilità Correlazione Regressione Lineare
DettagliStatistica a.a Autovalutazione 1
Statistica a.a. 016-17 Autovalutazione 1 CORSO: Diritto per le Imprese e le Istituzioni ATTENZIONE: alle domande aperte è stato dato un possibile esempio di risposta, altre parole possono essere usate
DettagliRingraziamenti dell Editore
Indice Elenco dei simboli e delle abbreviazioni in ordine di apparizione Ringraziamenti dell Editore XI XVII 1 Introduzione FAQ e qualcos altro, da leggere prima 1 1.1 QuestoèunlibrodiStatistica....................
DettagliIndice. 1. Premessa Le relazioni tra coppie di caratteri L analisi della contingenza L analisi della correlazione...
INSEGNAMENTO DI STATISTICA DEL TURISMO LEZIONE IX LE RELAZIONI TRA CARATTERI PROF. GIOVANNI DI TRAPANI Indice 1. Premessa.... 3 2. Le relazioni tra coppie di caratteri.... 4 3. L analisi della contingenza....
DettagliEsercitazioni di Statistica Metodologica
Esercitazioni di Statistica Metodologica June 22, 2009 1 Esercizio La compagnia di telefonia fissa Happy Line ha svolto una indagine sul numero di telefonate effettuate dai suoi clienti la settimana scorsa.
DettagliTeoria e tecniche dei test. Concetti di base
Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi
DettagliPROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE
PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE 1. Distribuzione congiunta Ci sono situazioni in cui un esperimento casuale non si può modellare con una sola variabile casuale,
DettagliStatistica e informatica
Statistica e informatica Statistica descrittiva:variabili doppie Francesco Pauli & Nicola Torelli A.A. 2016/2017 Solo una variabile... Finora abbiamo trattato di come rappresentare graficamente, sintetizzare
DettagliESERCIZI DI RIEPILOGO 1
ESERCIZI DI RIEPILOGO 1 ESERCIZIO 1 La tabella seguente contiene la distribuzione di frequenza della variabile X = età (misurata in anni) per un campione casuale di bambini: x i 4.6 8 3.2 3 5.4 6 2.6 2
DettagliEsercitazione del
Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36
DettagliLa retta di regressione
La retta di regressione Michele Impedovo Uno dei temi nuovi e centrali per il rinnovamento dei programmi di matematica, che si impone in modo naturale quando si abbia a disposizione un qualunque strumento
DettagliAnalisi delle corrispondenze
Capitolo 11 Analisi delle corrispondenze L obiettivo dell analisi delle corrispondenze, i cui primi sviluppi risalgono alla metà degli anni 60 in Francia ad opera di JP Benzécri e la sua equipe, è quello
DettagliStatistica - Esercitazione 1 Dott. Danilo Alunni Fegatelli
Esercizio 1: Statistica - Esercitazione 1 Dott. Danilo Alunni Fegatelli danilo.alunnifegatelli@uniroma1.it (a) Religione (b) Reddito familiare (c) Salario in Euro (d) Classe di reddito (I, II, ecc.) (e)
DettagliProgrammazione con Foglio di Calcolo Cenni di Statistica Descrittiva
Fondamenti di Informatica Ester Zumpano Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva Lezione 5 Statistica descrittiva La statistica descrittiva mette a disposizione il calcolo di
DettagliStatistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione
Statistica Esercitazione alessandro polli facoltà di scienze politiche, sociologia, comunicazione Obiettivo Questa esercitazione ha l obiettivo di consolidare ulteriormente gli strumenti di analisi bivariata
Dettagli1 4 Esempio 2. Si determini la distribuzione di probabilità della variabile casuale X = punteggio ottenuto lanciando un dado. Si ha immediatamente:
CAPITOLO TERZO VARIABILI CASUALI. Le variabili casuali e la loro distribuzione di probabilità In molte situazioni, dato uno spazio di probabilità S, si è interessati non tanto agli eventi elementari (o
DettagliITCS Erasmo da Rotterdam. Anno Scolastico 2014/2015. CLASSE 4^ M Costruzioni, ambiente e territorio
ITCS Erasmo da Rotterdam Anno Scolastico 014/015 CLASSE 4^ M Costruzioni, ambiente e territorio INDICAZIONI PER IL LAVORO ESTIVO DI MATEMATICA e COMPLEMENTI di MATEMATICA GLI STUDENTI CON IL DEBITO FORMATIVO
DettagliSTATISTICA DESCRITTIVA (canale B)
STATISTICA DESCRITTIVA (canale B) compito n. 1 del 28 marzo 2008 nome e cognome: corso di laurea: Astronomia matricola: Parte teorica Si ricorda che la corretta risposta ai quesiti della parte teorica
DettagliStatistica Descrittiva III
Serie Bi-variate Statistica Descrittiva III Definizioni Serie statistiche bi-variate Rappresentazioni tabellari e grafiche Indici di posizione e di variabilità Dipendenza lineare: retta di regressione
DettagliTra i non fumatori qual è la percentuale di non utilizzatori di sostanze stupefacenti? Scegli un'alternativa: a. 86% b. 10% c. 50% d. 25% e.
Domanda 1 Una misura di sintesi di una distribuzione si dice robusta se... a. Risulta particolarmente sensibile ai valori anomali (valori molto piccoli o molto grandi) c. Non risulta particolarmente sensibile
DettagliEsercizio 1 Questa tabella esprime i tempi di durata di 200 apparecchiature elettriche:
Istituzioni di Statistica 1 Esercizi su indici di posizione e di variabilità Esercizio 1 Questa tabella esprime i tempi di durata di 200 apparecchiature elettriche: Durata (ore) Frequenza 0 100? 100 200
DettagliEsercitazioni di Statistica
Esercitazioni di Statistica Indici di posizione e di variabilità Prof. Livia De Giovanni lstatistica@dis.uniroma1.it Esercizio 1 Data la seguente distribuzione unitaria del carattere X: X : 4 2 4 2 6 4
DettagliEsercitazione II Statistica e Calcolo delle Probabilità (con soluzioni)
Esercitazione II Statistica e Calcolo delle Probabilità (con soluzioni) Esercizio 1: Alla fine di una giornata di lavoro un intervistatore si accorge di aver perso i dati raccolti su un certo numero di
DettagliSTATISTICHE DESCRITTIVE Parte II
STATISTICHE DESCRITTIVE Parte II INDICI DI DISPERSIONE Introduzione agli Indici di Dispersione Gamma Differenza Interquartilica Varianza Deviazione Standard Coefficiente di Variazione introduzione Una
DettagliTest per la correlazione lineare
10 Test per la correlazione lineare Istituzioni di Matematica e Statistica 2015/16 E. Priola 1 Introduzione alla correlazione lineare Problema: In base ai dati che abbiamo possiamo dire che c è una qualche
DettagliCon riferimento ai dati riportati nella seguente tabella, indicare la tipologia dei caratteri rilevati.
Corso di Laurea INTERFACOLTÀ - Esercitazione di Statistica n 1 ESERCIZIO 1: Con riferimento ai dati riportati nella seguente tabella, indicare la tipologia dei caratteri rilevati. ESERCIZIO 1 Soluzione:
DettagliUniversità di Cassino Corso di Statistica 1 Esercitazione del 15/10/2007 Dott. Alfonso Piscitelli. Esercizio 1
Università di Cassino Corso di Statistica 1 Esercitazione del 15/10/2007 Dott. Alfonso Piscitelli Esercizio 1 Il seguente data set riporta la rilevazione di alcuni caratteri su un collettivo di 20 soggetti.
Dettaglix i. Δ x i
ITCS "R. LUXEMBURG" BO- AS 011-01 5CL MATEMATICA- COGOME: OME: VERIFICA UD 1.A : STATISTICA DESCRITTIVA (ORE ) DATA: 1] Data la serie del numero di componenti dei nuclei familiari rilevati in un gruppo
DettagliCORSO DI STATISTICA (parte 1) - ESERCITAZIONE 4
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 4 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Differenze semplici medie, confronti in termini di mutua variabilità La distribuzione del prezzo
DettagliCORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2 Dott.ssa Antonella Costanzo a.costanzo@unicas.it TIPI DI MEDIA: GEOMETRICA, QUADRATICA, ARMONICA Esercizio 1. Uno scommettitore puntando una somma iniziale
DettagliLezione 8. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 8. A. Iodice. Relazioni tra variabili
Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 26 Outline 1 2 3 4 () Statistica 2 / 26 Misura del legame Data una variabile doppia (X, Y ), la misura
DettagliLezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria
Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata Prof. Massimo Aria aria@unina.it Il concetto di interpolazione In matematica, e in particolare in
DettagliA proposito di valutazione scolastica
A proposito di valutazione scolastica Livello scolare: 2 biennio Abilità interessate Identificare situazioni che richiedono di rilevare lo stesso carattere su una unità statistica formata da 2 elementi,
DettagliCovarianza, correlazione e retta di regressione. Paola Lecca, CIBIO UNITN Corso di Matematica e Statistica 2
Covarianza, correlazione e retta di regressione Paola Lecca, CIBIO UNITN Corso di Matematica e Statistica 2 Questa presentazione è stata preparata attingendo dai seguenti testi S. M. Iacus, Statistica,
DettagliAnno Scolastico 2015/16 PROGRAMMAZIONE ANNUALE CLASSE TERZA LICEO LINGUISTICO LICEO DELLE SCIENZE UMANE LICEO ECONOMICO-SOCIALE LICEO MUSICALE
LICEO LAURA BASSI - BOLOGNA Anno Scolastico 2015/16 PROGRAMMAZIONE ANNUALE CLASSE TERZA LICEO LINGUISTICO LICEO DELLE SCIENZE UMANE LICEO ECONOMICO-SOCIALE LICEO MUSICALE MATEMATICA ARGOMENTI: DIVISIONE
DettagliLa statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci
La statistica Elaborazione e rappresentazione dei dati Gli indicatori statistici Introduzione La statistica raccoglie ed analizza gruppi di dati (su cose o persone) per trarne conclusioni e fare previsioni
DettagliL errore percentuale di una misura è l errore relativo moltiplicato per 100 ed espresso in percentuale. Si indica con e p e risulta: e ( e 100)%
UNITÀ L ELBORZIONE DEI DTI IN FISIC 1. Gli errori di misura.. Errori di sensibilità, errori casuali, errori sistematici. 3. La stima dell errore. 4. La media, la semidispersione e lo scarto quadratico
DettagliESERCIZI CORRELAZIONE
ESERCIZI CORRELAZIONE Marco Riani Es: 6 famiglie, ammontare della spesa annua (in euro) per l acquisto di due generi di largo consumo: latte fresco e biscotti. Famiglia Spesa annua per l acquisto di latte
DettagliMATEMATICA CORSO A II COMPITINO (Tema 1) 5 Aprile 2013
MATEMATICA CORSO A II COMPITINO (Tema 1) 5 Aprile 2013 Soluzioni 1. Due sperimentatori hanno rilevato rispettivamente 25 e 5 misure di una certa grandezza lineare e calcolato le medie che sono risultate
DettagliStatistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill
Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill Es. Soluzione degli esercizi del capitolo 6 home - indice In base agli arrotondamenti effettuati nei calcoli,
DettagliDispensa di Statistica
Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza
DettagliESERCITAZIONE IV - Soluzioni
umero di omicidi ESERCITAZIOE IV - Soluzioni Esercizio I. a),00 12,00 10,00 8,00 6,00 4,00 2,00 0,00 0 5 10 15 20 25 Popolazione povera (%) b) Poiché i due caratteri in analisi sono quantitativi per calcolare
DettagliPROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA
PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURA/TECNICA DI ANALISI DEI DATI SPECIFICAMENTE DESTINATA A STUDIARE LA RELAZIONE TRA UNA VARIABILE NOMINALE (ASSUNTA
DettagliStatistica di base per l analisi socio-economica
Laurea Magistrale in Management e comunicazione d impresa Statistica di base per l analisi socio-economica Giovanni Di Bartolomeo gdibartolomeo@unite.it Definizioni di base Una popolazione è l insieme
DettagliDistribuzioni Statistiche e Medie Esercitazione n 01
Distribuzioni Statistiche e Medie Esercitazione n 01 ESERCIZIO 1 In una clinica pediatrica si è registrato, nell'ultima settimana, il peso alla nascita dei neonati (in kg): Peso (in Kg) 2,7 1,8 4,6 2,9
DettagliLa matrice delle correlazioni è la seguente:
Calcolo delle componenti principali tramite un esempio numerico Questo esempio numerico puó essere utile per chiarire il calcolo delle componenti principali e per introdurre il programma SPAD. IL PROBLEMA
DettagliFacoltà di Scienze Politiche Corso di laurea in Servizio sociale. Compito di Statistica del 7/1/2003
Compito di Statistica del 7/1/2003 I giovani addetti all agricoltura in due diverse regioni sono stati classificati per età; la distribuzione di frequenze congiunta è data dalla tabella seguente Età in
DettagliSTATISTICA 1 ESERCITAZIONE 2
Frequenze STATISTICA 1 ESERCITAZIONE 2 Dott. Giuseppe Pandolfo 7 Ottobre 2013 RAPPRESENTAZIONE GRAFICA DEI DATI Le rappresentazioni grafiche dei dati consentono di cogliere la struttura e gli aspetti caratterizzanti
DettagliStatistica Analisi bidimensionale La dipendenza in media. alessandro polli facoltà di scienze politiche, sociologia, comunicazione
Statistica Analisi bidimensionale La dipendenza in media alessandro polli facoltà di scienze politiche, sociologia, comunicazione Obiettivo Nella sezione precedente abbiamo esaminato i principali metodi
DettagliFACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 21/09/2011
FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 1/9/11 ESERCIZIO 1 (+3++3) La seguente tabella riporta la distribuzione di frequenza dei valori di emoglobina nel sangue (espressi
DettagliANALISI MULTIVARIATA
ANALISI MULTIVARIATA Marcella Montico Servizio di epidemiologia e biostatistica... ancora sulla relazione tra due variabili: la regressione lineare semplice VD: quantitativa VI: quantitativa Misura la
Dettagli