CORSO DI LAUREA IN OTTICA E OPTOMETRIA CORSO DI INFORMATICA E STATISTICA DANIELE.MONTANINO@UNISALENTO.IT

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "CORSO DI LAUREA IN OTTICA E OPTOMETRIA CORSO DI INFORMATICA E STATISTICA DANIELE.MONTANINO@UNISALENTO.IT"

Transcript

1 CORSO DI LAUREA IN OTTICA E OPTOMETRIA CORSO DI INFORMATICA E STATISTICA DANIELE.MONTANINO@UNISALENTO.IT

2 CONVENZIONE SULLE CIFRE SIGNIFICATIVE La convenzione usata sul troncamento delle cifre è troncare semplicemente le cifre non significative se la cifra successiva è <5 Aumentare di una unità l ultima cifra significativa se la cifra successiva è 5 esempio: troncare a 2 cifre significative i seguenti numeri 2,35471 = 2,35 3,45567 = 3,46 8,49735 = 8,50 1,99801 = 2,00 ricordare che bisogna sempre scrivere esplicitamente tutte le cifre significative anche se queste sono zeri (come nell ultimo caso).

3 VARIABILI Variabili Qualitative (esempio colore degli occhi, visone chiara o sfocata ) Quantitative o numeriche (esempio diottrie, distanza interpupillare ) Tipi di variabili quantitative Discrete (esempio voto, età di un paziente in anni ) Continue (esempio altezza di un soggetto )

4 INSIEME DI VARIABILI Insieme di variabili { x 1, x 2, x } N { x } k k=1,n k=indice (o pedice). N=numerosità del campione esempio: i voti di 5 studenti all esame di Informatica e Statistica { x 1, x 2, x 3, x 4, x } 5 = { 28, 22, 25, 21,30}

5 SOMMA Somma (o sommatoria) di N numeri N x k k=1 = x 1 + x x N Nell esempio precedente 5 k=1 x k = =126

6 PROPRIETÀ DELLA SOMMA La somma è un operazione lineare N k=1 con A e B costanti; infatti N (Ax k + B) = A N k=1 x k + NB (Ax k + B) = (Ax 1 + B) + (Ax N + B) = A(x x N )+ (B B) k=1 N volte Per esempio nel caso precedente se moltiplichiamo per 10 e sommiamo 5 ad ogni numero abbiamo { 10x 1 + 5,10x 2 + 5,10x 3 + 5,10x 4 + 5,10x 5 + 5} = { 285, 225, 255, 215,305} che sommati danno 1285, cioè 10x126+5x5.

7 SOMMA Esercizio: provare con qualche esempio che N k=1 N k=1 k = N = k 2 = N 2 = N(N +1) 2 N(N +1)(2N +1) 6

8 PRODOTTO Prodotto (o produttoria)di N numeri N k=1 x k = x 1 x 2 Fattoriale: è definito come N k=1 x N N! = k =1 2 N Questa funzione tornerà utile in seguito. Il fattoriale è un numero che cresce molto velocemente 0!=1 (per definizione); 1!=1; 2!=2; 3!=6; 4!=24; 5!=120; 6! =720; 20!= ;

9 MEDIA DI UN CAMPIONE La media di un campione di dati è definita da X = 1 N N x k k=1 Esempio: nel caso precedente la media dei voti del campione dei cinque studenti sarà X = k=1 x k = = 25, 2

10 PROPRIETÀ DELLA MEDIA Usando le proprietà di linearità della somma è facile mostrare che la media è una operazione lineare con A e B costanti e AX + B = AX + B Ax + By + C = Ax + By + C In particolare la media degli scarti è zero X X = X X = 0

11 MEDIA GEOMETRICA La media definita precedentemente è la cosiddetta media lineare (o aritmetica). Esistono altri tipi di media. Vale la pena menzionare la media geometrica M g = N N x k k=1 questa media è usata quando sia ha a che fare con variabili moltiplicative (ad esempio tassi di crescita o di interesse).

12 MEDIA GEOMETRICA Esempio: il numero di batteri in una colonia cresce del 120% nelle prima ora, del 140% nella seconda del 130% nella terza e del 110% nella quarta ora. Qual è il tasso di crescita medio nelle quattro ore? La risposta è R = 4 1, 2 1, ,1 =1, , 5% Infatti se la colonia crescesse del 124,5% ogni ora l incremento totale finale sarebbe lo stesso.

13 FREQUENZE Le frequenze rappresentano il numero di occorrenze di una variabile sia qualitativa che quantitativa Esempio di variabile qualitativa: In un campione di 128 persone si verifica il loro colore degli occhi Colore degli occhi Frequenza Assoluta Frequenza relativa Neri 25 19,5% Nocciola 32 25,0% Blu 40 31,3% Verdi 31 24,2% Totale 128 La frequenza relativa è la frazione del numero rispetto al totale

14 FREQUENZA Vediamo il caso di una variabile quantitativa: voti di un campione di 300 studenti in un determinato esame Voto in trentesimi Studenti (frequenza) Totale 300

15 DISTRIBUZIONE DI FREQUENZA La precedente tabella può essere tradotta in istogramma. Questa sarà la distribuzione dei dati Numero di studenti Voto

16 CLASSI A volte è comodo o necessario raggruppare la variabile in esame in classi. Per esempio potremmo raggruppare la tabella dei voti precedenti in tre macroclassi : da 18 a 22, da 23 a 27 e da 28 a 30 Voti Numero di studenti Questo raggruppamento diventa evidentemente necessario quando si ha a che fare con variabili continue (esempio: l altezza di un campione di persone).

17 CUMULATIVA Dalla tabella precedente è possibile anche costruire la tabella delle cumulative Voto Studenti Cumulativa Totale 300 L ultima colonna è costruita sommando via via le frequenze precedenti. Per esempio nel caso precedente il numero di studenti che hanno preso un voto 25 sarà 200 Ovviamente la distribuzione cumulativa ha senso solo se la variabile è di tipo numerico

18 DISTRIBUZIONE CUMULATIVA Numero di studenti Voto

19 CUMULATIVA RELATIVA Dividendo le cumulative per la numerosità totale del campione si ha la cumulativa relativa. Nell esempio precedente si ha che, ad esempio, il 38.7% degli studenti ha un voto inferiore o uguale al 23. Voto Cum. relativa 18 0,7% 19 2,7% 20 6,3% 21 14,3% 22 26,0% 23 38,7% 24 55,0% 25 66,7% 26 77,7% 27 88,0% 28 94,3% 29 98,3% ,0% Numero di studenti 120,0% 100,0% 80,0% 60,0% 40,0% 20,0% 0,0% Voto

20 RIASSUMENDO Variabile frequenza assoluta frequenza relativa cumulativa assoluta cumulativa relativa x 1 n 1 f 1 s 1 c 1 x 2 n 2 f 2 s 2 c 2 x N n n f N s N c N n = N n k k=1 f k = n k n s k = k n i i=1 c k = s k n

21 MEDIA PESATA (O PONDERATA) Quando si ha a che fare con una tabella di frequenze la media di una variabile deve essere ovviamente pesata sulla frequenza della variabile X = 1 n N k=1 n k x k o alternativamente X = N k=1 f k x k questo perché la variabile x k appare n k volte nella tabella (nell esempio dei voti è come se dovessimo sommare 18 per 2 volte, 19 per 6 volte e così via e dividere per tutti e 300 gli studenti)

22 MEDIA PESATA Voto x k Studenti n k Frequenza relativa f k f k *x k ,7% 0, ,0% 0, ,7% 0, ,0% 1, ,7% 2, ,7% 2, ,3% 3, ,7% 2, ,0% 2, ,3% 2, ,3% 1, ,0% 1, ,7% 0,50 Totale studenti= 300 voto medio= 24,31

23 MEDIANA La mediana è quel valore per cui metà della distribuzione è inferiore e metà è superiore ad esso Esempio: si è misurata la miopia in un campione di studenti ottenendo la seguente distribuzione Diottrie Persone Cumulativa relativa 0, ,7% 0, ,1% 1, ,6% 1, ,0% 2, ,3% 2, ,5% 3, ,3% 3, ,8% 4, ,9% 4, ,6% 5, ,3% 5, ,7% 6, ,1% 6, ,5% 7, ,9% 7, ,2% 8, ,6% 8,5 9 99,8% 9,0 7 99,9% 9,5 3 99,9% 10, ,0% Osserviamo come il valore della cumulativa relativa assume il valore 50% in corrispondenza di 1,5 diottrie. Questa sarà il valore mediano poiché metà dei soggetti avrà una miopia inferiore a 1.5 diottrie e un altra metà superiore. Si noti come il valore della mediana non necessariamente coincida con la media (nel caso precedente vale 2 diottrie).

24 MEDIANA Voto Cum. relativa 18 0,7% 19 2,7% 20 6,3% 21 14,3% 22 26,0% 23 38,7% 24 55,0% 25 66,7% 26 77,7% 27 88,0% 28 94,3% 29 98,3% ,0% A volte la mediana non è ben definita. Riprendendo l esempio dei voti notiamo che non c è nessun valore corrispondente al 50%. In tal caso (sebbene esistano formule più sofisticate) per semplicità potremmo prendere il valore intermedio tra le classi a cavallo del 50%. Per esempio nel caso precedente il voto mediano sarebbe 23,5.

25 QUARTILI Allo stesso modo della mediana è possibile definire i quartili inferiore e superiore (ovvero i valori per cui il sotto cui troviamo il 25% e il 75% della popolazione) Diottrie Persone Cumulativa relativa 0, ,7% 0, ,1% 1, ,6% 1, ,0% 2, ,3% 2, ,5% 3, ,3% 3, ,8% 4, ,9% 4, ,6% 5, ,3% 5, ,7% 6, ,1% 6, ,5% 7, ,9% 7, ,2% 8, ,6% 8,5 9 99,8% 9,0 7 99,9% 9,5 3 99,9% 10, ,0% Seguendo il criterio precedente potremmo grosso modo identificare il quartile inferiore con il valore 1,75 e quello superiore con 2,75

26 PERCENTILI Un ulteriore raffinamento dei concetti precedenti sono i percentili. Per esempio il 90% percentile inferiore e superiore sono quei valori per cui al di sotto troviamo il 10% e il 90% della popolazione. nell esempio della miopia all incirca solo il 5% della popolazione ha meno di 0.25 diottrie mentre chi ha più di 3,5 diottrie è nel 95% percentile superiore. 100,0% 90,0% 80,0% 70,0% 90% 75% 60,0% 50,0% 40,0% 30,0% 20,0% 10,0% 0,0% 1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 10,0 11,0 12,0 13,0 14,0 15,0 16,0 17,0 18,0 19,0 20,0 21,0 x 50% 20% 10%

27 MODA La moda è il valore più comune in una distribuzione. Per esempio nell esempio dei voti la moda è il 24 mentre nell esempio della miopia la moda è 1,5 diottrie. Talvolta una distribuzione può avere due picchi distinti ben localizzati. In tal caso la distribuzione si dice bimodale (più in generale possono esistere distribuzioni multimodali ) 1200,0 1000,0 800,0 600,0 400,0 200,0 Una distribuzione del genere può essere sintomo di due popolazioni distinte (per esempio se misurassimo la miopia ad un campione di persone in parte italiane e in parte giapponesi, popolo notoriamente più miope) 0,0 1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 10,0 11,0 12,0 13,0 14,0 15,0 16,0 17,0 18,0 19,0 20,0 21,0

28 ESEMPIO Una fabbrica produce viti per occhiali attraverso tre macchine di lunghezza nominale 1,1mm. Si estrae un campione di 430 viti e si fa un istogramma della loro lunghezza reale Lunghezza (mm) Numero 0,85 0 0,90 2 0,95 8 1, , , , , ,25 7 1,30 1 1,35 2 1,40 4 1, , , ,60 2 1,65 1 1,70 1 1,75 0 1, ,85 0,90 0,95 1,00 1,05 1,10 1,15 1,20 1,25 1,30 1,35 1,40 1,45 1,50 1,55 1,60 1,65 1,70 1,75 1,80 Il fatto che vi è un secondo picco a 1.50 mm fa pensare che una delle macchine stia lavorando male ovvero sta producendo viti sistematicamente più lunghe di quelle programmate.

29 MEDIA PESATA SU CLASSI Talvolta occorre calcolare la media su di una tabella di classi. Prendiamo ad esempio la tabella dei voti suddivisa in classi Voti Numero di studenti Poiché non conosciamo il numero relativo di studenti relativo ad ogni voto, siamo costretti a scegliere un criterio per assegnare un voto medio ad ogni classe. La scelta più semplice è di considerare il valore centrale della classe

30 MEDIA PESATA SU CLASSI Voti Voto medio Numero di studenti La media pesata su questa tabella vale 24,18 che è solo leggermente diverso dal valore 24,31 calcolata con la tabella non suddivisa in classi. In ogni caso la suddivisione in classi provoca una perdita di informazioni e quindi fornisce un valore meno accurato per le variabili statistiche.

31 TABELLE A DOPPIA ENTRATA Un caso più generale avviene quando una tabella incrocia due (o più) variabili y 1 y 2 y M x 1 n 1,1 n 2,1 n 1,M x 2 n 2,1 n 2,2 n 2,M x N n N,1 n N,2 n N,M Una tabella di questo tipo viene detta a doppia entrata, o bivariata. In principio possono esistere anche tabelle che incrociano più di due variabili (multivariate) ma la loro rappresentazione è più difficoltosa. Per semplicità ci limiteremo a tabelle a doppia entrata.

32 TABELLE A DOPPIA ENTRATA Esempio di tabella a doppia entrata. X=colore degli occhi, Y=colore dei capelli Biondi Rossi Castani Σ Azzurri Verdi Σ Marginali di riga Marginali di colonna Totale generale Se X e Y qualitativi la tabella si dice di contingenza, se entrambi quantitativi di correlazione, se uno qualitativo e uno quantitativo si dice tabella mista.

33 MARGINALI Marginali di riga n i, = M n i, j j=1 Marginali di colonna n, j = N n i, j i=1 Totale generale N n = n i, = n, j = i=1 M j=1 N i=1 M j=1 n i, j

34 ESEMPIO DI TABELLA A DOPPIA ENTRATA Per esempio si supponga di avere la seguente tabella in cui si è misurato il grado di astigmatismo residuo su due campioni di persone che hanno eseguito due tecniche di chirurgia refrattiva (PRK o LASIK) Asitig. (diottrie) PRK LASIK n i* n *j L ultima riga sono le persone che hanno effettuato un certo tipo di intervento, l ultima colonna sono le persone che hanno un certo grado di astigmatismo residuo indipendentemente dal tipo di intervento.

35 ISTOGRAMMA E possibile costruire un istogramma per entrambe le entrate e il marginale di riga PRK LASIK PRK+LASIK ,1 0,2 0,3 0,4 0,5 0,6 Astig. (diottrie) 0,7 0,8 0,9 1 LASIK PRK PRK+LASIK

36 MEDIE PARZIALI Le medie su di una riga o una colonna costituiscono le medie parziali. Queste medie possono evidentemente essere effettuate se x e/o y sono variabili quantitative X j = 1 n j per esempio nel caso della tabella precedente possiamo calcolare solo le medie di colonna poiché le variabili di riga sono qualitative. Calcolando queste medie otteniamo separatamente l astigmatismo medio per chi ha eseguito l intervento con la PRK e la LASIK ottenendo (il calcolo è lasciato per esercizio): Media(PRK) = 0,32 Media(LASIK) = 0,46 N n i, j x i Y i = 1 n i, j y j n i i=1 M j=1 (attenzione: questo non induca alla facile conclusione che la LASIK è peggiore della PRK!)

37 MEDIE GENERALI Nelle tabelle a doppia entrata è anche possibile calcolare le medie generali delle variabili quantitative. Queste sono calcolate attraverso le formule X = 1 n Y = 1 n M j=1 N i=1 n, j X j n i, Y i = 1 n = 1 n N i=1 M j=1 n i, x i n, j y j ovvero come media pesata delle medie parziali oppure come una media delle variabili stesse pesata con i marginali di riga e di colonna (si può mostrare che si ha lo stesso risultato).

38 ESEMPIO DI MEDIE GENERALI Riprendiamo l esempio della tabella precedente: vogliamo calcolare l astigmatismo medio su tutto il campione Asitig. (diottrie) PRK LASIK n i* n *j Media 0,32 0,46 Questo può essere effettuato in due modi 1) Calcoliamo la medie delle medie pesando le medie sui marginali di colonna 42 0, , 46 X = = 0, ) Mediamo direttamente la variabile x usando come peso i marginali di riga X = = 0,39 Il risultato è lo stesso ma avendo già le medie parziali conviene il primo calcolo.

39 ESERCIZIO In questa tabella un certo numero di pazienti trattati con PRK vengono classificati in base all alla correzione apportata e all astigmatismo residuo dopo l operazione. Trovare le medie parziali di riga e di colonna e le medie generali. Fare un istogramma delle medie parziali sia per le righe che per le colonne. Cosa si potrebbe dedurne? As6gma6smo residuo Correzione apportata (dio?rie)

40 MEDIA QUADRATICA Un tipo ulteriore di media è la media quadratica, ovvero la radice quadrata della media dei quadrati M q = N k=1 N x k 2 Tale media è utile quando i vari quando i vari x k sono talvolta positivi e talvolta negativi mentre a noi interessa una media che non dipenda dal segno degli x k

41 INDICE DI VARIABILITÀ A volte a noi non interessa solo la media ma di un campione ma anche quanto questa si discosta mediamente dalla media. Tuttavia, come detto in precedenza, la media degli scarti è sempre zero 1 N N (x k X) = 0 k=1 poiché alcuni scarti sono positivi e altri negativi. Questa media non ci da quindi alcuna informazione sulla variabilità. Una possibile soluzione sarebbe di prendere la media dei valori assoluti degli scarti. Tuttavia, per diverse ragioni, la scelta migliore è prendere la media quadratica degli scarti

42 SCARTO QUADRATICO MEDIO Si definisce scarto quadratico medio quindi la media quadratica degli scarti N (x k X) 2 σ P = k=1 X N (la lettera σ è il sigma greco minuscolo). Tuttavia questa definizione ha il problema che per N=1 si ha che lo scarto medio è zero mentre per un solo dato noi vorremmo che lo scarto rimanga non definito.

43 DEVIAZIONE STANDARD Per la ragione precedente si preferisce definire la deviazione standard nella maniera seguente σ x = N k=1 (x k X) 2 N 1 un po più grande rispetto allo s.q.m. La deviazione standard è una misura della dispersione della popolazione intorno alla media. Lo scarto quadratico medio (quello cioè con N al denominatore) è talvolta definito come deviazione standard di popolazione. Per N molto grande la differenza tra i due è minima. Il quadrato dello scarto quadratico medio è detto varianza

44 DEVIAZIONE STANDARD Facciamo un esempio. Si supponga che Laura e Marco abbiano preso abbia preso i seguenti voti in 10 esami Laura={25,26,26,27,24,25,26,28,27,26} Marco={30,22,24,28,27,30,18,24,30,27} Come si vede entrambi hanno una media di 26. Però la deviazione standard dei voti di Laura è di 1,15 mentre quella di Marco è 3,97. Ciò indica che Laura è stata più costante nello studio mentre Marco ha avuto periodi di alti e bassi Notare che se avessimo usato lo scarto quadratico medio avremmo ottenuto 1,09 e 3,76, valori un poco più grandi dei precedenti.

45 CALCOLO DELLA DEVIAZIONE STANDARD Vediamo coma calcolare la deviazione standard (nel nostro caso N=10) - - Voto (x k ) x k - X (x k - X) X=26 - (x k - X) 2 = - (x k - X) 2 /(N- 1)= - (x k - X) 2 /(N- 1)= 12 12/9=1,33 1,33=1,15

46 DEVIAZIONE STANDARD SU TABELLE Per calcolare la deviazione standard su una tabella di frequenze occorre fare la media ponderata σ X = 1 N 1 N k=1 n k (x k x) 2 con n al solito la numerosità del campione N = N n k k=1

47 CALCOLO DELLA DEVIAZIONE STANDARD SU TABELLE Riprendiamo l esempio della tabella dei voti Voto (x k ) Studenti (n k ) n k (x k -X) , , , , , , , , , , , , ,69 X=24.31 n k (x k -X) 2 = n k (x k -X) 2 /(n- 1) = n k (x k -X) 2 /(n- 1) = , ,55/299=6,66 6,66=2,58

48 COEFFICIENTE DI VARIAZIONE E definito come il rapporto tra la deviazione standard è la media CV(X) = σ X / X Esempio: la media dei tempi di percorrenza dei treni sulla tratta Milano- Roma vale 350 minuti con una deviazione standard di 12 minuti, mentre sulla tratta Milano-Torino vale 280 minuti con una deviazione standard di 8 minuti. Quale delle due tratte è più affidabile? E evidente che non è possibile confrontare direttamente i due tempi di percorrenza poiché si riferiscono a diverse tratte. Tramite l indice di variabilità si ha che nel primo caso si ha CV=3,4% mentre nel secondo caso si ha CV=2,9%. I treni sulla tratta Milano-Torino sono più affidabili poiché hanno una variabilità minore rispetto all altra tratta.

49 INTERDIPENDENZA TRA VARIABILI DIVERSE A volte ci si chiede se ci può essere una qualche relazione tra due variabili X e Y. Per esempio se esiste una relazione tra ore passate al computer e problemi visivi (ad es. miopia). Si supponga per esempio di avere questa tabella in cui la miopia media di un campione di bambini viene messa in relazione alle ore giornaliere passate mediamente a giocare con la playstation. Ore passate a giocare Miopia media 0,8 1,3 1,2 2,4 2,7 3,2 Di questi dati è sempre buona norma fare un grafico!

50 GRAFICO A DISPERSIONE (SCATTER PLOT) Apparentemente c è una qualche dipendenza della miopia con il numero di ore passate a giocare ma come quantificare questa dipendenza? 3,5 3,0 Miopia media 2,5 2,0 1,5 1,0 0,5 0,0 0,0 1,0 2,0 3,0 4,0 5,0 6,0 Numero di ore medie giornaliere passate a giocare Un primo possibile indicatore è il coefficiente di correlazione lineare

51 COVARIANZA La covarianza tra due serie di dati è definita da - - COV(X,Y ) = N k=1 (x k X)(y k Y ) con X e Y medie di x k e y k. Questo coefficiente è la media del prodotto degli scarti. Questo coefficiente è positivo se mediamente i segni degli scarti sono concordi (ovvero se quando uno è positivo lo è anche l altro) e negativo quando sono discordi(cioè se uno è negativo, l altro è positivo e viceversa. Se non c è relazione tra i due segni la covarianza tende ad annullarsi. N

52 COVARIANZA Nel caso precedente per esempio si vede che c è concordanza, in effetti la covarianza è positiva e vale +0,77 - X=2,50 3,5 3,0 + Miopia 2,5 2,0 1, Y=1,93 1,0 0,5 0,0 0,0 1,0 2,0 3,0 4,0 5,0 6,0 Numero di ore medie giornaliere passate a giocare

53 CORRELAZIONE - - Detti x k e y k due serie di N dati con media X e Y si definisce coefficiente di correlazione tra X e Y la quantità R(X,Y ) = COV(X,Y ) σ XP σ Y P = N k=1 N k=1 ( x k X) y k Y ( x k X) 2 ( ) ( y k Y ) 2 Questo coefficiente è sempre un numero compreso tra -1 e 1 e ha questo significato. Più R è vicino a 1 più vi è una concordanza tra le due variabili (al crescere di una cresce l altra) Più R è vicino a -1 più vi è una discordanza tra le due variabili (al crescere di una decresce l altra) Se R è vicino a zero vi è indipendenza tra le variabili. N k=1

54 CALCOLO DEL COEFFICIENTE DI CORRELAZIONE Ore passate a giocare 0,0 1,0 2,0 3,0 4,0 5,0 Media=2,50 - (x-x) -2,5-1,5-0,5 0,5 1,5 2,5 (x- X) - 2 6,3 2,3 0,3 0,3 2,3 6,3 =17,50 Miopia media 0,8 1,3 1,2 2,4 2,7 3,2 Media=1,93 (y- Y) - -1,1-0,6-0,7 0,5 0,8 1,3 (y- Y) - 2 1,3 0,4 0,5 0,2 0,6 1,6 =4,6 (x- X)(y- Y) - - 2,8 0,9 0,4 0,2 1,2 3,2 =8.7 Il coefficiente di correlazione vale quindi R = = 0.97 il che indica che vi è un forte grado di relazione tra le ore passate a giocare e la miopia.

55 CUM GRANO SALIS Occorre sempre stare attenti però che non è detto che anche se c è un grado di relazione tra le due variabili vi è necessariamente una relazione causa-effetto tra di esse! Si potrebbe giungere a conclusioni paradossali come per esempio che l aumento temperatura globale sulla terra è causata dalla diminuzione del numero di pirati R=-0,93

56 REGRESSIONE Ci si chiede se tra le variabili X e Y esista una qualche relazione funzionale, cioè se esista una espressione Y=f(X) dove f è una qualche funzione che in qualche maniera approssimi i dati. La ricerca di una tale funzione è detta regressione Questa relazione funzionale può essere nota a priori (per esempio è noto che tra il peso di un corpo e il suo volume esiste una relazione lineare) oppure no. In questo secondo evidentemente non esiste una scelta univoca caso dallo studio del grafico a dispersione si potrebbe dedurre qual è il tipo di grafico più opportuno che approssima i dati.

57 REGRESSIONE In generale, quando si hanno a disposizione pochi punti è molto difficile stabilire qual è la funzione più opportuna 4,0 3,5 esponenziale 3,0 Miopia media 2,5 2,0 1,5 polinomio 1,0 0,5 0,0 0,0 1,0 2,0 3,0 4,0 5,0 6,0 Numero di ore medie giornaliere passate a giocare Nel caso del polinomio abbiamo una interpolazione, ovvero una curva che passa per tutti i punti. In generale non ci interessa una tale relazione funzionale, ma di una curva che si limiti ad approssimare i dati.

58 REGRESSIONE Con un gran numero di dati è più facile inferire la forma funzionale: Per esempio nel caso seguente è abbastanza evidente che i dati sono ben interpolati da una retta

59 REGRESSIONE LINEARE Qui noi ci occuperemo per semplicità del modello più semplice di regressione, ovvero quando i dati possono essere approssimati da una retta, ovvero da una relazione funzionale del tipo Y = A X + B con A e B variabili da determinare. Questo modello è detto di regressione lineare.

60 PRINCIPIO DEI MINIMI QUADRATI Per determinare i coefficienti A e B è possibile ricorrere al principio dei minimi quadrati (valido anche nel caso di regressioni non lineari). Siano x k e y k sono i nostri dati. Il valore teorico di y associato al valore x k è dato da ŷ k =Ax k +B. 3,5 3,0 Y 2,5 2,0 1,5 1,0 0,5 (x k, ŷ k ) (x k,y k ) 0,0 0,0 1,0 2,0 3,0 4,0 5,0 6,0 X

61 METODO DEI MINIMI QUADRATI Possiamo calcolare la somma dei quadrati degli scarti tra gli y k e i valori teorici ŷ k =Ax k +B. Q(A, B) = N ( y k ŷ k ) 2 = y k Ax k B k=1 N k=1 ( ) 2 questa quantità ci da una misura delle differenze tra i valori reali e quelli teorici delle y. Essa è una funzione delle variabili incognite A e B. I valori di A e B cercati sono quelli che minimizzano questa funzione, ovvero che rendono minima la differenza del quadrato degli scarti della relazione teorica con i dati reali.

62 METODO DEI MINIMI QUADRATI La minimizzazione si effettua tramite le tecniche standard dell analisi, ovvero derivando la funzione Q(A,B) rispetto ad A e a B e ponendo le derivate uguali a zero. Viene qui omessa la dimostrazione e viene dato direttamente il risultato A = R σ Y σ X B = Y AX dove R è il coefficiente di correlazione tra i dati. Come si vede il coefficiente angolare della retta e il coefficiente di correlazione sono legati tra di loro. In particolare se R>0 la retta è crescente, se R<0 decrescente (come ragionevole sia!)

63 ESEMPIO DI REGRESSIONE LINEARE Riprendiamo l esempio della miopia in funzione delle ore passate a giocare: Ore passate a giocare Miopia media Media Ricordiamo che R=0,97. Usando le formule precedenti si ha Dev. st. 0,0 1,0 2,0 3,0 4,0 5,0 2,50 2,5 1,71 0,8 1,3 1,2 2,4 2,7 3,2 1,93 1,9 0,88 A = 0, 97 0,88 = 0, 50 1, 71 B =1, 9 0, 50 2, 5 = 0, 69 Miopia 3,5 3,0 2,5 2,0 1,5 1,0 0,5 y = 0,50x + 0,69 R² = 0,93 0,0 0,0 1,0 2,0 3,0 4,0 5,0 6,0 Ore passate a giocare

64 COEFFICIENTE DI DETERMINAZIONE Dalle relazioni precedenti abbiamo che per la retta di regressione la somma dei quadrati degli scarti vale N 2 Q = k=1 " y k Y R σ % Y $ (x k X) ' # σ X & dopo qualche calcolo, ricordando la definizione di R si ottiene la relazione Q N 1 = σ Y 2 (1 R 2 ) In pratica: 1) se R 2 =1 si ha Q=0 e la retta passa esattamente per tutti i punti (determinazione perfetta) 2) Se R 2 =0 si ha Q/(N-1)=σ Y2, l errore quadratico medio non è migliore della varianza. La regressione non porta a nessun miglioramento di informazione (indifferenza o determinazione nulla) R 2 è detto coefficiente di determinazione e la regressione porta un risultato tanto migliore quanto questo è più vicino a 1.

65 PREVISIONE L uso della regressione serve per fornire una previsione (o estrapolazione) dei valori y per valori x diversi da quelli dall insieme x k. Per esempio, nel caso dell esercizio precedente vogliamo prevedere la miopia di un soggetto che passa 6 ore al giorno davanti alla playstation. Usando l equazione della retta avremo y = 0, 50 6, 0 + 0, 69 = 3, 7 si noti comunque che questa è solo una rozza estrapolazione. Valori reali potrebbero essere diversi da questa previsione.

66 MISURE DI CONNESSIONE Passiamo ad un altro esempio di verifica di relazioni. Si supponga di voler verificare se l uso di lenti bifocali può dar luogo a disturbi di emicrania ad alcuni pazienti. Vengono intervistati 94 pazienti e viene estratta la seguente tabella di contingenza Ha frequenti emicranie Non frequentii emicrania Usa lenti bifocali Non lenti bifocali Ovviamente ci possono essere altre cause per l emicrania però apparentemente sembra esserci una prevalenza di persone che usano lenti bifocali che ha problemi, cioè una connessione tra l uso di lenti ed emicranie. Vogliamo quantificare questa connessione.

67 NUMERO TEORICO IN ASSENZA DI CONNESSIONE Per capire se vi è una effettiva connessione dei due caratteri o se il fatto che l eccesso di persone che usa lenti bifocali con emicrania sia solo un fatto casuale dobbiamo confrontare questa tabella con quella teorica in cui i due caratteri sono indipendenti. Per esempio: il numero atteso di persone sul campione di 94 persone che che usa lenti bifocali e ha problemi di emicrania se non vi fosse nessuna connessione tra le due cose sarebbe n * 1,1 = = 27, 6 Numero di persone con emicrania Frazione di persone sul totale che usa lenti bifocali

68 TABELLA TEORICA DI INDIPENDENZA In pratica per ogni elemento ij il numero teorico si calcola come segue n * i, j = n n i,, j n ovvero moltiplicando i marginali di riga e colonna corrispondenti e dividendo per il numero totale (non fa nulla se non è un numero intero). Per esempio per la tabella precedente la tabella teorica sarebbe. Ha frequenti emicranie Non frequentii emicrania Usa lenti bifocali Non lenti bifocali 27,6 25, ,4 19,

69 INDICE DI CONNESSIONE (O CHI-QUADRO DI PEARSON) Per confrontare la tabella teorica con quella reale è possibile utilizzare il χ 2 (leggesi chi-quadrato) di Pearson definito come χ 2 = N M (n i, j n * i, j ) 2 = i=1 j=1 * n i, j N i=1 M j=1 2 n i, j n i, j * n dove N e M sono il numero di righe e di colonne della tabella (2 e 2 nel nostro esempio).

70 CHI-QUADRATO DI PEARSON Nel nostro caso avremmo quindi Tabella n ij Usa lenti bifocali Non lenti bifocali Ha frequenti emicranie Non frequentii emicrania 8 33 Ha frequenti Usa lenti bifocali Non lenti bifocali emicranie 27,6 25,4 emicrania 21,4 19,6 Non frequentii Tabella n* ij χ 2 = (41 27, 6)2 27, 6 + (12 25, 4)2 25, 4 resta da capire come interpretare questo numero + (8 21, 4)2 21, 4 + (33 19, 6)2 19, 6 = 31

71 CHI-QUADRATO DI PEARSON E possibile dimostrare che il χ 2 è un numero sempre compreso tra 0 e il n moltiplicato per il valore minimo tra il numero di righe meno 1 o il numero di colonne meno 1 0 χ 2 n min(n 1, M 1) E evidente che il valore 0 si può ottenere solo quando la tabella dei dati coincide esattamente con i valori teorici, cioè non c è una dipendenza tra i caratteri Di conseguenza: tanto più il valore di χ 2 si avvicina al valore massimo teorico tanto più c è dipendenza tra i due caratteri.

72 CHI-QUADRATO DI PEARSON Nel nostro caso abbiamo N=M=2 quindi il valore massimo teorico è uguale a n=94. Il valore di χ 2 =31indica che c è un livello medio di associazione, ovvero che c è una certa dipendenza tra il portare lenti bifocali e l avere spesso emicranie. Nello studio della statistica inferenziale si vedrà come quantificare meglio questo grado di associazione nel cosiddetto test del χ 2.

Relazioni statistiche: regressione e correlazione

Relazioni statistiche: regressione e correlazione Relazioni statistiche: regressione e correlazione È detto studio della connessione lo studio si occupa della ricerca di relazioni fra due variabili statistiche o fra una mutabile e una variabile statistica

Dettagli

Il concetto di valore medio in generale

Il concetto di valore medio in generale Il concetto di valore medio in generale Nella statistica descrittiva si distinguono solitamente due tipi di medie: - le medie analitiche, che soddisfano ad una condizione di invarianza e si calcolano tenendo

Dettagli

Dott.ssa Caterina Gurrieri

Dott.ssa Caterina Gurrieri Dott.ssa Caterina Gurrieri Le relazioni tra caratteri Data una tabella a doppia entrata, grande importanza riveste il misurare se e in che misura le variabili in essa riportata sono in qualche modo

Dettagli

ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE

ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE e-mail: tommei@dm.unipi.it web: www.dm.unipi.it/ tommei Ricevimento: su appuntamento Dipartimento di Matematica, piano terra, studio 114

Dettagli

1. Distribuzioni campionarie

1. Distribuzioni campionarie Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 2012/2013 lezioni di statistica del 3 e 6 giugno 2013 - di Massimo Cristallo - 1. Distribuzioni campionarie

Dettagli

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Introduzione : analisi delle relazioni tra due caratteristiche osservate sulle stesse unità statistiche studio del comportamento di due caratteri

Dettagli

Psicometria (8 CFU) Corso di Laurea triennale STANDARDIZZAZIONE

Psicometria (8 CFU) Corso di Laurea triennale STANDARDIZZAZIONE Psicometria (8 CFU) Corso di Laurea triennale Un punteggio all interno di una distribuzione è in realtà privo di significato se preso da solo. Sapere che un soggetto ha ottenuto un punteggio x=52 in una

Dettagli

Dimensione di uno Spazio vettoriale

Dimensione di uno Spazio vettoriale Capitolo 4 Dimensione di uno Spazio vettoriale 4.1 Introduzione Dedichiamo questo capitolo ad un concetto fondamentale in algebra lineare: la dimensione di uno spazio vettoriale. Daremo una definizione

Dettagli

Prova di autovalutazione Prof. Roberta Siciliano

Prova di autovalutazione Prof. Roberta Siciliano Prova di autovalutazione Prof. Roberta Siciliano Esercizio 1 Nella seguente tabella è riportata la distribuzione di frequenza dei prezzi per camera di alcuni agriturismi, situati nella regione Basilicata.

Dettagli

APPUNTI DI MATEMATICA LE FRAZIONI ALGEBRICHE ALESSANDRO BOCCONI

APPUNTI DI MATEMATICA LE FRAZIONI ALGEBRICHE ALESSANDRO BOCCONI APPUNTI DI MATEMATICA LE FRAZIONI ALGEBRICHE ALESSANDRO BOCCONI Indice 1 Le frazioni algebriche 1.1 Il minimo comune multiplo e il Massimo Comun Divisore fra polinomi........ 1. Le frazioni algebriche....................................

Dettagli

Un po di statistica. Christian Ferrari. Laboratorio di Matematica

Un po di statistica. Christian Ferrari. Laboratorio di Matematica Un po di statistica Christian Ferrari Laboratorio di Matematica 1 Introduzione La statistica è una parte della matematica applicata che si occupa della raccolta, dell analisi e dell interpretazione di

Dettagli

MINIMI QUADRATI. REGRESSIONE LINEARE

MINIMI QUADRATI. REGRESSIONE LINEARE MINIMI QUADRATI. REGRESSIONE LINEARE Se il coefficiente di correlazione r è prossimo a 1 o a -1 e se il diagramma di dispersione suggerisce una relazione di tipo lineare, ha senso determinare l equazione

Dettagli

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: Esempi di domande risposta multipla (Modulo II) 1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: 1) ha un numero di elementi pari a 5; 2) ha un numero di elementi

Dettagli

STATISTICA IX lezione

STATISTICA IX lezione Anno Accademico 013-014 STATISTICA IX lezione 1 Il problema della verifica di un ipotesi statistica In termini generali, si studia la distribuzione T(X) di un opportuna grandezza X legata ai parametri

Dettagli

Indici di dispersione

Indici di dispersione Indici di dispersione 1 Supponiamo di disporre di un insieme di misure e di cercare un solo valore che, meglio di ciascun altro, sia in grado di catturare le caratteristiche della distribuzione nel suo

Dettagli

La distribuzione Normale. La distribuzione Normale

La distribuzione Normale. La distribuzione Normale La Distribuzione Normale o Gaussiana è la distribuzione più importante ed utilizzata in tutta la statistica La curva delle frequenze della distribuzione Normale ha una forma caratteristica, simile ad una

Dettagli

ANALISI DELLE FREQUENZE: IL TEST CHI 2

ANALISI DELLE FREQUENZE: IL TEST CHI 2 ANALISI DELLE FREQUENZE: IL TEST CHI 2 Quando si hanno scale nominali o ordinali, non è possibile calcolare il t, poiché non abbiamo medie, ma solo frequenze. In questi casi, per verificare se un evento

Dettagli

risulta (x) = 1 se x < 0.

risulta (x) = 1 se x < 0. Questo file si pone come obiettivo quello di mostrarvi come lo studio di una funzione reale di una variabile reale, nella cui espressione compare un qualche valore assoluto, possa essere svolto senza necessariamente

Dettagli

RELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della

RELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della RELAZIONE TRA VARIABILI QUANTITATIVE Lezione 7 a Accade spesso nella ricerca in campo biomedico, così come in altri campi della scienza, di voler studiare come il variare di una o più variabili (variabili

Dettagli

E naturale chiedersi alcune cose sulla media campionaria x n

E naturale chiedersi alcune cose sulla media campionaria x n Supponiamo che un fabbricante stia introducendo un nuovo tipo di batteria per un automobile elettrica. La durata osservata x i delle i-esima batteria è la realizzazione (valore assunto) di una variabile

Dettagli

Matematica generale CTF

Matematica generale CTF Successioni numeriche 19 agosto 2015 Definizione di successione Monotonìa e limitatezza Forme indeterminate Successioni infinitesime Comportamento asintotico Criterio del rapporto per le successioni Definizione

Dettagli

Statistica e biometria. D. Bertacchi. Variabili aleatorie. V.a. discrete e continue. La densità di una v.a. discreta. Esempi.

Statistica e biometria. D. Bertacchi. Variabili aleatorie. V.a. discrete e continue. La densità di una v.a. discreta. Esempi. Iniziamo con definizione (capiremo fra poco la sua utilità): DEFINIZIONE DI VARIABILE ALEATORIA Una variabile aleatoria (in breve v.a.) X è funzione che ha come dominio Ω e come codominio R. In formule:

Dettagli

ESERCIZI SVOLTI PER LA PROVA DI STATISTICA

ESERCIZI SVOLTI PER LA PROVA DI STATISTICA ESERCIZI SVOLTI PER LA PROVA DI STATISTICA Stefania Naddeo (anno accademico 4/5) INDICE PARTE PRIMA: STATISTICA DESCRITTIVA. DISTRIBUZIONI DI FREQUENZA E FUNZIONE DI RIPARTIZIONE. VALORI CARATTERISTICI

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 1

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 1 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 1 Dott.ssa Antonella Costanzo a.costanzo@unicas.it A.Studio dell interdipendenza tra variabili: riepilogo Concetto relativo allo studio delle relazioni tra

Dettagli

VARIANZA CAMPIONARIA E DEVIAZIONE STANDARD. Si definisce scarto quadratico medio o deviazione standard la radice quadrata della varianza.

VARIANZA CAMPIONARIA E DEVIAZIONE STANDARD. Si definisce scarto quadratico medio o deviazione standard la radice quadrata della varianza. VARIANZA CAMPIONARIA E DEVIAZIONE STANDARD Si definisce varianza campionaria l indice s 2 = 1 (x i x) 2 = 1 ( xi 2 n x 2) Si definisce scarto quadratico medio o deviazione standard la radice quadrata della

Dettagli

LA CORRELAZIONE LINEARE

LA CORRELAZIONE LINEARE LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad esempio, si può supporre che vi sia una relazione tra l insoddisfazione

Dettagli

LE FUNZIONI A DUE VARIABILI

LE FUNZIONI A DUE VARIABILI Capitolo I LE FUNZIONI A DUE VARIABILI In questo primo capitolo introduciamo alcune definizioni di base delle funzioni reali a due variabili reali. Nel seguito R denoterà l insieme dei numeri reali mentre

Dettagli

Statistica multivariata. Statistica multivariata. Analisi multivariata. Dati multivariati. x 11 x 21. x 12 x 22. x 1m x 2m. x nm. x n2.

Statistica multivariata. Statistica multivariata. Analisi multivariata. Dati multivariati. x 11 x 21. x 12 x 22. x 1m x 2m. x nm. x n2. Analisi multivariata Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Cercare di capire le relazioni

Dettagli

8 Elementi di Statistica

8 Elementi di Statistica 8 Elementi di Statistica La conoscenza di alcuni elementi di statistica e di analisi degli errori è importante quando si vogliano realizzare delle osservazioni sperimentali significative, ed anche per

Dettagli

Siamo così arrivati all aritmetica modulare, ma anche a individuare alcuni aspetti di come funziona l aritmetica del calcolatore come vedremo.

Siamo così arrivati all aritmetica modulare, ma anche a individuare alcuni aspetti di come funziona l aritmetica del calcolatore come vedremo. DALLE PESATE ALL ARITMETICA FINITA IN BASE 2 Si è trovato, partendo da un problema concreto, che con la base 2, utilizzando alcune potenze della base, operando con solo addizioni, posso ottenere tutti

Dettagli

Misure della dispersione o della variabilità

Misure della dispersione o della variabilità QUARTA UNITA Misure della dispersione o della variabilità Abbiamo visto che un punteggio di per sé non ha alcun significato e lo acquista solo quando è posto a confronto con altri punteggi o con una statistica.

Dettagli

VERIFICA DELLE IPOTESI

VERIFICA DELLE IPOTESI VERIFICA DELLE IPOTESI Nella verifica delle ipotesi è necessario fissare alcune fasi prima di iniziare ad analizzare i dati. a) Si deve stabilire quale deve essere l'ipotesi nulla (H0) e quale l'ipotesi

Dettagli

Slide Cerbara parte1 5. Le distribuzioni teoriche

Slide Cerbara parte1 5. Le distribuzioni teoriche Slide Cerbara parte1 5 Le distribuzioni teoriche I fenomeni biologici, demografici, sociali ed economici, che sono il principale oggetto della statistica, non sono retti da leggi matematiche. Però dalle

Dettagli

Statistica. Lezione 6

Statistica. Lezione 6 Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 6 a.a 011-01 Dott.ssa Daniela Ferrante

Dettagli

Capitolo 13: L offerta dell impresa e il surplus del produttore

Capitolo 13: L offerta dell impresa e il surplus del produttore Capitolo 13: L offerta dell impresa e il surplus del produttore 13.1: Introduzione L analisi dei due capitoli precedenti ha fornito tutti i concetti necessari per affrontare l argomento di questo capitolo:

Dettagli

Politecnico di Milano. Facoltà di Ingegneria Industriale. Corso di Analisi e Geometria 2. Sezione D-G. (Docente: Federico Lastaria).

Politecnico di Milano. Facoltà di Ingegneria Industriale. Corso di Analisi e Geometria 2. Sezione D-G. (Docente: Federico Lastaria). Politecnico di Milano. Facoltà di Ingegneria Industriale. Corso di Analisi e Geometria 2. Sezione D-G. (Docente: Federico Lastaria). Aprile 20 Indice Serie numeriche. Serie convergenti, divergenti, indeterminate.....................

Dettagli

Lezione n. 2 (a cura di Chiara Rossi)

Lezione n. 2 (a cura di Chiara Rossi) Lezione n. 2 (a cura di Chiara Rossi) QUANTILE Data una variabile casuale X, si definisce Quantile superiore x p : X P (X x p ) = p Quantile inferiore x p : X P (X x p ) = p p p=0.05 x p x p Graficamente,

Dettagli

~ Copyright Ripetizionando - All rights reserved ~ http://ripetizionando.wordpress.com STUDIO DI FUNZIONE

~ Copyright Ripetizionando - All rights reserved ~ http://ripetizionando.wordpress.com STUDIO DI FUNZIONE STUDIO DI FUNZIONE Passaggi fondamentali Per effettuare uno studio di funzione completo, che non lascia quindi margine a una quasi sicuramente errata inventiva, sono necessari i seguenti 7 passaggi: 1.

Dettagli

Tasso di interesse e capitalizzazione

Tasso di interesse e capitalizzazione Tasso di interesse e capitalizzazione Tasso di interesse = i = somma che devo restituire dopo un anno per aver preso a prestito un euro, in aggiunta alla restituzione dell euro iniziale Quindi: prendo

Dettagli

4 3 4 = 4 x 10 2 + 3 x 10 1 + 4 x 10 0 aaa 10 2 10 1 10 0

4 3 4 = 4 x 10 2 + 3 x 10 1 + 4 x 10 0 aaa 10 2 10 1 10 0 Rappresentazione dei numeri I numeri che siamo abituati ad utilizzare sono espressi utilizzando il sistema di numerazione decimale, che si chiama così perché utilizza 0 cifre (0,,2,3,4,5,6,7,8,9). Si dice

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 12-Il t-test per campioni appaiati vers. 1.2 (7 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

Funzioni. Funzioni /2

Funzioni. Funzioni /2 Funzioni Una funzione f è una corrispondenza tra due insiemi A e B che a ciascun elemento di A associa un unico elemento di B. Si scrive: f : A B l'insieme A si chiama il dominio della funzione f, l'insieme

Dettagli

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a) Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B Eventi indipendenti: un evento non influenza l altro Eventi disgiunti: il verificarsi di un evento esclude l altro Evento prodotto:

Dettagli

I punteggi zeta e la distribuzione normale

I punteggi zeta e la distribuzione normale QUINTA UNITA I punteggi zeta e la distribuzione normale I punteggi ottenuti attraverso una misurazione risultano di difficile interpretazione se presi in stessi. Affinché acquistino significato è necessario

Dettagli

ESERCIZI DI STATISTICA DESCRITTIVA

ESERCIZI DI STATISTICA DESCRITTIVA ESERCIZI DI STATISTICA DESCRITTIVA ES1 Data la seguente serie di dati su Sesso e Altezza di 8 pazienti, riempire opportunamente due tabelle per rappresentare le distribuzioni di frequenze dei due caratteri,

Dettagli

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva Università del Piemonte Orientale Corsi di Laurea Triennale Corso di Statistica e Biometria Introduzione e Statistica descrittiva Corsi di Laurea Triennale Corso di Statistica e Biometria: Introduzione

Dettagli

LEZIONE n. 5 (a cura di Antonio Di Marco)

LEZIONE n. 5 (a cura di Antonio Di Marco) LEZIONE n. 5 (a cura di Antonio Di Marco) IL P-VALUE (α) Data un ipotesi nulla (H 0 ), questa la si può accettare o rifiutare in base al valore del p- value. In genere il suo valore è un numero molto piccolo,

Dettagli

VALORE DELLE MERCI SEQUESTRATE

VALORE DELLE MERCI SEQUESTRATE La contraffazione in cifre: NUOVA METODOLOGIA PER LA STIMA DEL VALORE DELLE MERCI SEQUESTRATE Roma, Giugno 2013 Giugno 2013-1 Il valore economico dei sequestri In questo Focus si approfondiscono alcune

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 5-Indici di variabilità (vers. 1.0c, 20 ottobre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

LEZIONE 23. Esempio 23.1.3. Si consideri la matrice (si veda l Esempio 22.2.5) A = 1 2 2 3 3 0

LEZIONE 23. Esempio 23.1.3. Si consideri la matrice (si veda l Esempio 22.2.5) A = 1 2 2 3 3 0 LEZIONE 23 231 Diagonalizzazione di matrici Abbiamo visto nella precedente lezione che, in generale, non è immediato che, data una matrice A k n,n con k = R, C, esista sempre una base costituita da suoi

Dettagli

La categoria «ES» presenta (di solito) gli stessi comandi

La categoria «ES» presenta (di solito) gli stessi comandi Utilizzo delle calcolatrici FX 991 ES+ Parte II PARMA, 11 Marzo 2014 Prof. Francesco Bologna bolfra@gmail.com ARGOMENTI DELLA LEZIONE 1. Richiami lezione precedente 2.Calcolo delle statistiche di regressione:

Dettagli

Corso di. Dott.ssa Donatella Cocca

Corso di. Dott.ssa Donatella Cocca Corso di Statistica medica e applicata Dott.ssa Donatella Cocca 1 a Lezione Cos'è la statistica? Come in tutta la ricerca scientifica sperimentale, anche nelle scienze mediche e biologiche è indispensabile

Dettagli

SISTEMI DI NUMERAZIONE E CODICI

SISTEMI DI NUMERAZIONE E CODICI SISTEMI DI NUMERAZIONE E CODICI Il Sistema di Numerazione Decimale Il sistema decimale o sistema di numerazione a base dieci usa dieci cifre, dette cifre decimali, da O a 9. Il sistema decimale è un sistema

Dettagli

Titolo della lezione. Analisi dell associazione tra due caratteri: indipendenza e dipendenza

Titolo della lezione. Analisi dell associazione tra due caratteri: indipendenza e dipendenza Titolo della lezione Analisi dell associazione tra due caratteri: indipendenza e dipendenza Introduzione Analisi univariata, bivariata, multivariata Analizzare le relazioni tra i caratteri, per cercare

Dettagli

Alessandro Pellegrini

Alessandro Pellegrini Esercitazione sulle Rappresentazioni Numeriche Esistono 1 tipi di persone al mondo: quelli che conoscono il codice binario e quelli che non lo conoscono Alessandro Pellegrini Cosa studiare prima Conversione

Dettagli

Vademecum studio funzione

Vademecum studio funzione Vademecum studio funzione Campo di Esistenza di una funzione o dominio: Studiare una funzione significa determinare gli elementi caratteristici che ci permettono di disegnarne il grafico, a partire dalla

Dettagli

Esercizi su lineare indipendenza e generatori

Esercizi su lineare indipendenza e generatori Esercizi su lineare indipendenza e generatori Per tutto il seguito, se non specificato esplicitamente K indicherà un campo e V uno spazio vettoriale su K Cose da ricordare Definizione Dei vettori v,,v

Dettagli

Fondamenti e didattica di Matematica Finanziaria

Fondamenti e didattica di Matematica Finanziaria Fondamenti e didattica di Matematica Finanziaria Silvana Stefani Piazza dell Ateneo Nuovo 1-20126 MILANO U6-368 silvana.stefani@unimib.it 1 Unità 9 Contenuti della lezione Operazioni finanziarie, criterio

Dettagli

Test d ipotesi. Statistica e biometria. D. Bertacchi. Test d ipotesi

Test d ipotesi. Statistica e biometria. D. Bertacchi. Test d ipotesi In molte situazioni una raccolta di dati (=esiti di esperimenti aleatori) viene fatta per prendere delle decisioni sulla base di quei dati. Ad esempio sperimentazioni su un nuovo farmaco per decidere se

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 10-Il test t per un campione e la stima intervallare (vers. 1.1, 25 ottobre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia,

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Test delle ipotesi sulla varianza In un azienda che produce componenti meccaniche, è stato

Dettagli

u 1 u k che rappresenta formalmente la somma degli infiniti numeri (14.1), ordinati al crescere del loro indice. I numeri u k

u 1 u k che rappresenta formalmente la somma degli infiniti numeri (14.1), ordinati al crescere del loro indice. I numeri u k Capitolo 4 Serie numeriche 4. Serie convergenti, divergenti, indeterminate Data una successione di numeri reali si chiama serie ad essa relativa il simbolo u +... + u +... u, u 2,..., u,..., (4.) oppure

Dettagli

Scelte in condizioni di rischio e incertezza

Scelte in condizioni di rischio e incertezza CAPITOLO 5 Scelte in condizioni di rischio e incertezza Esercizio 5.1. Tizio ha risparmiato nel corso dell anno 500 euro; può investirli in obbligazioni che rendono, in modo certo, il 10% oppure in azioni

Dettagli

Esercizio 1 Dato il gioco ({1, 2, 3}, v) con v funzione caratteristica tale che:

Esercizio 1 Dato il gioco ({1, 2, 3}, v) con v funzione caratteristica tale che: Teoria dei Giochi, Trento, 2004/05 c Fioravante Patrone 1 Teoria dei Giochi Corso di laurea specialistica: Decisioni economiche, impresa e responsabilità sociale, A.A. 2004/05 Soluzioni degli esercizi

Dettagli

f(x) = 1 x. Il dominio di questa funzione è il sottoinsieme proprio di R dato da

f(x) = 1 x. Il dominio di questa funzione è il sottoinsieme proprio di R dato da Data una funzione reale f di variabile reale x, definita su un sottoinsieme proprio D f di R (con questo voglio dire che il dominio di f è un sottoinsieme di R che non coincide con tutto R), ci si chiede

Dettagli

PIANO CARTESIANO: un problema di programmazione lineare

PIANO CARTESIANO: un problema di programmazione lineare PIANO CARTESIANO: un problema di programmazione lineare In un laboratorio sono disponibili due contatori A, B di batteri. Il contatore A può essere azionato da un laureato che guadagna 20 euro per ora.

Dettagli

2. Leggi finanziarie di capitalizzazione

2. Leggi finanziarie di capitalizzazione 2. Leggi finanziarie di capitalizzazione Si chiama legge finanziaria di capitalizzazione una funzione atta a definire il montante M(t accumulato al tempo generico t da un capitale C: M(t = F(C, t C t M

Dettagli

Statistica descrittiva: prime informazioni dai dati sperimentali

Statistica descrittiva: prime informazioni dai dati sperimentali SECONDO APPUNTAMENTO CON LA SPERIMENTAZIONE IN AGRICOLTURA Statistica descrittiva: prime informazioni dai dati sperimentali La statistica descrittiva rappresenta la base di partenza per le applicazioni

Dettagli

STATISTICA DESCRITTIVA UNIVARIATA

STATISTICA DESCRITTIVA UNIVARIATA Capitolo zero: STATISTICA DESCRITTIVA UNIVARIATA La STATISTICA è la scienza che si occupa di fenomeni collettivi che richiedono lo studio di un grande numero di dati. Il termine STATISTICA deriva dalla

Dettagli

Esercitazione 1 del corso di Statistica 2 Prof. Domenico Vistocco

Esercitazione 1 del corso di Statistica 2 Prof. Domenico Vistocco Esercitazione 1 del corso di Statistica 2 Prof. Domenico Vistocco Alfonso Iodice D Enza April 26, 2007 1...prima di cominciare Contare, operazione solitamente semplice, può diventare complicata se lo scopo

Dettagli

Lezione 10: Il problema del consumatore: Preferenze e scelta ottimale

Lezione 10: Il problema del consumatore: Preferenze e scelta ottimale Corso di Scienza Economica (Economia Politica) prof. G. Di Bartolomeo Lezione 10: Il problema del consumatore: Preferenze e scelta ottimale Facoltà di Scienze della Comunicazione Università di Teramo Scelta

Dettagli

SPC e distribuzione normale con Access

SPC e distribuzione normale con Access SPC e distribuzione normale con Access In questo articolo esamineremo una applicazione Access per il calcolo e la rappresentazione grafica della distribuzione normale, collegata con tabelle di Clienti,

Dettagli

2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale

2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale BIOSTATISTICA 2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk

Dettagli

UNIVERSITÀ DEGLI STUDI DI TERAMO

UNIVERSITÀ DEGLI STUDI DI TERAMO UNIVERSITÀ DEGLI STUDI DI TERAMO CORSO DI LAUREA IN ECONOMIA BANCARIA FINANZIARIA ED ASSICURATIVA (Classe 7) Corso di Matematica per l Economia (Prof. F. Eugeni) TEST DI INGRESSO Teramo, ottobre 00 SEZIONE

Dettagli

Regressione Mario Guarracino Data Mining a.a. 2010/2011

Regressione Mario Guarracino Data Mining a.a. 2010/2011 Regressione Esempio Un azienda manifatturiera vuole analizzare il legame che intercorre tra il volume produttivo X per uno dei propri stabilimenti e il corrispondente costo mensile Y di produzione. Volume

Dettagli

Capitolo 12 La regressione lineare semplice

Capitolo 12 La regressione lineare semplice Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara

Dettagli

Applicazioni lineari

Applicazioni lineari Applicazioni lineari Esempi di applicazioni lineari Definizione. Se V e W sono spazi vettoriali, una applicazione lineare è una funzione f: V W tale che, per ogni v, w V e per ogni a, b R si abbia f(av

Dettagli

Per studio di funzione intendiamo un insieme di procedure che hanno lo scopo di analizzare le proprietà di una funzione f ( x) R R

Per studio di funzione intendiamo un insieme di procedure che hanno lo scopo di analizzare le proprietà di una funzione f ( x) R R Studio di funzione Per studio di funzione intendiamo un insieme di procedure che hanno lo scopo di analizzare le proprietà di una funzione f ( x) R R : allo scopo di determinarne le caratteristiche principali.

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2014-2015 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

LE SUCCESSIONI 1. COS E UNA SUCCESSIONE

LE SUCCESSIONI 1. COS E UNA SUCCESSIONE LE SUCCESSIONI 1. COS E UNA SUCCESSIONE La sequenza costituisce un esempio di SUCCESSIONE. Ecco un altro esempio di successione: Una successione è dunque una sequenza infinita di numeri reali (ma potrebbe

Dettagli

Una sperimentazione. Probabilità. Una previsione. Calcolo delle probabilità. Nonostante ciò, è possibile dire qualcosa.

Una sperimentazione. Probabilità. Una previsione. Calcolo delle probabilità. Nonostante ciò, è possibile dire qualcosa. Una sperimentazione Probabilità Si sta sperimentando l efficacia di un nuovo farmaco per il morbo di Parkinson. Duemila pazienti partecipano alla sperimentazione: metà di essi vengono trattati con il nuovo

Dettagli

ESAME DI STATO DI LICEO SCIENTIFICO CORSO SPERIMENTALE P.N.I. 2004

ESAME DI STATO DI LICEO SCIENTIFICO CORSO SPERIMENTALE P.N.I. 2004 ESAME DI STAT DI LICE SCIENTIFIC CRS SPERIMENTALE P.N.I. 004 Il candidato risolva uno dei due problemi e 5 dei 0 quesiti in cui si articola il questionario. PRBLEMA Sia la curva d equazione: ke ove k e

Dettagli

STATISTICA DESCRITTIVA SCHEDA N. 5: REGRESSIONE LINEARE

STATISTICA DESCRITTIVA SCHEDA N. 5: REGRESSIONE LINEARE STATISTICA DESCRITTIVA SCHEDA N. : REGRESSIONE LINEARE Nella Scheda precedente abbiamo visto che il coefficiente di correlazione fra due variabili quantitative X e Y fornisce informazioni sull esistenza

Dettagli

ANALISI DI CORRELAZIONE

ANALISI DI CORRELAZIONE ANALISI DI CORRELAZIONE Esempio: Dati raccolti da n = 129 studenti di Pavia (A.A. 21/2) Altezza (cm) Peso (Kg) Voto Algebra e Geometria Voto Fisica I Valutare la correlazione delle seguenti coppie: Peso

Dettagli

Interesse, sconto, ratei e risconti

Interesse, sconto, ratei e risconti TXT HTM PDF pdf P1 P2 P3 P4 293 Interesse, sconto, ratei e risconti Capitolo 129 129.1 Interesse semplice....................................................... 293 129.1.1 Esercizio per il calcolo dell

Dettagli

Statistiche campionarie

Statistiche campionarie Statistiche campionarie Sul campione si possono calcolare le statistiche campionarie (come media campionaria, mediana campionaria, varianza campionaria,.) Le statistiche campionarie sono stimatori delle

Dettagli

Parte 2. Determinante e matrice inversa

Parte 2. Determinante e matrice inversa Parte. Determinante e matrice inversa A. Savo Appunti del Corso di Geometria 013-14 Indice delle sezioni 1 Determinante di una matrice, 1 Teorema di Cramer (caso particolare), 3 3 Determinante di una matrice

Dettagli

Complemento al corso di Fondamenti di Informatica I corsi di laurea in ingegneria, settore dell informazione Università la Sapienza Consorzio Nettuno

Complemento al corso di Fondamenti di Informatica I corsi di laurea in ingegneria, settore dell informazione Università la Sapienza Consorzio Nettuno Rappresentazione di numeri Complemento al corso di Fondamenti di Informatica I corsi di laurea in ingegneria, settore dell informazione Università la Sapienza Consorzio Nettuno Un numero e un entità teorica,

Dettagli

LA STATISTICA NEI TEST INVALSI

LA STATISTICA NEI TEST INVALSI LA STATISTICA NEI TEST INVALSI 1 Prova Nazionale 2011 Osserva il grafico seguente che rappresenta la distribuzione percentuale di famiglie per numero di componenti, in base al censimento 2001. Qual è la

Dettagli

postulato della valutazione tramite indicatori: La valutazione di un sistema sanitario tramite indicatori ipotizza

postulato della valutazione tramite indicatori: La valutazione di un sistema sanitario tramite indicatori ipotizza postulato della valutazione tramite indicatori: La valutazione di un sistema sanitario tramite indicatori ipotizza la praticabilità di una scomposizione della complessità in informazioni elementari ed

Dettagli

L espressione torna invece sempre vera (quindi la soluzione originale) se cambiamo contemporaneamente il verso: 1 < 0.

L espressione torna invece sempre vera (quindi la soluzione originale) se cambiamo contemporaneamente il verso: 1 < 0. EQUAZIONI E DISEQUAZIONI Le uguaglianze fra espressioni numeriche si chiamano equazioni. Cercare le soluzioni dell equazione vuol dire cercare quelle combinazioni delle lettere che vi compaiono che la

Dettagli

Statistica. Alfonso Iodice D Enza iodicede@unina.it

Statistica. Alfonso Iodice D Enza iodicede@unina.it Statistica Alfonso Iodice D Enza iodicede@unina.it Università degli studi di Cassino () Statistica 1 / 16 Outline 1 () Statistica 2 / 16 Outline 1 2 () Statistica 2 / 16 Outline 1 2 () Statistica 2 / 16

Dettagli

OCCUPATI SETTORE DI ATTIVITA' ECONOMICA

OCCUPATI SETTORE DI ATTIVITA' ECONOMICA ESERCIZIO 1 La tabella seguente contiene i dati relativi alla composizione degli occupati in Italia relativamente ai tre macrosettori di attività (agricoltura, industria e altre attività) negli anni 1971

Dettagli

Metodi Matematici ed Informatici per la Biologia Esame Finale, I appello 1 Giugno 2007

Metodi Matematici ed Informatici per la Biologia Esame Finale, I appello 1 Giugno 2007 Metodi Matematici ed Informatici per la Biologia Esame Finale, I appello 1 Giugno 2007 Nome: Alberto Cognome: De Sole Matricola: 01234567890 Codice 9784507811 Esercizio Risposta Voto 1 a b c d e 1 2 V

Dettagli

Funzioni. Parte prima. Daniele Serra

Funzioni. Parte prima. Daniele Serra Funzioni Parte prima Daniele Serra Nota: questi appunti non sostituiscono in alcun modo le lezioni del prof. Favilli, né alcun libro di testo. Sono piuttosto da intendersi a integrazione di entrambi. 1

Dettagli

ESAME DI STATISTICA Nome: Cognome: Matricola:

ESAME DI STATISTICA Nome: Cognome: Matricola: ESAME DI STATISTICA Nome: Cognome: Matricola: ISTRUZIONI: Per la prova è consentito esclusivamente l uso di una calcolatrice tascabile, delle tavole della normale e della t di Student. I risultati degli

Dettagli

Soluzione di equazioni quadratiche

Soluzione di equazioni quadratiche Soluzione di equazioni quadratiche Soluzione sulla Retta Algebrica Inseriamo sulla Retta Algebrica le seguenti espressioni polinomiali x e x 3 e cerchiamo di individuare i valori di x per i quali i punti

Dettagli

Analisi di scenario File Nr. 10

Analisi di scenario File Nr. 10 1 Analisi di scenario File Nr. 10 Giorgio Calcagnini Università di Urbino Dip. Economia, Società, Politica giorgio.calcagnini@uniurb.it http://www.econ.uniurb.it/calcagnini/ http://www.econ.uniurb.it/calcagnini/forecasting.html

Dettagli

Capitolo 2 Distribuzioni di frequenza

Capitolo 2 Distribuzioni di frequenza Edizioni Simone - Vol. 43/1 Compendio di statistica Capitolo 2 Distribuzioni di frequenza Sommario 1. Distribuzioni semplici. - 2. Distribuzioni doppie. - 3. Distribuzioni parziali: condizionate e marginali.

Dettagli

Basi di matematica per il corso di micro

Basi di matematica per il corso di micro Basi di matematica per il corso di micro Microeconomia (anno accademico 2006-2007) Lezione del 21 Marzo 2007 Marianna Belloc 1 Le funzioni 1.1 Definizione Una funzione è una regola che descrive una relazione

Dettagli