CORSO DI LAUREA IN OTTICA E OPTOMETRIA CORSO DI INFORMATICA E STATISTICA

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "CORSO DI LAUREA IN OTTICA E OPTOMETRIA CORSO DI INFORMATICA E STATISTICA DANIELE.MONTANINO@UNISALENTO.IT"

Transcript

1 CORSO DI LAUREA IN OTTICA E OPTOMETRIA CORSO DI INFORMATICA E STATISTICA

2 CONVENZIONE SULLE CIFRE SIGNIFICATIVE La convenzione usata sul troncamento delle cifre è troncare semplicemente le cifre non significative se la cifra successiva è <5 Aumentare di una unità l ultima cifra significativa se la cifra successiva è 5 esempio: troncare a 2 cifre significative i seguenti numeri 2,35471 = 2,35 3,45567 = 3,46 8,49735 = 8,50 1,99801 = 2,00 ricordare che bisogna sempre scrivere esplicitamente tutte le cifre significative anche se queste sono zeri (come nell ultimo caso).

3 VARIABILI Variabili Qualitative (esempio colore degli occhi, visone chiara o sfocata ) Quantitative o numeriche (esempio diottrie, distanza interpupillare ) Tipi di variabili quantitative Discrete (esempio voto, età di un paziente in anni ) Continue (esempio altezza di un soggetto )

4 INSIEME DI VARIABILI Insieme di variabili { x 1, x 2, x } N { x } k k=1,n k=indice (o pedice). N=numerosità del campione esempio: i voti di 5 studenti all esame di Informatica e Statistica { x 1, x 2, x 3, x 4, x } 5 = { 28, 22, 25, 21,30}

5 SOMMA Somma (o sommatoria) di N numeri N x k k=1 = x 1 + x x N Nell esempio precedente 5 k=1 x k = =126

6 PROPRIETÀ DELLA SOMMA La somma è un operazione lineare N k=1 con A e B costanti; infatti N (Ax k + B) = A N k=1 x k + NB (Ax k + B) = (Ax 1 + B) + (Ax N + B) = A(x x N )+ (B B) k=1 N volte Per esempio nel caso precedente se moltiplichiamo per 10 e sommiamo 5 ad ogni numero abbiamo { 10x 1 + 5,10x 2 + 5,10x 3 + 5,10x 4 + 5,10x 5 + 5} = { 285, 225, 255, 215,305} che sommati danno 1285, cioè 10x126+5x5.

7 SOMMA Esercizio: provare con qualche esempio che N k=1 N k=1 k = N = k 2 = N 2 = N(N +1) 2 N(N +1)(2N +1) 6

8 PRODOTTO Prodotto (o produttoria)di N numeri N k=1 x k = x 1 x 2 Fattoriale: è definito come N k=1 x N N! = k =1 2 N Questa funzione tornerà utile in seguito. Il fattoriale è un numero che cresce molto velocemente 0!=1 (per definizione); 1!=1; 2!=2; 3!=6; 4!=24; 5!=120; 6! =720; 20!= ;

9 MEDIA DI UN CAMPIONE La media di un campione di dati è definita da X = 1 N N x k k=1 Esempio: nel caso precedente la media dei voti del campione dei cinque studenti sarà X = k=1 x k = = 25, 2

10 PROPRIETÀ DELLA MEDIA Usando le proprietà di linearità della somma è facile mostrare che la media è una operazione lineare con A e B costanti e AX + B = AX + B Ax + By + C = Ax + By + C In particolare la media degli scarti è zero X X = X X = 0

11 MEDIA GEOMETRICA La media definita precedentemente è la cosiddetta media lineare (o aritmetica). Esistono altri tipi di media. Vale la pena menzionare la media geometrica M g = N N x k k=1 questa media è usata quando sia ha a che fare con variabili moltiplicative (ad esempio tassi di crescita o di interesse).

12 MEDIA GEOMETRICA Esempio: il numero di batteri in una colonia cresce del 120% nelle prima ora, del 140% nella seconda del 130% nella terza e del 110% nella quarta ora. Qual è il tasso di crescita medio nelle quattro ore? La risposta è R = 4 1, 2 1, ,1 =1, , 5% Infatti se la colonia crescesse del 124,5% ogni ora l incremento totale finale sarebbe lo stesso.

13 FREQUENZE Le frequenze rappresentano il numero di occorrenze di una variabile sia qualitativa che quantitativa Esempio di variabile qualitativa: In un campione di 128 persone si verifica il loro colore degli occhi Colore degli occhi Frequenza Assoluta Frequenza relativa Neri 25 19,5% Nocciola 32 25,0% Blu 40 31,3% Verdi 31 24,2% Totale 128 La frequenza relativa è la frazione del numero rispetto al totale

14 FREQUENZA Vediamo il caso di una variabile quantitativa: voti di un campione di 300 studenti in un determinato esame Voto in trentesimi Studenti (frequenza) Totale 300

15 DISTRIBUZIONE DI FREQUENZA La precedente tabella può essere tradotta in istogramma. Questa sarà la distribuzione dei dati Numero di studenti Voto

16 CLASSI A volte è comodo o necessario raggruppare la variabile in esame in classi. Per esempio potremmo raggruppare la tabella dei voti precedenti in tre macroclassi : da 18 a 22, da 23 a 27 e da 28 a 30 Voti Numero di studenti Questo raggruppamento diventa evidentemente necessario quando si ha a che fare con variabili continue (esempio: l altezza di un campione di persone).

17 CUMULATIVA Dalla tabella precedente è possibile anche costruire la tabella delle cumulative Voto Studenti Cumulativa Totale 300 L ultima colonna è costruita sommando via via le frequenze precedenti. Per esempio nel caso precedente il numero di studenti che hanno preso un voto 25 sarà 200 Ovviamente la distribuzione cumulativa ha senso solo se la variabile è di tipo numerico

18 DISTRIBUZIONE CUMULATIVA Numero di studenti Voto

19 CUMULATIVA RELATIVA Dividendo le cumulative per la numerosità totale del campione si ha la cumulativa relativa. Nell esempio precedente si ha che, ad esempio, il 38.7% degli studenti ha un voto inferiore o uguale al 23. Voto Cum. relativa 18 0,7% 19 2,7% 20 6,3% 21 14,3% 22 26,0% 23 38,7% 24 55,0% 25 66,7% 26 77,7% 27 88,0% 28 94,3% 29 98,3% ,0% Numero di studenti 120,0% 100,0% 80,0% 60,0% 40,0% 20,0% 0,0% Voto

20 RIASSUMENDO Variabile frequenza assoluta frequenza relativa cumulativa assoluta cumulativa relativa x 1 n 1 f 1 s 1 c 1 x 2 n 2 f 2 s 2 c 2 x N n n f N s N c N n = N n k k=1 f k = n k n s k = k n i i=1 c k = s k n

21 MEDIA PESATA (O PONDERATA) Quando si ha a che fare con una tabella di frequenze la media di una variabile deve essere ovviamente pesata sulla frequenza della variabile X = 1 n N k=1 n k x k o alternativamente X = N k=1 f k x k questo perché la variabile x k appare n k volte nella tabella (nell esempio dei voti è come se dovessimo sommare 18 per 2 volte, 19 per 6 volte e così via e dividere per tutti e 300 gli studenti)

22 MEDIA PESATA Voto x k Studenti n k Frequenza relativa f k f k *x k ,7% 0, ,0% 0, ,7% 0, ,0% 1, ,7% 2, ,7% 2, ,3% 3, ,7% 2, ,0% 2, ,3% 2, ,3% 1, ,0% 1, ,7% 0,50 Totale studenti= 300 voto medio= 24,31

23 MEDIANA La mediana è quel valore per cui metà della distribuzione è inferiore e metà è superiore ad esso Esempio: si è misurata la miopia in un campione di studenti ottenendo la seguente distribuzione Diottrie Persone Cumulativa relativa 0, ,7% 0, ,1% 1, ,6% 1, ,0% 2, ,3% 2, ,5% 3, ,3% 3, ,8% 4, ,9% 4, ,6% 5, ,3% 5, ,7% 6, ,1% 6, ,5% 7, ,9% 7, ,2% 8, ,6% 8,5 9 99,8% 9,0 7 99,9% 9,5 3 99,9% 10, ,0% Osserviamo come il valore della cumulativa relativa assume il valore 50% in corrispondenza di 1,5 diottrie. Questa sarà il valore mediano poiché metà dei soggetti avrà una miopia inferiore a 1.5 diottrie e un altra metà superiore. Si noti come il valore della mediana non necessariamente coincida con la media (nel caso precedente vale 2 diottrie).

24 MEDIANA Voto Cum. relativa 18 0,7% 19 2,7% 20 6,3% 21 14,3% 22 26,0% 23 38,7% 24 55,0% 25 66,7% 26 77,7% 27 88,0% 28 94,3% 29 98,3% ,0% A volte la mediana non è ben definita. Riprendendo l esempio dei voti notiamo che non c è nessun valore corrispondente al 50%. In tal caso (sebbene esistano formule più sofisticate) per semplicità potremmo prendere il valore intermedio tra le classi a cavallo del 50%. Per esempio nel caso precedente il voto mediano sarebbe 23,5.

25 QUARTILI Allo stesso modo della mediana è possibile definire i quartili inferiore e superiore (ovvero i valori per cui il sotto cui troviamo il 25% e il 75% della popolazione) Diottrie Persone Cumulativa relativa 0, ,7% 0, ,1% 1, ,6% 1, ,0% 2, ,3% 2, ,5% 3, ,3% 3, ,8% 4, ,9% 4, ,6% 5, ,3% 5, ,7% 6, ,1% 6, ,5% 7, ,9% 7, ,2% 8, ,6% 8,5 9 99,8% 9,0 7 99,9% 9,5 3 99,9% 10, ,0% Seguendo il criterio precedente potremmo grosso modo identificare il quartile inferiore con il valore 1,75 e quello superiore con 2,75

26 PERCENTILI Un ulteriore raffinamento dei concetti precedenti sono i percentili. Per esempio il 90% percentile inferiore e superiore sono quei valori per cui al di sotto troviamo il 10% e il 90% della popolazione. nell esempio della miopia all incirca solo il 5% della popolazione ha meno di 0.25 diottrie mentre chi ha più di 3,5 diottrie è nel 95% percentile superiore. 100,0% 90,0% 80,0% 70,0% 90% 75% 60,0% 50,0% 40,0% 30,0% 20,0% 10,0% 0,0% 1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 10,0 11,0 12,0 13,0 14,0 15,0 16,0 17,0 18,0 19,0 20,0 21,0 x 50% 20% 10%

27 MODA La moda è il valore più comune in una distribuzione. Per esempio nell esempio dei voti la moda è il 24 mentre nell esempio della miopia la moda è 1,5 diottrie. Talvolta una distribuzione può avere due picchi distinti ben localizzati. In tal caso la distribuzione si dice bimodale (più in generale possono esistere distribuzioni multimodali ) 1200,0 1000,0 800,0 600,0 400,0 200,0 Una distribuzione del genere può essere sintomo di due popolazioni distinte (per esempio se misurassimo la miopia ad un campione di persone in parte italiane e in parte giapponesi, popolo notoriamente più miope) 0,0 1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 10,0 11,0 12,0 13,0 14,0 15,0 16,0 17,0 18,0 19,0 20,0 21,0

28 ESEMPIO Una fabbrica produce viti per occhiali attraverso tre macchine di lunghezza nominale 1,1mm. Si estrae un campione di 430 viti e si fa un istogramma della loro lunghezza reale Lunghezza (mm) Numero 0,85 0 0,90 2 0,95 8 1, , , , , ,25 7 1,30 1 1,35 2 1,40 4 1, , , ,60 2 1,65 1 1,70 1 1,75 0 1, ,85 0,90 0,95 1,00 1,05 1,10 1,15 1,20 1,25 1,30 1,35 1,40 1,45 1,50 1,55 1,60 1,65 1,70 1,75 1,80 Il fatto che vi è un secondo picco a 1.50 mm fa pensare che una delle macchine stia lavorando male ovvero sta producendo viti sistematicamente più lunghe di quelle programmate.

29 MEDIA PESATA SU CLASSI Talvolta occorre calcolare la media su di una tabella di classi. Prendiamo ad esempio la tabella dei voti suddivisa in classi Voti Numero di studenti Poiché non conosciamo il numero relativo di studenti relativo ad ogni voto, siamo costretti a scegliere un criterio per assegnare un voto medio ad ogni classe. La scelta più semplice è di considerare il valore centrale della classe

30 MEDIA PESATA SU CLASSI Voti Voto medio Numero di studenti La media pesata su questa tabella vale 24,18 che è solo leggermente diverso dal valore 24,31 calcolata con la tabella non suddivisa in classi. In ogni caso la suddivisione in classi provoca una perdita di informazioni e quindi fornisce un valore meno accurato per le variabili statistiche.

31 TABELLE A DOPPIA ENTRATA Un caso più generale avviene quando una tabella incrocia due (o più) variabili y 1 y 2 y M x 1 n 1,1 n 2,1 n 1,M x 2 n 2,1 n 2,2 n 2,M x N n N,1 n N,2 n N,M Una tabella di questo tipo viene detta a doppia entrata, o bivariata. In principio possono esistere anche tabelle che incrociano più di due variabili (multivariate) ma la loro rappresentazione è più difficoltosa. Per semplicità ci limiteremo a tabelle a doppia entrata.

32 TABELLE A DOPPIA ENTRATA Esempio di tabella a doppia entrata. X=colore degli occhi, Y=colore dei capelli Biondi Rossi Castani Σ Azzurri Verdi Σ Marginali di riga Marginali di colonna Totale generale Se X e Y qualitativi la tabella si dice di contingenza, se entrambi quantitativi di correlazione, se uno qualitativo e uno quantitativo si dice tabella mista.

33 MARGINALI Marginali di riga n i, = M n i, j j=1 Marginali di colonna n, j = N n i, j i=1 Totale generale N n = n i, = n, j = i=1 M j=1 N i=1 M j=1 n i, j

34 ESEMPIO DI TABELLA A DOPPIA ENTRATA Per esempio si supponga di avere la seguente tabella in cui si è misurato il grado di astigmatismo residuo su due campioni di persone che hanno eseguito due tecniche di chirurgia refrattiva (PRK o LASIK) Asitig. (diottrie) PRK LASIK n i* n *j L ultima riga sono le persone che hanno effettuato un certo tipo di intervento, l ultima colonna sono le persone che hanno un certo grado di astigmatismo residuo indipendentemente dal tipo di intervento.

35 ISTOGRAMMA E possibile costruire un istogramma per entrambe le entrate e il marginale di riga PRK LASIK PRK+LASIK ,1 0,2 0,3 0,4 0,5 0,6 Astig. (diottrie) 0,7 0,8 0,9 1 LASIK PRK PRK+LASIK

36 MEDIE PARZIALI Le medie su di una riga o una colonna costituiscono le medie parziali. Queste medie possono evidentemente essere effettuate se x e/o y sono variabili quantitative X j = 1 n j per esempio nel caso della tabella precedente possiamo calcolare solo le medie di colonna poiché le variabili di riga sono qualitative. Calcolando queste medie otteniamo separatamente l astigmatismo medio per chi ha eseguito l intervento con la PRK e la LASIK ottenendo (il calcolo è lasciato per esercizio): Media(PRK) = 0,32 Media(LASIK) = 0,46 N n i, j x i Y i = 1 n i, j y j n i i=1 M j=1 (attenzione: questo non induca alla facile conclusione che la LASIK è peggiore della PRK!)

37 MEDIE GENERALI Nelle tabelle a doppia entrata è anche possibile calcolare le medie generali delle variabili quantitative. Queste sono calcolate attraverso le formule X = 1 n Y = 1 n M j=1 N i=1 n, j X j n i, Y i = 1 n = 1 n N i=1 M j=1 n i, x i n, j y j ovvero come media pesata delle medie parziali oppure come una media delle variabili stesse pesata con i marginali di riga e di colonna (si può mostrare che si ha lo stesso risultato).

38 ESEMPIO DI MEDIE GENERALI Riprendiamo l esempio della tabella precedente: vogliamo calcolare l astigmatismo medio su tutto il campione Asitig. (diottrie) PRK LASIK n i* n *j Media 0,32 0,46 Questo può essere effettuato in due modi 1) Calcoliamo la medie delle medie pesando le medie sui marginali di colonna 42 0, , 46 X = = 0, ) Mediamo direttamente la variabile x usando come peso i marginali di riga X = = 0,39 Il risultato è lo stesso ma avendo già le medie parziali conviene il primo calcolo.

39 ESERCIZIO In questa tabella un certo numero di pazienti trattati con PRK vengono classificati in base all alla correzione apportata e all astigmatismo residuo dopo l operazione. Trovare le medie parziali di riga e di colonna e le medie generali. Fare un istogramma delle medie parziali sia per le righe che per le colonne. Cosa si potrebbe dedurne? As6gma6smo residuo Correzione apportata (dio?rie)

40 MEDIA QUADRATICA Un tipo ulteriore di media è la media quadratica, ovvero la radice quadrata della media dei quadrati M q = N k=1 N x k 2 Tale media è utile quando i vari quando i vari x k sono talvolta positivi e talvolta negativi mentre a noi interessa una media che non dipenda dal segno degli x k

41 INDICE DI VARIABILITÀ A volte a noi non interessa solo la media ma di un campione ma anche quanto questa si discosta mediamente dalla media. Tuttavia, come detto in precedenza, la media degli scarti è sempre zero 1 N N (x k X) = 0 k=1 poiché alcuni scarti sono positivi e altri negativi. Questa media non ci da quindi alcuna informazione sulla variabilità. Una possibile soluzione sarebbe di prendere la media dei valori assoluti degli scarti. Tuttavia, per diverse ragioni, la scelta migliore è prendere la media quadratica degli scarti

42 SCARTO QUADRATICO MEDIO Si definisce scarto quadratico medio quindi la media quadratica degli scarti N (x k X) 2 σ P = k=1 X N (la lettera σ è il sigma greco minuscolo). Tuttavia questa definizione ha il problema che per N=1 si ha che lo scarto medio è zero mentre per un solo dato noi vorremmo che lo scarto rimanga non definito.

43 DEVIAZIONE STANDARD Per la ragione precedente si preferisce definire la deviazione standard nella maniera seguente σ x = N k=1 (x k X) 2 N 1 un po più grande rispetto allo s.q.m. La deviazione standard è una misura della dispersione della popolazione intorno alla media. Lo scarto quadratico medio (quello cioè con N al denominatore) è talvolta definito come deviazione standard di popolazione. Per N molto grande la differenza tra i due è minima. Il quadrato dello scarto quadratico medio è detto varianza

44 DEVIAZIONE STANDARD Facciamo un esempio. Si supponga che Laura e Marco abbiano preso abbia preso i seguenti voti in 10 esami Laura={25,26,26,27,24,25,26,28,27,26} Marco={30,22,24,28,27,30,18,24,30,27} Come si vede entrambi hanno una media di 26. Però la deviazione standard dei voti di Laura è di 1,15 mentre quella di Marco è 3,97. Ciò indica che Laura è stata più costante nello studio mentre Marco ha avuto periodi di alti e bassi Notare che se avessimo usato lo scarto quadratico medio avremmo ottenuto 1,09 e 3,76, valori un poco più grandi dei precedenti.

45 CALCOLO DELLA DEVIAZIONE STANDARD Vediamo coma calcolare la deviazione standard (nel nostro caso N=10) - - Voto (x k ) x k - X (x k - X) X=26 - (x k - X) 2 = - (x k - X) 2 /(N- 1)= - (x k - X) 2 /(N- 1)= 12 12/9=1,33 1,33=1,15

46 DEVIAZIONE STANDARD SU TABELLE Per calcolare la deviazione standard su una tabella di frequenze occorre fare la media ponderata σ X = 1 N 1 N k=1 n k (x k x) 2 con n al solito la numerosità del campione N = N n k k=1

47 CALCOLO DELLA DEVIAZIONE STANDARD SU TABELLE Riprendiamo l esempio della tabella dei voti Voto (x k ) Studenti (n k ) n k (x k -X) , , , , , , , , , , , , ,69 X=24.31 n k (x k -X) 2 = n k (x k -X) 2 /(n- 1) = n k (x k -X) 2 /(n- 1) = , ,55/299=6,66 6,66=2,58

48 COEFFICIENTE DI VARIAZIONE E definito come il rapporto tra la deviazione standard è la media CV(X) = σ X / X Esempio: la media dei tempi di percorrenza dei treni sulla tratta Milano- Roma vale 350 minuti con una deviazione standard di 12 minuti, mentre sulla tratta Milano-Torino vale 280 minuti con una deviazione standard di 8 minuti. Quale delle due tratte è più affidabile? E evidente che non è possibile confrontare direttamente i due tempi di percorrenza poiché si riferiscono a diverse tratte. Tramite l indice di variabilità si ha che nel primo caso si ha CV=3,4% mentre nel secondo caso si ha CV=2,9%. I treni sulla tratta Milano-Torino sono più affidabili poiché hanno una variabilità minore rispetto all altra tratta.

49 INTERDIPENDENZA TRA VARIABILI DIVERSE A volte ci si chiede se ci può essere una qualche relazione tra due variabili X e Y. Per esempio se esiste una relazione tra ore passate al computer e problemi visivi (ad es. miopia). Si supponga per esempio di avere questa tabella in cui la miopia media di un campione di bambini viene messa in relazione alle ore giornaliere passate mediamente a giocare con la playstation. Ore passate a giocare Miopia media 0,8 1,3 1,2 2,4 2,7 3,2 Di questi dati è sempre buona norma fare un grafico!

50 GRAFICO A DISPERSIONE (SCATTER PLOT) Apparentemente c è una qualche dipendenza della miopia con il numero di ore passate a giocare ma come quantificare questa dipendenza? 3,5 3,0 Miopia media 2,5 2,0 1,5 1,0 0,5 0,0 0,0 1,0 2,0 3,0 4,0 5,0 6,0 Numero di ore medie giornaliere passate a giocare Un primo possibile indicatore è il coefficiente di correlazione lineare

51 COVARIANZA La covarianza tra due serie di dati è definita da - - COV(X,Y ) = N k=1 (x k X)(y k Y ) con X e Y medie di x k e y k. Questo coefficiente è la media del prodotto degli scarti. Questo coefficiente è positivo se mediamente i segni degli scarti sono concordi (ovvero se quando uno è positivo lo è anche l altro) e negativo quando sono discordi(cioè se uno è negativo, l altro è positivo e viceversa. Se non c è relazione tra i due segni la covarianza tende ad annullarsi. N

52 COVARIANZA Nel caso precedente per esempio si vede che c è concordanza, in effetti la covarianza è positiva e vale +0,77 - X=2,50 3,5 3,0 + Miopia 2,5 2,0 1, Y=1,93 1,0 0,5 0,0 0,0 1,0 2,0 3,0 4,0 5,0 6,0 Numero di ore medie giornaliere passate a giocare

53 CORRELAZIONE - - Detti x k e y k due serie di N dati con media X e Y si definisce coefficiente di correlazione tra X e Y la quantità R(X,Y ) = COV(X,Y ) σ XP σ Y P = N k=1 N k=1 ( x k X) y k Y ( x k X) 2 ( ) ( y k Y ) 2 Questo coefficiente è sempre un numero compreso tra -1 e 1 e ha questo significato. Più R è vicino a 1 più vi è una concordanza tra le due variabili (al crescere di una cresce l altra) Più R è vicino a -1 più vi è una discordanza tra le due variabili (al crescere di una decresce l altra) Se R è vicino a zero vi è indipendenza tra le variabili. N k=1

54 CALCOLO DEL COEFFICIENTE DI CORRELAZIONE Ore passate a giocare 0,0 1,0 2,0 3,0 4,0 5,0 Media=2,50 - (x-x) -2,5-1,5-0,5 0,5 1,5 2,5 (x- X) - 2 6,3 2,3 0,3 0,3 2,3 6,3 =17,50 Miopia media 0,8 1,3 1,2 2,4 2,7 3,2 Media=1,93 (y- Y) - -1,1-0,6-0,7 0,5 0,8 1,3 (y- Y) - 2 1,3 0,4 0,5 0,2 0,6 1,6 =4,6 (x- X)(y- Y) - - 2,8 0,9 0,4 0,2 1,2 3,2 =8.7 Il coefficiente di correlazione vale quindi R = = 0.97 il che indica che vi è un forte grado di relazione tra le ore passate a giocare e la miopia.

55 CUM GRANO SALIS Occorre sempre stare attenti però che non è detto che anche se c è un grado di relazione tra le due variabili vi è necessariamente una relazione causa-effetto tra di esse! Si potrebbe giungere a conclusioni paradossali come per esempio che l aumento temperatura globale sulla terra è causata dalla diminuzione del numero di pirati R=-0,93

56 REGRESSIONE Ci si chiede se tra le variabili X e Y esista una qualche relazione funzionale, cioè se esista una espressione Y=f(X) dove f è una qualche funzione che in qualche maniera approssimi i dati. La ricerca di una tale funzione è detta regressione Questa relazione funzionale può essere nota a priori (per esempio è noto che tra il peso di un corpo e il suo volume esiste una relazione lineare) oppure no. In questo secondo evidentemente non esiste una scelta univoca caso dallo studio del grafico a dispersione si potrebbe dedurre qual è il tipo di grafico più opportuno che approssima i dati.

57 REGRESSIONE In generale, quando si hanno a disposizione pochi punti è molto difficile stabilire qual è la funzione più opportuna 4,0 3,5 esponenziale 3,0 Miopia media 2,5 2,0 1,5 polinomio 1,0 0,5 0,0 0,0 1,0 2,0 3,0 4,0 5,0 6,0 Numero di ore medie giornaliere passate a giocare Nel caso del polinomio abbiamo una interpolazione, ovvero una curva che passa per tutti i punti. In generale non ci interessa una tale relazione funzionale, ma di una curva che si limiti ad approssimare i dati.

58 REGRESSIONE Con un gran numero di dati è più facile inferire la forma funzionale: Per esempio nel caso seguente è abbastanza evidente che i dati sono ben interpolati da una retta

59 REGRESSIONE LINEARE Qui noi ci occuperemo per semplicità del modello più semplice di regressione, ovvero quando i dati possono essere approssimati da una retta, ovvero da una relazione funzionale del tipo Y = A X + B con A e B variabili da determinare. Questo modello è detto di regressione lineare.

60 PRINCIPIO DEI MINIMI QUADRATI Per determinare i coefficienti A e B è possibile ricorrere al principio dei minimi quadrati (valido anche nel caso di regressioni non lineari). Siano x k e y k sono i nostri dati. Il valore teorico di y associato al valore x k è dato da ŷ k =Ax k +B. 3,5 3,0 Y 2,5 2,0 1,5 1,0 0,5 (x k, ŷ k ) (x k,y k ) 0,0 0,0 1,0 2,0 3,0 4,0 5,0 6,0 X

61 METODO DEI MINIMI QUADRATI Possiamo calcolare la somma dei quadrati degli scarti tra gli y k e i valori teorici ŷ k =Ax k +B. Q(A, B) = N ( y k ŷ k ) 2 = y k Ax k B k=1 N k=1 ( ) 2 questa quantità ci da una misura delle differenze tra i valori reali e quelli teorici delle y. Essa è una funzione delle variabili incognite A e B. I valori di A e B cercati sono quelli che minimizzano questa funzione, ovvero che rendono minima la differenza del quadrato degli scarti della relazione teorica con i dati reali.

62 METODO DEI MINIMI QUADRATI La minimizzazione si effettua tramite le tecniche standard dell analisi, ovvero derivando la funzione Q(A,B) rispetto ad A e a B e ponendo le derivate uguali a zero. Viene qui omessa la dimostrazione e viene dato direttamente il risultato A = R σ Y σ X B = Y AX dove R è il coefficiente di correlazione tra i dati. Come si vede il coefficiente angolare della retta e il coefficiente di correlazione sono legati tra di loro. In particolare se R>0 la retta è crescente, se R<0 decrescente (come ragionevole sia!)

63 ESEMPIO DI REGRESSIONE LINEARE Riprendiamo l esempio della miopia in funzione delle ore passate a giocare: Ore passate a giocare Miopia media Media Ricordiamo che R=0,97. Usando le formule precedenti si ha Dev. st. 0,0 1,0 2,0 3,0 4,0 5,0 2,50 2,5 1,71 0,8 1,3 1,2 2,4 2,7 3,2 1,93 1,9 0,88 A = 0, 97 0,88 = 0, 50 1, 71 B =1, 9 0, 50 2, 5 = 0, 69 Miopia 3,5 3,0 2,5 2,0 1,5 1,0 0,5 y = 0,50x + 0,69 R² = 0,93 0,0 0,0 1,0 2,0 3,0 4,0 5,0 6,0 Ore passate a giocare

64 COEFFICIENTE DI DETERMINAZIONE Dalle relazioni precedenti abbiamo che per la retta di regressione la somma dei quadrati degli scarti vale N 2 Q = k=1 " y k Y R σ % Y $ (x k X) ' # σ X & dopo qualche calcolo, ricordando la definizione di R si ottiene la relazione Q N 1 = σ Y 2 (1 R 2 ) In pratica: 1) se R 2 =1 si ha Q=0 e la retta passa esattamente per tutti i punti (determinazione perfetta) 2) Se R 2 =0 si ha Q/(N-1)=σ Y2, l errore quadratico medio non è migliore della varianza. La regressione non porta a nessun miglioramento di informazione (indifferenza o determinazione nulla) R 2 è detto coefficiente di determinazione e la regressione porta un risultato tanto migliore quanto questo è più vicino a 1.

65 PREVISIONE L uso della regressione serve per fornire una previsione (o estrapolazione) dei valori y per valori x diversi da quelli dall insieme x k. Per esempio, nel caso dell esercizio precedente vogliamo prevedere la miopia di un soggetto che passa 6 ore al giorno davanti alla playstation. Usando l equazione della retta avremo y = 0, 50 6, 0 + 0, 69 = 3, 7 si noti comunque che questa è solo una rozza estrapolazione. Valori reali potrebbero essere diversi da questa previsione.

66 MISURE DI CONNESSIONE Passiamo ad un altro esempio di verifica di relazioni. Si supponga di voler verificare se l uso di lenti bifocali può dar luogo a disturbi di emicrania ad alcuni pazienti. Vengono intervistati 94 pazienti e viene estratta la seguente tabella di contingenza Ha frequenti emicranie Non frequentii emicrania Usa lenti bifocali Non lenti bifocali Ovviamente ci possono essere altre cause per l emicrania però apparentemente sembra esserci una prevalenza di persone che usano lenti bifocali che ha problemi, cioè una connessione tra l uso di lenti ed emicranie. Vogliamo quantificare questa connessione.

67 NUMERO TEORICO IN ASSENZA DI CONNESSIONE Per capire se vi è una effettiva connessione dei due caratteri o se il fatto che l eccesso di persone che usa lenti bifocali con emicrania sia solo un fatto casuale dobbiamo confrontare questa tabella con quella teorica in cui i due caratteri sono indipendenti. Per esempio: il numero atteso di persone sul campione di 94 persone che che usa lenti bifocali e ha problemi di emicrania se non vi fosse nessuna connessione tra le due cose sarebbe n * 1,1 = = 27, 6 Numero di persone con emicrania Frazione di persone sul totale che usa lenti bifocali

68 TABELLA TEORICA DI INDIPENDENZA In pratica per ogni elemento ij il numero teorico si calcola come segue n * i, j = n n i,, j n ovvero moltiplicando i marginali di riga e colonna corrispondenti e dividendo per il numero totale (non fa nulla se non è un numero intero). Per esempio per la tabella precedente la tabella teorica sarebbe. Ha frequenti emicranie Non frequentii emicrania Usa lenti bifocali Non lenti bifocali 27,6 25, ,4 19,

69 INDICE DI CONNESSIONE (O CHI-QUADRO DI PEARSON) Per confrontare la tabella teorica con quella reale è possibile utilizzare il χ 2 (leggesi chi-quadrato) di Pearson definito come χ 2 = N M (n i, j n * i, j ) 2 = i=1 j=1 * n i, j N i=1 M j=1 2 n i, j n i, j * n dove N e M sono il numero di righe e di colonne della tabella (2 e 2 nel nostro esempio).

70 CHI-QUADRATO DI PEARSON Nel nostro caso avremmo quindi Tabella n ij Usa lenti bifocali Non lenti bifocali Ha frequenti emicranie Non frequentii emicrania 8 33 Ha frequenti Usa lenti bifocali Non lenti bifocali emicranie 27,6 25,4 emicrania 21,4 19,6 Non frequentii Tabella n* ij χ 2 = (41 27, 6)2 27, 6 + (12 25, 4)2 25, 4 resta da capire come interpretare questo numero + (8 21, 4)2 21, 4 + (33 19, 6)2 19, 6 = 31

71 CHI-QUADRATO DI PEARSON E possibile dimostrare che il χ 2 è un numero sempre compreso tra 0 e il n moltiplicato per il valore minimo tra il numero di righe meno 1 o il numero di colonne meno 1 0 χ 2 n min(n 1, M 1) E evidente che il valore 0 si può ottenere solo quando la tabella dei dati coincide esattamente con i valori teorici, cioè non c è una dipendenza tra i caratteri Di conseguenza: tanto più il valore di χ 2 si avvicina al valore massimo teorico tanto più c è dipendenza tra i due caratteri.

72 CHI-QUADRATO DI PEARSON Nel nostro caso abbiamo N=M=2 quindi il valore massimo teorico è uguale a n=94. Il valore di χ 2 =31indica che c è un livello medio di associazione, ovvero che c è una certa dipendenza tra il portare lenti bifocali e l avere spesso emicranie. Nello studio della statistica inferenziale si vedrà come quantificare meglio questo grado di associazione nel cosiddetto test del χ 2.

Elementi di Statistica

Elementi di Statistica Elementi di Statistica Contenuti Contenuti di Statistica nel corso di Data Base Elementi di statistica descrittiva: media, moda, mediana, indici di dispersione Introduzione alle variabili casuali e alle

Dettagli

ESERCIZI SVOLTI PER LA PROVA DI STATISTICA

ESERCIZI SVOLTI PER LA PROVA DI STATISTICA ESERCIZI SVOLTI PER LA PROVA DI STATISTICA Stefania Naddeo (anno accademico 4/5) INDICE PARTE PRIMA: STATISTICA DESCRITTIVA. DISTRIBUZIONI DI FREQUENZA E FUNZIONE DI RIPARTIZIONE. VALORI CARATTERISTICI

Dettagli

Dott.ssa Caterina Gurrieri

Dott.ssa Caterina Gurrieri Dott.ssa Caterina Gurrieri Le relazioni tra caratteri Data una tabella a doppia entrata, grande importanza riveste il misurare se e in che misura le variabili in essa riportata sono in qualche modo

Dettagli

MINIMI QUADRATI. REGRESSIONE LINEARE

MINIMI QUADRATI. REGRESSIONE LINEARE MINIMI QUADRATI. REGRESSIONE LINEARE Se il coefficiente di correlazione r è prossimo a 1 o a -1 e se il diagramma di dispersione suggerisce una relazione di tipo lineare, ha senso determinare l equazione

Dettagli

(accuratezza) ovvero (esattezza)

(accuratezza) ovvero (esattezza) Capitolo n 2 2.1 - Misure ed errori In un analisi chimica si misurano dei valori chimico-fisici di svariate grandezze; tuttavia ogni misura comporta sempre una incertezza, dovuta alla presenza non eliminabile

Dettagli

RELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della

RELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della RELAZIONE TRA VARIABILI QUANTITATIVE Lezione 7 a Accade spesso nella ricerca in campo biomedico, così come in altri campi della scienza, di voler studiare come il variare di una o più variabili (variabili

Dettagli

RELAZIONE TRA DUE VARIABILI QUANTITATIVE

RELAZIONE TRA DUE VARIABILI QUANTITATIVE RELAZIONE TRA DUE VARIABILI QUANTITATIVE Quando si considerano due o più caratteri (variabili) si possono esaminare anche il tipo e l'intensità delle relazioni che sussistono tra loro. Nel caso in cui

Dettagli

Capitolo 9: PROPAGAZIONE DEGLI ERRORI

Capitolo 9: PROPAGAZIONE DEGLI ERRORI Capitolo 9: PROPAGAZIOE DEGLI ERRORI 9.1 Propagazione degli errori massimi ella maggior parte dei casi le grandezze fisiche vengono misurate per via indiretta. Il valore della grandezza viene cioè dedotto

Dettagli

Accuratezza di uno strumento

Accuratezza di uno strumento Accuratezza di uno strumento Come abbiamo già accennato la volta scora, il risultato della misurazione di una grandezza fisica, qualsiasi sia lo strumento utilizzato, non è mai un valore numerico X univocamente

Dettagli

STATISTICA (A-K) a.a. 2007-08 Prof.ssa Mary Fraire Test di STATISTICA DESCRITTIVA Esonero del 2007

STATISTICA (A-K) a.a. 2007-08 Prof.ssa Mary Fraire Test di STATISTICA DESCRITTIVA Esonero del 2007 A STATISTICA (A-K) a.a. 007-08 Prof.ssa Mary Fraire Test di STATISTICA DESCRITTIVA Esonero del 007 STESS N.O. RD 00 GORU N.O. RD 006 ) La distribuzione del numero degli occupati (valori x 000) in una provincia

Dettagli

Introduzione alla Teoria degli Errori

Introduzione alla Teoria degli Errori Introduzione alla Teoria degli Errori 1 Gli errori di misura sono inevitabili Una misura non ha significato se non viene accompagnata da una ragionevole stima dell errore ( Una scienza si dice esatta non

Dettagli

Titolo della lezione. Analisi dell associazione tra due caratteri: indipendenza e dipendenza

Titolo della lezione. Analisi dell associazione tra due caratteri: indipendenza e dipendenza Titolo della lezione Analisi dell associazione tra due caratteri: indipendenza e dipendenza Introduzione Analisi univariata, bivariata, multivariata Analizzare le relazioni tra i caratteri, per cercare

Dettagli

Il concetto di valore medio in generale

Il concetto di valore medio in generale Il concetto di valore medio in generale Nella statistica descrittiva si distinguono solitamente due tipi di medie: - le medie analitiche, che soddisfano ad una condizione di invarianza e si calcolano tenendo

Dettagli

Gli eventi sono stati definiti come i possibili risultati di un esperimento. Ogni evento ha una probabilità

Gli eventi sono stati definiti come i possibili risultati di un esperimento. Ogni evento ha una probabilità Probabilità Probabilità Gli eventi sono stati definiti come i possibili risultati di un esperimento. Ogni evento ha una probabilità Se tutti gli eventi fossero ugualmente possibili, la probabilità p(e)

Dettagli

Parte 2. Determinante e matrice inversa

Parte 2. Determinante e matrice inversa Parte. Determinante e matrice inversa A. Savo Appunti del Corso di Geometria 013-14 Indice delle sezioni 1 Determinante di una matrice, 1 Teorema di Cramer (caso particolare), 3 3 Determinante di una matrice

Dettagli

Esercizi su lineare indipendenza e generatori

Esercizi su lineare indipendenza e generatori Esercizi su lineare indipendenza e generatori Per tutto il seguito, se non specificato esplicitamente K indicherà un campo e V uno spazio vettoriale su K Cose da ricordare Definizione Dei vettori v,,v

Dettagli

La distribuzione Normale. La distribuzione Normale

La distribuzione Normale. La distribuzione Normale La Distribuzione Normale o Gaussiana è la distribuzione più importante ed utilizzata in tutta la statistica La curva delle frequenze della distribuzione Normale ha una forma caratteristica, simile ad una

Dettagli

1 Medie. la loro media aritmetica è il numero x dato dalla formula: x = x 1 + x 2 +... + x n

1 Medie. la loro media aritmetica è il numero x dato dalla formula: x = x 1 + x 2 +... + x n 1 Medie La statistica consta di un insieme di metodi atti a elaborare e a sintetizzare i dati relativi alle caratteristiche di una fissata popolazione, rilevati mediante osservazioni o esperimenti. Col

Dettagli

ALGEBRA: LEZIONI DAL 13 OTTOBRE AL 3 NOVEMBRE

ALGEBRA: LEZIONI DAL 13 OTTOBRE AL 3 NOVEMBRE ALGEBRA: LEZIONI DAL 13 OTTOBRE AL 3 NOVEMBRE 1 DIPENDENZA E INDIPENDENZA LINEARE Se ho alcuni vettori v 1, v 2,, v n in uno spazio vettoriale V, il sottospazio 1 W = v 1,, v n di V da loro generato è

Dettagli

LA CORRELAZIONE LINEARE

LA CORRELAZIONE LINEARE LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad esempio, si può supporre che vi sia una relazione tra l insoddisfazione

Dettagli

Indice generale. Modulo 1 Algebra 2

Indice generale. Modulo 1 Algebra 2 Indice generale Modulo 1 Algebra 2 Capitolo 1 Scomposizione in fattori. Equazioni di grado superiore al primo 1.1 La scomposizione in fattori 2 1.2 Raccoglimento a fattor comune 3 1.3 Raccoglimenti successivi

Dettagli

Algoritmo euclideo, massimo comun divisore ed equazioni diofantee

Algoritmo euclideo, massimo comun divisore ed equazioni diofantee Algoritmo euclideo, massimo comun divisore ed equazioni diofantee Se a e b sono numeri interi, si dice che a divide b, in simboli: a b, se e solo se esiste c Z tale che b = ac. Si può subito notare che:

Dettagli

Dimensione di uno Spazio vettoriale

Dimensione di uno Spazio vettoriale Capitolo 4 Dimensione di uno Spazio vettoriale 4.1 Introduzione Dedichiamo questo capitolo ad un concetto fondamentale in algebra lineare: la dimensione di uno spazio vettoriale. Daremo una definizione

Dettagli

4.2. IL TEST F DI FISHER O ANALISI DELLA VARIANZA (ANOVA)

4.2. IL TEST F DI FISHER O ANALISI DELLA VARIANZA (ANOVA) 4.2. IL TEST F DI FISHER O ANALISI DELLA VARIANZA (ANOVA) L analisi della varianza è un metodo sviluppato da Fisher, che è fondamentale per l interpretazione statistica di molti dati biologici ed è alla

Dettagli

Metodi statistici per l economia (Prof. Capitanio) Slide n. 4. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Metodi statistici per l economia (Prof. Capitanio) Slide n. 4. Materiale di supporto per le lezioni. Non sostituisce il libro di testo Metodi statistici per l economia (Prof. Capitanio) Slide n. 4 Materiale di supporto per le lezioni. Non sostituisce il libro di testo Dipendenza di un carattere QUANTITATIVO da un carattere QUALITATIVO

Dettagli

Da una a più variabili: derivate

Da una a più variabili: derivate Da una a più variabili: derivate ( ) 5 gennaio 2011 Scopo di questo articolo è di evidenziare le analogie e le differenze, relativamente al calcolo differenziale, fra le funzioni di una variabile reale

Dettagli

Parte 3. Rango e teorema di Rouché-Capelli

Parte 3. Rango e teorema di Rouché-Capelli Parte 3. Rango e teorema di Rouché-Capelli A. Savo Appunti del Corso di Geometria 203-4 Indice delle sezioni Rango di una matrice, 2 Teorema degli orlati, 3 3 Calcolo con l algoritmo di Gauss, 6 4 Matrici

Dettagli

APPUNTI DI MATEMATICA LE FRAZIONI ALGEBRICHE ALESSANDRO BOCCONI

APPUNTI DI MATEMATICA LE FRAZIONI ALGEBRICHE ALESSANDRO BOCCONI APPUNTI DI MATEMATICA LE FRAZIONI ALGEBRICHE ALESSANDRO BOCCONI Indice 1 Le frazioni algebriche 1.1 Il minimo comune multiplo e il Massimo Comun Divisore fra polinomi........ 1. Le frazioni algebriche....................................

Dettagli

ANALISI DELLE FREQUENZE: IL TEST CHI 2

ANALISI DELLE FREQUENZE: IL TEST CHI 2 ANALISI DELLE FREQUENZE: IL TEST CHI 2 Quando si hanno scale nominali o ordinali, non è possibile calcolare il t, poiché non abbiamo medie, ma solo frequenze. In questi casi, per verificare se un evento

Dettagli

VARIABILI E DISTRIBUZIONI DI FREQUENZA A.A. 2010/2011

VARIABILI E DISTRIBUZIONI DI FREQUENZA A.A. 2010/2011 VARIABILI E DISTRIBUZIONI DI FREQUENZA A.A. 2010/2011 1 RAPPRESENTARE I DATI: TABELLE E GRAFICI Un insieme di misure è detto serie statistica o serie dei dati 1) Una sua prima elementare elaborazione può

Dettagli

PROBABILITA, VALORE ATTESO E VARIANZA DELLE QUANTITÁ ALEATORIE E LORO RELAZIONE CON I DATI OSSERVATI

PROBABILITA, VALORE ATTESO E VARIANZA DELLE QUANTITÁ ALEATORIE E LORO RELAZIONE CON I DATI OSSERVATI statistica, Università Cattaneo-Liuc, AA 006-007, lezione del 08.05.07 IDICE (lezione 08.05.07 PROBABILITA, VALORE ATTESO E VARIAZA DELLE QUATITÁ ALEATORIE E LORO RELAZIOE CO I DATI OSSERVATI 3.1 Valore

Dettagli

Analisi statistica di dati biomedici Analysis of biologicalsignals

Analisi statistica di dati biomedici Analysis of biologicalsignals Analisi statistica di dati biomedici Analysis of biologicalsignals II Parte Verifica delle ipotesi (a) Agostino Accardo (accardo@units.it) Master in Ingegneria Clinica LM in Neuroscienze 2013-2014 e segg.

Dettagli

EQUAZIONI non LINEARI

EQUAZIONI non LINEARI EQUAZIONI non LINEARI Francesca Pelosi Dipartimento di Matematica, Università di Roma Tor Vergata CALCOLO NUMERICO e PROGRAMMAZIONE http://www.mat.uniroma2.it/ pelosi/ EQUAZIONI non LINEARI p.1/44 EQUAZIONI

Dettagli

LOGISTICA APPUNTI DI STATISTICA

LOGISTICA APPUNTI DI STATISTICA Cos'é la Statistica LOGISTICA APPUNTI DI STATISTICA La statistica è la disciplina che applica metodi scientifici alla raccolta di dati e informazioni per una loro classificazione, elaborazione e rappresentazione

Dettagli

EQUAZIONI E DISEQUAZIONI POLINOMIALI E COLLEGAMENTI CON LA GEOMETRIA ELEMENTARE

EQUAZIONI E DISEQUAZIONI POLINOMIALI E COLLEGAMENTI CON LA GEOMETRIA ELEMENTARE EQUAZIONI E DISEQUAZIONI POLINOMIALI E COLLEGAMENTI CON LA GEOMETRIA ELEMENTARE 1. EQUAZIONI Definizione: un equazione è un uguaglianza tra due espressioni letterali (cioè in cui compaiono numeri, lettere

Dettagli

Appunti sulle disequazioni

Appunti sulle disequazioni Premessa Istituto d Istruzione Superiore A. Tilgher Ercolano (Na) Appunti sulle disequazioni Questa breve trattazione non vuole costituire una guida completa ed esauriente sull argomento, ma vuole fornire

Dettagli

LEZIONE 14. a 1,1 v 1 + a 1,2 v 2 + a 1,3 v 3 + + a 1,n 1 v n 1 + a 1,n v n = w 1

LEZIONE 14. a 1,1 v 1 + a 1,2 v 2 + a 1,3 v 3 + + a 1,n 1 v n 1 + a 1,n v n = w 1 LEZIONE 14 141 Dimensione di uno spazio vettoriale Abbiamo visto come l esistenza di una base in uno spazio vettoriale V su k = R, C, permetta di sostituire a V, che può essere complicato da trattare,

Dettagli

ESTRAZIONE DI RADICE

ESTRAZIONE DI RADICE ESTRAZIONE DI RADICE La radice è l operazione inversa dell elevamento a potenza. L esponente della potenza è l indice della radice che può essere: quadrata (); cubica (); quarta (4); ecc. La base della

Dettagli

1a) Calcolare gli estremi dell intervallo di confidenza per µ al 90% in corrispondenza del campione osservato.

1a) Calcolare gli estremi dell intervallo di confidenza per µ al 90% in corrispondenza del campione osservato. Esercizio 1 Sia X 1,..., X un campione casuale estratto da una variabile aleatoria normale con media pari a µ e varianza pari a 1. Supponiamo che la media campionaria sia x = 2. 1a) Calcolare gli estremi

Dettagli

General Linear Model. Esercizio

General Linear Model. Esercizio Esercizio General Linear Model Una delle molteplici applicazioni del General Linear Model è la Trend Surface Analysis. Questa tecnica cerca di individuare, in un modello di superficie, quale tendenza segue

Dettagli

STATISTICA 1 ESERCITAZIONE 1 CLASSIFICAZIONE DELLE VARIABILI CASUALI

STATISTICA 1 ESERCITAZIONE 1 CLASSIFICAZIONE DELLE VARIABILI CASUALI STATISTICA 1 ESERCITAZIONE 1 Dott. Giuseppe Pandolfo 30 Settembre 2013 Popolazione statistica: insieme degli elementi oggetto dell indagine statistica. Unità statistica: ogni elemento della popolazione

Dettagli

Stima per intervalli Nei metodi di stima puntuale è sempre presente un ^ errore θ θ dovuto al fatto che la stima di θ in genere non coincide con il parametro θ. Sorge quindi l esigenza di determinare una

Dettagli

1 Definizione: lunghezza di una curva.

1 Definizione: lunghezza di una curva. Abstract Qui viene affrontato lo studio delle curve nel piano e nello spazio, con particolare interesse verso due invarianti: la curvatura e la torsione Il primo ci dice quanto la curva si allontana dall

Dettagli

ELEMENTI DI STATISTICA

ELEMENTI DI STATISTICA Pag 1 di 92 Francesco Sardo ELEMENTI DI STATISTICA PER VALUTATORI DI SISTEMI QUALITA AMBIENTE - SICUREZZA REV. 11 16/08/2009 Pag 2 di 92 Pag 3 di 92 0 Introduzione PARTE I 1 Statistica descrittiva 1.1

Dettagli

Metodi risolutivi per le disequazioni algebriche

Metodi risolutivi per le disequazioni algebriche Metodi risolutivi per le disequazioni algebriche v.scudero Una disequazioni algebrica si presenta in una delle quattro forme seguenti: () P( () P( (3) P( () P( essendo P( un polinomio in. Noi studieremo

Dettagli

MATEMATICA. { 2 x =12 y 3 y +8 x =0, si pone il problema di trovare, se esistono, un numero x ed un numero y che risolvano entrambe le equazioni.

MATEMATICA. { 2 x =12 y 3 y +8 x =0, si pone il problema di trovare, se esistono, un numero x ed un numero y che risolvano entrambe le equazioni. MATEMATICA. Sistemi lineari in due equazioni due incognite. Date due equazioni lineari nelle due incognite x, y come ad esempio { 2 x =12 y 3 y +8 x =0, si pone il problema di trovare, se esistono, un

Dettagli

Misure di base su una carta. Calcoli di distanze

Misure di base su una carta. Calcoli di distanze Misure di base su una carta Calcoli di distanze Per calcolare la distanza tra due punti su una carta disegnata si opera nel modo seguente: 1. Occorre identificare la scala della carta o ricorrendo alle

Dettagli

Numeri complessi e polinomi

Numeri complessi e polinomi Numeri complessi e polinomi 1 Numeri complessi L insieme dei numeri reali si identifica con la retta della geometria: in altri termini la retta si può dotare delle operazioni + e e divenire un insieme

Dettagli

esame di stato 2014 seconda prova scritta per i licei scientifici di ordinamento

esame di stato 2014 seconda prova scritta per i licei scientifici di ordinamento ARTICOLO Archimede 4 4 esame di stato 4 seconda prova scritta per i licei scientifici di ordinamento Il candidato risolva uno dei due problemi e risponda a 5 quesiti del questionario. PROBLEMA Nella figura

Dettagli

Esercitazioni di Statistica

Esercitazioni di Statistica Esercitazioni di Statistica Test d ipotesi sul valor medio e test χ 2 di adattamento Prof. Livia De Giovanni statistica@dis.uniroma1.it Esercizio 1 Si supponga che il diametro degli anelli metallici prodotti

Dettagli

errore I = numero soggetti (I = 4) K = numero livelli tratt. (K = 3) popolazione varianza dovuta ai soggetti trattamento

errore I = numero soggetti (I = 4) K = numero livelli tratt. (K = 3) popolazione varianza dovuta ai soggetti trattamento Analisi della varianza a una via a misure ripetute (Anova con 1 fattore within) modello strutturale dell'analisi della varianza a misure ripetute con 1 fattore: y = μ ik 0 +π i +α k + ik ε ik interazione

Dettagli

Rango: Rouchè-Capelli, dimensione e basi di spazi vettoriali.

Rango: Rouchè-Capelli, dimensione e basi di spazi vettoriali. CAPITOLO 7 Rango: Rouchè-Capelli, dimensione e basi di spazi vettoriali. Esercizio 7.1. Determinare il rango delle seguenti matrici al variare del parametro t R. 1 4 2 1 4 2 A 1 = 0 t+1 1 A 2 = 0 t+1 1

Dettagli

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE La presentazione dei dati per molte ricerche mediche fa comunemente riferimento a frequenze, assolute o percentuali. Osservazioni cliniche conducono sovente

Dettagli

Analisi delle Corrispondenze Multiple Prof. Roberto Fantaccione

Analisi delle Corrispondenze Multiple Prof. Roberto Fantaccione Analisi delle Corrispondenze Multiple Prof. Roberto Fantaccione Consideriamo il nostro dataset formato da 468 individui e 1 variabili nominali costituite dalle seguenti modalità : colonna D: Age of client

Dettagli

LA FUNZIONE ESPONENZIALE E IL LOGARITMO

LA FUNZIONE ESPONENZIALE E IL LOGARITMO LA FUNZIONE ESPONENZIALE E IL LOGARITMO APPUNTI PER IL CORSO DI ANALISI MATEMATICA I G. MAUCERI Indice 1. Introduzione 1 2. La funzione esponenziale 2 3. Il numero e di Nepero 9 4. L irrazionalità di e

Dettagli

STUDIO DI UNA FUNZIONE

STUDIO DI UNA FUNZIONE STUDIO DI UNA FUNZIONE OBIETTIVO: Data l equazione Y = f(x) di una funzione a variabili reali (X R e Y R), studiare l andamento del suo grafico. PROCEDIMENTO 1. STUDIO DEL DOMINIO (CAMPO DI ESISTENZA)

Dettagli

APPUNTI DI MATEMATICA LE DISEQUAZIONI NON LINEARI

APPUNTI DI MATEMATICA LE DISEQUAZIONI NON LINEARI APPUNTI DI MATEMATICA LE DISEQUAZIONI NON LINEARI Le disequazioni fratte Le disequazioni di secondo grado I sistemi di disequazioni Alessandro Bocconi Indice 1 Le disequazioni non lineari 2 1.1 Introduzione.........................................

Dettagli

Introduzione allo Scilab Parte 3: funzioni; vettori.

Introduzione allo Scilab Parte 3: funzioni; vettori. Introduzione allo Scilab Parte 3: funzioni; vettori. Felice Iavernaro Dipartimento di Matematica Università di Bari http://dm.uniba.it/ iavernaro felix@dm.uniba.it 13 Giugno 2007 Felice Iavernaro (Univ.

Dettagli

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Analisi dei dati quantitativi :

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Analisi dei dati quantitativi : Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Analisi dei dati quantitativi : Confronto tra due medie Università del Piemonte Orientale Corso di laurea in

Dettagli

ESAME DI STATO 2002 SECONDA PROVA SCRITTA PER IL LICEO SCIENTIFICO DI ORDINAMENTO

ESAME DI STATO 2002 SECONDA PROVA SCRITTA PER IL LICEO SCIENTIFICO DI ORDINAMENTO ARCHIMEDE 4/ 97 ESAME DI STATO SECONDA PROVA SCRITTA PER IL LICEO SCIENTIFICO DI ORDINAMENTO Il candidato risolva uno dei due problemi e 5 dei quesiti in cui si articola il questionario. PROBLEMA In un

Dettagli

+ / operatori di confronto (espressioni logiche/predicati) / + 5 3 9 = > < Pseudo codice. Pseudo codice

+ / operatori di confronto (espressioni logiche/predicati) / + 5 3 9 = > < Pseudo codice. Pseudo codice Pseudo codice Pseudo codice Paolo Bison Fondamenti di Informatica A.A. 2006/07 Università di Padova linguaggio testuale mix di linguaggio naturale ed elementi linguistici con sintassi ben definita e semantica

Dettagli

VALORE DELLE MERCI SEQUESTRATE

VALORE DELLE MERCI SEQUESTRATE La contraffazione in cifre: NUOVA METODOLOGIA PER LA STIMA DEL VALORE DELLE MERCI SEQUESTRATE Roma, Giugno 2013 Giugno 2013-1 Il valore economico dei sequestri In questo Focus si approfondiscono alcune

Dettagli

STUDIO DEL SEGNO DI UNA FUNZIONE

STUDIO DEL SEGNO DI UNA FUNZIONE STUDIO DEL SEGNO DI UNA FUNZIONE Quando si studia una funzione! " #$%&' (funzione reale di variabile reale) è fondamentale conoscere il segno, in altre parole sapere per quali valori di &( #$%&'$è positiva,

Dettagli

GeoGebra 4.2 Introduzione all utilizzo della Vista CAS per il secondo biennio e il quinto anno

GeoGebra 4.2 Introduzione all utilizzo della Vista CAS per il secondo biennio e il quinto anno GeoGebra 4.2 Introduzione all utilizzo della Vista CAS per il secondo biennio e il quinto anno La Vista CAS L ambiente di lavoro Le celle Assegnazione di una variabile o di una funzione / visualizzazione

Dettagli

Quando troncare uno sviluppo in serie di Taylor

Quando troncare uno sviluppo in serie di Taylor Quando troncare uno sviluppo in serie di Taylor Marco Robutti October 13, 2014 Lo sviluppo in serie di Taylor di una funzione è uno strumento matematico davvero molto utile, e viene spesso utilizzato in

Dettagli

Appunti di Statistica

Appunti di Statistica Appunti di Statistica Riccardo Ricci Università di Firenze, Facoltà di Psicologia Corso di Laurea in Scienze e Tecniche di Psicologia del Lavoro e delle Organizzazioni Anno Accademico 2002-2003 1 maggio

Dettagli

FUNZIONE ESPONENZIALE E FUNZIONE LOGARITMICA

FUNZIONE ESPONENZIALE E FUNZIONE LOGARITMICA FUNZIONE ESPONENZIALE E FUNZIONE LOGARITMICA DEFINIZIONE: Dato un numero reale a che sia a > 0 e a si definisce funzione esponenziale f(x) = a x la relazione che ad ogni valore di x associa uno e un solo

Dettagli

TECNICHE DI SIMULAZIONE

TECNICHE DI SIMULAZIONE TECNICHE DI SIMULAZIONE MODELLI STATISTICI NELLA SIMULAZIONE Francesca Mazzia Dipartimento di Matematica Università di Bari a.a. 2004/2005 TECNICHE DI SIMULAZIONE p. 1 Modelli statistici nella simulazione

Dettagli

Principal Component Analysis

Principal Component Analysis Principal Component Analysis Alessandro Rezzani Abstract L articolo descrive una delle tecniche di riduzione della dimensionalità del data set: il metodo dell analisi delle componenti principali (Principal

Dettagli

METODI ITERATIVI PER SISTEMI LINEARI

METODI ITERATIVI PER SISTEMI LINEARI METODI ITERATIVI PER SISTEMI LINEARI LUCIA GASTALDI 1. Metodi iterativi classici Sia A R n n una matrice non singolare e sia b R n. Consideriamo il sistema (1) Ax = b. Un metodo iterativo per la soluzione

Dettagli

Ricerca Operativa Branch-and-Bound per problemi di Programmazione Lineare Intera

Ricerca Operativa Branch-and-Bound per problemi di Programmazione Lineare Intera Ricerca Operativa Branch-and-Bound per problemi di Programmazione Lineare Intera L. De Giovanni AVVERTENZA: le note presentate di seguito non hanno alcuna pretesa di completezza, né hanno lo scopo di sostituirsi

Dettagli

METODO DEI MINIMI QUADRATI. Quest articolo discende soprattutto dai lavori di Deming, Press et al. (Numerical Recipes) e Jefferys.

METODO DEI MINIMI QUADRATI. Quest articolo discende soprattutto dai lavori di Deming, Press et al. (Numerical Recipes) e Jefferys. METODO DEI MINIMI QUADRATI GIUSEPPE GIUDICE Sommario Il metodo dei minimi quadrati è trattato in tutti i testi di statistica e di elaborazione dei dati sperimentali, ma non sempre col rigore necessario

Dettagli

FASCI DI RETTE. scrivere la retta in forma esplicita: 2y = 3x + 4 y = 3 2 x 2. scrivere l equazione del fascio di rette:

FASCI DI RETTE. scrivere la retta in forma esplicita: 2y = 3x + 4 y = 3 2 x 2. scrivere l equazione del fascio di rette: FASCI DI RETTE DEFINIZIONE: Si chiama fascio di rette parallele o fascio improprio [erroneamente data la somiglianza effettiva con un fascio!] un insieme di rette che hanno tutte lo stesso coefficiente

Dettagli

Capitolo 12 La regressione lineare semplice

Capitolo 12 La regressione lineare semplice Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara

Dettagli

APPLICAZIONI LINEARI

APPLICAZIONI LINEARI APPLICAZIONI LINEARI 1. Esercizi Esercizio 1. Date le seguenti applicazioni lineari (1) f : R 2 R 3 definita da f(x, y) = (x 2y, x + y, x + y); (2) g : R 3 R 2 definita da g(x, y, z) = (x + y, x y); (3)

Dettagli

4. Operazioni elementari per righe e colonne

4. Operazioni elementari per righe e colonne 4. Operazioni elementari per righe e colonne Sia K un campo, e sia A una matrice m n a elementi in K. Una operazione elementare per righe sulla matrice A è una operazione di uno dei seguenti tre tipi:

Dettagli

Effetto reddito ed effetto sostituzione.

Effetto reddito ed effetto sostituzione. . Indice.. 1 1. Effetto sostituzione di Slutsky. 3 2. Effetto reddito. 6 3. Effetto complessivo. 7 II . Si consideri un consumatore che può scegliere panieri (x 1 ; ) composti da due soli beni (il bene

Dettagli

Matematica B - a.a 2006/07 p. 1

Matematica B - a.a 2006/07 p. 1 Matematica B - a.a 2006/07 p. 1 Definizione 1. Un sistema lineare di m equazioni in n incognite, in forma normale, è del tipo a 11 x 1 + + a 1n x n = b 1 a 21 x 1 + + a 2n x n = b 2 (1) = a m1 x 1 + +

Dettagli

Corso di Informatica Generale (C. L. Economia e Commercio) Ing. Valerio Lacagnina Rappresentazione in virgola mobile

Corso di Informatica Generale (C. L. Economia e Commercio) Ing. Valerio Lacagnina Rappresentazione in virgola mobile Problemi connessi all utilizzo di un numero di bit limitato Abbiamo visto quali sono i vantaggi dell utilizzo della rappresentazione in complemento alla base: corrispondenza biunivoca fra rappresentazione

Dettagli

4. Confronto tra medie di tre o più campioni indipendenti

4. Confronto tra medie di tre o più campioni indipendenti BIOSTATISTICA 4. Confronto tra medie di tre o più campioni indipendenti Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk MARTA BLANGIARDO

Dettagli

Potenza dello studio e dimensione campionaria. Laurea in Medicina e Chirurgia - Statistica medica 1

Potenza dello studio e dimensione campionaria. Laurea in Medicina e Chirurgia - Statistica medica 1 Potenza dello studio e dimensione campionaria Laurea in Medicina e Chirurgia - Statistica medica 1 Introduzione Nella pianificazione di uno studio clinico randomizzato è fondamentale determinare in modo

Dettagli

3. Confronto tra medie di due campioni indipendenti o appaiati

3. Confronto tra medie di due campioni indipendenti o appaiati BIOSTATISTICA 3. Confronto tra medie di due campioni indipendenti o appaiati Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk MARTA BLANGIARDO

Dettagli

Equazioni non lineari

Equazioni non lineari Dipartimento di Matematica tel. 011 0907503 stefano.berrone@polito.it http://calvino.polito.it/~sberrone Laboratorio di modellazione e progettazione materiali Trovare il valore x R tale che f (x) = 0,

Dettagli

Il Dipartimento per le Comunicazioni: uno studio dell età del personale. Miriam Tagliavia Marzo 2011

Il Dipartimento per le Comunicazioni: uno studio dell età del personale. Miriam Tagliavia Marzo 2011 Il Dipartimento per le Comunicazioni: uno studio dell età del personale Marzo 2011 2 Il Dipartimento per le Comunicazioni: uno studio dell età del personale Il Dipartimento per le Comunicazioni, uno dei

Dettagli

Proposta di soluzione della prova di matematica Liceo scientifico di Ordinamento - 2014

Proposta di soluzione della prova di matematica Liceo scientifico di Ordinamento - 2014 Proposta di soluzione della prova di matematica Liceo scientifico di Ordinamento - 14 Problema 1 Punto a) Osserviamo che g (x) = f(x) e pertanto g () = f() = in quanto Γ è tangente all asse delle ascisse,

Dettagli

Principal Component Analysis (PCA)

Principal Component Analysis (PCA) Principal Component Analysis (PCA) Come evidenziare l informazione contenuta nei dati S. Marsili-Libelli: Calibrazione di Modelli Dinamici pag. Perche PCA? E un semplice metodo non-parametrico per estrarre

Dettagli

B9. Equazioni di grado superiore al secondo

B9. Equazioni di grado superiore al secondo B9. Equazioni di grado superiore al secondo Le equazioni di terzo grado hanno una, due o tre soluzioni, risolvibili algebricamente con formule molto più complesse di quelle dell equazione di secondo grado.

Dettagli

+ P a n n=1 + X. a n = a m 3. n=1. m=4. Per poter dare un significato alla somma (formale) di infiniti termini, ricorriamo al seguente procedimento:

+ P a n n=1 + X. a n = a m 3. n=1. m=4. Per poter dare un significato alla somma (formale) di infiniti termini, ricorriamo al seguente procedimento: Capitolo 3 Serie 3. Definizione Sia { } una successione di numeri reali. Ci proponiamo di dare significato, quando possibile, alla somma a + a 2 +... + +... di tutti i termini della successione. Questa

Dettagli

ESERCIZI SVOLTI Ricerca del dominio di funzioni razionali fratte e irrazionali. www.vincenzoscudero.it novembre 2009

ESERCIZI SVOLTI Ricerca del dominio di funzioni razionali fratte e irrazionali. www.vincenzoscudero.it novembre 2009 ESERCIZI SVOLTI Ricerca del dominio di funzioni razionali fratte e irrazionali v.scudero www.vincenzoscudero.it novembre 009 1 1 Funzioni algebriche fratte 1.1 Esercizio svolto y = x 1 x 11x + 10 (generalizzazione)

Dettagli

Capitolo 2 - Teoria della manutenzione: classificazione ABC e analisi di Pareto

Capitolo 2 - Teoria della manutenzione: classificazione ABC e analisi di Pareto Capitolo 2 - Teoria della manutenzione: classificazione ABC e analisi di Pareto Il presente capitolo continua nell esposizione di alcune basi teoriche della manutenzione. In particolare si tratteranno

Dettagli

ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE

ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE Per gli studenti del 1 Anno della Facoltà di Agraria APPUNTI DALLE LEZIONI (A.A. 00/003) Andrea Onofri Dipartimento di Scienze Agroambientali e della

Dettagli

Flusso a costo minimo e simplesso su reti

Flusso a costo minimo e simplesso su reti Flusso a costo minimo e simplesso su reti La particolare struttura di alcuni problemi di PL può essere talvolta utilizzata per la progettazione di tecniche risolutive molto più efficienti dell algoritmo

Dettagli

Programmazione Generale. Matematica e Complementi. Classi: 2 Biennio Quarta. Istituto Tecnico Tecnologico Basilio Focaccia Salerno

Programmazione Generale. Matematica e Complementi. Classi: 2 Biennio Quarta. Istituto Tecnico Tecnologico Basilio Focaccia Salerno Istituto Tecnico Tecnologico Basilio Focaccia Salerno Programmazione Generale Matematica e Complementi Classi: 2 Biennio Quarta I Docenti della Disciplina Salerno, lì 12 settembre 2014 Finalità della Disciplina

Dettagli

Esponenziali elogaritmi

Esponenziali elogaritmi Esponenziali elogaritmi Potenze ad esponente reale Ricordiamo che per un qualsiasi numero razionale m n prendere n>0) si pone a m n = n a m (in cui si può sempre a patto che a sia un numero reale positivo.

Dettagli

Esercizi per il corso di Algoritmi e Strutture Dati

Esercizi per il corso di Algoritmi e Strutture Dati 1 Esercizi per il corso di Algoritmi e Strutture Dati Esercizi sulla Tecnica Divide et Impera N.B. Tutti gli algoritmi vanno scritti in pseudocodice (non in Java, né in C++, etc. ). Di tutti gli algoritmi

Dettagli

Corso di Analisi Matematica. Polinomi e serie di Taylor

Corso di Analisi Matematica. Polinomi e serie di Taylor a.a. 2013/14 Laurea triennale in Informatica Corso di Analisi Matematica Polinomi e serie di Taylor Avvertenza Questi sono appunti informali delle lezioni, che vengono resi disponibili per comodità degli

Dettagli

Rilevazione degli apprendimenti. Anno Scolastico 2006 2007 PROVA DI MATEMATICA. Scuola Secondaria di II grado. Classe Terza Tipo A. Codici. Scuola:...

Rilevazione degli apprendimenti. Anno Scolastico 2006 2007 PROVA DI MATEMATICA. Scuola Secondaria di II grado. Classe Terza Tipo A. Codici. Scuola:... Ministero della Pubblica Istruzione Rilevazione degli apprendimenti Anno Scolastico 2006 2007 PROVA DI MATEMATICA Scuola Secondaria di II grado Classe Terza Tipo A Codici Scuola:..... Classe:.. Studente:.

Dettagli

Cristian Secchi Pag. 1

Cristian Secchi Pag. 1 CONTROLLI DIGITALI Laurea Magistrale in Ingegneria Meccatronica SISTEMI A TEMPO DISCRETO Ing. Tel. 0522 522235 e-mail: cristian.secchi@unimore.it http://www.dismi.unimo.it/members/csecchi Richiami di Controlli

Dettagli

Analisi Mat. 1 - Ing. Inform. - Soluzioni del compito del 23-3-06

Analisi Mat. 1 - Ing. Inform. - Soluzioni del compito del 23-3-06 Analisi Mat. - Ing. Inform. - Soluzioni del compito del 3-3-6 Sia p il polinomio di quarto grado definito da pz = z 4. Sia S il settore circolare formato dai numeri complessi che hanno modulo minore o

Dettagli

Iniziamo con un esercizio sul massimo comun divisore: Esercizio 1. Sia d = G.C.D.(a, b), allora:

Iniziamo con un esercizio sul massimo comun divisore: Esercizio 1. Sia d = G.C.D.(a, b), allora: Iniziamo con un esercizio sul massimo comun divisore: Esercizio 1. Sia d = G.C.D.(a, b), allora: G.C.D.( a d, b d ) = 1 Sono state introdotte a lezione due definizioni importanti che ricordiamo: Definizione

Dettagli