STATISTICA esercizi svolti su: INTERPOLAZIONE PER/FRA PUNTI NOTI

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "STATISTICA esercizi svolti su: INTERPOLAZIONE PER/FRA PUNTI NOTI"

Transcript

1 STATISTICA esercizi svolti su: INTERPOLAZIONE PER/FRA PUNTI NOTI 1

2 2 1. La popolazione (in migliaia) residente a Milano negli anni 1971 e 1981 è riportata nella seguente tabella: Anno Abitanti Valutare il numero di residenti negli anni intermedi usando le due funzioni interpolanti Ŷ = p 0 +p 1 X e Ŷ = α 0α1 X dove si è indicato con X l anno e con Y la popolazione. Svolgimento Per semplificare i calcoli, poniamo, come origine del tempo, l anno 1971 ed esprimiamo X come gli anni trascorsi dal Avremo perciò la seguente tabella: X Y A questo punto dobbiamo determinare i due parametri p 0 e p 1 in modo tale che la retta Ŷ = p 0 + p 1 X passi per i punti A = (0; 1731) e B = (10; 1605). Impostiamo perciò il sistema { 1731 = p0 + p 1 0 -passaggio per A = p 0 + p passaggio per B- da cui ricaviamo p 0 = 1731 p 1 = = 12.6 L equazione della retta interpolante per punti noti è quindi: Ŷ = X. Seguiamo ora lo stesso procedimento per determinare i parametri α 0 e α 1 in modo che la funzione Ŷ = α 0 α X 1 passi per i punti A e B. Il sistema da impostare è: { 1731 = α0 α1 0 -passaggio per A = α 0 α1 10 -passaggio per B-

3 3 da cui α 0 = 1731 Abbiamo quindi ricavato l equazione: α 1 = = Ŷ = 1731 (0.9925) X. Per valutare il numero di residenti negli anni compresi tra il 1971 e il 1981, tramite le due funzioni interpolanti trovate, basterà sostituire in esse i valori di X corrispondenti. Facendo ciò è possibile completare la seguente tabella: Anno x Ŷ = x Ŷ = 1731 (0.9925) x Dalla tabella ricaviamo che ad esempio, per l anno 1975, secondo la retta interpolante Ŷ = X, la popolazione residente a Milano è stata di (migliaia di persone), mentre, secondo la funzione Ŷ = 1731 (0.9925)X è stata di (migliaia di persone). 2. La seguente tabella riporta, per due famiglie, il reddito annuo netto X e la spesa annua per abbigliamento Y (dati in migliaia di euro): X Y Si determinino i parametri della funzione interpolante Ŷ = α 0X α 1. Svolgimento Consideriamo i seguenti due punti A = (20.5; 0.8) e B = (25; 1.1) e impostiamo il seguente sistema imponendo il passaggio della funzione interpolante per essi: { 0.8 = α0 (20.5) α 1 -passaggio per A- 1.1 = α 0 (25) α 1 -passaggio per B-

4 4 Risolvendo si ottiene: α 0 = 0.8 (20.5) α = 0.8 (20.5) α 1 (25)α 1 α 0 = 0.8 (20.5) α 1 ( = ) α1 α 0 = 0.8 (20.5) α 1 ( ) 1.1 log = α 1 log 0.8 α 0 = 0.8 (20.5) α 1 ( ) 1.1 log 0.8 α 1 = ( ) 25 log 20.5 ( ) da cui: { α0 = α 1 = Abbiamo perciò ottenuto l equazione della funzione interpolante cercata: Ŷ = X Valutare l area sottesa alla curva normale standardizzata in corrispondenza del valore z = 0, 537. Calcolare inoltre il 75-esimo percentile della distribuzione normale standardizzata. Svolgimento Dalle tavole della distribuzione normale standard, ricaviamo i seguenti valori z Φ(z)

5 5 Abbiamo quindi i due punti A = (0.53; ) e B = (0.54; ) e cerchiamo i parametri della retta interpolante passante per A e B. Impostiamo il sistema da cui otteniamo { = p p 1 -passaggio per A = p p 1 -passaggio per B- { p0 = p = p p 1 { p0 = p 1 p 1 = { p0 = p 1 = L equazione della retta interpolante passante per A e per B è perciò Ŷ = Z per 0.53 < Z < 0.54 e tale retta nel punto z = assume il valore Abbiamo quindi determinato, come richiesto, l area sottesa alla curva normale standardizzata da a 0.537: Φ(0.537) = Per calcolare il 75-esimo percentile (terzo quartile) della distribuzione normale standardizzata, consultiamo le tavole ed otteniamo: Φ(z) z Abbiamo quindi i due punti A = (0.67; ) e B = (0.68; ) e cerchiamo i parametri della retta interpolante passante per A e B. Impostiamo il sistema { = p p 1 -passaggio per A = p p 1 -passaggio per B- da cui otteniamo con calcoli analoghi a quelli svolti precedentemente che { p0 = p 1 =

6 6 La retta interpolante passante per A e per B è perciò Ŷ = Z. Andiamo ora a calcolare il valore di z in corrispondenza del quale Ŷ = 0.75: 0.75 = z z = Il 75-esimo percentile della distribuzione normale standardizzata, è perciò Nove soggetti di età diversa sono stati sottoposti ad un test. Per ogni individuo è stata registrata l età in anni compiuti (carattere X) ed il tempo di risoluzione del test (carattere Y ) espresso in minuti: x i y i a) Dopo aver rappresentato graficamente la nuvola di punti (x i, y i ) per i = 1,...9, determinare l equazione della retta interpolante Ŷ = α 0 + α 1 X ottenuta col metodo dei minimi quadrati. Rappresentare inoltre la retta interpolante ed interpretare il significato dei parametri α 0 e α 1. b) Al fine di valutare la bontà di adattamento della retta interpolante ricavata al punto precedente: calcolare i residui di interpolazione e fornirne un opportuna rappresentazione grafica; valutare, mediante un opportuno indice, l ordine di grandezza dei residui; scomporre la devianza totale di Y in devianza spiegata (dalla retta) e devianza residua; calcolare l indice di determinazione della retta commentando i risultati. Svolgimento a) Il grafico della nuvola di punti è il seguente:

7 7 Y X Fig. 1: Grafico della nuvola di punti (x i,y i ). Completiamo la seguente tabella per agevolare i calcoli successivi: x i y i x i y i x 2 i yi Andiamo quindi a determinare ˆα 0 e ˆα 1 della retta interpolante Ŷ = ˆα 0 + ˆα 1 X dove ˆα 1 = cov(x, Y ) var(x) ˆα 0 = ȳ ˆα 1 x Calcoliamo per prima cosa le medie dei due caratteri: x = = 19

8 8 e quindi la covarianza: cov(x, Y ) = Calcoliamo la varianza di X: ȳ = = n n x i y i xȳ = 1 (1896) = V ar(x) = M 1 (X 2 ) [M 1 (X) 2 ] [ ] 2 = 1 N x 2 i N 1 N x i N = (19)2 9 = Quindi: ˆα 1 = ˆα 0 = ( ) { ˆα1 = ˆα 0 = L equazione della retta interpolante ai minimi quadrati è perciò: Ŷ = X. Il grafico della retta è riportato in Figura (2). Interpretiamo ora i valori dei parametri: * ˆα 0 = significa che (in teoria) un soggetto di 0 anni impiega per risolvere il test minuti. Notiamo che in questo contesto, il valore di α 0 è poco significativo (perchè non ha senso valutare il tempo di risoluzione del test per un individuo di 0 anni). * ˆα 1 = significa che all aumentare di un anno dell età del soggetto, il tempo di risoluzione del test diminuisce di minuti.

9 9 Y (X,Y) X Fig. 2: Grafico della retta interpolante Ŷ = X. b) Calcoliamo ora i residui di interpolazione, completando la seguente tabella. x i y i ŷ i y i ŷ i y i ŷ i A titolo esemplificativo, riportiamo i calcoli effettuati per completare la quarta riga: le altre sono state riempite in modo analogo. Consideriamo x 4 = 18 e il corrispondente valore di Y : y 4 = 12. Per determinare ŷ 4 sostituiamo, nell equazione della retta interpolante Ŷ = 30.76ˆ X, il valore x 4 = 18 ad X: ŷ 4 = 30.76ˆ x 4 = 30.76ˆ = A questo punto calcoliamo il residuo di interpolazione y 4 ŷ 4 = = Per riempire l ultima colonna, non resta che calcolare il modulo del residuo: y 4 ŷ 4 = =

10 10 Ora è necessario controllare che i segni dei residui non si susseguano in modo sistematico. Per fare ciò controlliamo la quarta colonna (y i ŷ i ) della tabella precedente: in questo caso, si può notare che il segno dei residui non è propriamente casuale, infatti si può evidenziare una certa regolarità. Osserviamo inoltre che in corrispondenza dei punti in cui y i ŷ i > 0 la retta interpolante sottostima Y, infatti il valore previsto ŷ i è inferiore al valore effettivo y i. Nei punti invece dove y i ŷ i < 0 la retta interpolante sovrastima Y dal momento che ŷ i > y i. Possiamo ora rappresentare graficamente i residui di interpolazione (vedi Figura (3)). y -y i i X Fig. 3: Rappresentazione grafica dei residui di interpolazione. Notiamo che anche l analisi grafica dei residui di interpolazione evidenzia un andamento dei residui non casuale: ciò sottolinea maggiormente che i segni dei residui non si susseguono in modo non sistematico. Per valutare l ordine di grandezza dei residui, calcoliamo la media aritmetica

11 11 dei loro valori assoluti: M 1 ( Y Ŷ ) = y i ŷ i = = É possibile commentare il valore ottenuto nel seguente modo: mediamente i valori osservati (Y ) si discostano dai valori previsti dalla retta (Ŷ ) di minuti. Un altro modo per valutare l ordine di grandezza dei residui è quello di calcolare la media quadratica dei residui: per fare ciò, completiamo la seguente tabella x i y i ŷ i y i ŷ i y i ŷ i e calcoliamo la media quadratica dei residui: M 2 ( Y Ŷ ) = 1 9 y i ŷ i = = É possibile commentare il valore ottenuto nel seguente modo: mediamente (in media quadratica) i valori osservati (Y ) si discostano dai valori previsti dalla retta (Ŷ ) di minuti. Continuando l analisi dell ordine di grandezza dei residui, possiamo calcolare anche i seguenti due indici relativi alla media aritmetica: (a) M 1 ( Y Ŷ ) M 1 (Y ) = =

12 12 (b) che significa che mediamente lo scostamento tra i valori osservati e i valori interpolati è pari al 6.32% della media di Y ; M 2 ( Y Ŷ ) M 1 (Y ) = = che significa invece che mediamente (in media quadratica) lo scostamento tra i valori osservati e i valori interpolati è pari al 7.25% della media di Y. Per calcolare la devianza totale di Y e la devianza residua, riprendiamo la precedente tabella e completiamola: x i y i ŷ i y i ŷ i (y i ŷ i ) 2 ŷ i ȳ (ŷ i ȳ) Calcoliamo ora la devianza totale la devianza residua e la devianza spiegata 9 (y i ȳ) 2 = 9 yi 2 9 (ȳ) 2 = (11. 4) 2 = (y i ŷ i ) 2 = (ŷ i ȳ) 2 = É quindi verificata la scomposizione: = DEVIANZA = DEVIANZA + DEVIANZA TOTALE RESIDUA SPIEGATA

13 13 Calcoliamo infine l indice di determinazione: I 2 d = DEV. SPIEGATA DEV. TOTALE = = La retta interpolante ai minimi quadrati spiega il 90.9% della variabilità totale del carattere Y : possiamo pertanto concludere che esiste un buon adattamento della retta ai minimi quadrati al fenomeno analizzato. 5. La seguente tabella riporta il numero di occupati (in migliaia di unità) in Italia per gli anni dal 1998 al 2002 (Fonte Istat): anno occupati a) Rappresentare graficamente il fenomeno; b) Determinare e rappresentare graficamente l equazione della retta interpolante: Ŷ = ˆα 0 + ˆα 1 X dove X rappresenta il numero di anni trascorsi dal 1998; c) Calcolare i residui di interpolazione e valutare la bontà di adattamento della retta interpolante. Svolgimento a) La rappresentazione grafica del fenomeno è riportata in Figura (4).

14 14 Y X Fig. 4: Rappresentazione grafica della nuvola dei punti. b) Per prima cosa riscriviamo i dati relativi agli anni considerando il carattere X come il numero di anni trascorsi dal 1998 e completiamo la seguente tabella: Anno x i y i x i y i x 2 i ŷ i TOT Per determinare i parametri della retta interpolante Ŷ = ˆα 0 + ˆα 1 X impostiamo il seguente sistema: ˆα 1 = cov(x, Y ) var(x) ˆα 0 = ȳ ˆα 1 x Calcoliamo le medie dei due caratteri: x = x i = 10 5 = 2 ȳ = y i = =

15 15 e grazie alla tabella sopra riportata, calcoliamo la covarianza tra X e Y e la varianza di X: cov(x, Y ) = x i y i xȳ = = var(x) = x 2 i ( x)2 = = 2 Sostituendo tali valori, otteniamo: ˆα 1 = ˆα 0 = ˆα 1 2 vale a dire ˆα 1 = ˆα 0 = L equazione della retta interpolante fra punti noti è quindi: Ŷ = X. In Figura (5) vediamo rappresentata tale retta interpolante.

16 16 Y X Fig. 5: Rappresentazione grafica della retta interpolante Ŷ = X. c) Per calcolare i residui di interpolazione, completiamo la seguente tabella: Anno x i y i ŷ i y i ŷ i yi 2 (ŷ i ȳ) TOT Osservando i segni dei residui di interpolazione, risulta chiaro che la retta interpolante ai minimi quadrati tende a sottostimare il carattere Y in corrispondenza dei valori estremi (anno 1998 e anno 2002), mentre tende a sovrastimare Y in quasi tutti gli anni intermedi (anno 1999 e anno 2000). Calcoliamo ora la devianza totale: 5 (y i ȳ) 2 = e la devianza spiegata: 5 yi 2 5 (ȳ)2 = ( ) 2 = (ŷ i ȳ) 2 = A questo punto possiamo calcolare l indice di determinazione per valutare la bontà di adattamento della retta interpolante: I 2 d = DEV. SPIEGATA DEV. TOTALE

17 17 = = La retta interpolante ai minimi quadrati spiega il 98.7% della variabilità totale del carattere Y : possiamo quindi concludere che esiste un ottimo adattamento della retta interpolante ai minimi quadrati al fenomeno analizzato. 6. Siano X e Y due variabili di cui sono note le seguenti quantità: N = 10; N x i = 150; N y i = 600; N x 2 i = 2410; N y 2 i = 46240; N x i y i = Determinare i parametri delle due rette di interpolazione Ŷ = a + bx e ˆX = c + dy e rappresentare graficamente le due rette. Svolgimento Determiniamo i parametri a e b tali che Ŷ = a + b X. Impostiamo perciò il sistema: b = cov(x, Y ) var(x) a = ȳ b x e andiamo a calcolare le quantità che ci interessano: x = 1 N ȳ = 1 N N x i = = N y i = = 60 10

18 18 var(x) = 1 N N x 2 i ( x)2 = (15)2 10 = 16 var(y ) = 1 N N yi 2 (ȳ)2 cov(x, Y ) = Sostituendo nel sistema, otteniamo: = (60)2 10 = N N x i y i xȳ = (15 60) 10 = 80. b = a = 60 b 15 cioè b = 5 a = 135 Otteniamo perciò la retta interpolante: Per determinare i parametri c e d tali che Ŷ = X. ˆX = c + d Y è necessario invece risolvere il sistema d = cov(x, Y ) var(y ) c = x d ȳ

19 19 Andiamo quindi a sostituire i valori ricavati: d = c = 15 d 60 e otteniamo d = c = La retta interpolante è pertanto: ˆX = Y. Il grafico delle due rette interpolanti è riportato in Figura (6). Y X= Y 60 (X;Y) Y=135-5X X Fig. 6: Rappresentazione grafica delle due rette interpolanti.

20 20 Osserviamo che l unico punto che hanno in comune le due rette è il punto (15; 60) che ha come coordinate le medie aritmentiche dei due caratteri. 7. La seguente tabella riporta il numero di spettatori Y (in migliaia) delle sale cinematografiche di una città della Lombardia negli anni X dal 1995 al 2001: Anni Spettatori a) Costruire la retta interpolante a minimi quadrati Ŷ = a + bx ed interpretare il significato dei parametri a e b. b) Indicare quale numero di spettatori si può prevedere per l anno 2008 e commentare il risultato ottenuto. c) Calcolare i residui dopo aver rappresentato graficamente la retta interpolante. d) Supponendo che il dato relativo all anno 1998 non sia noto, ricalcolare i parametri della retta interpolante, rappresentarla graficamente e calcolare il numero di spettatori per l anno 1998, commentando. Svolgimento a) Per prima cosa riscriviamo i dati relativi agli anni considerando il carattere X come il numero di anni trascorsi dal 1995 e completiamo la seguente tabella: Anno x i y i x 2 i x i y i TOT Determiniamo i parametri a e b tali che Impostiamo perciò il sistema: Ŷ = a + b X. b = cov(x, Y ) var(x) a = ȳ b x

21 21 e andiamo a calcolare le quantità che ci interessano: x = 1 N N x i = = 3 ȳ = 1 N N y i = = var(x) = 1 N N x 2 i ( x)2 cov(x, Y ) = = 1 91 (3)2 7 = 4 1 N N x i y i xȳ = ( ) 7 = Sostituendo nel sistema, otteniamo: b = a = b 3 cioè b = a = La retta interpolante ha equazione: Ŷ = X. Interpretiamo ora i valori dei parametri: * a = significa che la retta prevede che nell anno 1995 (cioè quando sono trascorsi 0 anni dal 1995) nelle sale cinematografiche della città della Lombardia presa in esame, ci siano stati migliaia di spettatori.

22 22 * b = significa che passando da un anno al successivo, il numero di spettatori nelle sale cinematografiche della città lombarda presa in esame, diminuisce di migliaia di unità. b) Per calcolare il numero di spettatori previsti nel 2008, basta andare a valutare il valore della retta interpolante in corrispondenza del valore x = 13 (13 anni trascorsi dal 1995): Ŷ 2008 = = Per l anno 2008 si prevedono nelle sale cinematografiche della città lombarda presa in esame migliaia di spettatori. c) In Figura (7) vediamo rappresentata tale retta interpolante. Y (X,Y) Y= X X Fig. 7: Rappresentazione grafica della retta interpolante Ŷ = X. Per calcolare i residui di interpolazione, completiamo la seguente tabella: Anno x i y i ŷ i y i ŷ i d) Supponiamo ora che il dato relativo all anno 1998 non sia noto. Avremo quindi la nuova tabella:

23 23 Anno x i y i x 2 i x i y i TOT tramite la quale determiniamo i nuovi parametri ã e b tali che Ŷ = ã + b X. Impostiamo perciò il sistema: b = cov(x, Y ) var(x) ã = ȳ b x e andiamo a calcolare le quantità che ci interessano: x = 1 N x i = 1 N 6 18 = 3 ȳ = 1 N y i = = N 6 var(x) = 1 N N x 2 i ( x) 2 cov(x, Y ) = = 1 82 (3)2 6 = N N x i y i xȳ = ( ) 6 = 2.3. Sostituendo nel sistema, otteniamo: 2.3 b = 4. 6 ã = b 3

24 24 cioè b = ã = Si ottiene perciò la retta interpolante: Ŷ = X. In Figura (8) vediamo rappresentata tale retta interpolante. Y (X,Y) Y= X X Fig. 8: Rappresentazione grafica della retta interpolante Ŷ = X. Per calcolare il numero di spettatori nel 1998 (dato mancante), basta andare a valutare il valore della retta interpolante in corrispondenza del valore x = 3 (3 anni trascorsi dal 1995): Ŷ 1998 = = Supponendo di non avere il dato relativo all anno 1998, si prevedono nelle sale cinematografiche della città lombarda presa in esame, per l anno 1998, migliaia di spettatori. Notiamo che tale previsione non si discosta in modo eccessivo dal valore effettivo relativo all anno 1998 (11.1): ciò conferma il buon comportamento della retta ai minimi quadrati nella situazione analizzata.

25 STATISTICA: esercizi svolti sulla CONNESSIONE 1

26 1 LA CONNESSIONE 2 1 LA CONNESSIONE 1. I dati relativi alla popolazione occupata per grande ripartizione geografica e per settore di attività economica sono riportati nella seguente tabella: Ripartiz. Nord (N) Centro-Sud (CS) Attività Totale Agricoltura (A) Industria (I) Altre attività (AA) Totale a) Determinare la distribuzione bivariata di frequenze relative; b) determinare le distribuzioni condizionate di frequenze relative; c) valutare, mediante il calcolo delle frequenze teoriche, se esiste indipendenza distributiva tra i due caratteri. In caso di risposta negativa, costruire la tabella corrispondente a questa situazione; d) calcolare le contingenze e fornire la loro interpretazione; e) calcolare le contingenze relative e fornire la loro interpretazione; f) valutare la connessione tra i due caratteri mediante un indice basato sulle contingenze relative. Svolgimento. Svolgimento punto a) Le frequenze congiunte relative sono ricavabili dalle frequenze congiunte attraverso la relazione: fr(a i, b j ) = n ij N Nel nostro caso abbiamo ad esempio che: per i = 1, 2, 3 e j = 1, 2. fr(a, N) = n 11 N = = Tale valore indica l importanza numerica relativa degli individui che nella popolazione occupata sono caratterizzati dall essere contemporaneamente impiegati in agricoltura e risiedere al nord. In particolare possiamo dire che il 3.32% della popolazione occupata risiede al nord ed è impiegata nel settore agricolo. fr(a, CS) = n 12 N = = Tale valore dice che il 5.94% della popolazione occupata risiede al centro sud ed è impiegata nel settore agricolo. Procedendo in modo del tutto analogo nel caso di tutte le altre frequenze congiunte relative si ottiene la seguente tabella:

27 1 LA CONNESSIONE 3 Ripartiz. Nord (N) Centro-Sud (CS) Attività Totale Agricoltura (A) Industria (I) Altre attività (AA) Totale fr(i, N) = indica che il 19.65% della popolazione occupata risiede al nord ed è impiegata nel settore industriale; fr(i, CS) = indica che il 12.5% della popolazione occupata risiede al centro sud ed è impiegata nel settore industriale; fr(aa, N) = indica che il 27.12% della popolazione occupata risiede al nord ed è impiegata nelle altre attività; fr(aa, CS) = indica che il 31.47% della popolazione occupata risiede al centro sud ed è impiegata nelle altre attività; Nell ultima riga e colonna della tabella sopra ricavata sono riportate le frequenze marginali relative rispettivamente dei caratteri Ripartizione Geografica e Settore di Attività Economica. Esse sono state ricavate, rispettivamente, utilizzando le espressioni: fr(b j ) = n.j j = 1, 2 N fr(a i ) = n i. i = 1, 2, 3. N Le frequenze marginali relative del carattere Ripartizione Geografica forniscono le seguenti informazioni: fr(n) = indica che il 50.09% della popolazione occupata risiede al nord. f r(cs) = indica che il 49.91% della popolazione occupata risiede al centro sud. Le frequenze marginali relative del carattere Settore di Attività Economica forniscono invece le seguenti informazioni: fr(a) = indica che il 9.26% della popolazione occupata è impiegata nel settore agricolo. fr(i) = indica che il 32.15% della popolazione occupata è impiegata nel settore industriale. fr(aa) = indica che il 58.59% della popolazione occupata è impiegata in altre attività..

28 1 LA CONNESSIONE 4 Svolgimento punto b) Iniziamo con il calcolo delle frequenze relative condizionate del carattere Settore di attività Economica. Fissiamo innanzi tutto l attenzione sulla distribuzione parziale associata alla modalità N del carattere Ripartizione Geografica. In tal caso le frequenze relative condizionate sono date da: fr(a N) = n 11 n.1 = = fr(i N) = n 21 n.1 = = fr(aa N) = n 31 n.1 = = In modo del tutto analogo possono essere ricavate le frequenze relative del carattere Settore di Attività Economica condizionate alla modalità CS del carattere Ripartizione Geografica. I risultati sono riportati nella seguente tabella: Ripartiz. Nord (N) Centro-Sud (CS) Attività Agricoltura (A) Industria (I) Altre attività (AA) Totale Si osservi che l ultima colonna della tabella sopra riportata contiene le frequenze relative marginali del carattere Settore di Attività Economica. Le frequenze relative condizionate del carattere Settore di Attività Economica danno le seguenti informazioni: fr(a N) = indica che il 6.64% della popolazione occupata residente al nord risulta essere impiegata nel settore agricolo; fr(i N) = indica che il 39.23% della popolazione occupata residente al nord risulta essere impiegata nel settore industriale; f r(aa N) = indica che il 54.13% della popolazione occupata residente al nord risulta essere impiegata in altre attività; f r(a CS) = indica che il 11.91% della popolazione occupata residente al centro sud risulta essere impiegata nel settore agricolo; f r(i CS) = indica che il 25.04% della popolazione occupata residente al centro sud risulta essere impiegata nel settore industriale; f r(aa CS) = indica che il 63.05% della popolazione occupata residente al centro sud risulta essere impiegata in altre attività. Per quanto riguarda il calcolo delle frequenze relative condizionate del carattere Ripartizione Geografica, fissiamo innanzi tutto l attenzione sulla distribuzione parziale

29 1 LA CONNESSIONE 5 associata alla modalità A del carattere Settore di attività Economica. In tal caso le frequenze relative condizionate sono date da: fr(n A) = n 11 n 1. = = fr(cs A) = n 12 n 1. = = In modo del tutto analogo possono essere ricavate le frequenze relative del carattere Ripartizione Geografica condizionate alla modalità I e AA del carattere Settore di attività Economica. I risultati di questi calcoli sono riportati sinteticamente nella seguente tabella: Ripartiz. Nord (N) Centro-Sud (CS) Attività Totale Agricoltura (A) Industria (I) Altre attività (AA) Si osservi che l ultima riga della tabella sopra riportata contiene le frequenze relative marginali del carattere Ripartizione Geografica. Le frequenze relative condizionate del carattere Ripartizione geografica forniscono le seguenti informazioni: fr(n A) = indica che il 35.87% della popolazione occupata impiegata nel settore agricolo risiede al nord; f r(cs A) = indica che il 64.13% della popolazione occupata impiegata nel settore agricolo risiede al centro sud; fr(n I) = indica che il 66.12% della popolazione occupata impiegata nel settore industriale risiede al nord; f r(cs I) = indica che il 38.88% della popolazione occupata impiegata nel settore industriale risiede al centro sud; f r(n AA) = indica che il 46.29% della popolazione occupata impiegata in altri settori risiede al nord; f r(cs AA) = indica che il 53.71% della popolazione occupata impiegata in altri settori risiede al centro sud. Svolgimento punto c) Affinchè tra i due caratteri Settore di attività Economica e Ripartizione geografica vi sia indipendenza distributiva, è necessario che ciascuna delle frequenze congiunte n ij coincida con la corrispondente frequenza teorica di indipendenza distributiva ˆn ij = n i. n.j N : n ij = ˆn ij i = 1, 2, 3 j = 1, 2.

30 1 LA CONNESSIONE 6 E sufficiente che una sola frequenza congiunta differisca dalla corrispondente frequenza teorica per concludere che tra i due caratteri non vi è indipendenza distributiva. Ad esempio, se i due caratteri in considerazione fossero indipendenti in distribuzione, n 11 dovrebbe coincidere con: ˆn 11 = n 1. n.1 N = = In realtà abbiamo che n 11 = 698 ˆn 11 e di conseguenza tra i due caratteri in considerazione non vi è indipendenza distributiva. Come richiesto dal testo dell esercizio, si ricava la tabella delle frequenze teoriche nel caso di indipendenza distributiva: Ripartiz. Nord (N) Centro-Sud (CS) Attività Totale Agricoltura (A) Industria (I) Altre attività (AA) Totale Si osservi che le distribuzioni marginali della tabella delle ferquenze teoriche ˆn ij coincidono con quelle della tabella delle frequenze effettive n ij. Svolgimento punto d) Le contingenze C ij sono per definizione costituite dalla differenza tra la frequenza effettiva n ij e quella teorica nel caso di indipendenza distributiva ˆn ij : C ij = n ij ˆn ij i = 1, 2, 3 j = 1, 2. Il loro calcolo è riportato nella seguente tabella: Ripartiz. Nord (N) Centro-Sud (CS) Attività Totale Agricoltura (A) Industria (I) Altre attività (AA) Totale Si osservi che sia i totali di riga che di colonna delle contingenze sono nulli. Il valore assunto dalle contingenze appena ricavate fornisce le seguenti informazioni: C 11 = : la frequenza congiunta effettiva associata alle modalità A del carattere Settore di Attività Economica e N del carattere Ripartizione Geografica, risulta essere minore rispetto a quella teorica in ipotesi di indipendenza distributiva. Tra le modalità A del carattere Settore di attività Economica, e N del carattere Ripartizione Geografica vi è repulsione in quanto la frequenza congiunta che si è osservata è inferiore a quella che si sarebbe dovuta osservare se tra i due caratteri vi fosse stata indipendenza distributiva;

31 1 LA CONNESSIONE 7 C 12 = : la frequenza congiunta effettiva associata alle modalità A del carattere Settore di Attività Economica e CS del carattere Ripartizione Geografica, risulta essere maggiore rispetto a quella teorica in ipotesi di indipendenza distributiva. Tra le modalità A del carattere Settore di Attività Economica e CS del carattere Ripartizione Geografica vi è attrazione in quanto la frequenza congiunta che si è osservata è maggiore di quella che si sarebbe dovuta osservare se tra i due caratteri vi fosse stata indipendenza distributiva; C 21 = : la frequenza congiunta effettiva associata alle modalità modalità I del carattere Settore di Attività Economica e N del carattere Ripartizione Geografica, risulta essere maggiore rispetto a quella teorica in ipotesi di indipendenza distributiva. Tra le modalità I del carattere Settore di Attività Economica e N del carattere Ripartizione Geografica vi è attrazione in quanto la frequenza congiunta che si è osservata è maggiore di quella che si sarebbe dovuta osservare se tra i due caratteri vi fosse stata indipendenza distributiva; C 22 = : la frequenza congiunta effettiva associata alle modalità modalità I del carattere Settore di Attività Economica e CS del carattere Ripartizione Geografica, risulta essere minore rispetto a quella teorica in ipotesi di indipendenza distributiva. Tra le modalità I del carattere Settore di Attività Economica e CS del carattere Ripartizione Geografica vi è repulsione in quanto la frequenza congiunta che si è osservata è inferiore a quella che si sarebbe dovuta osservare se tra i due caratteri vi fosse stata indipendenza distributiva; C 31 = : la frequenza congiunta effettiva associata alle modalità modalità AA del carattere Settore di Attività Economica e N del carattere Ripartizione Geografica, risulta essere minore rispetto a quella teorica in ipotesi di indipendenza distributiva. Tra le modalità AA del carattere Settore di Attività Economica e N del carattere Ripartizione Geografica vi è repulsione in quanto la frequenza congiunta che si è osservata è inferiore a quella che si sarebbe dovuta osservare se tra i due caratteri vi fosse stata indipendenza distributiva; C 32 = : la frequenza congiunta effettiva associata alle modalità modalità AA del carattere Settore di Attività Economica e CS del carattere Ripartizione Geografica, risulta essere maggiore rispetto a quella teorica in ipotesi di indipendenza distributiva. Tra le modalità AA del carattere Settore di Attività Economica e CS del carattere Ripartizione Geografica vi è attrazione in quanto la frequenza congiunta che si è osservata è maggiore di quella che si sarebbe dovuta osservare se tra i due caratteri vi fosse stata indipendenza distributiva; Svolgimento punto e) Per contingenze relative si intendono le grandezze: ρ ij = C ij ˆn ij i = 1, 2, 3 j = 1, 2.

32 1 LA CONNESSIONE 8 Il calcolo delle contingenze relative è riportato nella segeunte tabella: Ripartiz. Nord (N) Centro-Sud (CS) Attività Agricoltura (A) Industria (I) Altre attività (AA) Il valore assunto dalle contingenze relative appena ricavate fornisce le seguenti informazioni: ρ 11 = : la frequenza congiunta effettiva associata alle modalità A del carattere Settore di Attività Economica e N del carattere Ripartizione Geografica, è inferiore del 28.39% rispetto a quella teorica d indipendenza distributiva. ρ 12 = : la frequenza congiunta effettiva associata alle modalità A del carattere Settore di Attività Economica e CS del carattere Ripartizione Geografica, supera del 28.39% quella teorica d indipendenza distributiva. ρ 21 = : la frequenza congiunta effettiva associata alle modalità I del carattere Settore di Attività Economica e N del carattere Ripartizione Geografica, supera del 22.02% quella teorica d indipendenza distributiva. ρ 22 = : la frequenza congiunta effettiva associata alle modalità I del carattere Settore di Attività Economica e CS del carattere Ripartizione Geografica, è inferiore del 22.02%rispetto a quella teorica d indipendenza distributiva. ρ 31 = : la frequenza congiunta effettiva associata alle modalità AA del carattere Settore di Attività Economica e N del carattere Ripartizione Geografica, è inferiore del 7.56% rispetto a quella teorica d indipendenza distributiva. ρ 11 = : la frequenza congiunta effettiva associata alle modalità AA del carattere Settore di Attività Economica e CS del carattere Ripartizione Geografica, supera del 7.56% quella teorica d indipendenza distributiva. Svolgimento punto f) Al fine di effettuare una sintesi delle contingenze relative in precedenza calcolate, utilizziamo l indice di connessione di Mortara e l indice quadratico di connessione di K. Pearson. L indice di connessione di Mortara è dato da: M 1 ( ρ ) = ρ ij ˆn ij N = 1 N = 3 2 C ij 1 ( ) 21002

33 1 LA CONNESSIONE 9 = = Il valore appena individuato informa che, in media, le frequenze effettive differiscono da quelle teoriche del 14.19% del valore di quest ultime. Nella seguente tabella sono riportati i valori dei rapporti C2 ij ˆn ij. Tali valori saranno utili per il calcolo dell indice quadratico di connessione di K. Pearson. Ripartiz. Nord (N) Centro-Sud (CS) Attività Totale Agricoltura (A) Industria (I) Altre attività (AA) Totale L indice quadratico di connessione di K.Pearson è dato da: M 2 ( ρ ) = ρ 2 ij N ˆn ij = Cij 2 N = ˆn ij = Il valore appena individuato informa che, in media quadratica, le frequenze effettive differiscono da quelle teoriche del 16.29% del valore di quest ultime. Per avere informazioni sul grado della connessione esistente tra i due caratteri, è opportuno ricorrere ad un indice normalizzato. Un indice che possiede tale caratteristica, viene ottenuto dividendo l indice di connessione quadratico di Pearson per il suo massimo valore assumibile. Il valore massimo assumibile da M 2 ( ρ ) corrisponde al caso di massima connessione tra i due caratteri e, in tale caso, si dimostra che M 2 ( ρ ) = (k 1) 1 2 dove k = min(r, c) ed r e c indicano il numero di modalità dei due caratteri. Otteniamo quindi l indice di connessione quadratico normalizzato: C = M 2( ρ ). (k 1) 1 2 L indice appena introdotto gode delle seguenti proprietà: 0 C 1; C = 0 se e solo se tra i caratteri in considerazione vi è indipendenza distributiva;

34 1 LA CONNESSIONE 10 C = 1 se e solo se tra i caratteri vi è massima connessione. Nel nostro caso abbiamo: C = = Concludendo, l indice quadratico di connessione di Pearson, è pari al 16.29% del suo massimo valore (che corrisponde al caso di massima connessione). Si può quindi concludere che tra i due caratteri Settore di Attività Economica e Ripartizione geografica vi è un basso grado di connessione. 2. I 300 partecipanti ad un concorso pubblico costituito dalle due prove C e D hanno ottenuto le seguenti valutazioni: C\D Insufficiente (I D ) Sufficiente (S D ) Buono (B D ) Tot Insufficiente (I C ) Sufficiente (S C ) Buono (B C ) Tot a) Si confrontino le distribuzioni condizionate del carattere Esito della prova C e si commenti; b) calcolare le contingenze relative e fornire la loro interpretazione; c) calcolare un indice di connessione ed interpretare il valore ottenuto. Svolgimento Svolgimento punto a) Le 3 distribuzioni condizionate, o parziali, del carattere Esito della prova C, corrispondono alle colonne della tabella di contingenza fornita dal testo dell esercizio. Si osservi che tali distribuzioni parziali non sono direttamente confrontabili in quanto hanno differente numerosità complessiva. Per effettuare un confronto, è opportuno ricavare le distribuzioni condizionate (o parziali) di frequenze relative: C\D Insufficiente (I D ) Sufficiente (S D ) Buono (B D ) Tot Insufficiente (I C ) Sufficiente (S C ) Buono (B C ) Tot La tabella sopra riportata mostra che la quota di prove C valutate insufficienti, varia al variare dell esito della prova D. Lo stesso possiamo dire anche per le quote di prove C che sono state valutate sufficienti o buone. Dato che, se i due caratteri in considerazione fossero indipendenti in distribuzione, tutte le distribuzioni condizionate di fequenze relative sarebbero identiche, si può concludere che tra Esito della prova C

35 1 LA CONNESSIONE 11 ed Esito della prova D non vi è indipendenza distributiva. Svolgimento punto b) Per calcolare le contingenze è comodo ricavare dapprima le frequenze congiunte teoriche ˆn ij nell ipotesi di indipendenza distributiva. Ricordiamo che il valore di tale frequenze è dato da: ˆn ij = n i. n.j N Il loro calcolo è riportato nella seguente tabella: i = 1,..., r; j = 1,..., c. C\D Insufficiente (I D ) Sufficiente (S D ) Buono (B D ) Tot Insufficiente (I C ) Sufficiente (S C ) Buono (B C ) Tot Nella seguente tabella sono riportati i valori delle contingenze C ij = n ij ˆn ij : C\D Insufficiente (I D ) Sufficiente (S D ) Buono (B D ) Tot Insufficiente (I C ) Sufficiente (S C ) Buono (B C ) Tot A questo punto è possibile ricavare agevolmente le contingenze relative ρ ij ricordando che: ρ ij = C ij ˆn ij i = 1,..., r; j = 1,..., c. Il loro valore è riportato nella seguente tabella: C\D Insufficiente (I D ) Sufficiente (S D ) Buono (B D ) Insufficiente (I C ) Sufficiente (S C ) Buono (B C ) Il valore assunto dalle contingenze relative appena ricavate, fornisce le seguenti informazioni: ρ 11 = 1.168: la frequenza congiunta effettiva associata alle modalità I C del carattere Esito della prova C e I D del carattere Esito della prova D, supera del 116.8% quella teorica d indipendenza distributiva. ρ 21 = 0.445: la frequenza congiunta effettiva associata alle modalità I C del carattere Esito della prova C e S D del carattere Esito della prova D, è inferiore del 44.5% rispetto a quella teorica d indipendenza distributiva. ρ 31 = 0.579: la frequenza congiunta effettiva associata alle modalità I C del carattere Esito della prova C e B D del carattere Esito della prova D, è inferiore del 57.9% rispetto a quella teorica d indipendenza distributiva.

36 1 LA CONNESSIONE 12 ρ 12 = 0.770: la frequenza congiunta effettiva associata alle modalità S C del carattere Esito della prova C e I D del carattere Esito della prova D, è inferiore del 77.0% rispetto a quella teorica d indipendenza distributiva. ρ 22 = 0.682: la frequenza congiunta effettiva associata alle modalità S C del carattere Esito della prova C e S D del carattere Esito della prova D, supera del 68.2% quella teorica d indipendenza distributiva. ρ 32 = 0.168: la frequenza congiunta effettiva associata alle modalità S C del carattere Esito della prova C e B D del carattere Esito della prova D, è inferiore del 16.8% rispetto a quella teorica d indipendenza distributiva. ρ 13 = 0.852: la frequenza congiunta effettiva associata alle modalità B C del carattere Esito della prova C e I D del carattere Esito della prova D, è inferiore del 85.2% rispetto a quella teorica d indipendenza distributiva. ρ 23 = 0.051: la frequenza congiunta effettiva associata alle modalità B C del carattere Esito della prova C e S D del carattere Esito della prova D, è inferiore del 5.1% rispetto a quella teorica d indipendenza distributiva. ρ 33 = 0.954: la frequenza congiunta effettiva associata alle modalità B C del carattere Esito della prova C e S D del carattere Esito della prova D, supera del 95.4% quella teorica d indipendenza distributiva. Nel loro complesso le contingenze relative sembrano suggerire che tra i due caratteri allo studio vi sia una elevata connessione, in particolare permettono di osservare la tendenza dei partecipanti al concorso pubblico ad ottenere la medesima valutazione in entrambe le prove. Infatti le coppie di modalità (I C ; I D ), (S C ; S D ) e (B C ; B D ) sono le uniche che si attraggono e, come evidenziano i commenti fatti in precedenza, il grado di tale attrazione è in genere elevato. E interessante anche osservare che il grado di repulsione tende a crescere all aumentare della diversità nella valutazione delle due prove. Si osservi ad esempio che ρ 31 < ρ 21. Svolgimento punto c) Per completezza calcoliamo sia l indice di connessione di Mortara sia l indice quadratico di connessione di K.Pearson. L indice di connessione di Mortara è dato da: M 1 ( ρ ) = 1 N = 1 N ρ ij ˆn ij 3 C ij = 1 ( ) 300 = = Il valore appena individuato informa che, in media, le frequenze effettive differiscono da quelle teoriche del 61.55% del valore di quest ultime.

37 1 LA CONNESSIONE 13 Nella seguente tabella sono riportati i valori dei rapporti C2 ij ˆn ij. Tali valori saranno utili per il calcolo dell indice quadratico di connessione di K. Pearson. C\D Insufficiente (I D ) Sufficiente (S D ) Buono (B D ) Tot Insufficiente (I C ) Sufficiente (S C ) Buono (B C ) Tot L indice quadratico di connessione di K.Pearson è dato da: M 2 ( ρ ) = ρ 2 ij N ˆn ij = Cij 2 N = ˆn ij = In alternativa, il valore di M 2 ( ρ ) si sarebbe potuto ricavare mediante il procedimento indiretto. A tal fine, ricordiamo che: dove X 2 = = = M 2 ( ρ ) = 3 (n ij ˆn ij ) ˆn ij n 2 ij ˆn ij 3 n 2 ij ˆn ij N 1 N X2 3 ˆn ij n ij Nella seguente tabella sono riportati i valori dei rapporti n2 ij ˆn ij. Tali valori sono utili per il calcolo, mediante il procedimento indiretto, dell indice quadratico di connessione di K. Pearson. C\D Insufficiente (I D ) Sufficiente (S D ) Buono (B D ) Tot Insufficiente (I C ) Sufficiente (S C ) Buono (B C ) Tot

38 1 LA CONNESSIONE 14 In definitiva, si ha che: X 2 = = M 2 ( ρ ) = N X2 1 = = Il valore appena individuato informa che, in media quadratica, le frequenze effettive differiscono da quelle teoriche del 70.37% del valore di quest ultime. Per avere informazioni sul grado della connessione esistente tra i due caratteri, ricorriamo all indice normalizzato: C = M 2( ρ ) (k 1) 1 2 dove k = min(r, c) ed r e c indicano il numero di modalità dei due caratteri. Nel nostro caso k = 3 da cui: C = M 2( ρ ) (3 1) 1 2 = = L indice quadratico di connessione di Pearson, è pari al 49.75% del suo massimo valore (che corrisponde al caso di massima connessione). Si può quindi concludere che tra i due caratteri Esito della prova C e Esito della prova D vi è un medio grado di connessione. 3. I 400 studenti di due istituti di scuola media inferiore sono stati classificati in base al sesso ed alla categoria di peso (sottopeso, peso forma, sovrappeso). Da tale classificazione è emerso quanto segue: 1) i maschi sono il 40% degli studenti; 2) il 10% degli studenti è sottopeso; di questi il 30% sono maschi; 3) il 35% degli studenti è sovrappeso; di questi il 65% sono femmine. a) Costruire la distribuzione congiunta delle frequenze assolute dei due caratteri, Sesso e Peso ; b) determinare le distribuzioni di frequenze relative condizionate di Peso da Sesso ; c) determinare le contingenze assolute e fornire la loro interpretazione;

39 1 LA CONNESSIONE 15 e) valutare la connessione tra i due caratteri mediante un indice basato sulle contingenze. Svolgimento Svolgimento punto a) Nel seguito indicheremo ripettivamente con M e F le modalità maschio e femmina del carattere Sesso e con s, P ed S le modalità sottopeso, peso forma e sovrappeso del carattere Peso. Dall informazione 1) del testo dell esercizio abbiamo che e di conseguenza fr(m) = 0.4 fr(f ) = 1 fr(m) = 0.6. Abbiamo in questo modo ricavato la distribuzione di frequenze relative marginali del carattere Sesso. Dall informazione 2) del testo dell esercizio abbiamo che ed inolte Ricordando che fr(m s) = fr(m,s) fr(s) e di conseguenza fr(s) = 0.1 fr(m s) = abbiamo che fr(m, s) = fr(m s) fr(s) = = 0.03 fr(f, s) = fr(s) fr(m, s) = = Abbiamo così ricato le frequenze congiunte relative delle modalità del carattere Sesso con la modalità s del carattere Peso. Dall informazione 3) del testo dell esercizio abbiamo che fr(s) = 0.35 e sfruttando quanto ricavato in precedenza abbiamo fr(p ) = 1 (fr(s) + fr(s)) = = Siamo in questo modo riusciti a ricavare l intera distribuzione di frequenze relative marginali del carattere Peso. Abbiamo inoltre che: fr(f S) = Ricordando che fr(f S) = fr(f,s) fr(s) abbiamo fr(f, S) = fr(f S) fr(s) = =

40 1 LA CONNESSIONE 16 e di conseguenza fr(m, S) = fr(s) fr(f, S) = = Siamo in questo modo riusciti a ricavare le frequenze congiunte relative delle modalità del carattere Sesso con la modalità S del carattere Peso. Le frequenze congiunte relative che risultano ancora incognite sono fr(m, P ) e fr(f, P ). Il loro valore è calcolabile, sfruttando quanto in precedenza ricavato, nel seguente modo: fr(m, P ) = fr(m) fr(m, s) fr(m, S) = = fr(f, P ) = fr(f ) fr(f, s) fr(f, S) = = In definitiva, la distribuzione di fequenze congiunte relative è riportata nelle seguente tabella: Sesso\P eso s P S Tot M F Tot La distribuzione di frequenze assolute congiunte può essere a questo punto ricavata semplicemente moltiplicando per N = 400 le frequenze relative congiunte appena calcolate. Tale distribuzione è riportata nella tabella seguente: Sesso\P eso s P S Tot M F Tot Svolgimento punto b) Iniziamo con il ricavare la distribuzione di frequenze condizionate di Peso relative alla modalità M di Sesso. fr(s M) = fr(m, s) fr(m) = n(m, s) n(m) = = = fr(p M) = fr(m, P ) fr(m) fr(s M) = fr(m, S) fr(m) = n(m, P ) n(m) = n(m, S) n(m) = = = = = = Procedendo in modo analogo possiamo ricavare la distribuzione di frequenze condizionate di Peso relative alla modalità F di Sesso. I risultati di questi calcoli e di quelli già fatti in precedenza sono riportati nella seguente tabella. Sesso\P eso s P S Tot M F

41 1 LA CONNESSIONE 17 Svolgimento punto c) Per calcolare le contingenze ricaviamo dapprima le frequenze congiunte teoriche ˆn ij nell ipotesi di indipendenza distributiva. Ricordiamo che il valore di tale frequenze è dato da: ˆn ij = n i. n.j N Il loro calcolo è riportato nella seguente tabella: i = 1,..., r; j = 1,..., c. Sesso\P eso s P S Tot M F Tot Di seguito sono riportati i valori delle contingenze C ij = n ij ˆn ij : Sesso\P eso s P S Tot M F Tot Si osservi che sia i totali di riga che di colonna delle contingenze sono nulli. Il valore assunto dalle contingenze appena ricavate fornisce le seguenti informazioni: C 11 = 4: la frequenza congiunta effettiva associata alle modalità M del carattere Sesso e s del carattere Peso, risulta essere minore rispetto a quella teorica in ipotesi di indipendenza distributiva. Tra le modalità F del carattere Sesso e s del carattere Peso vi è repulsione in quanto la frequenza congiunta che si è osservata è minore di quella che si sarebbe dovuta osservare se tra i due caratteri vi fosse stata indipendenza distributiva; C 21 = 4: la frequenza congiunta effettiva associata alle modalità F del carattere Sesso e s del carattere Peso, risulta essere maggiore rispetto a quella teorica in ipotesi di indipendenza distributiva. Tra le modalità F del carattere Sesso e s del carattere Peso vi è attrazione in quanto la frequenza congiunta che si è osservata è maggiore di quella che si sarebbe dovuta osservare se tra i due caratteri vi fosse stata indipendenza distributiva; C 12 = 11: la frequenza congiunta effettiva associata alle modalità M del carattere Sesso e P del carattere Peso, risulta essere maggiore rispetto a quella teorica in ipotesi di indipendenza distributiva. Tra le modalità M del carattere Sesso e P del carattere Peso vi è attrazione in quanto la frequenza congiunta che si è osservata è maggiore di quella che si sarebbe dovuta osservare se tra i due caratteri vi fosse stata indipendenza distributiva; C 22 = 11: la frequenza congiunta effettiva associata alle modalità F del carattere Sesso e P del carattere Peso, risulta essere minore rispetto a quella teorica in ipotesi di indipendenza distributiva. Tra le modalità F del carattere

STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE

STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 2 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1.1

Dettagli

STATISTICA: esercizi svolti sulla DIPENDENZA IN MEDIA

STATISTICA: esercizi svolti sulla DIPENDENZA IN MEDIA STATISTICA: esercizi svolti sulla DIPEDEZA I MEDIA 1 1 LA DIPEDEZA I MEDIA 2 1 LA DIPEDEZA I MEDIA 1. La popolazione in migliaia di unità occupata in Piemonte nel 1985 per reddito annuo Y (migliaia di

Dettagli

Corso in Statistica Medica

Corso in Statistica Medica Corso in Statistica Medica Introduzione alle tecniche statistiche di elaborazione dati Regressione e correlazione Dott. Angelo Menna Università degli Studi di Chieti G. d Annunziod Annunzio Anno Accademico

Dettagli

PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE

PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE 1. Distribuzione congiunta Ci sono situazioni in cui un esperimento casuale non si può modellare con una sola variabile casuale,

Dettagli

Esercitazione 1. 6 Marzo 2019

Esercitazione 1. 6 Marzo 2019 Esercitazione 1 6 Marzo 019 Esercizio 1 Su un collettivo di 100 appartamenti ubicati nella stessa zona della città vengono rilevati i seguenti caratteri: X 1 affitto mensile pagato dal locatario (in Euro)

Dettagli

Facoltà di Scienze Politiche Corso di laurea in Servizio sociale. Compito di Statistica del 7/1/2003

Facoltà di Scienze Politiche Corso di laurea in Servizio sociale. Compito di Statistica del 7/1/2003 Compito di Statistica del 7/1/2003 I giovani addetti all agricoltura in due diverse regioni sono stati classificati per età; la distribuzione di frequenze congiunta è data dalla tabella seguente Età in

Dettagli

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2010/2011 Statistica Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza

Dettagli

STATISTICA esercizi svolti sulla VARIABILITA

STATISTICA esercizi svolti sulla VARIABILITA STATISTICA esercizi svolti sulla VARIABILITA 1 1 VARIABILITA 2 1 VARIABILITA 1.1 Esercizi 1. La seguente tabella riporta il tempo (in giorni) impiegato da sei individui per il consumo di una confezione

Dettagli

Statistica bivariata: il problema della dipendenza

Statistica bivariata: il problema della dipendenza Statistica bivariata: il problema della dipendenza Antonio Punzo Università di Catania, Dipartimento di Economia e Impresa antoniopunzo@unictit Orario delle lezioni: Martedì, ore 16:00-18:00, Palazzo delle

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Associazione, correlazione e dipendenza tra caratteri In un collettivo di 11 famiglie è stata

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative

Dettagli

Statistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione

Statistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2011/2012 Statistica Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate.

Dettagli

Statistica 1 A.A. 2015/2016

Statistica 1 A.A. 2015/2016 Corso di Laurea in Economia e Finanza Statistica 1 A.A. 2015/2016 (8 CFU, corrispondenti a 48 ore di lezione frontale e 24 ore di esercitazione) Prof. Luigi Augugliaro 1 / 19 Analisi dell associazione

Dettagli

ESERCIZI SVOLTI Giuliano Bonollo - Michele Bonollo

ESERCIZI SVOLTI Giuliano Bonollo - Michele Bonollo ESERCIZI SVOLTI Giuliano Bonollo - Michele Bonollo 1 La seguente tabella riporta le frequenze relative riguardanti gli studenti di un università e gli esiti dell esame da essi sostenuto. Qual è la percentuale

Dettagli

Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010.

Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010. Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010 Statistica Esercitazione 4 12 maggio 2010 Dipendenza in media. Covarianza e

Dettagli

Statistica. Esercitazione 3 9 maggio 2012 Coefficiente di variazione. Serie storiche. Connessione e indipendenza statistica

Statistica. Esercitazione 3 9 maggio 2012 Coefficiente di variazione. Serie storiche. Connessione e indipendenza statistica Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 20/202 Statistica Esercitazione 3 9 maggio 202 Coefficiente di variazione. Serie storiche.

Dettagli

STATISTICA. Esonero 8 novembre 2014 Soluzione. Quesito 1.

STATISTICA. Esonero 8 novembre 2014 Soluzione. Quesito 1. STATISTICA Esonero 8 novembre 2014 Soluzione Quesito 1. Si consideri la seguente distribuzione unitaria dei salari degli impiegati di una compagnia (migliaia di euro): 3 4 6 4 3 10 4 8 9 2 a) calcolare

Dettagli

STATISTICA: esercizi svolti sulla MEDIA ARITMETICA

STATISTICA: esercizi svolti sulla MEDIA ARITMETICA STATISTICA: esercizi svolti sulla MEDIA ARITMETICA 1 1 MEDIA ARITMETICA 2 1 MEDIA ARITMETICA 1. La seguente tabella riporta il numero di persone divise per sesso che si sono presentate durante l anno 1997

Dettagli

Istituzioni di Statistica 1 Esercizi su tabelle di contingenza

Istituzioni di Statistica 1 Esercizi su tabelle di contingenza Istituzioni di Statistica 1 Esercizi su tabelle di contingenza Esercizio 1 Per stimare la percentuale di fumatori nella popolazione italiana adulta viene intervistato un campione di 60 donne e uno di 40

Dettagli

STATISTICA (I MODULO - STATISTICA DESCRITTIVA) Esercitazione I 23/02/2007

STATISTICA (I MODULO - STATISTICA DESCRITTIVA) Esercitazione I 23/02/2007 Esercitazione I 23/02/2007 La seguente tabella contiene i dati inerenti le imprese di ristorazione di un dato comune: Unità X 1 X 2 X 3 X 4 X 5 X 6 Unità X 1 X 2 X 3 X 4 X 5 X 6 1 1600 20 4 52 3 3 26 141

Dettagli

Tema d esame del 15/02/12

Tema d esame del 15/02/12 Tema d esame del 15/0/1 Volendo aprire un nuovo locale, una catena di ristoranti chiede ad un consulente di valutare la posizione geografica ideale all interno di un centro abitato. A questo scopo, avvalendosi

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 015-016 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per la

Dettagli

STATISTICA. Esonero 8 novembre 2014 Soluzione. Quesito 1.

STATISTICA. Esonero 8 novembre 2014 Soluzione. Quesito 1. STATISTICA Esonero 8 novembre 2014 Soluzione Quesito 1. Si consideri la seguente distribuzione unitaria dei salari degli impiegati di una compagnia (migliaia di euro): 2 3 5 3 2 9 3 7 8 1 a) calcolare

Dettagli

Esercitazione Marzo 2019

Esercitazione Marzo 2019 Esercitazione 13 Marzo 019 Esercizio 1 Su un collettivo di 100 appartamenti ubicati nella stessa zona della città vengono rilevati i seguenti caratteri: X 1 affitto mensile pagato dal locatario (in Euro)

Dettagli

Esercitazioni di statistica

Esercitazioni di statistica Esercitazioni di statistica Misure di associazione: Indipendenza assoluta e in media Stefania Spina Universitá di Napoli Federico II stefania.spina@unina.it 22 ottobre 2014 Stefania Spina Esercitazioni

Dettagli

STATISTICA (I modulo - Statistica Descrittiva) Esercitazione I 24/02/2006

STATISTICA (I modulo - Statistica Descrittiva) Esercitazione I 24/02/2006 STATISTICA (I modulo - Statistica Descrittiva) Esercitazione I 24/02/2006 La seguente tabella contiene i dati inerenti le unità del settore della ristorazione in un dato comune: Unità X 1 X 2 X 3 X 4 X

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 4

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 4 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 4 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Differenze semplici medie, confronti in termini di mutua variabilità La distribuzione del prezzo

Dettagli

Dr. Marco Vicentini Anno Accademico Rev 02/04/2011

Dr. Marco Vicentini Anno Accademico Rev 02/04/2011 Università degli Studi di Padova Facoltà di Psicologia, L4, Psicometria, Modulo B Dr. Marco Vicentini marco.vicentini@unipd.it Anno Accademico 2010 2011 Rev 02/04/2011 Tabelle di contingenza Percentuali

Dettagli

Statistica Descrittiva Soluzioni 7. Interpolazione: minimi quadrati

Statistica Descrittiva Soluzioni 7. Interpolazione: minimi quadrati ISTITUZIONI DI STATISTICA A. A. 2007/2008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona

Dettagli

STATISTICA: esercizi svolti sulla DISTRIBUZIONE NORMALE

STATISTICA: esercizi svolti sulla DISTRIBUZIONE NORMALE STATISTICA: esercizi svolti sulla DISTRIBUZIONE NORMALE 1 2 Tavole della normale standard. Φ(x) = x 1 2π e t2 2 dt z.00.01.02.03.04.05.06.07.08.09 0.0 0.0 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279

Dettagli

Statistica descrittiva in due variabili

Statistica descrittiva in due variabili Statistica descrittiva in due variabili Dott Nicola Pintus AA 2018-2019 Indichiamo con U la popolazione statistica e con u i le unità statistiche Ad ogni unità statistica associamo i caratteri osservati

Dettagli

Lavoro Quantità. si determinino prodotto marginale e medio del fattore lavoro.

Lavoro Quantità. si determinino prodotto marginale e medio del fattore lavoro. Microeconomia, Esercitazione 3. A cura di Giuseppe Gori (giuseppe.gori@unibo.it) 1 Esercizi. 1.1 Produzione/1 Data una certa tecnologia di produzione definita solo nell input lavoro (o, in alternativa,

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unina.it Università degli studi di Cassino () Statistica 1 / 24 Outline 1 () Statistica 2 / 24 Outline 1 2 () Statistica 2 / 24 Outline 1 2 3 () Statistica 2 /

Dettagli

Università degli Studi di Padova Facoltà di Scienze Statistiche, CL. in Astronomia

Università degli Studi di Padova Facoltà di Scienze Statistiche, CL. in Astronomia Università degli Studi di Padova Facoltà di Scienze Statistiche, CL. in Astronomia Esame di Statistica Descrittiva mod. B, Appello del 4/7/2007 CORREZIONE 1) Un azienda produce bulloni di diametro pari

Dettagli

Corso di Laurea in Informatica Applicata Esame di Calcolo delle Probabilità e Statistica Prova scritta dell 11 gennaio 2007

Corso di Laurea in Informatica Applicata Esame di Calcolo delle Probabilità e Statistica Prova scritta dell 11 gennaio 2007 Corso di Laurea in Informatica Applicata Esame di Calcolo delle Probabilità e Statistica Prova scritta dell 11 gennaio 007 Primo esercizio Per una certa stampante S 1, la probabilità che un generico foglio

Dettagli

Esercitazioni di Statistica

Esercitazioni di Statistica Esercitazioni di Statistica Indici di posizione e di variabilità Prof. Livia De Giovanni lstatistica@dis.uniroma1.it Esercizio 1 Data la seguente distribuzione unitaria del carattere X: X : 4 2 4 2 6 4

Dettagli

Prova d esame di Statistica - II canale - nuovo ordinamento Dott.ssa C. Conigliani 19/06/2003

Prova d esame di Statistica - II canale - nuovo ordinamento Dott.ssa C. Conigliani 19/06/2003 19/06/2003 Compito A Esercizio 1. [14 punti] Data la seguente distribuzione doppia secondo i caratteri reddito familiare mensile () e spesa alimentare mensile (): 0 300 300 600 600 e più tot 0 1000 25

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Misura dell associazione tra due caratteri Uno store manager è interessato a studiare la relazione

Dettagli

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli Dipartimento di Sociologia e Ricerca Sociale Corso di Laurea in Sociologia Insegnamento di Statistica (a.a. 2018-2019) dott.ssa Gaia Bertarelli Esercitazione n. 4 1. La seguente tabella riporta la distribuzione

Dettagli

Esercitazione III Soluzione

Esercitazione III Soluzione Esercitazione III Soluzione Esercizio 1 a) Frequenze congiunte assolute: n ij Reddito mensile Titolo di studio 1000-000 000-5000 5000-8000 Totale Laurea triennale 4 1 0 5 Laurea magistrale 1 4 7 Dottorato

Dettagli

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli Dipartimento di Sociologia e Ricerca Sociale Corso di Laurea in Sociologia Insegnamento di Statistica (a.a. 018-019) dott.ssa Gaia Bertarelli Esercitazione n. 3 1. I giorni impiegati da sei individui per

Dettagli

x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y )

x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y ) Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 0/03 lezioni di statistica del 5 e 8 aprile 03 - di Massimo Cristallo - A. Le relazioni tra i fenomeni

Dettagli

Fonti e strumenti statistici per la comunicazione

Fonti e strumenti statistici per la comunicazione Fonti e strumenti statistici per la comunicazione Introduzione all analisi bivariata: il caso di caratteri qualitativi Prof.ssa Isabella Mingo A.A. 016-017 Che cosa è l analisi bivariata? E lo studio congiunto

Dettagli

REGRESSIONE E CORRELAZIONE

REGRESSIONE E CORRELAZIONE REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.

Dettagli

PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE

PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) PROBABILITÀ SCHEDA

Dettagli

STATISTICA CORSO BASE. Prova scritta del Tempo: 2 ore Cognome e Nome:... Matricola:...

STATISTICA CORSO BASE. Prova scritta del Tempo: 2 ore Cognome e Nome:... Matricola:... STATISTICA CORSO BASE. Prova scritta del 7-2-2013. Tempo: 2 ore Cognome e Nome:.............................. Matricola:.............................. Attenzione: Prima di affrontare la prova si consiglia

Dettagli

Esercitazioni di Matematica Generale A.A. 2016/2017 Pietro Pastore Lezione del 21 Novembre Logaritmi e Proprietà

Esercitazioni di Matematica Generale A.A. 2016/2017 Pietro Pastore Lezione del 21 Novembre Logaritmi e Proprietà Esercitazioni di Matematica Generale A.A. 016/017 Pietro Pastore Lezione del 1 Novembre 016 Logaritmi e Proprietà Quando scriviamo log a b = c che leggiamo logaritmo in base a di b uguale a c, c è l esponente

Dettagli

Correlazione lineare e regressione

Correlazione lineare e regressione 7c e regressione Se i due caratteri sono entrambi quantitativi, X e Y, possiamo studiare la loro correlazione lineare. Prima di tutto cerchiamo di capire di cosa si tratta. Se elenchiamo le N osservazioni

Dettagli

Statistica (parte II) Esercitazione 4

Statistica (parte II) Esercitazione 4 Statistica (parte II) Esercitazione 4 Davide Passaretti 03/03/016 Test sulla differenza tra medie (varianze note) Un negozio di scarpe è interessato a capire se le misure delle scarpe acquistate da adulti

Dettagli

La statistica descrittiva seconda parte. a cura della prof.ssa Anna Rita Valente

La statistica descrittiva seconda parte. a cura della prof.ssa Anna Rita Valente La statistica descrittiva seconda parte a cura della prof.ssa Anna Rita Valente INDICI DI POSIZIONE CENTRALE Sono dei valori che descrivono in modo sintetico una serie di dati raccolti. I più semplici

Dettagli

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli Dipartimento di Sociologia e Ricerca Sociale Corso di Laurea in Sociologia Insegnamento di Statistica (a.a. 2018-2019) dott.ssa Gaia Bertarelli Esercitazione n. 6 1. Si consideri un campione di 69 persone

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri

Dettagli

STATISTICA 1 ESERCITAZIONE 6

STATISTICA 1 ESERCITAZIONE 6 STATISTICA 1 ESERCITAZIONE 6 Dott. Giuseppe Pandolfo 5 Novembre 013 CONCENTRAZIONE Osservando l ammontare di un carattere quantitativo trasferibile su un collettivo statistico può essere interessante sapere

Dettagli

Fondamenti e metodi analisi empirica nelle scienze sociali

Fondamenti e metodi analisi empirica nelle scienze sociali CORSO DI FONDAMENTI E METODI PER L'ANALISI EMPIRICA NELLE SCIENZE SOCIALI Distribuzioni statistiche multiple AA 2017/2018 1. Introduzione: il processo di rilevazione e le distribuzioni statistiche. 2.

Dettagli

Corso di Laurea in MQEGA

Corso di Laurea in MQEGA Corso di Laurea in MQEGA Insegnamento di Statistica (Prof. P.F. Perri) Esercizi di riepilogo sulle distribuzioni bivariate Esercizio 1 La rilevazione congiunta dei caratteri e Y su 100 unità statistiche

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 41 Outline 1 2 3 4 5 () Statistica 2 / 41 Misura del legame Data una variabile doppia (X, Y ), la

Dettagli

Facoltá di Economia: correzione prova scritta di STATISTICA 1, Mod. 1.

Facoltá di Economia: correzione prova scritta di STATISTICA 1, Mod. 1. Facoltá di Economia: correzione prova scritta di STATISTICA 1, Mod. 1. Esercizio A. La seguente tabella riporta la serie delle variazioni percentuali annue dei prezzi, distintamente per alcuni settori

Dettagli

STATISTICA (I modulo - Statistica Descrittiva) Soluzione Esercitazione I ( )

STATISTICA (I modulo - Statistica Descrittiva) Soluzione Esercitazione I ( ) STATISTICA (I modulo - Statistica Descrittiva) Soluzione Esercitazione I (09.10.2003) Esercizio A. a) L unità statistica è lo studente che ha sostenuto l esame conclusivo nell ultima sessione. Il collettivo

Dettagli

STATISTICA: esercizi svolti su MEDIA GEOMETRICA MEDIA ARMONICA e MEDIA QUADRATICA

STATISTICA: esercizi svolti su MEDIA GEOMETRICA MEDIA ARMONICA e MEDIA QUADRATICA STATISTICA: esercizi svolti su MEDIA GEOMETRICA MEDIA ARMONICA e MEDIA QUADRATICA 1 1 MEDIA GEOMETRICA, ARMONICA, QUADRATICA 2 1 MEDIA GEOMETRICA, ARMONICA, QUADRATICA 1. Calcolare la media aritmetica

Dettagli

Vogliamo determinare una funzione lineare che meglio approssima i nostri dati sperimentali e poter decidere sulla bontà di questa approssimazione.

Vogliamo determinare una funzione lineare che meglio approssima i nostri dati sperimentali e poter decidere sulla bontà di questa approssimazione. S.S.I.S. TOSCANA F.I.M. II anno FUNZIONI DI REGRESSIONE E METODO DEI MINIMI QUADRATI Supponiamo di star conducendo uno studio sulla crescita della radice di mais in funzione del contenuto di saccarosio

Dettagli

Il problema lineare dei minimi quadrati

Il problema lineare dei minimi quadrati Il problema lineare dei minimi quadrati APPLICAZIONE: Il polinomio di migliore approssimazione nel senso dei minimi quadrati Felice Iavernaro Dipartimento di Matematica Università di Bari 15 Gennaio 2009

Dettagli

Dispense Associazione PRELIMINARY DRAFT

Dispense Associazione PRELIMINARY DRAFT Dispense Associazione PRELIMINARY DRAFT Cristina Mollica & Jan Martin Rossi January 3, 2019 1 Esercizio 3 - Prova scritta 12-01-2018 Esercizio 3. Si consideri la distribuzione doppia di un campione di

Dettagli

Esercizi su Regressione e Connessione

Esercizi su Regressione e Connessione Esercizi su Regressione e Connessione Stefano Cabras 31 marzo 2009 Sommario Questa serie di esercizi è principalmente incentrata sulla regressione e la connessione, tuttavia in alcuni esercizi le soluzioni

Dettagli

docente: J. Mortera/P. Vicard Nome

docente: J. Mortera/P. Vicard Nome A opportuni passaggi). Verrà accettato in consegna solo il presente plico. 2. [9] Una certa zona è servita da 4 compagnie telefoniche. Per ciascuna compagnia è stato rilevato il costo al minuto (in centesimi

Dettagli

STATISTICA esercizi svolti sulla CONCENTRAZIONE

STATISTICA esercizi svolti sulla CONCENTRAZIONE SAISICA esercizi svolti sulla COCERAZIOE COCERAZIOE 2 COCERAZIOE. Esercizi. Il reddito annuo (in migliaia di euro) di 7 fratelli è il seguente: individui A B C D E F G reddito (in migliaia di euro) 5 20

Dettagli

La regressione lineare. Rappresentazione analitica delle distribuzioni

La regressione lineare. Rappresentazione analitica delle distribuzioni La regressione lineare Rappresentazione analitica delle distribuzioni Richiamiamo il concetto di dipendenza tra le distribuzioni di due caratteri X e Y. Ricordiamo che abbiamo definito dipendenza perfetta

Dettagli

LOGARITMI. Corso di laurea: BIOLOGIA Tutor: Floris Marta; Max Artizzu PRECORSI DI MATEMATICA. L uguaglianza: a x = b

LOGARITMI. Corso di laurea: BIOLOGIA Tutor: Floris Marta; Max Artizzu PRECORSI DI MATEMATICA. L uguaglianza: a x = b Corso di laurea: BIOLOGIA Tutor: Floris Marta; Max Artizzu PRECORSI DI MATEMATICA LOGARITMI L uguaglianza: a x = b nella quale a e b rappresentano due numeri reali noti ed x un incognita, è un equazione

Dettagli

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Introduzione : analisi delle relazioni tra due caratteristiche osservate sulle stesse unità statistiche studio del comportamento di due caratteri

Dettagli

Statistica Descrittiva Soluzioni 3. Medie potenziate

Statistica Descrittiva Soluzioni 3. Medie potenziate ISTITUZIONI DI STATISTICA A. A. 2007/2008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona

Dettagli

Capitolo 12. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 12.1: Suggerimento

Capitolo 12. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 12.1: Suggerimento Capitolo Suggerimenti agli esercizi a cura di Elena Siletti Esercizio.: Suggerimento Per verificare se due fenomeni sono dipendenti in media sarebbe necessario confrontare le medie condizionate, in questo

Dettagli

Stesso valore medio per distribuzioni diverse

Stesso valore medio per distribuzioni diverse Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2018-2019 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

Regressione & Correlazione

Regressione & Correlazione Regressione & Correlazione Monia Ranalli Ranalli M. Dipendenza Settimana # 4 1 / 20 Sommario Regressione Modello di regressione lineare senplice Stima dei parametri Adattamento del modello ai dati Correlazione

Dettagli

Esercitazione 4. Aprile 2019

Esercitazione 4. Aprile 2019 Esercitazione Aprile ALCUNE NOTE Versione aggiornata! Dal momento che questa esercitazione è stata svolta a più puntate, vi prego (soprattutto chi non ha potuto partecipare alle ore supplementari) di prestare

Dettagli

ESERCIZI DI MICROECONOMIA

ESERCIZI DI MICROECONOMIA ESERCIZIO 1 - Equilibrio di mercato e spostamenti delle curve di domanda e di offerta La quantità domandata di un certo bene è descritta dalla funzione: p (D) mentre la quantità offerta è descritta dalla

Dettagli

STATISTICA (2) ESERCITAZIONE 2. Dott.ssa Antonella Costanzo

STATISTICA (2) ESERCITAZIONE 2. Dott.ssa Antonella Costanzo STATISTICA (2) ESERCITAZIONE 2 5.02.2014 Dott.ssa Antonella Costanzo Esercizio 1. La v.c. Normale: uso delle tavole E noto che un certo tipo di dati si distribuiscono secondo una gaussiana di media 10

Dettagli

Correlazione e regressione per problemi di Luciano Corso

Correlazione e regressione per problemi di Luciano Corso Correlazione e regressione per problemi di Luciano Corso Presidente della sezione di Verona della Mathesis Direttore della Rivista MatematicaMente Email: lcorso@iol.it CASTELLAMMARE DI STABIA 20180717

Dettagli

STATISTICHE DESCRITTIVE Parte II

STATISTICHE DESCRITTIVE Parte II STATISTICHE DESCRITTIVE Parte II INDICI DI DISPERSIONE Introduzione agli Indici di Dispersione Gamma Differenza Interquartilica Varianza Deviazione Standard Coefficiente di Variazione introduzione Una

Dettagli

3. rappresentare mediante i grafici ritenuti più idonei le distribuzioni di frequenze assolute dei diversi caratteri;

3. rappresentare mediante i grafici ritenuti più idonei le distribuzioni di frequenze assolute dei diversi caratteri; Esercizio 1 Il corso di Statistica è frequentato da 10 studenti che presentano le seguenti caratteristiche Studente Sesso Colore Occhi Voto Soddisfazione Età Stefano M Nero 18 Per niente 21 Francesca F

Dettagli

7. STATISTICA DESCRITTIVA

7. STATISTICA DESCRITTIVA 7. STATISTICA DESCRITTIVA Quando si effettua un indagine statistica si ha a che fare con un numeroso insieme di oggetti, detto popolazione del quale si intende esaminare una o più caratteristiche (matricole

Dettagli

Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill

Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill Es. Soluzione degli esercizi del capitolo 7 home - indice In base agli arrotondamenti effettuati nei calcoli,

Dettagli

Esercitazione: 16 novembre 2009 SOLUZIONI

Esercitazione: 16 novembre 2009 SOLUZIONI Esercitazione: 16 novembre 009 SOLUZIONI Esercizio 1 Scrivere [ ] equazione vettoriale, parametrica [ ] e cartesiana della retta passante 1 per il punto P = e avente direzione d =. 1 x 1 Soluzione: Equazione

Dettagli

Statistica Corso Base (Serale) Dott.ssa Cristina Mollica

Statistica Corso Base (Serale) Dott.ssa Cristina Mollica Statistica Corso Base (Serale) Dott.ssa Cristina Mollica cristina.mollica@uniroma1.it Concentrazione Esercizio 1: Nell ultima settimana una banca ha erogato i seguenti importi (in migliaia di euro) per

Dettagli

CONICHE. Esercizi Esercizio 1. Nel piano con riferimento cartesiano ortogonale Oxy sia data la conica C di equazione

CONICHE. Esercizi Esercizio 1. Nel piano con riferimento cartesiano ortogonale Oxy sia data la conica C di equazione CONICHE Esercizi Esercizio 1. Nel piano con riferimento cartesiano ortogonale Oy sia data la conica C di equazione 7 2 + 2 3y + 5y 2 + 32 3 = 0. Calcolare le equazioni di una rototraslazione che riduce

Dettagli

1 Ampliamento del piano e coordinate omogenee

1 Ampliamento del piano e coordinate omogenee 1 Ampliamento del piano e coordinate omogenee Vogliamo dare una idea, senza molte pretese, dei concetti che stanno alla base di alcuni calcoli svolti nella classificazione delle coniche. Supponiamo di

Dettagli

Y M F Calcolare X e darne un adeguata interpretazione;

Y M F Calcolare X e darne un adeguata interpretazione; Corso di Laurea INTERACOLTÀ - Esercitazione di tatistica n 4 EERCIZIO 1: Nella tabella sono riportati i dati inerenti il numero di anni di attività () ed il sesso () di 48 agenti di commercio dell azienda

Dettagli

Analisi congiunta di più fenomeni

Analisi congiunta di più fenomeni Analisi congiunta di più fenomeni Dati relativi al disastro del Titanic: Morti Sopravvissuti Classe Sesso Età 1 a Uomini Bambini 0 5 Adulti 118 57 Donne Bambini 0 1 Adulti 4 140 2 a Uomini Bambini 0 11

Dettagli

Casa dello Studente. Casa dello Studente

Casa dello Studente. Casa dello Studente Esercitazione - 14 aprile 2016 ESERCIZIO 1 Di seguito si riporta il giudizio (punteggio da 0 a 5) espresso da un gruppo di studenti rispetto alle diverse residenze studentesche di un Ateneo: a) Si calcolino

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Indici di forma, distribuzioni doppie di frequenza e studio del legame tra variabili Il seguente data set

Dettagli

ECONOMIA APPLICATA ALL INGEGNERIA (Docente: Prof. Ing. Donato Morea)

ECONOMIA APPLICATA ALL INGEGNERIA (Docente: Prof. Ing. Donato Morea) ESERCIZIO n. 1 - Scelte di consumo (scelta ottimale, variazione di prezzo, variazione di reddito) Un consumatore ha preferenze rappresentate dalla seguente funzione di utilità: a) Determinare la scelta

Dettagli

ECONOMIA APPLICATA ALL INGEGNERIA (Docente: Prof. Ing. Donato Morea)

ECONOMIA APPLICATA ALL INGEGNERIA (Docente: Prof. Ing. Donato Morea) ESERCIZIO n. 1 - La produzione ed i costi di produzione (1 ) Un impresa utilizza una tecnologia descritta dalla seguente funzione di produzione: I prezzi dei fattori lavoro e capitale sono, rispettivamente,

Dettagli

Esercizi sulle coniche (prof.ssa C. Carrara)

Esercizi sulle coniche (prof.ssa C. Carrara) Esercizi sulle coniche prof.ssa C. Carrara Alcune parti di un esercizio possono ritrovarsi in un altro esercizio, insieme a parti diverse. È un occasione per affrontarle da un altra angolazione.. Determinare

Dettagli

Distribuzioni Statistiche e Medie Esercitazione n 01

Distribuzioni Statistiche e Medie Esercitazione n 01 Distribuzioni Statistiche e Medie Esercitazione n 01 ESERCIZIO 1 In una clinica pediatrica si è registrato, nell'ultima settimana, il peso alla nascita dei neonati (in kg): Peso (in Kg) 2,7 1,8 4,6 2,9

Dettagli

Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill

Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill Es. Soluzione degli esercizi del capitolo 8 home - indice In base agli arrotondamenti effettuati nei calcoli, si

Dettagli

Corso di Psicometria Progredito

Corso di Psicometria Progredito Corso di Psicometria Progredito 5. La correlazione lineare Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014 Sommario 1 Tipi di relazione

Dettagli

DISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a Prerequisiti Popolazione, unità, carattere Come nascono i dati:

DISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a Prerequisiti Popolazione, unità, carattere Come nascono i dati: DISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a. 2007-2008 Prerequisiti Popolazione, unità, carattere Come nascono i dati: osservazione e sperimentazione Popolazione: reale e virtuale Classificazione

Dettagli

STATISTICA: esercizi svolti su RAPPORTI STATISTICI E NUMERI INDICI

STATISTICA: esercizi svolti su RAPPORTI STATISTICI E NUMERI INDICI STATISTICA: esercizi svolti su RAPPORTI STATISTICI E NUMERI INDICI 1 1 RAPPORTI STATISTICI E NUMERI INDICI 2 1 RAPPORTI STATISTICI E NUMERI INDICI 1. La seguente tabella riporta il numero di studenti iscritti

Dettagli

Esercizi sulle coniche (prof.ssa C. Carrara)

Esercizi sulle coniche (prof.ssa C. Carrara) Esercizi sulle coniche prof.ssa C. Carrara Alcune parti di un esercizio possono ritrovarsi in un altro esercizio, insieme a parti diverse. È un occasione per affrontarle più volte.. Stabilire il tipo di

Dettagli

Analisi bivariata. Il caso di caratteri qualitativi

Analisi bivariata. Il caso di caratteri qualitativi Analisi bivariata Il caso di caratteri qualitativi Pagina 337 Che cosa è l analisi bivariata? E lo studio congiunto di due caratteri Esempio nel caso di caratteri qualitativi: I valori delle celle derivano

Dettagli

Nuovo Ordinamento Esame di Statistica I 24 giugno 2002 Cognome docente: J. Mortera / P. Vicard Nome

Nuovo Ordinamento Esame di Statistica I 24 giugno 2002 Cognome docente: J. Mortera / P. Vicard Nome Esame di Statistica I 24 giugno 2002 Cognome 1. [12] Da un campione di 100 aziende agricole della provincia di Bologna è stata rilevata la classe di superficie (in migliaia di ettari) ottenendo i seguenti

Dettagli

FUNZIONI E GRAFICI. tempo (anni)

FUNZIONI E GRAFICI. tempo (anni) FUNZIONI E GRAFICI In questa sezione si dà il significato intuitivo di funzione, si stabiliscono definizioni e terminologia, si descrive come una funzione può essere rappresentata graficamente e come se

Dettagli