La seguente tabella riporta il voto riportato da 10 studenti all esame di Statistica Sociale e il numero di ore di lezione non seguite dallo studente (il corso prevede 30 ore di lezione). Ci si chiede se ed in quale misura il non aver seguito tutte le lezioni possa avere un effetto sul voto finale all esame. Studente Y X Francesco 18 28 Antonio 19 27 Andrea 21 24 Maria 30 2 Anna 25 15 Giorgio 21 22 Sofia 22 18 Luigi 23 27 Mario 29 4 Francesca 28 2
1. definisci x e y e spiega cosa indicano 2. disegna il diagramma di dispersione 3. Ipotizzando l esistenza di una relazione lineare tra le variabili specifica le assunzioni del modello e 4. Scrivi l equazione della retta di regressione (determina i coefficienti a e b) e fornisci una interpretazione dei coefficienti stimati 5. Dopo aver calcolato l errore standard di b costruisci l intervallo di confidenza al 95% e fornisci una interpretazione 6. Calcola il coefficiente di correlazione r e commentane il segno e l'intensità 7. Calcola il coefficiente di determinazione r-quadro e commenta il valore in termini di bontà di adattamento del modello 8. riporta il valore previsto del voto in Statistica in corrispondenza di: ore non seguite = 2 ore non seguite = 28 e traccia la retta di regressione
1. definisci x e y e spiega cosa indicano La variabile dipendente indicata con y è il voto in Statistica Sociale, mentre x è il numero di ore di lezione non seguite ed è la variabile esplicativa
2. Disegna il diagramma di dispersione Y 15 20 25 30 0 10 20 30 X
3. Ipotizzando l esistenza di una relazione lineare tra le variabili specifica le assunzioni del modello Il modello di regressione assume che: 1) La distribuzione condizionata di y per ciascun valore di x e normale 2) La deviazioni standard della distribuzione condizionata della y e uguale a per ciascun valore di x
4. Scrivi l equazione della retta di regressione (determina i coefficienti a e b) Studente Y X Y-mediaY X-mediaX Francesco 18 28-5.6 11.1-62.16 123.21 Antonio 19 27-4.6 10.1-46.46 102.01 Andrea 21 24-2.6 7.1-18.46 50.41 Maria 30 2 6.4-14.9-95.36 222.01 Anna 25 15 1.4-1.9-2.66 3.61 Giorgio 21 22-2.6 5.1-13.26 26.01 Sofia 22 18-1.6 1.1-1.76 1.21 Luigi 23 27-0.6 10.1-6.06 102.01 Mario 29 4 5.4-12.9-69.66 166.41 Francesca 28 2 4.4-14.9-65.56 222.01 Media 23.6 16.9 Somma -381.4 1018.9 b= -0.3743 a= 29.9261
5. Dopo aver calcolato l errore standard di b costruisci l intervallo di confidenza al 95% e fornisci una interpretazione SSE= 17.63 se 17.63 10 2 1018 1.48 31.91 0.0464
5. Dopo aver calcolato l errore standard di b costruisci l intervallo di confidenza al 95% e fornisci una interpretazione 0.3746 2.306(0.0464) [- 0.4846; - 0.2646]
6. Calcola il coefficiente di correlazione r e commentane il segno e l'intensità s s y x 160.4 9 1019 9 4.22 10.64 r 11.29 4.47 ( 0.3743) 0.94 è negativo e molto vicino all unità quindi
7. Calcola il coefficiente di determinazione r-quadro e commenta il valore in termini di bontà di adattamento del modello r 2 160 18 160 0.89 è molto vicino all unità quindi
8. riporta il valore previsto del voto in Statistica in corrispondenza di: ore non seguite = 2 ore non seguite = 28 e traccia la retta di regressione b= -0.3743 y x2 29.93 0.3743*2 29.18 a= 29.9261 y 29.93 0.3743*28 19.45 x 2
35 Y val predetti 30 Voto Statistica Sociale 25 20 15 10 5 0 0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 Ore di lezione non seguite