AVVISO: dal prossimo mercoledì, faremo lezione 14:00 16:00 Fino ad avviso contrario, sempre nell aula P2 Sito del corso http://www.di.unisa.it/professori/zizza/lab_bio/inizio.htm Libri di testo (suggeriti) E. Belluco [B], Excel per la statistica,franco Angeli ed., 2005 L. Stracqualursi, M. Matteucci [SM], Statistica e Laboratorio, Monduzzi Editore, 2011. 1
Negozio Reddito MASSIMO Negozio 1 21.500,00 Negozio 2 16.800,00 Negozio 3 20.500,00 Negozio 4 21.100,00 minimo Media Negozio 5 19.700,00 Excel include numerose funzioni, come SOMMA, MEDIA, e altre via via più complesse, organizzate per tipologia (matematiche, testuali, data-ora, finanziarie ) N.B. In queste prime lezioni non entreremo nel dettaglio di nomi e funzionalità, poi saremo più precisi. Supponiamo di avere dei dati num1, num2, e di voler calcolare una funzione (ad esempio la somma). Ogni dato occupa una cella (supponiamo da A1 a A9) Il risultato occuperà una cella della tabella Occorre quindi Posizionarsi nella cella in cui si vuole sia riportato il risultato Digitare: =SOMMA(A1:A9) Premere INVIO Il risultato apparirà nella casella. 2
Con riferimento alla tabella precedente, inserire i dati in un foglio excel. In un altro foglio della stessa cartella, ricopiare i dati e calcolare: Reddito minimo Reddito massimo Secondo reddito massimo (usare opportunamente la funzione GRANDE) Nella tabella seguente sono riportati i valori di biossido di azoto, monossido di carbonio, biossido di zolfo, particelle totali sospese, ozono, rilevate in 10 centraline in un giorno. Centralina NO2 CO SO2 PTS O3 1 190 1430 70 70 120 2 208 2024 115 170 172 3 380 1800 180 95 145 4 150 1320 95 44 230 5 308 2560 255 145 215 6 407 3100 130 82 158 7 187 1200 310 80 167 8 241 1040 195 56 285 9 220 1900 90 115 135 10 420 2230 108 198 189 Inserire i dati in una tabella excel e, per ogni colonna, indicare il valore medio 3
Scriviamo nella cella A13 valori medi Siccome vogliamo la stessa operazione ripetuta per le colonne consecutive, procediamo in questo modo: Nella cella B13 digitiamo =MEDIA(B2:B11) Usare il TRASCINAMENTO per calcolare la media delle altre colonne per riempire celle con contenuti che hanno un motivo 5,115 5,120 5,125 5,130 5,135 5,140 5,145 5,150 5,155 5,160 5,165 5,170 Posizionarsi nella prima cella e digitare 5,115. Selezionare le 12 celle. Nel menù Home, cercare Riempimento nella Scheda Modifica. Nella finestra di dialogo selezionare Serie e specificare il valore di incremento (0,005) e OK. 4
La tabella seguente riporta i valori di tensione (in volt) misurati da un voltmetro digitale in un punto del circuito elettronico 5,145 5,120 5,146 5,114 5,134 5,148 5,146 5,143 5,145 5,156 5,132 5,138 5,139 5,140 5,139 5,132 5,128 5,142 5,132 5,138 5,143 5,159 5,123 5,148 5,131 5,143 5,146 5,129 5,141 5,135 5,145 5,139 5,136 5,161 5,118 5,141 5,138 5,152 5,146 5,138 5,131 5,160 5,169 5,142 5,129 5,131 5,128 5,140 5,150 5,130 5,124 5,150 5,140 5,136 5,150 5,158 5,144 5,132 5,145 5,142 5,133 5,137 5,131 5,137 5,154 5,155 5,126 5,126 5,133 5,149 5,128 5,125 5,133 5,134 5,144 5,133 5,157 5,134 5,138 5,142 5,143 5,133 5,154 5,134 5,124 5,129 5,155 5,153 5,146 5,154 5,158 5,148 5,140 5,133 5,134 5,133 5,152 5,155 5,132 5,135 5,136 5,148 5,153 5,150 5,147 5,162 5,129 5,148 5,151 5,157 5,151 5,137 5,128 5,140 5,143 5,140 5,130 5,153 5,142 5,151 5,146 5,148 5,137 5,157 5,158 5,157 5,153 5,131 5,164 5,159 5,134 5,148 5,144 5,143 5,156 5,147 5,145 5,123 5,140 5,162 5,139 5,152 5,132 5,154 5,128 5,140 5,151 5,138 5,139 5,142 Occorre produrre un istogramma della distribuzione dei valori di tensione. Servono per rappresentare distribuzioni di variabili quantitative continue (misurabili, misurazione di una grandezza, in R) raggruppate in classi. Reddito $ 25.000,00 $ 20.000,00 $ 15.000,00 $ 10.000,00 $ 5.000,00 $ - Negozio 1 Negozio 2 Negozio 3 Negozio 4 Negozio 5 Reddito Come i grafici a barre sono costituiti da rettangoli, ma qui sono adiacenti e - Numero dei rettangoli = numero delle classi - Larghezza del rettangolo = ampiezza delle classi - Altezza del rettangolo = frequenza delle classi (se di uguale ampiezza) o densità di frequenza. Grafico a barre 5
Occorre produrre un istogramma della distribuzione dei valori di tensione. 1. Riportiamo i dati della tabella in un foglio Excel (che chiamiamo Es 2.6 dati) 2. Selezionare Analisi dei Dati (dal menù Strumenti o Dati) e quindi Istogramma (se non c è, occorre installare la caratteristica, usando Opzioni Excel raggiungibile dal bottone pulsante Office in alto a sinistra. Selezionare strumenti Analisi VBA e strumenti analisi ). 3. Si apre una finestra di dialogo: selezionare le celle; lasciare selezionato nuovo foglio di lavoro e selezionare grafico di output. Premere OK. Occorre produrre un istogramma della distribuzione dei valori di tensione. 1. Riportiamo i dati della tabella in un foglio Excel (che chiamiamo Es 2.6 dati) 2. Selezionare Analisi dei Dati (dal menù Strumenti o Dati) e quindi Istogramma. 3. Si apre una finestra di dialogo: selezionare le celle; lasciare selezionato nuovo foglio di lavoro e selezionare grafico di output. Premere OK. 6
Sono frequenze ASSOLUTE 90 Istogramma Frequenza 80 70 60 50 40 30 20 10 Frequenza 0 5,114 5,132333333 5,150666667 Altro Classe Calcoliamo separatamente le classi 1. In un altro foglio scriviamo classi 5,115 5,120 5,125 5,130 5,135 5,140 5,145 5,150 5,155 5,160 5,165 5,170 2. Ritorniamo sul foglio dei dati e ripetiamo il processo precedente (Analisi dati Istogramma dati) 3. Scegliamo questa colonna come classi 4. Quando selezioniamo OK, questo è il risultato 7
Classe Frequenza 5,115 1 5,120 2 5,125 5 5,130 13 5,135 26 5,140 26 5,145 22 5,150 20 5,155 18 5,160 12 5,165 4 5,170 1 Altro 0 30 25 Istogramma 20 Frequenza 15 10 Frequenza 5 0 5,115 5,120 5,125 5,130 5,135 5,140 5,145 5,150 5,155 5,160 5,165 5,170 Altro Classe Rilevazione (raccolta dati) di un dato fenomeno Caratteri: caratteristiche (quantitative o qualitative) scelte per definire il fenomeno Modalità (di un carattere): valori che il carattere può assumere 8
Abbiamo a disposizione un campione (222) di misurazioni su due grandezze D= durata dell eruzione (in minuti) T = tempo di attesa per l eruzione successiva (in minuti) Calcoliamo la tabella delle frequenze (assolute) prendendo come classi i singoli valori della variabile T 9
Come estrarre queste frequenze con Excel? Devo creare classi di ampiezza 1, a partire dal minimo tempo fino al massimo tempo 1. Considerare solo la colonna dei tempi 2. Individuare il valore minimo e il valore massimo (funzioni) 3. Preparare la colonna delle classi di singolo valore, a partire dal minimo fino al massimo. Usare il Riempimento (Home) e incremento di 1. Abbiamo creato quindi le classi di ampiezza 1. Vogliamo ora calcolare le frequenze di ogni singolo valore (queste sono le nostre classi). Come estrarre queste frequenze con Excel? La funzione FREQUENZA ha bisogno di una matrice dati (quindi selezionare la colonna dei tempi) e di una matrice delle classi (quindi selezionare quella appena creata). Attenzione: affinché sia riportata la frequenza per ogni valore della classe, occorre che la formula sia in forma di matrice. Occorre quindi, PRIMA di richiamare la funzione evidenziare la colonna in cui andrà il risultato (tante celle quante sono le classi +1) Quando poi, dalla finestra di dialogo della funzione FREQUENZA, si immette la matrice delle classi, non premere INVIO ma premere CTRL+SHIFT+INVIO. Se non si fa così, si visualizza un solo valore. 10
Inseriamo anche la percentuale (o distribuzione) cumulativa Al termine dell esame di Stato, in una classe ogni alunno dichiara dove vorrebbe andare in vacanza. Questi i risultati: mare, mare, montagna, mare, città,, montagna, lago. A) Qual è l unità statistica di rilevazione e quante sono le unità statistiche complessivamente? B) Quale carattere è rilevato e di che tipo di carattere si tratta? C) Dopo aver costruito la distribuzione delle frequenze assolute, determinare la distribuzione delle frequenze relative D) Scegliere una modalità del carattere e commentare la frequenza assoluta e quella relativa ad essa associate E) Quanto vale la somma delle frequenze assolute? E quella delle frequenze relative? 11
LUOGO DI VACANZA ci7à straniera ci7à straniera lago lago parco diver>men> parco diver>men> lago E.che2e di riga Conteggio di LUOGO DI VACANZA 4 ci7à straniera 2 lago 3 10 6 parco diver>men> 2 Totale complessivo 27 Frequenze rela.ve (f i =n i / Luogo di vacanza (X i ) Frequenze assolute (n i ) n) 4 0,15 ci7à straniera 2 0,07 Lago 3 0,11 Mare 10 0,37 Montagna 6 0,22 parco diver>men> 2 0,07 totale 27 1 LUOGO DI VACANZA ci7à straniera ci7à straniera lago lago parco diver>men> parco diver>men> lago E.che2e di riga Conteggio di LUOGO DI VACANZA 4 ci7à straniera 2 lago 3 10 6 parco diver>men> 2 Totale complessivo 27 Frequenze rela.ve (f i =n i / Luogo di vacanza (X i ) Frequenze assolute (n i ) n) 4 0,15 ci7à straniera 2 0,07 Lago 3 0,11 Mare 10 0,37 Montagna 6 0,22 parco diver>men> 2 0,07 totale 27 1 Come si ottiene? 12
A 1 LUOGO DI VACANZA 2 3 4 5 6 città italiana 7 città straniera 8 9 10 11 12 città straniera 13 città italiana 14 15 16 città italiana 17 18 lago 19 20 21 lago 22 città italiana 23 parco divertimenti 24 parco divertimenti 25 26 27 28 lago Per costruire la distribuzione di frequenza (assoluta), 1) dal menu INSERISCI, seleziona Tabella Pivot 2) dopo aver selezionato l'intervallo da> A1:A28, clicca su OK, 3)trascina il campo "LUOGO DI VACANZA" sia in "e>che7e di riga" che in " valori" per o7enere il conteggio delle modalità A 1 LUOGO DI VACANZA 2 3 4 5 6 città italiana 7 città straniera 8 9 10 11 12 città straniera 13 città italiana 14 15 16 città italiana 17 18 lago 19 20 21 lago 22 città italiana 23 parco divertimenti 24 parco divertimenti 25 26 27 28 lago E.che2e di riga Conteggio di LUOGO DI VACANZA 4 ci7à straniera 2 lago 3 10 6 parco diver>men> 2 Totale complessivo 27 F G H 1 Luogo di vacanza (X i ) Frequenze assolute (n i ) Frequenze relative (f i =n i /n) 2 città italiana 4 0,15 3 città straniera 2 0,07 4 lago 3 0,11 5 10 0,37 6 6 0,22 7 parco divertimenti 2 0,07 8 totale 27 1 =SOMMA(G2:G7) =G2/G$8 Come si fa? 13
La seguente tabella mostra la popolazione residente in Emilia Romagna di 15 anni e oltre per titolo di studio nell anno 2008 Popolazione residente (in Titolo di studio migliaia) Licenza elementare, nessun titolo 969,583 Licenza media 1050,040 Qualifica professionale 253,402 Maturità 1003,382 Dottorato, laurea e diploma universitario 429,578 Totale 3705,985 Costruire la distribuzione delle frequenze percentuali [cosa devo sapere per poterle calcolare?] Titolo di studio Popolazione residente (in migliaia) Frequenze % Licenza elementare, nessun >tolo 969,583 26,16 Licenza media 1050,040 28,33 Qualifica professionale 253,402 6,84 Maturità 1003,382 27,07 Do7orato, laurea e diploma universitario 429,578 11,59 Totale 3705,985 100,00 =SOMMA(B2:B6) =B2/B$7*100 E se volessi anche le frequenze cumulate e le relative percentuali? Devo partire dal primo valore, che resta uguale, poi ad esso aggiungo il secondo, a questo il terzo e così via. Ognuna viene divisa per il numero di unità (totale) ed ho la percentuale cumulativa. 14
Es. 1.4 SM (escluso grafico) Esercizio geyser: aumentare le classi di ampiezza 3 e inserire anche la percentuale cumulativa (usando l istogramma, non a mano) 15