Introduzione al Calcolo Grafico e Statistico

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Introduzione al Calcolo Grafico e Statistico"

Transcript

1 Introduzione al Calcolo Grafico e Statistico con R Mario Romanazzi Dipartimento di Statistica, Università di Venezia Ca Foscari S. Giobbe, Cannaregio 87, 000 Venezia 7 dicembre 007

2

3 Indice Cos è R? 9 Primi passi. Operatori aritmetici e logici Variabili e operatore di assegnazione Oggetti. Vettore Matrice Data Frame Fattore Lista Funzione Cambiare modalità Lavorare con gli oggetti. Vettori numerici Matrici Estrazione e modifica di elementi di oggetti Subsetting Stringhe di caratteri Dati mancanti Importazione ed esportazione di dati 6 Distribuzioni di probabilità 6. Distribuzioni di probabilità Campionamento Un primo sguardo ai grafici 7. La funzione plot() Le primitive grafiche

4 INDICE 8 Analisi iniziale dei dati 9 8. Tabelle di frequenza Istogrammi Diagrammi scatola-baffi Indici di sintesi Analisi della concentrazione Visualizzare dati multivariati 6 9. Correlazione lineare Diagrammi di dispersione Componenti principali Modelli lineari 7

5 Elenco delle tabelle. Operatori aritmetici, di confronto binario e logici Funzioni elementari Arrotondamento Funzioni di matrici Opzioni di read.table Opzioni di write.table Distribuzioni di Probabilità Univariate Alcuni parametri grafici Principali diagrammi statistici

6 6 ELENCO DELLE TABELLE

7 Elenco delle figure. Console di R Dizionario alfabetico dell aiuto in linea Diagrammi di funzioni con plot() Funzioni di densità gaussiane Funzione di probabilità binomiale Funzioni di ripartizione binomiale e normale Ottagono regolare Cerchi casuali Campione Banca d Italia: distribuzione territoriale delle famiglie. 8. Campione Banca d Italia: numero di componenti delle famiglie per area territoriale Campione Banca d Italia: reddito familiare per area territoriale. 8. Campione Banca d Italia: distribuzione del reddito familiare con interpolante lognormale Campione Banca d Italia: quantili del reddito empirici e basati sul modello lognormale Voto di laurea in Economia Voto di diploma dei laureati in Economia Campione Banca d Italia: quantili del reddito nelle aree territoriali Campione Banca d Italia: curva di concentrazione di Lorenz Dendrogramma delle variabili socio-demografiche Frazione di famiglie con un solo componente e frazione di separati e divorziati Diagramma di dispersione delle componenti principali standardizzate Biplot dei comuni e delle variabili socio-demografiche Errore di approssimazione dei dati socio-demografici dei comuni Redditi e consumi familiari pro capite (scala logaritmica) Influenza delle variabili di stratificazione sulla relazione reddito consumo

8 8 ELENCO DELLE FIGURE

9 Capitolo Cos è R? Come S-Plus, R è figlio del linguaggio S, sviluppato negli anni ottanta del secolo scorso presso i Bell Laboratories AT&T da R. Becker, J. Chambers e A. Wilks. L atto di nascita ufficiale è l articolo di R. Ihaka e R. Gentleman R: a language for data analysis and graphics [] apparso nel 996 sul Journal of Computational and Graphical Statistics. Da allora il software si è sviluppato grazie ai contributi dei ricercatori del Comprehensive R Archive Network (CRAN). A differenza di S-Plus, R è un software non commerciale, ed è distribuito gratuitamente sotto le condizioni dettate dalla GNU Public Licence della Free Software Foundation. La sua caratteristica distintiva è di essere open source, il che significa che l utente ha la possibilità di accedere al codice che sta alla base del programma, ed eventualmente modificarlo e redistribuirlo. Un altro punto di forza è la compatibilità con gran parte dei sistemi operativi in uso, da Windows a Linux, da Unix a Mac/OS. Ma cos è R? Lo si può definire un linguaggio di programmazione e, nello stesso tempo, un sistema integrato di calcolo le cui risorse consentono di specificare un insieme di comandi e richiederne l esecuzione, visualizzare i risultati in formato testo, visualizzare i grafici in una finestra ausiliaria, accedere ad archivi esterni, anche sulla rete, per acquisire documenti, dati e grafici, archiviare in modo permanente risultati e/o grafici. Il software di R, con la relativa documentazione, così come le informazioni su aggiornamenti e progetti collaterali, sono facilmente ottenibili dalla rete. Ecco gli indirizzi più utili. pagina principale, software, 9

10 0 CAPITOLO. COS È R? documentazione, archivio delle domande più frequenti, mailing list. La guida di riferimento di R è [] R Development Core Team, A language and environment for statistical computing, R Foundation for Statistical Computing, Vienna, 006 (http://www.r-project.org). Applicazioni della metodologia statistica di base con R sono illustrate nel manuale di S. M. Iacus e G. Masarotto, Laboratorio di Statistica con R, McGraw- Hill, 007 []. Lo sviluppo del sistema è curato dalla Fondazione R, raggiungibile all indirizzo sostenuta finanziariamente da contributi di una rete di università, istituzioni ed imprese sparse in tutto il mondo. R è affiancato da progetti che mirano a sviluppare software dedicato ad applicazioni particolari. Ricordiamo tra gli altri Bioconductor (http://www.bioconductor.org): analisi statistica di dati di espressione genica, gr (http://www.r-project.org/gr): modelli grafici statistici.

11 Capitolo Primi passi Quando si lancia R mediante l eseguibile Rgui.exe si apre una finestra, la console di R (illustrata nella Figura.), contenente informazioni sulla versione del programma e l aiuto in linea. Figura.: Console di R. Il segnale che il sistema è pronto a ricevere i comandi è il simbolo di maggiore che appare sul lato sinistro della console > R non supporta menù se non in misura limitata perciò i comandi devono essere digitati sulla tastiera e vengono eseguiti premendo il tasto Enter. Il segnale del sistema e i comandi sono evidenziati in rosso. Commenti e note esplicative si possono inserire dopo il carattere # (cancelletto). Data e ora si ottengono mediante la funzione date() > date() [] Fri Dec 7 9:0: 007 > q() Per uscire dal sistema si dà il comando Il sistema offre varie forme di assistenza. L assistenza in linea si ottiene digitando il punto interrogativo seguito dal nome della funzione desiderata. Ad esempio eseguendo >?mean il sistema visualizza in una finestra a parte la descrizione della funzione mean (media aritmetica di un insieme di dati). Il comando

12 CAPITOLO. PRIMI PASSI > help.start() apre un file HTML contenente informazioni sui diversi elementi del programma, in particolare sulle librerie disponibili. Utilissimo l elenco alfabetico dei comandi, illustrato nella Figura., con descrizioni corredate da esempi e collegamenti ipertestuali. Figura.: Dizionario alfabetico dell aiuto in linea.. Operatori aritmetici e logici R offre tutte le funzionalità di una calcolatrice numerica. Per valutare l espressione numerica ( + )(9 ) / si digita il comando > (+)*(9-)^/ # Esempio di espressione numerica la cui esecuzione produce la visualizzazione sulla console del messaggio [] 60 contenente il risultato; [] indica che la visualizzazione parte dal primo, e in questo caso unico, dato prodotto dalla valutazione dell espressione. È importante notare che il risultato stesso non è archiviato in memoria. I simboli +,,, /, ˆ, () rappresentano gli operatori aritmetici di addizione, sottrazione, moltiplicazione, divisione e potenza e le parentesi. I simboli ==,! =, <, <=, >, >= indicano invece gli operatori logici di uguale, diverso, minore e minore o uguale, maggiore e maggiore o uguale. Ne illustriamo l uso con alcuni esempi. > == 0 # Proposizione falsa [] FALSE >!= - # Proposizione vera [] TRUE > *(6-8) < - [] FALSE > *(6-8) <= - [] TRUE TRUE e FALSE indicano le costanti logiche VERO, FALSO. Gli operatori logici AND (prodotto logico), OR (somma logica), NOT (negazione logica) sono resi mediante i simboli &,,! il cui uso ` illustrato di seguito.

13 .. VARIABILI E OPERATORE DI ASSEGNAZIONE > (+)>0 & (-0)>0 # Operatore AND [] FALSE > (+)>0 (-0)>0 # Operatore OR [] TRUE >!(*(-0)>0) # Operatore NOT [] TRUE La Tabella. offre un prospetto riassuntivo degli operatori aritmetici, di confronto binario e logici. Operatori Aritmetici + addizione sottrazione prodotto / divisione ˆ potenza %/% divisione intera %% resto della divisione intera Operatori di Confronto Binario < (<=) minore (minore o uguale) > (>=) maggiore (maggiore o uguale) == uguale! = diverso Operatori Logici! negazione logica (NOT) & prodotto logico (AND) somma logica (OR) Tabella.: Operatori aritmetici, di confronto binario e logici.. Variabili e operatore di assegnazione In una sessione di lavoro sorge spesso la necessità di archiviare dati nella memoria del computer in modo da poterli usare più volte. Possiamo ad esempio richiedere che la variabile cambio contenga il cambio dollaro - euro, circa uguale a.7. Il comando > cambio <-.7 archivia il numero decimale.7 in un area della memoria identificata dal nome cambio. La freccia (ottenuta digitando il simbolo di minore, <, seguito dal simbolo di sottrazione, -) è l operatore di assegnazione. Il comando > cambio produce il risultato

14 CAPITOLO. PRIMI PASSI [].7 cioè visualizza il contenuto corrente dell area di memoria corrispondente al nome cambio. Ecco ulteriori esempi. > 0000/cambio [] R gestisce correttamente le situazioni eccezionali. > 0 -> zero > /zero [] Inf > 0-/zero [] -Inf > 0*/zero [] NaN Le costanti numeriche -Inf e Inf sono usate per rappresentare quantità non limitate mentre NaN (not a number, non è un numero) è il codice utilizzato per risultati non interpretabili come numeri e nemmeno uguali a -INF o INF.

15 Capitolo Oggetti Le entità con cui si opera nell ambiente di R prendono il nome di oggetti e sono caratterizzati da due attributi base: mode (traducibile con modo o modalità) e length (lunghezza). Mode Mode è la modalità di base degli elementi che formano un oggetto. Ci sono quattro modalità fondamentali numeric (numero reale), complex (numero complesso), logical (dato logico, con due possibili determinazioni: vero o falso), character (carattere alfanumerico), function (funzione), riservata alle funzioni. Length Length è il numero di elementi che compongono un oggetto. Gli oggetti più importanti sono vettore, matrice, data frame, lista, fattore e funzione. La funzione ls() visualizza sulla console l elenco degli oggetti correntemente presenti nella memoria. La funzione str(nome) produce una breve descrizione della struttura dell oggetto nome. La funzione rm(nome,nome,...) rimuove dalla memoria gli oggetti specificati. > ls() # Quali sono gli oggetti presenti nella memoria? [] cambio cost zero > rm(cost) # Libera l area di memoria occupata da cost > ls() [] cambio zero. Vettore Il vettore è una collezione ordinata di n componenti aventi tutte la stessa modalità (numeric, complex, logical, character) ed è l oggetto base di R (uno

16 6 CAPITOLO. OGGETTI scalare è un vettore di lunghezza unitaria. Il metodo più generale di definire un vettore è di usare la funzione c()(c sta per concatenate, cioè componi in un unica sequenza ordinata). Ad esempio, per costruire il vettore vett con componenti ordinatamente uguali a -., 0,, - daremo il comando > vett <- c(-.,0,,-) > mode(vett); length(vett) [] numeric [] Otteniamo un vettore logico se controlliamo quali componenti di vett sono minori di zero. > vett <- vett<0 > vett [] TRUE FALSE FALSE TRUE > length(vett) == length(vett) [] TRUE Vale la pena osservare che, nell espressione vett<0, l operatore di confronto binario è applicato singolarmente a tutte le componenti del vettore. Ancora, il vettore vett alfanumerico avente come elementi le sigle automobilistiche delle province del Veneto si costruisce col comando > vett <- c( BL, PD, RO, TV, VE, VI, VR ) > mode(vett); length(vett) [] character [] 7 La funzione rep() (da repeat, ripeti) crea vettori con elementi ripetuti, come ad esempio > rep(,times=) [] > rep(c(0,),c(,)) # forma breve [] > rep(c(0,),) [] La funzione seq() (sequence, sequenza) produce vettori con componenti equispaziate. > seq(from=0,to=,by=0.) [] > seq(0,,0.) # forma breve [] Un operatore utilissimo è : che produce vettori con elementi separati da intervalli unitari.

17 .. MATRICE 7 > :0 [] > c(.:,.:8.) [] Matrice La matrice (più in generale, un array) è una generalizzazione multivariata del vettore. Una matrice n m si può considerare come la collezione ordinata dei suoi n vettori riga (ciascuno con m componenti) o dei suoi m vettori colonna (ciascuno con n componenti). Come per i vettori, gli elementi di una matrice devono avere la stessa modalità (non necessariamente numeric). La funzione più semplice per definire una matrice è matrix(). La matrice avente nelle colonne i numeri da a si ottiene con > matr <- matrix(:,nrow=,ncol=,byrow=false) > matr [,] [,] [,] [,] 9 [,] 6 0 [,] 7 [,] 8 > length(matr); dim(matr); str(matr) [] [] int [:, :] La funzione dim() (da dimensions, dimensioni) restituisce ordinatamente il numero di righe e di colonne. I seguenti comandi costruiscono la matrice nulla e la matrice identica d ordine tre. > matrix(0,,) [,] [,] [,] [,] [,] [,] > matrix(c(rep(c(,0,0,0),),),,) [,] [,] [,] [,] 0 0 [,] 0 0 [,] 0 0. Data Frame È un oggetto simile ad una matrice, ma i vettori colonna possono avere modalità diverse. Un esempio importante di data frame è la matrice dati derivante dalla

18 8 CAPITOLO. OGGETTI rilevazione di m variabili (non necessariamente tutte numeriche) su n unità statistiche. Supponiamo ad esempio di aver rilevato nome, numero di matricola, genere ed età di un campione di cinque studenti e di aver ordinato i dati di ciascuna variabile in un vettore. > nome <- c( Dino, Anna, Luisa, Marco, Paolo ) > matr <- c(9,00,9679,86,678076) > gen <- c( M, F, F, M, M ) > eta <- c(,9,0,,) Per ordinare dati osservati in un unica tabella in cui le righe corrispondono agli studenti, le colonne alle variabili è utile la funzione data.frame(). > dati <- data.frame(matr,gen,eta,row.names = nome) > dati matr gen eta Dino 9 M Anna 00 F 9 Luisa 9679 F 0 Marco 86 M Paolo M L opzione row.names = nome associa ad ogni riga un etichetta corrispondente alla determinazione di nome. Se non l avessimo specificata le etichette sarebbero state,,,,. L oggetto dati non può avere una struttura di matrice perchè le colonne hanno tipologie differenti.. Fattore È un vettore le cui componenti corrispondono ai gruppi individuati da una classificazione. L utilizzazione più frequente è la ripartizione delle n unità di un collettivo in gruppi corrispondenti alle determinazioni distinte di una variabile categoriale. Nell esempio del campione di studenti possiamo considerare il gruppo dei maschi e quello delle femmine. La funzione factor() crea un fattore assegnando opportune etichette alle modalità. Una funzione frequentemente usata con i fattori è tapply(oggetto, fattore, funzione) che applica una funzione specificata ai gruppi definiti dalle determinazioni di un fattore. > genere <- factor(gen,labels=c( Femmina, Maschio )) > mean(eta) # media complessiva [].6 > tapply(eta,genere,mean) # medie parziali Femmina Maschio 9..0 > tapply(eta,genere,length) # dimensioni dei gruppi Femmina Maschio

19 .. LISTA 9 Nell esempio precedente tapply(,,mean) calcola l età media separatamente per le femmine e per i maschi mentre tapply(,,length) fornisce le numerosità dei due gruppi.. Lista La lista generalizza ulteriormente la nozione di vettore perchè gli elementi possono avere modalità diverse ed essere a loro volta vettori, matrici, liste. I risultati di molte funzioni statistiche hanno questa struttura. Illustriamo di seguito la costruzione di una lista contenente le regioni delle Venezie, il numero delle rispettive province e le corrispondenti sigle automobilistiche. > reg <- c( FriuliVG, TrentinoAA, Veneto ) > npr <- c(,,7) > pfvg <- c( GO, PN, TS, UD ) > ptaa<-c( BZ, TN ) > pven <- c( BL, PD, RO, TV, VE, VI, VR ) La funzione che costruisce la lista è list(). > venezie <- list(regione=reg,nprov=npr, + province=list(pfvg,ptaa,pven)) > venezie $regione [] FriuliVG TrentinoAA Veneto $nprov [] 7 $province $province[[]] [] GO PN TS UD $province[[]] [] BZ TN $province[[]] [] BL PD RO TV VE VI VR.6 Funzione Le funzioni (sia quelle interne del sistema sia quelle definite dagli utenti) sono oggetti con modalità function. Ne abbiamo già incontrato svariati esempi, come gli operatori aritmetici e logici, le funzioni che costruiscono gli oggetti (c(), matrix(), data.frame(), list(), factor()) e quelle che ne descrivono le caratteristiche (mode(), length(), dim()). Funzioni come ls(), rm() permettono di controllare l insieme degli oggetti presenti nella memoria. La funzione mean() esegue invece una trasformazione di un vettore numerico, cioè il calcolo della corrispondente media aritmetica. La Tabella. riporta un elenco di altre funzioni di questo tipo. Vale la pena osservare che, mentre il risultato di funzioni

20 0 CAPITOLO. OGGETTI Funzione R Risultato min(x), max(x) elemento minimo (massimo) range(x) vettore con elementi min(x), max(x) sum(x), prod(x) somma (prodotto) sort(x) vettore ordinato in modo crescente abs(x) valore assoluto sqrt(x) radice quadrata log(x), log0(x) logaritmo (naturale e in base 0) exp(x) esponenziale sin(x), cos(x), tan(x) funzioni trigonometriche asin(x), acos(x), atan(x) funzioni trigonometriche inverse Tabella.: Funzioni elementari. come sort(), sum(), min(), max() dipende da tutte le componenti del vettore, le funzioni abs(), sqrt() ecc. operano separatamente su ciascuna componente. Tipicamente, le funzioni definite dall utente eseguono microprogrammi che risolvono problemi particolari. L esempio seguente mostra la definizione di una funzione che calcola la media geometrica di n numeri positivi. > mgeo <- function(x) + { + if (length(x)==0) return(nan) + if(!is.numeric(x)) return(nan) + if(min(x)<0) return(nan) + if(min(x)==0) return(0) + if(min(x)>0) return(prod(x)^(/length(x))) + } > mgeo(:) [].87 > mgeo(c(-,,)) [] NaN Il nome della funzione è mgeo e gli argomenti ammissibili sono vettori numerici con componenti non negative. Il programma comprende alcuni controlli sui dati. Se, ad esempio, il vettore non è numerico oppure ci sono dati negativi, il risultato predefinito è NaN. Il costrutto if (cond) expr esegue l espressione expr a condizione che cond sia vera. Il costrutto if (cond) expr else expr esegue expr se cond è vera, altrimenti esegue expr. Come ulteriore esempio proponiamo un microprogramma per la generazione dei primi n numeri di Fibonacci. > fibon <- function(x) La media geometrica dei numeri positivi x,..., x n è la radice n-esima del prodotto di x,..., x n. La successione di Fibonacci è definita dalle proprietà x = x = e, per i >, x i = x i + x i.

21 .7. CAMBIARE MODALITÀ + { + str <- Numeri di Fibonacci minori di (o uguali a) + str <- Argomento della funzione non numerico + str <- Argomento della funzione minore di + if (!is.numeric(x)) stop(str) + if (is.numeric(x) & x < ) stop(str) + if (is.numeric(x) & trunc(x) == ) + { + print(c(str,as.character()),quote=f) + print(as.character(),quote=f) + } + if (is.numeric(x) & trunc(x) == ) + { + print(c(str,as.character()),quote=f) + print(as.character(c(,)),quote=f) + } + if (is.numeric(x) & trunc(x) > ) + { + vett <- numeric(); vett[] <- ; vett[] <- + for (i in :trunc(x)) vett[i] <- vett[i-] + vett[i-] + print(c(str,as.character(trunc(x))),quote=f) + print(as.character(vett),quote=f) + } + } > fibon(8) [] Numeri di Fibonacci minori di (o uguali a) [] 8 [] 8 Il costrutto for (i in i:i) espressione esegue in sequenza i comandi contenuti in espressione facendo variare i da i a i. La funzione stop(messaggio) provoca l arresto dell esecuzione dell espressione corrente e visualizza il contenuto di messaggio. > fibon(-6) Error in fibon(-6) : Argomento della funzione minore di.7 Cambiare modalità È possibile, con alcune limitazioni, cambiare la modalità di un oggetto mediante funzioni del tipo as.character(), as.logical(), as.numeric(). Come regola generale, un oggetto può sempre essere convertito a modalità carattere racchiudendo fra virgolette ( ) le sue determinazioni, mentre la conversione a modalità logica o numerica può provocare la sostituzione di dati col codice NA (not available, dato mancante).

22 CAPITOLO. OGGETTI Così as.logical(x) converte il numero 0 nella costante logica FALSE e tutti gli altri numeri nella costante logica TRUE; inoltre essa converte le stringhe di caratteri FALSE, F nella costante logica FALSE e le stringhe TRUE, T nella costante logica TRUE. Tutte le altre stringhe di caratteri sono tradotte come NA. A sua volta, la funzione as.numeric(x) traduce le costanti logiche FALSE e TRUE nelle costanti numeriche 0 e, rispettivamente; inoltre stringhe di caratteri del tipo,., interpretabili come dati numerici, sono tradotte nelle corrispondenti costanti numeriche,.. Tutte le altre stringhe di caratteri sono tradotte come NA. Queste regole sono documentate dai seguenti esempi. La costante numerica pi corrisponde al numero reale pi greco approssimativamente uguale a... > as.character(.) []. > as.character(pi) [] as.character( > 0) [] TRUE as.logical(pi) [] TRUE > as.logical( pi ) [] NA Pi greco è il rapporto delle lunghezze di una circonferenza e del suo diametro.

23 Capitolo Lavorare con gli oggetti Eseguire un calcolo, o elaborare dati, equivale a trasformare un insieme di oggetti x,..., x n in un insieme di oggetti y,..., y m mediante opportune funzioni. Come abbiamo visto, insieme agli oggetti-tipo del Capitolo, R mette a disposizione moltissime funzioni, comprese tutte le funzioni matematiche di base (vedi Tabella.).. Vettori numerici Se x, y sono vettori numerici con n componenti e a, b sono numeri reali, la combinazione lineare di x e y è il vettore z = ax+by in cui la componente j-esima di z è z j = ax j + by j. Vale la pena osservare che il risultato è ottenuto in due passi: prima si moltiplicano le componenti di x e di y per a e b, rispettivamente, poi si sommano le componenti corrispondenti. La combinazione lineare di un numero finito qualsiasi di vettori si ottiene in modo analogo. > x <- :; y <- rep(,); a <- ; b <- - > a*x+b*y [] 7 9 In R è ammessa la somma algebrica di vettori di dimensione diversa. In particolare, se x è un vettore con n componenti e a è un numero reale, la trasformazione x + a produce il vettore z con componenti z j = x j + a. > x <- seq(,,0.); a <- -0. > x+a [] Le usuali funzioni matematiche, se hanno per argomento un vettore, sono applicate componente per componente. > x <- : > x^

24 CAPITOLO. LAVORARE CON GLI OGGETTI Funzione ceiling(x) floor(x) round(x,m) signif(x,m) trunc(x) Risultato minimo intero maggiore o uguale a x massimo intero minore o uguale a x arrotonda x ad m cifre decimali arrotonda x ad m cifre complessive tronca le cifre decimali Tabella.: Arrotondamento. [] 9 > sqrt(x) [] La Tabella. elenca le funzioni per l arrotondamento di valori numerici. La più importante è round(x, m), che arrotonda le componenti del vettore x ad m cifre decimali (default m = 0). > x <- sqrt(:0) > round(x); round(x,) [] [] Matrici R mette a disposizione un buon apparato di funzioni per la trasformazione di matrici (Tabella.). I seguenti esempi mostrano l uso della funzione diag(x). In generale, se x è una matrice quadrata, diag(x) produce il vettore degli elementi diagonali di x; se x è un vettore, diag(x) produce una matrice diagonale con elementi diagonali ordinatamente uguali alle componenti di x. > diag(matrix(:9,,)) [] 9 > diag(rep(,)) [,][,][,] [,] 0 0 [,] 0 0 [,] 0 0 Per vettorializzare una matrice basta applicare la funzione as.vector(). > as.vector(matrix(:9,,)) [] La traccia, somma degli elementi della diagonale principale di una matrice quadrata, si ottiene mediante la funzione sum().

25 .. ESTRAZIONE E MODIFICA DI ELEMENTI DI OGGETTI Funzione R chol(x) colsums(x) (rowsums(x)) det(x) eigen(x) qr(x) solve(x) svd(x) t(x) Risultato triangolarizzazione di Choleski somme di colonna (riga) determinante autovalori, autovettori scomposizione QR inversa scomposizione in valori singolari trasposta Tabella.: Funzioni di matrici. > m <- matrix(:9,,)) > sum(diag(m)) [] L operatore del prodotto righe per colonne è %*%. Se le matrici non hanno dimensioni compatibili, si ottiene un messaggio d errore. > m <- matrix(:6,,); m <- matrix(c(-,,0,),,) < m <- rep(,) > m%*%m [,][,] [,] [,] [,] 6 > m%*%m Error in m %*% m : non-conformable arguments Per costruire matrici a blocchi, o aggiungere righe o colonne a matrici preesistenti, sono utili le funzioni rbind(), cbind(). La prima giustappone le righe, la seconda le colonne. > rbind(cbind(matrix(,,),matrix(0,,)), + cbind(matrix(0,,),matrix(,,))) [,][,][,][,] [,] 0 0 [,] 0 0 [,] 0 0 [,] 0 0. Estrazione e modifica di elementi di oggetti Un problema frequente è la costruzione di nuovi oggetti mediante elementi di oggetti già esistenti, di solito vettori, matrici o liste. Gli operatori più importanti per effettuare queste trasformazioni sono [ ], per vettori e matrici, [[ ]] per le liste.

26 6 CAPITOLO. LAVORARE CON GLI OGGETTI Se x è un vettore, x[i] restituisce l elemento i-esimo x i, x[ i] restituisce il vettore x privato dell elemento i-esimo e x[c(i, i,..., i k )] restituisce il vettore con elementi x i, x i,..., x ik. > v <- c(-0,,-,0,,.,0,6) > v[] # Componente [] > v[:] # Componenti,, e [] - 0 > v[-length(v)] # Elimina l ultima componente [] > v[] <- 8 # Ridefinisce la prima componente > v [] Se y è una matrice, y[i, j] restituisce l elemento y ij mentre y[i, ] e y[, j] restituiscono, rispettivamente, riga i-esima e colonna j-esima di y. Valori negativi degli argomenti dell operatore [ ] cancellano da y gli elementi corrispondenti. > y <- matrix(:0,,) [,] [,] [,] [,] [,] [,] 7 9 [,] > y[,] # Elemento sulla seconda riga e quinta colonna [] 0 > y[,] # Prima riga [] 7 9 > y[-,] # Elimina la prima riga [] > y[,] # Quinta colonna [] 9 0 > y[,:] # Prime tre colonne [,] [,] [,] [,] [,] 6 > y[,] <- rep(,) # Ridefinisce la quinta colonna > y [,] [,] [,] [,] [,] [,] 7 [,] 6 8. Subsetting Gli esempi precedenti illustrano l uso dell operatore [ ] per selezionare elementi di vettori o matrici in base alla posizione. Lo stesso operatore consente di selezionare elementi con proprietà specificate, non necessariamente dipendenti

27 .. STRINGHE DI CARATTERI 7 dalla posizione. Gli esempi sottostanti mostrano come estrarre da un vettore le componenti positive e contare il numero di componenti uguali a zero. > vett <- c(-0,,0.,-,,0,0) > vett[vett>0] # Estrae le componenti positive [] > length(vett[vett == 0]) # Conta le componenti nulle [] Nel seguente esempio le componenti negative sono poste uguali a zero. > vett[vett < 0] <- 0 > vett [] Stringhe di caratteri Operazioni frequenti sulle stringhe di caratteri alfanumerici sono conteggio dei caratteri, conversione maiuscolo/minuscolo, ricerca, estrazione o sostituzione di sottostringhe. Dato un vettore alfanumerico x, nchar(x) fornisce il numero di caratteri delle singole componenti, mentre tolower(x) e toupper(x) riscrivono tutti i caratteri alfabetici in formato minuscolo e maiuscolo, rispettivamente > vett <- c( cane, GATTO, Topo ) > nchar(vett) [] > tolower(vett) [] cane gatto topo > toupper(vett) [] CANE GATTO TOPO La funzione paste(str,str,...) fonde le componenti corrispondenti dei vettori alfanumerici str, str,..., inserendo eventuali separatori. Al contrario, strsplit(x,str) divide le componenti del vettore alfanumerico x in corrispondenza alle sottostringhe specificate dalle componenti del vettore str. Il risultato è una lista degli spezzoni così originati. Negli esempi che seguono usiamo i vettori alfanumerici letters e LETTERS i cui elementi sono le lettere minuscole e maiuscole dell alfabeto latino. > paste(letters[],:,sep= ) [] A A A > paste(letters[],:,sep= _ ) [] A_ A_ A_ > unlist(strsplit( Nel mezzo del cammin di nostra vita, )) [] Nel mezzo del cammin di nostra vita > unlist(strsplit( Dante, )) [] D a n t e

28 8 CAPITOLO. LAVORARE CON GLI OGGETTI La ricerca di una particolare combinazione di caratteri in una stringa alfanumerica è eseguita dalle funzioni grep() e regexpr(). Se x è un vettore alfanumerico, grep(str,x) restituisce gli indici delle componenti di x contenenti la sottostringa str, mentre regexpr(str,x) fornisce le posizioni in cui inizia la sottostringa str all interno di ogni componente di x (se la sottostringa cercata non è presente, la posizione è posta uguale a ). > vett <- c( Po, topo, gatto, ippopotamo ) > grep( po,vett) [] > regexpr( po,vett) [] - - attr(, match.length ) [] - - La funzione gsub(str,str,x) sostituisce la sottostringa str al posto di str in tutte le componenti di x. > gsub( po, PO,vett) [] Po topo gatto ippopotamo Infine, la funzione substring(x,i,i) estrae dalle componenti del vettore x le sottostringhe comprese tra le posizioni i e i. La versione substring(x,i,i) <- str sostituisce la sottostringa con str. > testo <- Nel mazzo del cammin > substr(testo,6,6) <- e > testo [] Nel mezzo del cammin Nel seguente esempio preleviamo da un vettore alfanumerico le componenti che iniziano con la lettera a. > vett <- c( Alberto, asino, burro, ape ) > vett[substr(vett,,) == a ] [] asino ape.6 Dati mancanti Nell ambiente di R i dati mancanti sono individuati dal codice NA (not available, non disponibile). Numerose funzioni consentono di riconoscerne la presenza negli oggetti, rimuoverli oppure specificare le modalità di trattamento. Le più importanti sono is.na(), na.fail(), na.omit(). La funzione is.na(x) consente di localizzare eventuali dati mancanti in un oggetto (vettore, matrice o data-frame). Infatti is.na(x) produce un oggetto dello stesso tipo di x, i cui elementi assumono la determinazione TRUE se l elemento corrispondente di x è NA, FALSE in caso contrario.

R - Esercitazione 1. Lorenzo Di Biagio dibiagio@mat.uniroma3.it. 30 Settembre 2013. Università Roma Tre

R - Esercitazione 1. Lorenzo Di Biagio dibiagio@mat.uniroma3.it. 30 Settembre 2013. Università Roma Tre R - Esercitazione 1 Lorenzo Di Biagio dibiagio@mat.uniroma3.it Università Roma Tre 30 Settembre 2013 Introduzione a R R è un software open-source, per Linux, Mac OS X, Windows, distribuito secondo la licenza

Dettagli

Laboratorio di Statistica con R

Laboratorio di Statistica con R Laboratorio di Statistica con R R è un vero e proprio linguaggio di programmazione. Il suo nome, è dovuto probabilmente al nome dei suoi sviluppatori:robert Gentleman e Ross Ihaka Le principali funzioni

Dettagli

Vettori ed assegnamenti in R

Vettori ed assegnamenti in R Università degli Studi di Milano Laurea Specialistica in Genomica Funzionale e Bioinformatica Corso di Linguaggi di Programmazione per la Bioinformatica Vettori ed assegnamenti in R Giorgio Valentini e

Dettagli

Laboratorio di ST1 Lezione 2

Laboratorio di ST1 Lezione 2 Laboratorio di ST1 Lezione 2 Claudia Abundo Dipartimento di Matematica Università degli Studi Roma Tre Frequenze in R ESEMPIO Fiori preferiti da n=6 ragazze In R: fiori=c("rosa", "orchidea", "violetta",

Dettagli

Corso Introduttivo all utilizzo di R! Prof.ssa D.F. Iezzi stella.iezzi@uniroma2.it

Corso Introduttivo all utilizzo di R! Prof.ssa D.F. Iezzi stella.iezzi@uniroma2.it Corso Introduttivo all utilizzo di R! Prof.ssa D.F. Iezzi stella.iezzi@uniroma2.it Il software R q Il software R è distribuito gratuitamente come software Open Source con licenza GPL (General Public License)

Dettagli

Introduzione allo Scilab Parte 1: numeri, variabili ed operatori elementari

Introduzione allo Scilab Parte 1: numeri, variabili ed operatori elementari Introduzione allo Scilab Parte 1: numeri, variabili ed operatori elementari Felice Iavernaro Dipartimento di Matematica Università di Bari http://dm.uniba.it/ iavernaro 6 Giugno 2007 Felice Iavernaro (Univ.

Dettagli

MODULO 3. Microsoft Excel. TEST ED ESERCIZI SU: http://www.informarsi.net/ecdl/excel/index.php

MODULO 3. Microsoft Excel. TEST ED ESERCIZI SU: http://www.informarsi.net/ecdl/excel/index.php MODULO 3 Microsoft Excel TEST ED ESERCIZI SU: http:///ecdl/excel/index.php Foglio Elettronico - SpreadSheet Un foglio elettronico (in inglese spreadsheet) è un programma applicativo usato per memorizzare

Dettagli

STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione2: 04-03-2005

STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione2: 04-03-2005 esercitazione 2 p. 1/12 STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione2: 04-03-2005 Luca Monno Università degli studi di Pavia luca.monno@unipv.it http://www.lucamonno.it

Dettagli

LAB LEZ. 1 STATISTICA DESCRITTIVA CON R

LAB LEZ. 1 STATISTICA DESCRITTIVA CON R LAB LEZ. 1 STATISTICA DESCRITTIVA CON R 1 2 L AMBIENTE DI SVILUPPO DI RStudio 1 3 4 2 1 FINESTRA PER GLI SCRIPT E PER VISUALIZZARE I DATI 2 CONSOLE DEI COMANDI 3 VARIABILI PRESENTI NELLA MEMORIA DEL PROGRAMMA

Dettagli

Dai dati al modello teorico

Dai dati al modello teorico Dai dati al modello teorico Analisi descrittiva univariata in R 1 Un po di terminologia Popolazione: (insieme dei dispositivi che verranno messi in produzione) finito o infinito sul quale si desidera avere

Dettagli

Guida rapida - versione Web e Tablet

Guida rapida - versione Web e Tablet Guida rapida - versione Web e Tablet Cos è GeoGebra? Un pacchetto completo di software di matematica dinamica Dedicato all apprendimento e all insegnamento a qualsiasi livello scolastico Gestisce interattivamente

Dettagli

APPENDICE III. CONSIGLI PER L USO DEL SOFTWARE R (a cura del Dott. Lorenzo Giolli)

APPENDICE III. CONSIGLI PER L USO DEL SOFTWARE R (a cura del Dott. Lorenzo Giolli) APPENDICE III. CONSIGLI PER L USO DEL SOFTWARE R (a cura del Dott. Lorenzo Giolli) AIII.1. Installazione del software R Aprire il browser e andare alla pagina www.r-project.org e cliccare CRAN (Download,

Dettagli

INTR T O R D O UZ U IO I N O E N A 1

INTR T O R D O UZ U IO I N O E N A 1 INTRODUZIONE A 1 Cos è R R può essere definito come un sistema per l analisi statistica. È contemporaneamente un linguaggio ed un software. Lo stesso R Development Core Team[1], parlando di R, preferisce

Dettagli

Microsoft Excel. Il foglio elettronico Microsoft Excel Cartelle, Fogli di lavoro e celle Contenuto delle celle. Numeri, date, formule, testo, funzioni

Microsoft Excel. Il foglio elettronico Microsoft Excel Cartelle, Fogli di lavoro e celle Contenuto delle celle. Numeri, date, formule, testo, funzioni Microsoft Excel Sommario Il foglio elettronico Microsoft Excel Cartelle, Fogli di lavoro e celle Contenuto delle celle Numeri, date, formule, testo, funzioni Formattazione dei dati Creazione di serie di

Dettagli

Il foglio elettronico

Il foglio elettronico Il foglio elettronico Foglio di calcolo, Spreadsheet in inglese, Permette di elaborare DATI NUMERICI. E una TABELLA che contiene numeri che possono essere elaborati con FUNZIONI matematiche e statistiche.

Dettagli

Prof.ssa Paola Vicard

Prof.ssa Paola Vicard Questa nota consiste perlopiù nella traduzione da Descriptive statistics di J. Shalliker e C. Ricketts, 2000, University of Plymouth Consideriamo come esempio il data set contenuto nel foglio excel esercizio1_dati.xls.

Dettagli

Le formule possono essere scritte utilizzando un insieme di funzioni predefinite che Excel mette a disposizione, raggruppate per argomento.

Le formule possono essere scritte utilizzando un insieme di funzioni predefinite che Excel mette a disposizione, raggruppate per argomento. Excel: le funzioni Le formule possono essere scritte utilizzando un insieme di funzioni predefinite che Excel mette a disposizione, raggruppate per argomento. DEFINIZIONE: Le funzioni sono dei procedimenti

Dettagli

I punteggi zeta e la distribuzione normale

I punteggi zeta e la distribuzione normale QUINTA UNITA I punteggi zeta e la distribuzione normale I punteggi ottenuti attraverso una misurazione risultano di difficile interpretazione se presi in stessi. Affinché acquistino significato è necessario

Dettagli

EXCEL FINESTRA DI EXCEL BARRE PRINCIPALI CARTELLA DI LAVORO BARRE DI SPOSTAMENTO

EXCEL FINESTRA DI EXCEL BARRE PRINCIPALI CARTELLA DI LAVORO BARRE DI SPOSTAMENTO EXCEL FINESTRA DI EXCEL BARRE PRINCIPALI CARTELLA DI LAVORO BARRE DI SPOSTAMENTO BARRE PRINCIPALI GESTIONE FILE BARRA DEI MENU BARRA STANDARD Nuovo: si crea un nuovo foglio Apri: si carica un foglio da

Dettagli

CURRICOLO MATEMATICA ABILITA COMPETENZE

CURRICOLO MATEMATICA ABILITA COMPETENZE CURRICOLO MATEMATICA 1) Operare con i numeri nel calcolo aritmetico e algebrico, scritto e mentale, anche con riferimento a contesti reali. Per riconoscere e risolvere problemi di vario genere, individuando

Dettagli

Scuola Primaria Conta oggetti o eventi, a voce e a mente, in senso progressivo e regressivo e per salti di due, tre ;

Scuola Primaria Conta oggetti o eventi, a voce e a mente, in senso progressivo e regressivo e per salti di due, tre ; Primo anno Secondo anno Terzo anno Primo anno MATEMATICA Scuola dell Infanzia Scuola Primaria Conta oggetti o eventi, a voce e a mente, in senso progressivo e regressivo e per salti di due, tre ; legge

Dettagli

Prof.ssa Paola Vicard

Prof.ssa Paola Vicard Questa nota consiste perlopiù nella traduzione da Descriptive statistics di J. Shalliker e C. Ricketts, 2000, University of Plymouth Consideriamo come esempio il data set contenuto nel foglio excel esercizio2_dati.xls.

Dettagli

Foglio di calcolo. Il foglio di calcolo: Excel. Selezione delle celle

Foglio di calcolo. Il foglio di calcolo: Excel. Selezione delle celle Foglio di calcolo Il foglio di calcolo: Excel I dati inseriti in Excel sono organizzati in Cartelle di lavoro a loro volta suddivise in Fogli elettronici. I fogli sono formati da celle disposte per righe

Dettagli

Laboratorio di Informatica

Laboratorio di Informatica per chimica industriale e chimica applicata e ambientale LEZIONE 2 Rappresentazione delle informazioni: numeri e caratteri 1 Codice La relazione che associa ad ogni successione ben formata di simboli di

Dettagli

Foglio elettronico. OpenOffice.org Calc 1.1.3

Foglio elettronico. OpenOffice.org Calc 1.1.3 Foglio elettronico OpenOffice.org Calc 1.1.3 PRIMI PASSI CON IL FOGLIO ELETTRONICO Aprire il programma Menu Avvio applicazioni Office OpenOffice.org Calc. Chiudere il programma Menu File Esci. Pulsanti

Dettagli

LABORATORIO DI PROGRAMMAZIONE 2012 2013 EDIZIONE 1, TURNO B

LABORATORIO DI PROGRAMMAZIONE 2012 2013 EDIZIONE 1, TURNO B LABORATORIO DI PROGRAMMAZIONE 2012 2013 EDIZIONE 1, TURNO B 23.XI.2012 VINCENZO MARRA Indice Esercizio 1 1 Menu 1 Tempo: 35 min. 2 Commento 1 2 Esercizio 2 2 Ordinamento e ricerca binaria con la classe

Dettagli

if t>=0 x=1; else x=0; end fornisce, nella variabile x, il valore della funzione gradino a tempi continui, calcolata in t.

if t>=0 x=1; else x=0; end fornisce, nella variabile x, il valore della funzione gradino a tempi continui, calcolata in t. Il programma MATLAB In queste pagine si introduce in maniera molto breve il programma di simulazione MAT- LAB (una abbreviazione di MATrix LABoratory). Introduzione MATLAB è un programma interattivo di

Dettagli

SH.Invoice è un software pratico e completo per la gestione della fatturazione di professionisti e imprese.

SH.Invoice è un software pratico e completo per la gestione della fatturazione di professionisti e imprese. Presentazione: SH.Invoice è un software pratico e completo per la gestione della fatturazione di professionisti e imprese. Il programma si distingue per la rapidità e l elasticità del processo di gestione

Dettagli

Codici Numerici. Modifica dell'informazione. Rappresentazione dei numeri.

Codici Numerici. Modifica dell'informazione. Rappresentazione dei numeri. Codici Numerici. Modifica dell'informazione. Rappresentazione dei numeri. A partire da questa lezione, ci occuperemo di come si riescono a codificare con sequenze binarie, quindi con sequenze di 0 e 1,

Dettagli

Dr. Marco Vicentini marco.vicentini@unipd.it Anno Accademico 2010 2011 Rev 30/03/2011

Dr. Marco Vicentini marco.vicentini@unipd.it Anno Accademico 2010 2011 Rev 30/03/2011 Università degli Studi di Padova Facoltà di Psicologia, L4, Psicometria, Modulo B Dr. Marco Vicentini marco.vicentini@unipd.it Anno Accademico 2010 2011 Rev 30/03/2011 Statistica descrittiva e inferenziale

Dettagli

Pivot è bello. Principali. misure di variabilità. Il contesto è di tipo matematico, in particolare riguarda l uso di dati numerici e delle loro

Pivot è bello. Principali. misure di variabilità. Il contesto è di tipo matematico, in particolare riguarda l uso di dati numerici e delle loro Pivot è bello Livello scolare: 1 biennio Abilità Conoscenze interessate Predisporre la struttura della Distribuzioni delle matrice dei dati grezzi con frequenze a seconda del riguardo a una rilevazione

Dettagli

Elaborazione dei dati su PC Regressione Multipla

Elaborazione dei dati su PC Regressione Multipla 21 Elaborazione dei dati su PC Regressione Multipla Analizza Regressione Statistiche Grafici Metodo di selezione Analisi dei dati 21.1 Introduzione 21.2 Regressione lineare multipla con SPSS 21.3 Regressione

Dettagli

Gestione Rapporti (Calcolo Aree)

Gestione Rapporti (Calcolo Aree) Gestione Rapporti (Calcolo Aree) L interfaccia dello strumento generale «Gestione Rapporti»...3 Accedere all interfaccia (toolbar)...3 Comandi associati alle icone della toolbar...4 La finestra di dialogo

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 1

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 1 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 1 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Un breve riepilogo: caratteri, unità statistiche e collettivo UNITA STATISTICA: oggetto dell osservazione

Dettagli

Uso di base delle funzioni in Microsoft Excel

Uso di base delle funzioni in Microsoft Excel Uso di base delle funzioni in Microsoft Excel Le funzioni Una funzione è un operatore che applicato a uno o più argomenti (valori, siano essi numeri con virgola, numeri interi, stringhe di caratteri) restituisce

Dettagli

Corso sul pacchetto R

Corso sul pacchetto R Corso sul pacchetto R Introduzione ad R http://www.r-project.org ! R è un ambiente di sviluppo specifico per elaborare dati, eseguire calcoli ed effettuare rappresentazioni grafiche, che utilizza un linguaggio

Dettagli

4. Operazioni elementari per righe e colonne

4. Operazioni elementari per righe e colonne 4. Operazioni elementari per righe e colonne Sia K un campo, e sia A una matrice m n a elementi in K. Una operazione elementare per righe sulla matrice A è una operazione di uno dei seguenti tre tipi:

Dettagli

Statistica 1 A.A. 2015/2016

Statistica 1 A.A. 2015/2016 Corso di Laurea in Economia e Finanza Statistica 1 A.A. 2015/2016 (8 CFU, corrispondenti a 48 ore di lezione frontale e 24 ore di esercitazione) Prof. Luigi Augugliaro 1 / 39 Introduzione Come si è detto,

Dettagli

1 La Matrice dei dati

1 La Matrice dei dati Dispense sull uso di Excel Daniela Marella 1 La Matrice dei dati Un questionario è costituito da un insieme di domande raccolte su un determinato supporto (cartaceo o elettronico) e somministrate alla

Dettagli

Matlab per applicazioni statistiche

Matlab per applicazioni statistiche Matlab per applicazioni statistiche Marco J. Lombardi 19 aprile 2005 1 Introduzione Il sistema Matlab è ormai uno standard per quanto riguarda le applicazioni ingegneristiche e scientifiche, ma non ha

Dettagli

Esercitazione di riepilogo 23 Aprile 2013

Esercitazione di riepilogo 23 Aprile 2013 Esercitazione di riepilogo 23 Aprile 2013 Grafici Grafico a barre Servono principalmente per rappresentare variabili (caratteri) qualitative, quantitative e discrete. Grafico a settori circolari (torta)

Dettagli

i=1 Y i, dove Y i, i = 1,, n sono indipendenti e somiglianti e con la stessa distribuzione di Y.

i=1 Y i, dove Y i, i = 1,, n sono indipendenti e somiglianti e con la stessa distribuzione di Y. Lezione n. 5 5.1 Grafici e distribuzioni Esempio 5.1 Legame tra Weibull ed esponenziale; TLC per v.a. esponenziali Supponiamo che X Weibull(α, β). (i) Si consideri la distribuzione di Y = X β. (ii) Fissato

Dettagli

STATISTICA DESCRITTIVA UNIVARIATA

STATISTICA DESCRITTIVA UNIVARIATA Capitolo zero: STATISTICA DESCRITTIVA UNIVARIATA La STATISTICA è la scienza che si occupa di fenomeni collettivi che richiedono lo studio di un grande numero di dati. Il termine STATISTICA deriva dalla

Dettagli

Il concetto di valore medio in generale

Il concetto di valore medio in generale Il concetto di valore medio in generale Nella statistica descrittiva si distinguono solitamente due tipi di medie: - le medie analitiche, che soddisfano ad una condizione di invarianza e si calcolano tenendo

Dettagli

Introduzione al foglio elettronico

Introduzione al foglio elettronico Introduzione al foglio elettronico 1. Che cos'è un foglio elettronico? Un foglio elettronico è un programma che permette di inserire dei dati, di calcolare automaticamente i risultati, di ricalcolarli

Dettagli

Strumenti informatici 2.3 - Le statistiche descrittive con Excel e SPSS

Strumenti informatici 2.3 - Le statistiche descrittive con Excel e SPSS Strumenti informatici 2.3 - Le statistiche descrittive con Excel e SPSS Per ottenere le statistiche descrittive di una o più variabili in Excel occorre utilizzare le funzioni, che sono operatori matematici,

Dettagli

FOGLIO ELETTRONICO (SPREADSHEET)

FOGLIO ELETTRONICO (SPREADSHEET) FOGLIO ELETTRONICO (SPREADSHEET) I fogli elettronici sono programmi che consentono di condurre calcoli matematici, creare tabelle correlate tra loro, impostare piani di gestione e realizzare grafici dei

Dettagli

Prof.ssa Paola Vicard

Prof.ssa Paola Vicard DISTRIBUZIONE DI FREQUENZE PER CARATTERI QUALITATIVI Questa nota consiste per la maggior parte nella traduzione (con alcune integrazioni) da Descriptive statistics di J. Shalliker e C. Ricketts, 2000,

Dettagli

LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE

LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE DESCRIZIONE DEI DATI DA ESAMINARE Sono stati raccolti i dati sul peso del polmone di topi normali e affetti da una patologia simile

Dettagli

L analisi dei dati. Capitolo 4. 4.1 Il foglio elettronico

L analisi dei dati. Capitolo 4. 4.1 Il foglio elettronico Capitolo 4 4.1 Il foglio elettronico Le più importanti operazioni richieste dall analisi matematica dei dati sperimentali possono essere agevolmente portate a termine da un comune foglio elettronico. Prenderemo

Dettagli

UNIVERSITÀ DEGLI STUDI DI FERRARA

UNIVERSITÀ DEGLI STUDI DI FERRARA UNIVERSITÀ DEGLI STUDI DI FERRARA Anno Accademico 2012/2013 REGISTRO DELL ATTIVITÀ DIDATTICA Docente: ANDREOTTI MIRCO Titolo del corso: MATEMATICA ED ELEMENTI DI STATISTICA Corso: CORSO UFFICIALE Corso

Dettagli

Esame di Informatica CHE COS È UN FOGLIO ELETTRONICO CHE COS È UN FOGLIO ELETTRONICO CHE COS È UN FOGLIO ELETTRONICO. Facoltà di Scienze Motorie

Esame di Informatica CHE COS È UN FOGLIO ELETTRONICO CHE COS È UN FOGLIO ELETTRONICO CHE COS È UN FOGLIO ELETTRONICO. Facoltà di Scienze Motorie Facoltà di Scienze Motorie CHE COS È UN FOGLIO ELETTRONICO Una tabella che contiene parole e numeri che possono essere elaborati applicando formule matematiche e funzioni statistiche. Esame di Informatica

Dettagli

LA STATISTICA E IL CALCOLO DELLE PROBABILITÀ

LA STATISTICA E IL CALCOLO DELLE PROBABILITÀ LA STATISTICA E IL CALCOLO DELLE PROBABILITÀ Prof. Francesco Tottoli Versione 3 del 20 febbraio 2012 DEFINIZIONE È una scienza giovane e rappresenta uno strumento essenziale per la scoperta di leggi e

Dettagli

Il foglio elettronico: Excel

Il foglio elettronico: Excel Il foglio elettronico: Excel Laboratorio di Informatica Corso di Laurea triennale in Biologia Dott. Fabio Aiolli (aiolli@math.unipd.it) Dott.ssa Elisa Caniato (ecaniato@gmail.com) Anno accademico 2007-2008

Dettagli

Competenza chiave europea: MATEMATICA. Scuola Primaria. DISCIPLINE DI RIFERIMENTO: MATEMATICA DISCIPLINE CONCORRENTI: tutte

Competenza chiave europea: MATEMATICA. Scuola Primaria. DISCIPLINE DI RIFERIMENTO: MATEMATICA DISCIPLINE CONCORRENTI: tutte Competenza chiave europea: MATEMATICA Scuola Primaria DISCIPLINE DI RIFERIMENTO: MATEMATICA DISCIPLINE CONCORRENTI: tutte TAB. A TRAGUARDI PER LO SVILUPPO DELLE COMPETENZE al termine della Scuola Primaria

Dettagli

Dott.ssa Caterina Gurrieri

Dott.ssa Caterina Gurrieri Dott.ssa Caterina Gurrieri Le relazioni tra caratteri Data una tabella a doppia entrata, grande importanza riveste il misurare se e in che misura le variabili in essa riportata sono in qualche modo

Dettagli

Analisi di dati di frequenza

Analisi di dati di frequenza Analisi di dati di frequenza Fase di raccolta dei dati Fase di memorizzazione dei dati in un foglio elettronico 0 1 1 1 Frequenze attese uguali Si assuma che dalle risposte al questionario sullo stato

Dettagli

Parte IV. I fogli elettronici e Excel

Parte IV. I fogli elettronici e Excel Parte IV I fogli elettronici e Excel Caratteristiche principali dei fogli elettronici Organizzazione dei dati in forma tabellare. Ogni cella può contenere: numeri, testi, formule il cui calcolo è aggiornato

Dettagli

Microsoft Excel Nozioni di base

Microsoft Excel Nozioni di base Sistemi di elaborazione delle informazioni Microsoft Excel Nozioni di base Luca Bortolussi SOMMARIO Introduzione Interfaccia Excel Celle Immissioni dati Formattazione Gestione fogli di lavoro Formattazione

Dettagli

Modelli statistici per l economia e l azienda (Nuovo Ordinamento) Laurea Specialistica Docente: Prof.ssa J. MORTERA Numero di crediti: 9

Modelli statistici per l economia e l azienda (Nuovo Ordinamento) Laurea Specialistica Docente: Prof.ssa J. MORTERA Numero di crediti: 9 Modelli statistici per l economia e l azienda (Nuovo Ordinamento) Laurea Specialistica Docente: Prof.ssa J. MORTERA Numero di crediti: 9 1. Obiettivi Come obbiettivo principale si vuole spiegare come analizzare

Dettagli

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva Università del Piemonte Orientale Corsi di Laurea Triennale Corso di Statistica e Biometria Introduzione e Statistica descrittiva Corsi di Laurea Triennale Corso di Statistica e Biometria: Introduzione

Dettagli

Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico 2011-12)

Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico 2011-12) Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico 011-1) REGRESSIONE LINEARE SEMPLICE OPEN STATISTICA 8.44 Per 8 settimanali, appartenenti alla medesima fascia di prezzo e presenti in edicola

Dettagli

EPG Metodologia della ricerca e Tecniche Multivariate dei dati. Dott.ssa Antonella Macchia E-mail: a.macchia@unich.it. www.psicometria.unich.

EPG Metodologia della ricerca e Tecniche Multivariate dei dati. Dott.ssa Antonella Macchia E-mail: a.macchia@unich.it. www.psicometria.unich. EPG Metodologia della ricerca e Tecniche Multivariate dei dati Dott.ssa Antonella Macchia E-mail: a.macchia@unich.it www.psicometria.unich.it GIORNI E ORARI LEZIONI Sabato 01-03-2014 h 08:00-12:00 Sabato

Dettagli

LUdeS Informatica 2 EXCEL. Prima parte AA 2013/2014

LUdeS Informatica 2 EXCEL. Prima parte AA 2013/2014 LUdeS Informatica 2 EXCEL Prima parte AA 2013/2014 COS E EXCEL? Microsoft Excel è uno dei fogli elettronici più potenti e completi operanti nell'ambiente Windows. Un foglio elettronico è un programma che

Dettagli

disponibili nel pacchetto software.

disponibili nel pacchetto software. Modulo syllabus 4 00 000 00 0 000 000 0 Modulo syllabus 4 DATABASE 00 000 00 0 000 000 0 Richiede che il candidato dimostri di possedere la conoscenza relativa ad alcuni concetti fondamentali sui database

Dettagli

ESERCIZI SVOLTI PER LA PROVA DI STATISTICA

ESERCIZI SVOLTI PER LA PROVA DI STATISTICA ESERCIZI SVOLTI PER LA PROVA DI STATISTICA Stefania Naddeo (anno accademico 4/5) INDICE PARTE PRIMA: STATISTICA DESCRITTIVA. DISTRIBUZIONI DI FREQUENZA E FUNZIONE DI RIPARTIZIONE. VALORI CARATTERISTICI

Dettagli

Parte 2. Determinante e matrice inversa

Parte 2. Determinante e matrice inversa Parte. Determinante e matrice inversa A. Savo Appunti del Corso di Geometria 013-14 Indice delle sezioni 1 Determinante di una matrice, 1 Teorema di Cramer (caso particolare), 3 3 Determinante di una matrice

Dettagli

Riassunto 24 Parole chiave 24 Commenti e curiosità 25 Esercizi 27 Appendice

Riassunto 24 Parole chiave 24 Commenti e curiosità 25 Esercizi 27 Appendice cap 0 Romane - def_layout 1 12/06/12 07.51 Pagina V Prefazione xiii Capitolo 1 Nozioni introduttive 1 1.1 Introduzione 1 1.2 Cenni storici sullo sviluppo della Statistica 2 1.3 La Statistica nelle scienze

Dettagli

Come descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva. Brugnaro Luca

Come descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva. Brugnaro Luca Come descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva Brugnaro Luca Progetto formativo complessivo Obiettivo: incrementare le competenze degli operatori sanitari nelle metodiche

Dettagli

Traccia delle lezioni svolte in laboratorio Excel 2003. Excel 2003 Excel 2010

Traccia delle lezioni svolte in laboratorio Excel 2003. Excel 2003 Excel 2010 Traccia delle lezioni svolte in laboratorio Excel 2003 Excel 2003 Excel 2010 INTRODUZIONE A EXCEL EXCEL è un programma di Microsoft Office che permette di analizzare grandi quantità di dati (database)

Dettagli

Come costruire una distribuzione di frequenze per caratteri quantitativi continui

Come costruire una distribuzione di frequenze per caratteri quantitativi continui Come costruire una distribuzione di frequenze per caratteri quantitativi continui Consideriamo i dati contenuti nel primo foglio di lavoro (quello denominato dati) del file esempio2.xls. I dati si riferiscono

Dettagli

SISTEMI DI NUMERAZIONE DECIMALE E BINARIO

SISTEMI DI NUMERAZIONE DECIMALE E BINARIO SISTEMI DI NUMERAZIONE DECIMALE E BINARIO Il sistema di numerazione decimale (o base dieci) possiede dieci possibili valori (0, 1, 2, 3, 4, 5, 6, 7, 8 o 9) utili a rappresentare i numeri. Le cifre possiedono

Dettagli

STATISTICA DESCRITTIVA - SCHEDA N. 1 VARIABILI QUALITATIVE

STATISTICA DESCRITTIVA - SCHEDA N. 1 VARIABILI QUALITATIVE Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) STATISTICA DESCRITTIVA

Dettagli

MATEMATICA SCUOLE DELL INFANZIA

MATEMATICA SCUOLE DELL INFANZIA MATEMATICA SCUOLE DELL INFANZIA CAMPO DI ESPERIENZA: LA CONOSCENZA DEL MONDO (ordine, misura, spazio, tempo, natura) È l'ambito relativo all'esplorazione, scoperta e prima sistematizzazione delle conoscenze

Dettagli

Analisi sensitività. Strumenti per il supporto alle decisioni nel processo di Valutazione d azienda

Analisi sensitività. Strumenti per il supporto alle decisioni nel processo di Valutazione d azienda Analisi sensitività. Strumenti per il supporto alle decisioni nel processo di Valutazione d azienda Premessa Con l analisi di sensitività il perito valutatore elabora un range di valori invece di un dato

Dettagli

Facciamo qualche precisazione

Facciamo qualche precisazione Abbiamo introdotto alcuni indici statistici (di posizione, di variabilità e di forma) ottenibili da Excel con la funzione Riepilogo Statistiche Facciamo qualche precisazione Al fine della partecipazione

Dettagli

Excel Foglio elettronico: esempio

Excel Foglio elettronico: esempio Excel Sist.Elaborazione Inf. excel 1 Foglio elettronico: esempio Sist.Elaborazione Inf. excel 2 Foglio elettronico o spreadsheet griglia o tabella di celle o caselle in cui è possibile inserire: diversi

Dettagli

PROBABILITA, VALORE ATTESO E VARIANZA DELLE QUANTITÁ ALEATORIE E LORO RELAZIONE CON I DATI OSSERVATI

PROBABILITA, VALORE ATTESO E VARIANZA DELLE QUANTITÁ ALEATORIE E LORO RELAZIONE CON I DATI OSSERVATI statistica, Università Cattaneo-Liuc, AA 006-007, lezione del 08.05.07 IDICE (lezione 08.05.07 PROBABILITA, VALORE ATTESO E VARIAZA DELLE QUATITÁ ALEATORIE E LORO RELAZIOE CO I DATI OSSERVATI 3.1 Valore

Dettagli

Matlab: Strutture di Controllo. Informatica B

Matlab: Strutture di Controllo. Informatica B Matlab: Strutture di Controllo Informatica B Tipo di dato logico È un tipo di dato che può avere solo due valori true (vero) 1 false (falso) 0 I valori di questo tipo possono essere generati direttamente

Dettagli

Sistemi di Numerazione Binaria NB.1

Sistemi di Numerazione Binaria NB.1 Sistemi di Numerazione Binaria NB.1 Numeri e numerali Numero: entità astratta Numerale : stringa di caratteri che rappresenta un numero in un dato sistema di numerazione Lo stesso numero è rappresentato

Dettagli

Struttura logica di un programma

Struttura logica di un programma Struttura logica di un programma Tutti i programmi per computer prevedono tre operazioni principali: l input di dati (cioè l inserimento delle informazioni da elaborare) il calcolo dei risultati cercati

Dettagli

Indice Statistiche Univariate Statistiche Bivariate

Indice Statistiche Univariate Statistiche Bivariate Indice 1 Statistiche Univariate 1 1.1 Importazione di un file.data.............................. 1 1.2 Medie e variabilità................................... 6 1.3 Distribuzioni di frequenze...............................

Dettagli

FOGLIO ELETTRONICO (SPREADSHEET) CHE COS È UN FOGLIO ELETTRONICO

FOGLIO ELETTRONICO (SPREADSHEET) CHE COS È UN FOGLIO ELETTRONICO FOGLIO ELETTRONICO (SPREADSHEET) CHE COS È UN FOGLIO ELETTRONICO I fogli elettronici sono pacchetti applicativi per microcomputer molto diffusi. Motivo del successo: eseguire calcoli di tipo tabellare

Dettagli

La distribuzione Normale. La distribuzione Normale

La distribuzione Normale. La distribuzione Normale La Distribuzione Normale o Gaussiana è la distribuzione più importante ed utilizzata in tutta la statistica La curva delle frequenze della distribuzione Normale ha una forma caratteristica, simile ad una

Dettagli

OBIETTIVI SPECIFICI DI APPRENDIMENTO

OBIETTIVI SPECIFICI DI APPRENDIMENTO Disciplina:... Anno scolastico: 20.../20... Classe/i :... Docente:... DI APPRENDIMENTO SEZIONE 1 Premesse matematiche Nozioni fondamentali sui sistemi di numerazione Sistemi di numerazione in base diversa

Dettagli

Note sull uso di R per l Algebra Lineare

Note sull uso di R per l Algebra Lineare Note sull uso di R per l Algebra Lineare Sommario Introduzione Alcuni comandi elementari di R Creazione di matrici e vettori e accesso ai loro elementi Alcuni particolari tipi di matrice Operazioni con

Dettagli

Guida SH.Shop. Inserimento di un nuovo articolo:

Guida SH.Shop. Inserimento di un nuovo articolo: Guida SH.Shop Inserimento di un nuovo articolo: Dalla schermata principale del programma, fare click sul menu file, quindi scegliere Articoli (File Articoli). In alternativa, premere la combinazione di

Dettagli

Introduzione al software SAS

Introduzione al software SAS Introduzione al software SAS Metodi Quantitativi per Economia, Finanza e Management Esercitazione n 1 Orario di ricevimento Alberto Saccardi alberto.saccardi@nunatac.it asaccardi@liuc.it Lunedì 17-18 Aula

Dettagli

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: Esempi di domande risposta multipla (Modulo II) 1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: 1) ha un numero di elementi pari a 5; 2) ha un numero di elementi

Dettagli

L ambiente grafico di R

L ambiente grafico di R L ambiente grafico di R Giorgio Valentini e mail: valentini@dsi.unimi.it DSI Dipartimento di Scienze dell Informazione Università degli Studi di Milano 1 Rappresentazioni grafiche in R Il linguaggio R

Dettagli

SCUOLA PRIMARIA I.C. di CRESPELLANO PROGRAMMAZIONE ANNUALE MATEMATICA

SCUOLA PRIMARIA I.C. di CRESPELLANO PROGRAMMAZIONE ANNUALE MATEMATICA SCUOLA PRIMARIA I.C. di CRESPELLANO PROGRAMMAZIONE ANNUALE MATEMATICA ANNO SCOLASTICO 2013/2014 INSEGNANTI Gabellone, Silvagni,Damiano TRAGUARDI DELLE COMPETENZE AL TERMINE della CLASSE QUARTA Sviluppa

Dettagli

Premesse alla statistica

Premesse alla statistica Premesse alla statistica Versione 22.10.08 Premesse alla statistica 1 Insiemi e successioni I dati di origine sperimentale si presentano spesso non come singoli valori, ma come insiemi di valori. Richiamiamo

Dettagli

Probabilità discreta

Probabilità discreta Probabilità discreta Daniele A. Gewurz 1 Che probabilità c è che succeda...? Una delle applicazioni della combinatoria è nel calcolo di probabilità discrete. Quando abbiamo a che fare con un fenomeno che

Dettagli

I grafici. Dati numerici. Grafico

I grafici. Dati numerici. Grafico I grafici I grafici sono rappresentazione di dati numerici e/o di funzioni. Devono facilitare la visualizzazione e la comprensione dei numeri e del fenomeno che rappresentano da parte dell utente Dati

Dettagli

Chiudere il Programma Menu File Esci Pulsanti 1 clic sul pulsante Tasto dx 1 clic sulla barra del titolo Chiudi Tastiera Alt+F4

Chiudere il Programma Menu File Esci Pulsanti 1 clic sul pulsante Tasto dx 1 clic sulla barra del titolo Chiudi Tastiera Alt+F4 Foglio Elettronico PRIMI PASSI CON IL FOGLIO ELETTRONICO Avviare il Programma Menu Start Tutti i programmi Microsoft Excel Pulsanti 2 clic sull icona presente sul Desktop Chiudere il Programma Menu File

Dettagli

DATABASE SU EXCEL: I FILTRI

DATABASE SU EXCEL: I FILTRI DATABASE SU EXCEL: I FILTRI È possibile mettere in relazione i dati in base a determinati criteri di ricerca e creare un archivio di dati E necessario creare delle categorie di ordinamento in base alle

Dettagli

Laboratorio di Matematica Computazionale A.A. 2008-2009 Lab. 1 - Introduzione a Matlab

Laboratorio di Matematica Computazionale A.A. 2008-2009 Lab. 1 - Introduzione a Matlab Laboratorio di Matematica Computazionale A.A. 2008-2009 Lab. 1 - Introduzione a Matlab Alcune informazioni su Matlab Matlab è uno strumento per il calcolo scientifico utilizzabile a più livelli, dalla

Dettagli

CURRICOLO MATEMATICA

CURRICOLO MATEMATICA 1 CURRICOLO MATEMATICA Competenza 1 al termine della scuola dell Infanzia 2 NUMERI Raggruppare, ordinare, contare, misurare oggetti, grandezze ed eventi direttamente esperibili. Utilizzare calendari settimanali

Dettagli

Lab. 1 - Introduzione a Matlab

Lab. 1 - Introduzione a Matlab Lab. 1 - Introduzione a Matlab Alcune informazioni su Matlab Matlab è uno strumento per il calcolo scientifico utilizzabile a più livelli, dalla calcolatrice tascabile, alla simulazione ed analisi di sistemi

Dettagli

1. I database. La schermata di avvio di Access

1. I database. La schermata di avvio di Access 7 Microsoft Access 1. I database Con il termine database (o base di dati) si intende una raccolta organizzata di dati, strutturati in maniera tale che, effettuandovi operazioni di vario tipo (inserimento

Dettagli