Introduzione al Calcolo Grafico e Statistico

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Introduzione al Calcolo Grafico e Statistico"

Transcript

1 Introduzione al Calcolo Grafico e Statistico con R Mario Romanazzi Dipartimento di Statistica, Università di Venezia Ca Foscari S. Giobbe, Cannaregio 87, 000 Venezia 7 dicembre 007

2

3 Indice Cos è R? 9 Primi passi. Operatori aritmetici e logici Variabili e operatore di assegnazione Oggetti. Vettore Matrice Data Frame Fattore Lista Funzione Cambiare modalità Lavorare con gli oggetti. Vettori numerici Matrici Estrazione e modifica di elementi di oggetti Subsetting Stringhe di caratteri Dati mancanti Importazione ed esportazione di dati 6 Distribuzioni di probabilità 6. Distribuzioni di probabilità Campionamento Un primo sguardo ai grafici 7. La funzione plot() Le primitive grafiche

4 INDICE 8 Analisi iniziale dei dati 9 8. Tabelle di frequenza Istogrammi Diagrammi scatola-baffi Indici di sintesi Analisi della concentrazione Visualizzare dati multivariati 6 9. Correlazione lineare Diagrammi di dispersione Componenti principali Modelli lineari 7

5 Elenco delle tabelle. Operatori aritmetici, di confronto binario e logici Funzioni elementari Arrotondamento Funzioni di matrici Opzioni di read.table Opzioni di write.table Distribuzioni di Probabilità Univariate Alcuni parametri grafici Principali diagrammi statistici

6 6 ELENCO DELLE TABELLE

7 Elenco delle figure. Console di R Dizionario alfabetico dell aiuto in linea Diagrammi di funzioni con plot() Funzioni di densità gaussiane Funzione di probabilità binomiale Funzioni di ripartizione binomiale e normale Ottagono regolare Cerchi casuali Campione Banca d Italia: distribuzione territoriale delle famiglie. 8. Campione Banca d Italia: numero di componenti delle famiglie per area territoriale Campione Banca d Italia: reddito familiare per area territoriale. 8. Campione Banca d Italia: distribuzione del reddito familiare con interpolante lognormale Campione Banca d Italia: quantili del reddito empirici e basati sul modello lognormale Voto di laurea in Economia Voto di diploma dei laureati in Economia Campione Banca d Italia: quantili del reddito nelle aree territoriali Campione Banca d Italia: curva di concentrazione di Lorenz Dendrogramma delle variabili socio-demografiche Frazione di famiglie con un solo componente e frazione di separati e divorziati Diagramma di dispersione delle componenti principali standardizzate Biplot dei comuni e delle variabili socio-demografiche Errore di approssimazione dei dati socio-demografici dei comuni Redditi e consumi familiari pro capite (scala logaritmica) Influenza delle variabili di stratificazione sulla relazione reddito consumo

8 8 ELENCO DELLE FIGURE

9 Capitolo Cos è R? Come S-Plus, R è figlio del linguaggio S, sviluppato negli anni ottanta del secolo scorso presso i Bell Laboratories AT&T da R. Becker, J. Chambers e A. Wilks. L atto di nascita ufficiale è l articolo di R. Ihaka e R. Gentleman R: a language for data analysis and graphics [] apparso nel 996 sul Journal of Computational and Graphical Statistics. Da allora il software si è sviluppato grazie ai contributi dei ricercatori del Comprehensive R Archive Network (CRAN). A differenza di S-Plus, R è un software non commerciale, ed è distribuito gratuitamente sotto le condizioni dettate dalla GNU Public Licence della Free Software Foundation. La sua caratteristica distintiva è di essere open source, il che significa che l utente ha la possibilità di accedere al codice che sta alla base del programma, ed eventualmente modificarlo e redistribuirlo. Un altro punto di forza è la compatibilità con gran parte dei sistemi operativi in uso, da Windows a Linux, da Unix a Mac/OS. Ma cos è R? Lo si può definire un linguaggio di programmazione e, nello stesso tempo, un sistema integrato di calcolo le cui risorse consentono di specificare un insieme di comandi e richiederne l esecuzione, visualizzare i risultati in formato testo, visualizzare i grafici in una finestra ausiliaria, accedere ad archivi esterni, anche sulla rete, per acquisire documenti, dati e grafici, archiviare in modo permanente risultati e/o grafici. Il software di R, con la relativa documentazione, così come le informazioni su aggiornamenti e progetti collaterali, sono facilmente ottenibili dalla rete. Ecco gli indirizzi più utili. pagina principale, software, 9

10 0 CAPITOLO. COS È R? documentazione, archivio delle domande più frequenti, mailing list. La guida di riferimento di R è [] R Development Core Team, A language and environment for statistical computing, R Foundation for Statistical Computing, Vienna, 006 (http://www.r-project.org). Applicazioni della metodologia statistica di base con R sono illustrate nel manuale di S. M. Iacus e G. Masarotto, Laboratorio di Statistica con R, McGraw- Hill, 007 []. Lo sviluppo del sistema è curato dalla Fondazione R, raggiungibile all indirizzo sostenuta finanziariamente da contributi di una rete di università, istituzioni ed imprese sparse in tutto il mondo. R è affiancato da progetti che mirano a sviluppare software dedicato ad applicazioni particolari. Ricordiamo tra gli altri Bioconductor (http://www.bioconductor.org): analisi statistica di dati di espressione genica, gr (http://www.r-project.org/gr): modelli grafici statistici.

11 Capitolo Primi passi Quando si lancia R mediante l eseguibile Rgui.exe si apre una finestra, la console di R (illustrata nella Figura.), contenente informazioni sulla versione del programma e l aiuto in linea. Figura.: Console di R. Il segnale che il sistema è pronto a ricevere i comandi è il simbolo di maggiore che appare sul lato sinistro della console > R non supporta menù se non in misura limitata perciò i comandi devono essere digitati sulla tastiera e vengono eseguiti premendo il tasto Enter. Il segnale del sistema e i comandi sono evidenziati in rosso. Commenti e note esplicative si possono inserire dopo il carattere # (cancelletto). Data e ora si ottengono mediante la funzione date() > date() [] Fri Dec 7 9:0: 007 > q() Per uscire dal sistema si dà il comando Il sistema offre varie forme di assistenza. L assistenza in linea si ottiene digitando il punto interrogativo seguito dal nome della funzione desiderata. Ad esempio eseguendo >?mean il sistema visualizza in una finestra a parte la descrizione della funzione mean (media aritmetica di un insieme di dati). Il comando

12 CAPITOLO. PRIMI PASSI > help.start() apre un file HTML contenente informazioni sui diversi elementi del programma, in particolare sulle librerie disponibili. Utilissimo l elenco alfabetico dei comandi, illustrato nella Figura., con descrizioni corredate da esempi e collegamenti ipertestuali. Figura.: Dizionario alfabetico dell aiuto in linea.. Operatori aritmetici e logici R offre tutte le funzionalità di una calcolatrice numerica. Per valutare l espressione numerica ( + )(9 ) / si digita il comando > (+)*(9-)^/ # Esempio di espressione numerica la cui esecuzione produce la visualizzazione sulla console del messaggio [] 60 contenente il risultato; [] indica che la visualizzazione parte dal primo, e in questo caso unico, dato prodotto dalla valutazione dell espressione. È importante notare che il risultato stesso non è archiviato in memoria. I simboli +,,, /, ˆ, () rappresentano gli operatori aritmetici di addizione, sottrazione, moltiplicazione, divisione e potenza e le parentesi. I simboli ==,! =, <, <=, >, >= indicano invece gli operatori logici di uguale, diverso, minore e minore o uguale, maggiore e maggiore o uguale. Ne illustriamo l uso con alcuni esempi. > == 0 # Proposizione falsa [] FALSE >!= - # Proposizione vera [] TRUE > *(6-8) < - [] FALSE > *(6-8) <= - [] TRUE TRUE e FALSE indicano le costanti logiche VERO, FALSO. Gli operatori logici AND (prodotto logico), OR (somma logica), NOT (negazione logica) sono resi mediante i simboli &,,! il cui uso ` illustrato di seguito.

13 .. VARIABILI E OPERATORE DI ASSEGNAZIONE > (+)>0 & (-0)>0 # Operatore AND [] FALSE > (+)>0 (-0)>0 # Operatore OR [] TRUE >!(*(-0)>0) # Operatore NOT [] TRUE La Tabella. offre un prospetto riassuntivo degli operatori aritmetici, di confronto binario e logici. Operatori Aritmetici + addizione sottrazione prodotto / divisione ˆ potenza %/% divisione intera %% resto della divisione intera Operatori di Confronto Binario < (<=) minore (minore o uguale) > (>=) maggiore (maggiore o uguale) == uguale! = diverso Operatori Logici! negazione logica (NOT) & prodotto logico (AND) somma logica (OR) Tabella.: Operatori aritmetici, di confronto binario e logici.. Variabili e operatore di assegnazione In una sessione di lavoro sorge spesso la necessità di archiviare dati nella memoria del computer in modo da poterli usare più volte. Possiamo ad esempio richiedere che la variabile cambio contenga il cambio dollaro - euro, circa uguale a.7. Il comando > cambio <-.7 archivia il numero decimale.7 in un area della memoria identificata dal nome cambio. La freccia (ottenuta digitando il simbolo di minore, <, seguito dal simbolo di sottrazione, -) è l operatore di assegnazione. Il comando > cambio produce il risultato

14 CAPITOLO. PRIMI PASSI [].7 cioè visualizza il contenuto corrente dell area di memoria corrispondente al nome cambio. Ecco ulteriori esempi. > 0000/cambio [] R gestisce correttamente le situazioni eccezionali. > 0 -> zero > /zero [] Inf > 0-/zero [] -Inf > 0*/zero [] NaN Le costanti numeriche -Inf e Inf sono usate per rappresentare quantità non limitate mentre NaN (not a number, non è un numero) è il codice utilizzato per risultati non interpretabili come numeri e nemmeno uguali a -INF o INF.

15 Capitolo Oggetti Le entità con cui si opera nell ambiente di R prendono il nome di oggetti e sono caratterizzati da due attributi base: mode (traducibile con modo o modalità) e length (lunghezza). Mode Mode è la modalità di base degli elementi che formano un oggetto. Ci sono quattro modalità fondamentali numeric (numero reale), complex (numero complesso), logical (dato logico, con due possibili determinazioni: vero o falso), character (carattere alfanumerico), function (funzione), riservata alle funzioni. Length Length è il numero di elementi che compongono un oggetto. Gli oggetti più importanti sono vettore, matrice, data frame, lista, fattore e funzione. La funzione ls() visualizza sulla console l elenco degli oggetti correntemente presenti nella memoria. La funzione str(nome) produce una breve descrizione della struttura dell oggetto nome. La funzione rm(nome,nome,...) rimuove dalla memoria gli oggetti specificati. > ls() # Quali sono gli oggetti presenti nella memoria? [] cambio cost zero > rm(cost) # Libera l area di memoria occupata da cost > ls() [] cambio zero. Vettore Il vettore è una collezione ordinata di n componenti aventi tutte la stessa modalità (numeric, complex, logical, character) ed è l oggetto base di R (uno

16 6 CAPITOLO. OGGETTI scalare è un vettore di lunghezza unitaria. Il metodo più generale di definire un vettore è di usare la funzione c()(c sta per concatenate, cioè componi in un unica sequenza ordinata). Ad esempio, per costruire il vettore vett con componenti ordinatamente uguali a -., 0,, - daremo il comando > vett <- c(-.,0,,-) > mode(vett); length(vett) [] numeric [] Otteniamo un vettore logico se controlliamo quali componenti di vett sono minori di zero. > vett <- vett<0 > vett [] TRUE FALSE FALSE TRUE > length(vett) == length(vett) [] TRUE Vale la pena osservare che, nell espressione vett<0, l operatore di confronto binario è applicato singolarmente a tutte le componenti del vettore. Ancora, il vettore vett alfanumerico avente come elementi le sigle automobilistiche delle province del Veneto si costruisce col comando > vett <- c( BL, PD, RO, TV, VE, VI, VR ) > mode(vett); length(vett) [] character [] 7 La funzione rep() (da repeat, ripeti) crea vettori con elementi ripetuti, come ad esempio > rep(,times=) [] > rep(c(0,),c(,)) # forma breve [] > rep(c(0,),) [] La funzione seq() (sequence, sequenza) produce vettori con componenti equispaziate. > seq(from=0,to=,by=0.) [] > seq(0,,0.) # forma breve [] Un operatore utilissimo è : che produce vettori con elementi separati da intervalli unitari.

17 .. MATRICE 7 > :0 [] > c(.:,.:8.) [] Matrice La matrice (più in generale, un array) è una generalizzazione multivariata del vettore. Una matrice n m si può considerare come la collezione ordinata dei suoi n vettori riga (ciascuno con m componenti) o dei suoi m vettori colonna (ciascuno con n componenti). Come per i vettori, gli elementi di una matrice devono avere la stessa modalità (non necessariamente numeric). La funzione più semplice per definire una matrice è matrix(). La matrice avente nelle colonne i numeri da a si ottiene con > matr <- matrix(:,nrow=,ncol=,byrow=false) > matr [,] [,] [,] [,] 9 [,] 6 0 [,] 7 [,] 8 > length(matr); dim(matr); str(matr) [] [] int [:, :] La funzione dim() (da dimensions, dimensioni) restituisce ordinatamente il numero di righe e di colonne. I seguenti comandi costruiscono la matrice nulla e la matrice identica d ordine tre. > matrix(0,,) [,] [,] [,] [,] [,] [,] > matrix(c(rep(c(,0,0,0),),),,) [,] [,] [,] [,] 0 0 [,] 0 0 [,] 0 0. Data Frame È un oggetto simile ad una matrice, ma i vettori colonna possono avere modalità diverse. Un esempio importante di data frame è la matrice dati derivante dalla

18 8 CAPITOLO. OGGETTI rilevazione di m variabili (non necessariamente tutte numeriche) su n unità statistiche. Supponiamo ad esempio di aver rilevato nome, numero di matricola, genere ed età di un campione di cinque studenti e di aver ordinato i dati di ciascuna variabile in un vettore. > nome <- c( Dino, Anna, Luisa, Marco, Paolo ) > matr <- c(9,00,9679,86,678076) > gen <- c( M, F, F, M, M ) > eta <- c(,9,0,,) Per ordinare dati osservati in un unica tabella in cui le righe corrispondono agli studenti, le colonne alle variabili è utile la funzione data.frame(). > dati <- data.frame(matr,gen,eta,row.names = nome) > dati matr gen eta Dino 9 M Anna 00 F 9 Luisa 9679 F 0 Marco 86 M Paolo M L opzione row.names = nome associa ad ogni riga un etichetta corrispondente alla determinazione di nome. Se non l avessimo specificata le etichette sarebbero state,,,,. L oggetto dati non può avere una struttura di matrice perchè le colonne hanno tipologie differenti.. Fattore È un vettore le cui componenti corrispondono ai gruppi individuati da una classificazione. L utilizzazione più frequente è la ripartizione delle n unità di un collettivo in gruppi corrispondenti alle determinazioni distinte di una variabile categoriale. Nell esempio del campione di studenti possiamo considerare il gruppo dei maschi e quello delle femmine. La funzione factor() crea un fattore assegnando opportune etichette alle modalità. Una funzione frequentemente usata con i fattori è tapply(oggetto, fattore, funzione) che applica una funzione specificata ai gruppi definiti dalle determinazioni di un fattore. > genere <- factor(gen,labels=c( Femmina, Maschio )) > mean(eta) # media complessiva [].6 > tapply(eta,genere,mean) # medie parziali Femmina Maschio 9..0 > tapply(eta,genere,length) # dimensioni dei gruppi Femmina Maschio

19 .. LISTA 9 Nell esempio precedente tapply(,,mean) calcola l età media separatamente per le femmine e per i maschi mentre tapply(,,length) fornisce le numerosità dei due gruppi.. Lista La lista generalizza ulteriormente la nozione di vettore perchè gli elementi possono avere modalità diverse ed essere a loro volta vettori, matrici, liste. I risultati di molte funzioni statistiche hanno questa struttura. Illustriamo di seguito la costruzione di una lista contenente le regioni delle Venezie, il numero delle rispettive province e le corrispondenti sigle automobilistiche. > reg <- c( FriuliVG, TrentinoAA, Veneto ) > npr <- c(,,7) > pfvg <- c( GO, PN, TS, UD ) > ptaa<-c( BZ, TN ) > pven <- c( BL, PD, RO, TV, VE, VI, VR ) La funzione che costruisce la lista è list(). > venezie <- list(regione=reg,nprov=npr, + province=list(pfvg,ptaa,pven)) > venezie $regione [] FriuliVG TrentinoAA Veneto $nprov [] 7 $province $province[[]] [] GO PN TS UD $province[[]] [] BZ TN $province[[]] [] BL PD RO TV VE VI VR.6 Funzione Le funzioni (sia quelle interne del sistema sia quelle definite dagli utenti) sono oggetti con modalità function. Ne abbiamo già incontrato svariati esempi, come gli operatori aritmetici e logici, le funzioni che costruiscono gli oggetti (c(), matrix(), data.frame(), list(), factor()) e quelle che ne descrivono le caratteristiche (mode(), length(), dim()). Funzioni come ls(), rm() permettono di controllare l insieme degli oggetti presenti nella memoria. La funzione mean() esegue invece una trasformazione di un vettore numerico, cioè il calcolo della corrispondente media aritmetica. La Tabella. riporta un elenco di altre funzioni di questo tipo. Vale la pena osservare che, mentre il risultato di funzioni

20 0 CAPITOLO. OGGETTI Funzione R Risultato min(x), max(x) elemento minimo (massimo) range(x) vettore con elementi min(x), max(x) sum(x), prod(x) somma (prodotto) sort(x) vettore ordinato in modo crescente abs(x) valore assoluto sqrt(x) radice quadrata log(x), log0(x) logaritmo (naturale e in base 0) exp(x) esponenziale sin(x), cos(x), tan(x) funzioni trigonometriche asin(x), acos(x), atan(x) funzioni trigonometriche inverse Tabella.: Funzioni elementari. come sort(), sum(), min(), max() dipende da tutte le componenti del vettore, le funzioni abs(), sqrt() ecc. operano separatamente su ciascuna componente. Tipicamente, le funzioni definite dall utente eseguono microprogrammi che risolvono problemi particolari. L esempio seguente mostra la definizione di una funzione che calcola la media geometrica di n numeri positivi. > mgeo <- function(x) + { + if (length(x)==0) return(nan) + if(!is.numeric(x)) return(nan) + if(min(x)<0) return(nan) + if(min(x)==0) return(0) + if(min(x)>0) return(prod(x)^(/length(x))) + } > mgeo(:) [].87 > mgeo(c(-,,)) [] NaN Il nome della funzione è mgeo e gli argomenti ammissibili sono vettori numerici con componenti non negative. Il programma comprende alcuni controlli sui dati. Se, ad esempio, il vettore non è numerico oppure ci sono dati negativi, il risultato predefinito è NaN. Il costrutto if (cond) expr esegue l espressione expr a condizione che cond sia vera. Il costrutto if (cond) expr else expr esegue expr se cond è vera, altrimenti esegue expr. Come ulteriore esempio proponiamo un microprogramma per la generazione dei primi n numeri di Fibonacci. > fibon <- function(x) La media geometrica dei numeri positivi x,..., x n è la radice n-esima del prodotto di x,..., x n. La successione di Fibonacci è definita dalle proprietà x = x = e, per i >, x i = x i + x i.

21 .7. CAMBIARE MODALITÀ + { + str <- Numeri di Fibonacci minori di (o uguali a) + str <- Argomento della funzione non numerico + str <- Argomento della funzione minore di + if (!is.numeric(x)) stop(str) + if (is.numeric(x) & x < ) stop(str) + if (is.numeric(x) & trunc(x) == ) + { + print(c(str,as.character()),quote=f) + print(as.character(),quote=f) + } + if (is.numeric(x) & trunc(x) == ) + { + print(c(str,as.character()),quote=f) + print(as.character(c(,)),quote=f) + } + if (is.numeric(x) & trunc(x) > ) + { + vett <- numeric(); vett[] <- ; vett[] <- + for (i in :trunc(x)) vett[i] <- vett[i-] + vett[i-] + print(c(str,as.character(trunc(x))),quote=f) + print(as.character(vett),quote=f) + } + } > fibon(8) [] Numeri di Fibonacci minori di (o uguali a) [] 8 [] 8 Il costrutto for (i in i:i) espressione esegue in sequenza i comandi contenuti in espressione facendo variare i da i a i. La funzione stop(messaggio) provoca l arresto dell esecuzione dell espressione corrente e visualizza il contenuto di messaggio. > fibon(-6) Error in fibon(-6) : Argomento della funzione minore di.7 Cambiare modalità È possibile, con alcune limitazioni, cambiare la modalità di un oggetto mediante funzioni del tipo as.character(), as.logical(), as.numeric(). Come regola generale, un oggetto può sempre essere convertito a modalità carattere racchiudendo fra virgolette ( ) le sue determinazioni, mentre la conversione a modalità logica o numerica può provocare la sostituzione di dati col codice NA (not available, dato mancante).

22 CAPITOLO. OGGETTI Così as.logical(x) converte il numero 0 nella costante logica FALSE e tutti gli altri numeri nella costante logica TRUE; inoltre essa converte le stringhe di caratteri FALSE, F nella costante logica FALSE e le stringhe TRUE, T nella costante logica TRUE. Tutte le altre stringhe di caratteri sono tradotte come NA. A sua volta, la funzione as.numeric(x) traduce le costanti logiche FALSE e TRUE nelle costanti numeriche 0 e, rispettivamente; inoltre stringhe di caratteri del tipo,., interpretabili come dati numerici, sono tradotte nelle corrispondenti costanti numeriche,.. Tutte le altre stringhe di caratteri sono tradotte come NA. Queste regole sono documentate dai seguenti esempi. La costante numerica pi corrisponde al numero reale pi greco approssimativamente uguale a... > as.character(.) []. > as.character(pi) [] as.character( > 0) [] TRUE as.logical(pi) [] TRUE > as.logical( pi ) [] NA Pi greco è il rapporto delle lunghezze di una circonferenza e del suo diametro.

23 Capitolo Lavorare con gli oggetti Eseguire un calcolo, o elaborare dati, equivale a trasformare un insieme di oggetti x,..., x n in un insieme di oggetti y,..., y m mediante opportune funzioni. Come abbiamo visto, insieme agli oggetti-tipo del Capitolo, R mette a disposizione moltissime funzioni, comprese tutte le funzioni matematiche di base (vedi Tabella.).. Vettori numerici Se x, y sono vettori numerici con n componenti e a, b sono numeri reali, la combinazione lineare di x e y è il vettore z = ax+by in cui la componente j-esima di z è z j = ax j + by j. Vale la pena osservare che il risultato è ottenuto in due passi: prima si moltiplicano le componenti di x e di y per a e b, rispettivamente, poi si sommano le componenti corrispondenti. La combinazione lineare di un numero finito qualsiasi di vettori si ottiene in modo analogo. > x <- :; y <- rep(,); a <- ; b <- - > a*x+b*y [] 7 9 In R è ammessa la somma algebrica di vettori di dimensione diversa. In particolare, se x è un vettore con n componenti e a è un numero reale, la trasformazione x + a produce il vettore z con componenti z j = x j + a. > x <- seq(,,0.); a <- -0. > x+a [] Le usuali funzioni matematiche, se hanno per argomento un vettore, sono applicate componente per componente. > x <- : > x^

24 CAPITOLO. LAVORARE CON GLI OGGETTI Funzione ceiling(x) floor(x) round(x,m) signif(x,m) trunc(x) Risultato minimo intero maggiore o uguale a x massimo intero minore o uguale a x arrotonda x ad m cifre decimali arrotonda x ad m cifre complessive tronca le cifre decimali Tabella.: Arrotondamento. [] 9 > sqrt(x) [] La Tabella. elenca le funzioni per l arrotondamento di valori numerici. La più importante è round(x, m), che arrotonda le componenti del vettore x ad m cifre decimali (default m = 0). > x <- sqrt(:0) > round(x); round(x,) [] [] Matrici R mette a disposizione un buon apparato di funzioni per la trasformazione di matrici (Tabella.). I seguenti esempi mostrano l uso della funzione diag(x). In generale, se x è una matrice quadrata, diag(x) produce il vettore degli elementi diagonali di x; se x è un vettore, diag(x) produce una matrice diagonale con elementi diagonali ordinatamente uguali alle componenti di x. > diag(matrix(:9,,)) [] 9 > diag(rep(,)) [,][,][,] [,] 0 0 [,] 0 0 [,] 0 0 Per vettorializzare una matrice basta applicare la funzione as.vector(). > as.vector(matrix(:9,,)) [] La traccia, somma degli elementi della diagonale principale di una matrice quadrata, si ottiene mediante la funzione sum().

25 .. ESTRAZIONE E MODIFICA DI ELEMENTI DI OGGETTI Funzione R chol(x) colsums(x) (rowsums(x)) det(x) eigen(x) qr(x) solve(x) svd(x) t(x) Risultato triangolarizzazione di Choleski somme di colonna (riga) determinante autovalori, autovettori scomposizione QR inversa scomposizione in valori singolari trasposta Tabella.: Funzioni di matrici. > m <- matrix(:9,,)) > sum(diag(m)) [] L operatore del prodotto righe per colonne è %*%. Se le matrici non hanno dimensioni compatibili, si ottiene un messaggio d errore. > m <- matrix(:6,,); m <- matrix(c(-,,0,),,) < m <- rep(,) > m%*%m [,][,] [,] [,] [,] 6 > m%*%m Error in m %*% m : non-conformable arguments Per costruire matrici a blocchi, o aggiungere righe o colonne a matrici preesistenti, sono utili le funzioni rbind(), cbind(). La prima giustappone le righe, la seconda le colonne. > rbind(cbind(matrix(,,),matrix(0,,)), + cbind(matrix(0,,),matrix(,,))) [,][,][,][,] [,] 0 0 [,] 0 0 [,] 0 0 [,] 0 0. Estrazione e modifica di elementi di oggetti Un problema frequente è la costruzione di nuovi oggetti mediante elementi di oggetti già esistenti, di solito vettori, matrici o liste. Gli operatori più importanti per effettuare queste trasformazioni sono [ ], per vettori e matrici, [[ ]] per le liste.

26 6 CAPITOLO. LAVORARE CON GLI OGGETTI Se x è un vettore, x[i] restituisce l elemento i-esimo x i, x[ i] restituisce il vettore x privato dell elemento i-esimo e x[c(i, i,..., i k )] restituisce il vettore con elementi x i, x i,..., x ik. > v <- c(-0,,-,0,,.,0,6) > v[] # Componente [] > v[:] # Componenti,, e [] - 0 > v[-length(v)] # Elimina l ultima componente [] > v[] <- 8 # Ridefinisce la prima componente > v [] Se y è una matrice, y[i, j] restituisce l elemento y ij mentre y[i, ] e y[, j] restituiscono, rispettivamente, riga i-esima e colonna j-esima di y. Valori negativi degli argomenti dell operatore [ ] cancellano da y gli elementi corrispondenti. > y <- matrix(:0,,) [,] [,] [,] [,] [,] [,] 7 9 [,] > y[,] # Elemento sulla seconda riga e quinta colonna [] 0 > y[,] # Prima riga [] 7 9 > y[-,] # Elimina la prima riga [] > y[,] # Quinta colonna [] 9 0 > y[,:] # Prime tre colonne [,] [,] [,] [,] [,] 6 > y[,] <- rep(,) # Ridefinisce la quinta colonna > y [,] [,] [,] [,] [,] [,] 7 [,] 6 8. Subsetting Gli esempi precedenti illustrano l uso dell operatore [ ] per selezionare elementi di vettori o matrici in base alla posizione. Lo stesso operatore consente di selezionare elementi con proprietà specificate, non necessariamente dipendenti

27 .. STRINGHE DI CARATTERI 7 dalla posizione. Gli esempi sottostanti mostrano come estrarre da un vettore le componenti positive e contare il numero di componenti uguali a zero. > vett <- c(-0,,0.,-,,0,0) > vett[vett>0] # Estrae le componenti positive [] > length(vett[vett == 0]) # Conta le componenti nulle [] Nel seguente esempio le componenti negative sono poste uguali a zero. > vett[vett < 0] <- 0 > vett [] Stringhe di caratteri Operazioni frequenti sulle stringhe di caratteri alfanumerici sono conteggio dei caratteri, conversione maiuscolo/minuscolo, ricerca, estrazione o sostituzione di sottostringhe. Dato un vettore alfanumerico x, nchar(x) fornisce il numero di caratteri delle singole componenti, mentre tolower(x) e toupper(x) riscrivono tutti i caratteri alfabetici in formato minuscolo e maiuscolo, rispettivamente > vett <- c( cane, GATTO, Topo ) > nchar(vett) [] > tolower(vett) [] cane gatto topo > toupper(vett) [] CANE GATTO TOPO La funzione paste(str,str,...) fonde le componenti corrispondenti dei vettori alfanumerici str, str,..., inserendo eventuali separatori. Al contrario, strsplit(x,str) divide le componenti del vettore alfanumerico x in corrispondenza alle sottostringhe specificate dalle componenti del vettore str. Il risultato è una lista degli spezzoni così originati. Negli esempi che seguono usiamo i vettori alfanumerici letters e LETTERS i cui elementi sono le lettere minuscole e maiuscole dell alfabeto latino. > paste(letters[],:,sep= ) [] A A A > paste(letters[],:,sep= _ ) [] A_ A_ A_ > unlist(strsplit( Nel mezzo del cammin di nostra vita, )) [] Nel mezzo del cammin di nostra vita > unlist(strsplit( Dante, )) [] D a n t e

28 8 CAPITOLO. LAVORARE CON GLI OGGETTI La ricerca di una particolare combinazione di caratteri in una stringa alfanumerica è eseguita dalle funzioni grep() e regexpr(). Se x è un vettore alfanumerico, grep(str,x) restituisce gli indici delle componenti di x contenenti la sottostringa str, mentre regexpr(str,x) fornisce le posizioni in cui inizia la sottostringa str all interno di ogni componente di x (se la sottostringa cercata non è presente, la posizione è posta uguale a ). > vett <- c( Po, topo, gatto, ippopotamo ) > grep( po,vett) [] > regexpr( po,vett) [] - - attr(, match.length ) [] - - La funzione gsub(str,str,x) sostituisce la sottostringa str al posto di str in tutte le componenti di x. > gsub( po, PO,vett) [] Po topo gatto ippopotamo Infine, la funzione substring(x,i,i) estrae dalle componenti del vettore x le sottostringhe comprese tra le posizioni i e i. La versione substring(x,i,i) <- str sostituisce la sottostringa con str. > testo <- Nel mazzo del cammin > substr(testo,6,6) <- e > testo [] Nel mezzo del cammin Nel seguente esempio preleviamo da un vettore alfanumerico le componenti che iniziano con la lettera a. > vett <- c( Alberto, asino, burro, ape ) > vett[substr(vett,,) == a ] [] asino ape.6 Dati mancanti Nell ambiente di R i dati mancanti sono individuati dal codice NA (not available, non disponibile). Numerose funzioni consentono di riconoscerne la presenza negli oggetti, rimuoverli oppure specificare le modalità di trattamento. Le più importanti sono is.na(), na.fail(), na.omit(). La funzione is.na(x) consente di localizzare eventuali dati mancanti in un oggetto (vettore, matrice o data-frame). Infatti is.na(x) produce un oggetto dello stesso tipo di x, i cui elementi assumono la determinazione TRUE se l elemento corrispondente di x è NA, FALSE in caso contrario.

Laboratorio di Statistica con R

Laboratorio di Statistica con R Laboratorio di Statistica con R R è un vero e proprio linguaggio di programmazione. Il suo nome, è dovuto probabilmente al nome dei suoi sviluppatori:robert Gentleman e Ross Ihaka Le principali funzioni

Dettagli

R - Esercitazione 1. Lorenzo Di Biagio dibiagio@mat.uniroma3.it. 30 Settembre 2013. Università Roma Tre

R - Esercitazione 1. Lorenzo Di Biagio dibiagio@mat.uniroma3.it. 30 Settembre 2013. Università Roma Tre R - Esercitazione 1 Lorenzo Di Biagio dibiagio@mat.uniroma3.it Università Roma Tre 30 Settembre 2013 Introduzione a R R è un software open-source, per Linux, Mac OS X, Windows, distribuito secondo la licenza

Dettagli

Corso Introduttivo all utilizzo di R! Prof.ssa D.F. Iezzi stella.iezzi@uniroma2.it

Corso Introduttivo all utilizzo di R! Prof.ssa D.F. Iezzi stella.iezzi@uniroma2.it Corso Introduttivo all utilizzo di R! Prof.ssa D.F. Iezzi stella.iezzi@uniroma2.it Il software R q Il software R è distribuito gratuitamente come software Open Source con licenza GPL (General Public License)

Dettagli

L ambiente grafico di R

L ambiente grafico di R L ambiente grafico di R Giorgio Valentini e mail: valentini@dsi.unimi.it DSI Dipartimento di Scienze dell Informazione Università degli Studi di Milano 1 Rappresentazioni grafiche in R Il linguaggio R

Dettagli

APPENDICE III. CONSIGLI PER L USO DEL SOFTWARE R (a cura del Dott. Lorenzo Giolli)

APPENDICE III. CONSIGLI PER L USO DEL SOFTWARE R (a cura del Dott. Lorenzo Giolli) APPENDICE III. CONSIGLI PER L USO DEL SOFTWARE R (a cura del Dott. Lorenzo Giolli) AIII.1. Installazione del software R Aprire il browser e andare alla pagina www.r-project.org e cliccare CRAN (Download,

Dettagli

LAB LEZ. 1 STATISTICA DESCRITTIVA CON R

LAB LEZ. 1 STATISTICA DESCRITTIVA CON R LAB LEZ. 1 STATISTICA DESCRITTIVA CON R 1 2 L AMBIENTE DI SVILUPPO DI RStudio 1 3 4 2 1 FINESTRA PER GLI SCRIPT E PER VISUALIZZARE I DATI 2 CONSOLE DEI COMANDI 3 VARIABILI PRESENTI NELLA MEMORIA DEL PROGRAMMA

Dettagli

INTR T O R D O UZ U IO I N O E N A 1

INTR T O R D O UZ U IO I N O E N A 1 INTRODUZIONE A 1 Cos è R R può essere definito come un sistema per l analisi statistica. È contemporaneamente un linguaggio ed un software. Lo stesso R Development Core Team[1], parlando di R, preferisce

Dettagli

Primi passi con R. D. Fioredistella IEZZI e-mail: stella.iezzi@uniroma2.it

Primi passi con R. D. Fioredistella IEZZI e-mail: stella.iezzi@uniroma2.it Primi passi con R Che cosa è Ø R è un ambiente di programmazione (un insieme di funzioni, librerie, oggetti) Ø R è specializzato in analisi dei dati e rappresentazioni grafiche Ø R opera su sistemi operativi

Dettagli

GeoGebra 4.2 Introduzione all utilizzo della Vista CAS per il secondo biennio e il quinto anno

GeoGebra 4.2 Introduzione all utilizzo della Vista CAS per il secondo biennio e il quinto anno GeoGebra 4.2 Introduzione all utilizzo della Vista CAS per il secondo biennio e il quinto anno La Vista CAS L ambiente di lavoro Le celle Assegnazione di una variabile o di una funzione / visualizzazione

Dettagli

Esercitazione di riepilogo 23 Aprile 2013

Esercitazione di riepilogo 23 Aprile 2013 Esercitazione di riepilogo 23 Aprile 2013 Grafici Grafico a barre Servono principalmente per rappresentare variabili (caratteri) qualitative, quantitative e discrete. Grafico a settori circolari (torta)

Dettagli

Elementi di Statistica

Elementi di Statistica Elementi di Statistica Contenuti Contenuti di Statistica nel corso di Data Base Elementi di statistica descrittiva: media, moda, mediana, indici di dispersione Introduzione alle variabili casuali e alle

Dettagli

UNIVERSITÀ DEGLI STUDI DI FERRARA

UNIVERSITÀ DEGLI STUDI DI FERRARA UNIVERSITÀ DEGLI STUDI DI FERRARA Anno Accademico 2012/2013 REGISTRO DELL ATTIVITÀ DIDATTICA Docente: ANDREOTTI MIRCO Titolo del corso: MATEMATICA ED ELEMENTI DI STATISTICA Corso: CORSO UFFICIALE Corso

Dettagli

if t>=0 x=1; else x=0; end fornisce, nella variabile x, il valore della funzione gradino a tempi continui, calcolata in t.

if t>=0 x=1; else x=0; end fornisce, nella variabile x, il valore della funzione gradino a tempi continui, calcolata in t. Il programma MATLAB In queste pagine si introduce in maniera molto breve il programma di simulazione MAT- LAB (una abbreviazione di MATrix LABoratory). Introduzione MATLAB è un programma interattivo di

Dettagli

1 La Matrice dei dati

1 La Matrice dei dati Dispense sull uso di Excel Daniela Marella 1 La Matrice dei dati Un questionario è costituito da un insieme di domande raccolte su un determinato supporto (cartaceo o elettronico) e somministrate alla

Dettagli

Rapida Introduzione all uso del Matlab Ottobre 2002

Rapida Introduzione all uso del Matlab Ottobre 2002 Rapida Introduzione all uso del Matlab Ottobre 2002 Tutti i tipi di dato utilizzati dal Matlab sono in forma di array. I vettori sono array monodimensionali, e così possono essere viste le serie temporali,

Dettagli

Dai dati al modello teorico

Dai dati al modello teorico Dai dati al modello teorico Analisi descrittiva univariata in R 1 Un po di terminologia Popolazione: (insieme dei dispositivi che verranno messi in produzione) finito o infinito sul quale si desidera avere

Dettagli

Regole sintattiche. Simboli

Regole sintattiche. Simboli Simboli Regole sintattiche Ogni sequenza di caratteri alfanumerici che inizi con un carattere alfabetico e non contenga spazi o caratteri speciali è interpretata come un unico simbolo. Le lettere maiuscole

Dettagli

Tipo intero. Esempio. Tipo intero: operatori. Programma PortaMonete.java. Tipi base o primitivi

Tipo intero. Esempio. Tipo intero: operatori. Programma PortaMonete.java. Tipi base o primitivi Tipo intero Tipi base o primitivi Tipi interi: int, byte, short, long Tipi float: float, double Caratteri: char Tipo booleano: boolean Operatori numerici e logici La parola chiave int definisce una variabile

Dettagli

LA NUMERAZIONE BINARIA

LA NUMERAZIONE BINARIA LA NUMERAZIONE BINARIA 5 I SISTEMI DI NUMERAZIONE Fin dalla preistoria l uomo ha avuto la necessità di fare calcoli, utilizzando svariati tipi di dispositivi: manuali (mani, bastoncini, sassi, abaco),

Dettagli

Contenuto del libro...2 Convenzioni utilizzate nel libro...2

Contenuto del libro...2 Convenzioni utilizzate nel libro...2 Indice Introduzione... 1 Contenuto del libro...2 Convenzioni utilizzate nel libro...2 I INTERVALLI E FORMULE DI EXCEL 1 Ricavare il massimo dagli intervalli.... 7 Tecniche avanzate di selezione degli intervalli...7

Dettagli

Dipartimento di Scienze dell Educazione Università degli studi Roma Tre

Dipartimento di Scienze dell Educazione Università degli studi Roma Tre Dipartimento di Scienze dell Educazione Università degli studi Roma Tre Materiale del Laboratorio sulle Procedure Statistiche di base con SPSS CASD Centro Analisi Statistica Dati 1 1. Il Questionario Nella

Dettagli

Introduzione a R Ovvero: Come non avere limiti nella programmazione se non quelli dettati dalla nostra stessa mente

Introduzione a R Ovvero: Come non avere limiti nella programmazione se non quelli dettati dalla nostra stessa mente Università di Bologna - Facoltà di Scienze Statistiche Laurea Triennale in Statistica e Ricerca Sociale Corso di Analisi di Serie Storiche e Multidimensionali Prof.ssa Marilena Pillati Introduzione a R

Dettagli

i=1 Y i, dove Y i, i = 1,, n sono indipendenti e somiglianti e con la stessa distribuzione di Y.

i=1 Y i, dove Y i, i = 1,, n sono indipendenti e somiglianti e con la stessa distribuzione di Y. Lezione n. 5 5.1 Grafici e distribuzioni Esempio 5.1 Legame tra Weibull ed esponenziale; TLC per v.a. esponenziali Supponiamo che X Weibull(α, β). (i) Si consideri la distribuzione di Y = X β. (ii) Fissato

Dettagli

Introduzione a MATLAB. Il Laboratorio. MATLAB Cos è? Oltre alle lezioni. Octave ( www.octave.org ) Scilab ( www.scilab.org )

Introduzione a MATLAB. Il Laboratorio. MATLAB Cos è? Oltre alle lezioni. Octave ( www.octave.org ) Scilab ( www.scilab.org ) Introduzione a MATLAB! Informazioni sul laboratorio! MATLAB! Operazioni di base! Variabili ed assegnamento! Comandi utili! Utilizzo dell Help! Formato dei numeri! Numeri complessi Il Laboratorio! Openlab

Dettagli

Per forma di una distribuzione si intende il modo secondo il quale si dispongono i valori di un carattere intorno alla rispettiva media.

Per forma di una distribuzione si intende il modo secondo il quale si dispongono i valori di un carattere intorno alla rispettiva media. FORMA DI UNA DISTRIBUZIONE Per forma di una distribuzione si intende il modo secondo il quale si dispongono i valori di un carattere intorno alla rispettiva media. Le prime informazioni sulla forma di

Dettagli

INTRODUZIONE A R INTRODUZIONE A R

INTRODUZIONE A R INTRODUZIONE A R Negli anni 90 i Bell Laboratories sviluppano un nuovo ambiente per l analisi statistica: S. Sulla base di tale linguaggio viene successivamente sviluppato un software con il nome S-PLUS. R nasce come ambiente

Dettagli

Corso sul pacchetto R

Corso sul pacchetto R Corso sul pacchetto R Introduzione ad R http://www.r-project.org ! R è un ambiente di sviluppo specifico per elaborare dati, eseguire calcoli ed effettuare rappresentazioni grafiche, che utilizza un linguaggio

Dettagli

Pivot è bello. Principali. misure di variabilità. Il contesto è di tipo matematico, in particolare riguarda l uso di dati numerici e delle loro

Pivot è bello. Principali. misure di variabilità. Il contesto è di tipo matematico, in particolare riguarda l uso di dati numerici e delle loro Pivot è bello Livello scolare: 1 biennio Abilità Conoscenze interessate Predisporre la struttura della Distribuzioni delle matrice dei dati grezzi con frequenze a seconda del riguardo a una rilevazione

Dettagli

Esplorazione dei dati

Esplorazione dei dati Esplorazione dei dati Introduzione L analisi esplorativa dei dati evidenzia, tramite grafici ed indicatori sintetici, le caratteristiche di ciascun attributo presente in un dataset. Il processo di esplorazione

Dettagli

SISTEMI DI NUMERAZIONE DECIMALE E BINARIO

SISTEMI DI NUMERAZIONE DECIMALE E BINARIO SISTEMI DI NUMERAZIONE DECIMALE E BINARIO Il sistema di numerazione decimale (o base dieci) possiede dieci possibili valori (0, 1, 2, 3, 4, 5, 6, 7, 8 o 9) utili a rappresentare i numeri. Le cifre possiedono

Dettagli

4. Operazioni elementari per righe e colonne

4. Operazioni elementari per righe e colonne 4. Operazioni elementari per righe e colonne Sia K un campo, e sia A una matrice m n a elementi in K. Una operazione elementare per righe sulla matrice A è una operazione di uno dei seguenti tre tipi:

Dettagli

TANTO PER COMINCIARE: INTRODUZIONE VELOCE AD R

TANTO PER COMINCIARE: INTRODUZIONE VELOCE AD R TANTO PER COMINCIARE: INTRODUZIONE VELOCE AD R Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Università degli Studi di Perugia Versione on-line: http://www.unipg.it/ onofri/rtutorial/index.html

Dettagli

Guida rapida - versione Web e Tablet

Guida rapida - versione Web e Tablet Guida rapida - versione Web e Tablet Cos è GeoGebra? Un pacchetto completo di software di matematica dinamica Dedicato all apprendimento e all insegnamento a qualsiasi livello scolastico Gestisce interattivamente

Dettagli

Prof.ssa Paola Vicard

Prof.ssa Paola Vicard Questa nota consiste per la maggior parte nella traduzione (con alcune integrazioni) da Descriptive statistics di J. Shalliker e C. Ricketts, 2000, University of Plymouth Consideriamo come esempio il data

Dettagli

Corso di Analisi Matematica. Funzioni reali di variabile reale

Corso di Analisi Matematica. Funzioni reali di variabile reale a.a. 2011/12 Laurea triennale in Informatica Corso di Analisi Matematica Funzioni reali di variabile reale Avvertenza Questi sono appunti informali delle lezioni, che vengono resi disponibili per comodità

Dettagli

STATISTICA ECONOMICA ED ANALISI DI MERCATO Previsioni Economiche ed Analisi di Serie Storiche A.A. 2003 / 04 ESERCITAZIONE 2

STATISTICA ECONOMICA ED ANALISI DI MERCATO Previsioni Economiche ed Analisi di Serie Storiche A.A. 2003 / 04 ESERCITAZIONE 2 STATISTICA ECONOMICA ED ANALISI DI MERCATO Previsioni Economiche ed Analisi di Serie Storiche A.A. 2003 / 04 ESERCITAZIONE 2 Introduzione all uso di EViews di Daniele Toninelli 1. INTRODUZIONE ad EViews

Dettagli

Esercitazione Statistica Computazionale B Modelli di regressione lineare semplice Verifica di ipotesi - Analisi della varianza

Esercitazione Statistica Computazionale B Modelli di regressione lineare semplice Verifica di ipotesi - Analisi della varianza Esercitazione Statistica Computazionale B Modelli di regressione lineare semplice Verifica di ipotesi - Analisi della varianza 3 maggio 2005 Esercizio 1 Consideriamo l esempio del libro di testo Annette

Dettagli

Guida all uso del foglio elettronico Excel Lezioni ed esercizi

Guida all uso del foglio elettronico Excel Lezioni ed esercizi Lezioni di EXCEL Guida all uso del foglio elettronico Excel Lezioni ed esercizi 1 Il foglio elettronico Excel Excel è un foglio elettronico che consente di effettuare svariate operazioni nel campo matematico,

Dettagli

ESERCIZI SVOLTI PER LA PROVA DI STATISTICA

ESERCIZI SVOLTI PER LA PROVA DI STATISTICA ESERCIZI SVOLTI PER LA PROVA DI STATISTICA Stefania Naddeo (anno accademico 4/5) INDICE PARTE PRIMA: STATISTICA DESCRITTIVA. DISTRIBUZIONI DI FREQUENZA E FUNZIONE DI RIPARTIZIONE. VALORI CARATTERISTICI

Dettagli

Corso di Laurea in INFORMATICA

Corso di Laurea in INFORMATICA Corso di Laurea in INFORMATICA Algoritmi e Strutture Dati MODULO 2. Algebre di dati Dati e rappresentazioni, requisiti delle astrazioni di dati, costrutti. Astrazioni di dati e dati primitivi. Specifica

Dettagli

CONTROLLI STATISTICI

CONTROLLI STATISTICI CONTROLLI STATISTICI Si definisce Statistica la disciplina che si occupa della raccolta, effettuata in modo scientifico, dei dati e delle informazioni, della loro classificazione, elaborazione e rappresentazione

Dettagli

Le formule possono essere scritte utilizzando un insieme di funzioni predefinite che Excel mette a disposizione, raggruppate per argomento.

Le formule possono essere scritte utilizzando un insieme di funzioni predefinite che Excel mette a disposizione, raggruppate per argomento. Excel: le funzioni Le formule possono essere scritte utilizzando un insieme di funzioni predefinite che Excel mette a disposizione, raggruppate per argomento. DEFINIZIONE: Le funzioni sono dei procedimenti

Dettagli

Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico 2011-12)

Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico 2011-12) Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico 011-1) REGRESSIONE LINEARE SEMPLICE OPEN STATISTICA 8.44 Per 8 settimanali, appartenenti alla medesima fascia di prezzo e presenti in edicola

Dettagli

Strumenti informatici 2.3 - Le statistiche descrittive con Excel e SPSS

Strumenti informatici 2.3 - Le statistiche descrittive con Excel e SPSS Strumenti informatici 2.3 - Le statistiche descrittive con Excel e SPSS Per ottenere le statistiche descrittive di una o più variabili in Excel occorre utilizzare le funzioni, che sono operatori matematici,

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 1

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 1 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 1 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Un breve riepilogo: caratteri, unità statistiche e collettivo UNITA STATISTICA: oggetto dell osservazione

Dettagli

Matlab: Strutture di Controllo. Informatica B

Matlab: Strutture di Controllo. Informatica B Matlab: Strutture di Controllo Informatica B Tipo di dato logico È un tipo di dato che può avere solo due valori true (vero) 1 false (falso) 0 I valori di questo tipo possono essere generati direttamente

Dettagli

Abbiamo visto due definizioni del valore medio e della deviazione standard di una grandezza casuale, in funzione dalle informazioni disponibili:

Abbiamo visto due definizioni del valore medio e della deviazione standard di una grandezza casuale, in funzione dalle informazioni disponibili: Incertezze di misura Argomenti: classificazione delle incertezze; definizione di incertezza tipo e schemi di calcolo; schemi per il calcolo dell incertezza di grandezze combinate; confronto di misure affette

Dettagli

MICROSOFT EXCEL INTRODUZIONE PRIMI PASSI

MICROSOFT EXCEL INTRODUZIONE PRIMI PASSI MICROSOFT EXCEL INTRODUZIONE Si tratta di un software appartenente alla categoria dei fogli di calcolo: con essi si intendono veri e propri fogli elettronici, ciascuno dei quali è diviso in righe e colonne,

Dettagli

Fondamenti di Informatica Ingegneria Clinica Lezione 19/11/2009. Prof. Raffaele Nicolussi

Fondamenti di Informatica Ingegneria Clinica Lezione 19/11/2009. Prof. Raffaele Nicolussi Fondamenti di Informatica Ingegneria Clinica Lezione 19/11/2009 Prof. Raffaele Nicolussi FUB - Fondazione Ugo Bordoni Via B. Castiglione 59-00142 Roma Docente Raffaele Nicolussi rnicolussi@fub.it Lezioni

Dettagli

Introduzione alla Teoria degli Errori

Introduzione alla Teoria degli Errori Introduzione alla Teoria degli Errori 1 Gli errori di misura sono inevitabili Una misura non ha significato se non viene accompagnata da una ragionevole stima dell errore ( Una scienza si dice esatta non

Dettagli

Grafici delle distribuzioni di frequenza

Grafici delle distribuzioni di frequenza Grafici delle distribuzioni di frequenza L osservazione del grafico può far notare irregolarità o comportamenti anomali non direttamente osservabili sui dati; ad esempio errori di misurazione 1) Diagramma

Dettagli

Corso basilare di programmazione

Corso basilare di programmazione Parte vi Corso basilare di programmazione Introduzione............................................ 947 Programma didattico.................................. 947 Strumenti per la compilazione..........................

Dettagli

Parte IV. I fogli elettronici e Excel

Parte IV. I fogli elettronici e Excel Parte IV I fogli elettronici e Excel Caratteristiche principali dei fogli elettronici Organizzazione dei dati in forma tabellare. Ogni cella può contenere: numeri, testi, formule il cui calcolo è aggiornato

Dettagli

Laboratorio di Informatica

Laboratorio di Informatica per chimica industriale e chimica applicata e ambientale LEZIONE 2 Rappresentazione delle informazioni: numeri e caratteri 1 Codice La relazione che associa ad ogni successione ben formata di simboli di

Dettagli

Tenendo conto che la funzione di probabilità per una v.c. binomiale X è definita dalla seguente notazione

Tenendo conto che la funzione di probabilità per una v.c. binomiale X è definita dalla seguente notazione APPENDICE I. TAVOLE STATISTICHE Si ribadisce al lettore che in questa Appendice si riportano le procedure di Excel e di R.2.12.1 che gli permettono di trovare qualsiasi valore di probabilità cercato e

Dettagli

Accuratezza di uno strumento

Accuratezza di uno strumento Accuratezza di uno strumento Come abbiamo già accennato la volta scora, il risultato della misurazione di una grandezza fisica, qualsiasi sia lo strumento utilizzato, non è mai un valore numerico X univocamente

Dettagli

La Statistica applicata attraverso l uso del programma R

La Statistica applicata attraverso l uso del programma R La Statistica applicata attraverso l uso del programma R Francesca Parpinel febbraio 2000 1 Introduzione È difficile pensare allo studio della statistica dei fenomeni reali non associato all uso del computer,

Dettagli

Probabilità discreta

Probabilità discreta Probabilità discreta Daniele A. Gewurz 1 Che probabilità c è che succeda...? Una delle applicazioni della combinatoria è nel calcolo di probabilità discrete. Quando abbiamo a che fare con un fenomeno che

Dettagli

LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE

LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE DESCRIZIONE DEI DATI DA ESAMINARE Sono stati raccolti i dati sul peso del polmone di topi normali e affetti da una patologia simile

Dettagli

Software di calcolo numerico, analisi, statistica e simulazione. Un esempio pratico: Octave

Software di calcolo numerico, analisi, statistica e simulazione. Un esempio pratico: Octave Software di calcolo numerico, analisi, statistica e simulazione Un esempio pratico: Octave Problemi tradizionali Risoluzione di funzioni matematiche complesse Esecuzione di calcoli matriciali Analisi

Dettagli

Come descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva. Brugnaro Luca

Come descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva. Brugnaro Luca Come descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva Brugnaro Luca Progetto formativo complessivo Obiettivo: incrementare le competenze degli operatori sanitari nelle metodiche

Dettagli

(accuratezza) ovvero (esattezza)

(accuratezza) ovvero (esattezza) Capitolo n 2 2.1 - Misure ed errori In un analisi chimica si misurano dei valori chimico-fisici di svariate grandezze; tuttavia ogni misura comporta sempre una incertezza, dovuta alla presenza non eliminabile

Dettagli

Parte 2. Determinante e matrice inversa

Parte 2. Determinante e matrice inversa Parte. Determinante e matrice inversa A. Savo Appunti del Corso di Geometria 013-14 Indice delle sezioni 1 Determinante di una matrice, 1 Teorema di Cramer (caso particolare), 3 3 Determinante di una matrice

Dettagli

Sistemi di Numerazione Binaria NB.1

Sistemi di Numerazione Binaria NB.1 Sistemi di Numerazione Binaria NB.1 Numeri e numerali Numero: entità astratta Numerale : stringa di caratteri che rappresenta un numero in un dato sistema di numerazione Lo stesso numero è rappresentato

Dettagli

A.1 Rappresentazione geometrica dei segnali

A.1 Rappresentazione geometrica dei segnali Appendice A Rappresentazione dei segnali A.1 Rappresentazione geometrica dei segnali Scomporre una generica forma d onda s(t) in somma di opportune funzioni base è operazione assai comune, particolarmente

Dettagli

LUdeS Informatica 2 EXCEL. Prima parte AA 2013/2014

LUdeS Informatica 2 EXCEL. Prima parte AA 2013/2014 LUdeS Informatica 2 EXCEL Prima parte AA 2013/2014 COS E EXCEL? Microsoft Excel è uno dei fogli elettronici più potenti e completi operanti nell'ambiente Windows. Un foglio elettronico è un programma che

Dettagli

CORSO DI LAUREA IN OTTICA E OPTOMETRIA CORSO DI INFORMATICA E STATISTICA DANIELE.MONTANINO@UNISALENTO.IT

CORSO DI LAUREA IN OTTICA E OPTOMETRIA CORSO DI INFORMATICA E STATISTICA DANIELE.MONTANINO@UNISALENTO.IT CORSO DI LAUREA IN OTTICA E OPTOMETRIA CORSO DI INFORMATICA E STATISTICA DANIELE.MONTANINO@UNISALENTO.IT CONVENZIONE SULLE CIFRE SIGNIFICATIVE La convenzione usata sul troncamento delle cifre è troncare

Dettagli

La distribuzione Gaussiana

La distribuzione Gaussiana Università del Piemonte Orientale Corso di Laurea in Biotecnologie Corso di Statistica Medica La distribuzione Normale (o di Gauss) Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione

Dettagli

Introduzione ad Access

Introduzione ad Access Introduzione ad Access Antonino Bella Centro Nazionale di Epidemiologia, Sorveglianza e Promozione della Salute Istituto Superiore di Sanità 1 Base di Dati 2 Database: Concetti (1) Database Collezione

Dettagli

Cenni di statistica descrittiva

Cenni di statistica descrittiva Cenni di statistica descrittiva La statistica descrittiva è la disciplina nella quale si studiano le metodologie di cui si serve uno sperimentatore per raccogliere, rappresentare ed elaborare dei dati

Dettagli

Excel Terza parte. Excel 2003

Excel Terza parte. Excel 2003 Excel Terza parte Excel 2003 TABELLA PIVOT Selezioniamo tutti i dati (con le relative etichette) Dati Rapporto tabella pivot e grafico pivot Fine 2 La tabella pivot viene messa di default in una pagina

Dettagli

I grafici. Dati numerici. Grafico

I grafici. Dati numerici. Grafico I grafici I grafici sono rappresentazione di dati numerici e/o di funzioni. Devono facilitare la visualizzazione e la comprensione dei numeri e del fenomeno che rappresentano da parte dell utente Dati

Dettagli

LAVORO ESTIVO DI INFORMATICA CLASSE 2O

LAVORO ESTIVO DI INFORMATICA CLASSE 2O LAVORO ESTIVO DI INFORMATICA CLASSE 2O PER COLORO CHE HANNO AVUTO LA SOSPENSIONE DEL GIUDIZIO, GLI ESERCIZI SVOLTI DEVONO ESSERE CONSEGNATI TASSATIVAMENTE IL GIORNO DELL'ESAME SCRITTO. A CHI È STATO ASSEGNATO

Dettagli

MINIGUIDA EXCEL MICROSOFT EXCEL

MINIGUIDA EXCEL MICROSOFT EXCEL 1 MICROSOFT EXCEL Molto spesso ci si trova a dover affrontare problemi che richiedono numerosi calcoli meccanici e ripetitivi. Un foglio elettronico è una tabella particolare che permette di far svolgere

Dettagli

ELEMENTI DI STATISTICA PER IDROLOGIA

ELEMENTI DI STATISTICA PER IDROLOGIA Carlo Gregoretti Corso di Idraulica ed Idrologia Elementi di statist. per Idrolog.-7//4 ELEMETI DI STATISTICA PER IDROLOGIA Introduzione Una variabile si dice casuale quando assume valori che dipendono

Dettagli

Variabili Casuali Continue e Distribuzione Normale

Variabili Casuali Continue e Distribuzione Normale Variabili Casuali Continue e Distribuzione Normale Nel Capitolo 5 si è definita variabile casuale continua una variabile casuale che può assumere tutti valori compresi fra gli estremi di un intervallo

Dettagli

LibreOffice Calc. Moreno Marzolla http://www.moreno.marzolla.name/

LibreOffice Calc. Moreno Marzolla http://www.moreno.marzolla.name/ Moreno Marzolla http://www.moreno.marzolla.name/ Copyright 2011, Gianluca Amato http://fad.unich.it/course/view.php?id=12 Copyright 2011, Moreno Marzolla (http://www.moreno.marzolla.name/teaching/labinf2011/)

Dettagli

Breve Introduzione a R

Breve Introduzione a R Breve Introduzione a R Guida rapida per iniziare ad usare l ambiente di calcolo R M. Ponti Centro Interdipartimentale di Ricerca per le Scienze Ambientali in Ravenna, Università di Bologna Aprile, 2003

Dettagli

Facciamo qualche precisazione

Facciamo qualche precisazione Abbiamo introdotto alcuni indici statistici (di posizione, di variabilità e di forma) ottenibili da Excel con la funzione Riepilogo Statistiche Facciamo qualche precisazione Al fine della partecipazione

Dettagli

90.1 Sistemi di numerazione. 90.1.1 Sistema decimale. 605 Capitolo 90 Dai sistemi di numerazione all organizzazione della memoria

90.1 Sistemi di numerazione. 90.1.1 Sistema decimale. 605 Capitolo 90 Dai sistemi di numerazione all organizzazione della memoria 605 Capitolo 90 Dai sistemi di numerazione all organizzazione della memoria 90.1 Sistemi di numerazione.................................................... 605 90.1.1 Sistema decimale..................................................

Dettagli

Prof.ssa Paola Vicard

Prof.ssa Paola Vicard Questa nota consiste perlopiù nella traduzione da Descriptive statistics di J. Shalliker e C. Ricketts, 2000, University of Plymouth Consideriamo come esempio il data set contenuto nel foglio excel esercizio1_dati.xls.

Dettagli

Statistica 1 A.A. 2015/2016

Statistica 1 A.A. 2015/2016 Corso di Laurea in Economia e Finanza Statistica 1 A.A. 2015/2016 (8 CFU, corrispondenti a 48 ore di lezione frontale e 24 ore di esercitazione) Prof. Luigi Augugliaro 1 / 39 Introduzione Come si è detto,

Dettagli

Traccia delle lezioni svolte in laboratorio Excel 2003. Excel 2003 Excel 2010

Traccia delle lezioni svolte in laboratorio Excel 2003. Excel 2003 Excel 2010 Traccia delle lezioni svolte in laboratorio Excel 2003 Excel 2003 Excel 2010 INTRODUZIONE A EXCEL EXCEL è un programma di Microsoft Office che permette di analizzare grandi quantità di dati (database)

Dettagli

Servizio Nazionale di Valutazione a.s. 2014/15 Guida alla lettura Prova di Matematica Classe seconda Scuola primaria

Servizio Nazionale di Valutazione a.s. 2014/15 Guida alla lettura Prova di Matematica Classe seconda Scuola primaria Servizio Nazionale di Valutazione a.s. 2014/15 Guida alla lettura Prova di Matematica Classe seconda Scuola primaria I quesiti sono distribuiti negli ambiti secondo la tabella seguente Ambito Numero di

Dettagli

AREA MATEMATICO-SCIENTIFICO-TECNOLOGICA MATEMATICA

AREA MATEMATICO-SCIENTIFICO-TECNOLOGICA MATEMATICA AREA MATEMATICO-SCIENTIFICO-TECNOLOGICA MATEMATICA TRAGUARDI PER LO SVILUPPO DELLE COMPETENZE AL TERMINE DELLA SCUOLA SECONDARIA DI PRIMO GRADO. L alunno ha rafforzato un atteggiamento positivo rispetto

Dettagli

PROBABILITA, VALORE ATTESO E VARIANZA DELLE QUANTITÁ ALEATORIE E LORO RELAZIONE CON I DATI OSSERVATI

PROBABILITA, VALORE ATTESO E VARIANZA DELLE QUANTITÁ ALEATORIE E LORO RELAZIONE CON I DATI OSSERVATI statistica, Università Cattaneo-Liuc, AA 006-007, lezione del 08.05.07 IDICE (lezione 08.05.07 PROBABILITA, VALORE ATTESO E VARIAZA DELLE QUATITÁ ALEATORIE E LORO RELAZIOE CO I DATI OSSERVATI 3.1 Valore

Dettagli

LICEO SCIENTIFICO opzione delle scienze applicate MATEMATICA LICEO SCIENTIFICO MATEMATICA

LICEO SCIENTIFICO opzione delle scienze applicate MATEMATICA LICEO SCIENTIFICO MATEMATICA LICEO SCIENTIFICO MATEMATICA PROFILO GENERALE E COMPETENZE Al termine del percorso liceale lo studente dovrà padroneggiare i principali concetti e metodi di base della matematica, sia aventi valore intrinseco

Dettagli

LICEO SCIENTIFICO opzione delle scienze applicate MATEMATICA

LICEO SCIENTIFICO opzione delle scienze applicate MATEMATICA LICEO SCIENTIFICO opzione delle scienze applicate MATEMATICA PROFILO GENERALE E COMPETENZE Al termine del percorso liceale lo studente dovrà padroneggiare i principali concetti e metodi di base della matematica,

Dettagli

DIPARTIMENTO DI MATEMATICA Liceo scientifico e liceo scientifico delle scienze applicate

DIPARTIMENTO DI MATEMATICA Liceo scientifico e liceo scientifico delle scienze applicate 1. Profilo generale DIPARTIMENTO DI MATEMATICA Liceo scientifico e liceo scientifico delle scienze applicate PRIMO BIENNIO L insegnamento di matematica nel primo biennio ha come finalità l acquisizione

Dettagli

L analisi dei dati. Capitolo 4. 4.1 Il foglio elettronico

L analisi dei dati. Capitolo 4. 4.1 Il foglio elettronico Capitolo 4 4.1 Il foglio elettronico Le più importanti operazioni richieste dall analisi matematica dei dati sperimentali possono essere agevolmente portate a termine da un comune foglio elettronico. Prenderemo

Dettagli

I punteggi zeta e la distribuzione normale

I punteggi zeta e la distribuzione normale QUINTA UNITA I punteggi zeta e la distribuzione normale I punteggi ottenuti attraverso una misurazione risultano di difficile interpretazione se presi in stessi. Affinché acquistino significato è necessario

Dettagli

Archivio CD. Fondamenti di Programmazione

Archivio CD. Fondamenti di Programmazione Archivio CD Una persona possiede un certo numero di CD musicali e desidera organizzare il proprio archivio tramite uno strumento software. Il programma deve permettere: - l inserimento di un nuovo CD nella

Dettagli

Lezione 5 Introduzione a Microsoft Excel Parte Seconda

Lezione 5 Introduzione a Microsoft Excel Parte Seconda Lezione 5 Introduzione a Microsoft Excel Parte Seconda Utilizzo delle funzioni... 1 Utilizzo di intervalli nelle formule... 2 Riferimenti di cella e di intervallo... 5 Indirizzi assoluti, relativi e misti...

Dettagli

Aplusix II. Manuale dell utente

Aplusix II. Manuale dell utente Aplusix II Versione 1.2 Febbraio 2009 Manuale dell utente INDICE 1. TAVOLA SINOTTICA 2 2. INTRODUZIONE 3 3. ACCESSO 3 4. PRIMO UTILIZZO 3 5. SECONDO UTILIZZO 5 6. TERZO UTILIZZO 6 7. L ATTIVITA ESERCITAZIONE

Dettagli

OBIETTIVI SPECIFICI DI APPRENDIMENTO

OBIETTIVI SPECIFICI DI APPRENDIMENTO Disciplina:... Anno scolastico: 20.../20... Classe/i :... Docente:... DI APPRENDIMENTO SEZIONE 1 Premesse matematiche Nozioni fondamentali sui sistemi di numerazione Sistemi di numerazione in base diversa

Dettagli

Gli eventi sono stati definiti come i possibili risultati di un esperimento. Ogni evento ha una probabilità

Gli eventi sono stati definiti come i possibili risultati di un esperimento. Ogni evento ha una probabilità Probabilità Probabilità Gli eventi sono stati definiti come i possibili risultati di un esperimento. Ogni evento ha una probabilità Se tutti gli eventi fossero ugualmente possibili, la probabilità p(e)

Dettagli

1 Grafico di una funzione reale 1. 2 Funzioni elementari 2 2.1 Funzione potenza... 2 2.2 Funzione esponenziale... 3 2.3 Funzione logaritmica...

1 Grafico di una funzione reale 1. 2 Funzioni elementari 2 2.1 Funzione potenza... 2 2.2 Funzione esponenziale... 3 2.3 Funzione logaritmica... UNIVR Facoltà di Economia Sede di Vicenza Corso di Matematica Funzioni reali di variabile reale Indice Grafico di una funzione reale 2 Funzioni elementari 2 2. Funzione potenza................................................

Dettagli

FACOLTA DI PSICOLOGIA Scienze della Mente TESINA DI INFORMATICA. Fossataro Carlotta Di Rienzo Ariana Basso Alessandra Marchetto Helena

FACOLTA DI PSICOLOGIA Scienze della Mente TESINA DI INFORMATICA. Fossataro Carlotta Di Rienzo Ariana Basso Alessandra Marchetto Helena FACOLTA DI PSICOLOGIA Scienze della Mente TESINA DI INFORMATICA Fossataro Carlotta Di Rienzo Ariana Basso Alessandra Marchetto Helena SPSS INDICE INTRODUZIONE...3 FINESTRE...4 EDITOR DEI DATI...4 OUTPUT...11

Dettagli

Codifica binaria e algebra di Boole

Codifica binaria e algebra di Boole Codifica binaria e algebra di Boole Corso di Programmazione A.A. 2008/09 G. Cibinetto Contenuti della lezione Codifica binaria dell informazione Numeri naturali, interi, frazionari, in virgola mobile Base

Dettagli

1. Richiami di Statistica. Stefano Di Colli

1. Richiami di Statistica. Stefano Di Colli 1. Richiami di Statistica Metodi Statistici per il Credito e la Finanza Stefano Di Colli Dati: Fonti e Tipi I dati sperimentali sono provenienti da un contesto delimitato, definito per rispettare le caratteristiche

Dettagli