Dai dati al modello teorico
|
|
|
- Enrico Cavalli
- 10 anni fa
- Visualizzazioni
Transcript
1 Dai dati al modello teorico Analisi descrittiva univariata in R 1 Un po di terminologia Popolazione: (insieme dei dispositivi che verranno messi in produzione) finito o infinito sul quale si desidera avere informazioni. insieme Campione casuale: (prototipi) sottoinsieme della popolazione scelta in modo casuale. Unità statistica o campionaria: (un prototipo) un elemento del campione casuale Taglia del campione: (numero di prototipi realizzati) numero di unità statistiche Statistica descrittiva Descrizione per via grafica Descrizione per via numerica Carattere (tempo di rottura del dispositivo) ogni aspetto elementare oggetto di rilevazione nelle unità statistiche della popolazione (e quindi del campione) Modalità o classe di modalità: i diversi modi con cui il carattere si presenta nelle unità statistiche della popolazione (e quindi del campione) 2 1
2 Se si ha un campione casuale di tempi di vita, come si perviene ad un modello teorico? Esempio: si misura il tempo di vita di 20 lampadine, che è stato riportato di seguito Stimare la funzione guasto, la funzione di affidabilità, la densità di guasto, il tempo medio di vita. Determinare quale modello teorico potrebbe descrivere il tempo di vita. 10,45 2,30 19,71 49,81 46,89 69,08 0,32 11,36 43,20 3,24 6,10 1,01 0,71 3,89 5,38 0,37 7,29 9,12 17,52 9,60 dati<-c(10.45,2.30,19.71,49.81,46.89,69.08,0.32,11.36,43.20,3.24,6.10,1.01,0.71,3.89, ,0.37,7.29,9.12,17.52,9.60) hist(dati, col= blue,labels=t, freq=f,ylim=range(0,0.08)) - Labels: Consente di etichettare le barre Sui parametri di input - freq: Consente di scegliere se rappresentare la freq. assoluta oppure la densità E possibile manipolare i valori calcolati dalla funzione hist() 3 Per lavorare con i vettori generati, usare la sintassi Nell esempio: NOMEHISTOGRAMMA$NOMEVETTORE fornisce le frequenze relative. Notare che le frequenze relative sono diverse dai dati forniti nel vettore density, che invece sono calcolati dividendo le frequenze relative per l ampiezza delle classi. 4 2
3 La funzione density() delinea l andamento della distribuzione dei dati una volta suddivisi in classi. Il comando rug(dati) aggiunge il grafico dot-plotall istogramma. Nei grafici la scelta delle classi è stata automatica. Potrebbe essere necessario scegliere un numero di classi diverso. 5 hist(dati,prob=true, col='blue',labels=t,ylim=range(0,0.08), breaks=4) Parametro di input: -Breaks Se intero, specifica Il numero delle classi Non sempre la scelta del numero delle classi produce un effetto sul grafico. Questo dipende dall algoritmo implementato. A volte si rende necessario immettere direttamente gli estremi delle classi. E possibile che il numero delle classi prodotto sia diverso da quello richiesto. 6 3
4 hist(dati,prob=true, col='blue',labels=t,ylim=range(0,0.08), + breaks=c(0,15,30,45,60,75)) Parametro di input: -Breaks Se contiene un vettore, specifica gli estremi delle classi Ad esempio con questa scelta delle classi, il carattere bimodale della stima si attenua. 7 Stimare il tempo medio. Per calcolare il tempo medio di vita, è possibile usare l indice di sintesi media campionaria x 1 n xi n i = 1 = Alternativamente: La media rappresenta un indice di posizione del campione. Rappresenta il suo baricentro, immaginando di assegnare ad ogni elemento del campione casuale peso 1/n. 8 4
5 Altri indici Deviazione standard campionaria. Indice di variabilità dei dati. Campo di variazione Indice di variabilità dei dati. Quartili In particolare la mediana è un indice di posizione più robusto della media. La differenza tra il terzo ed il primo quartile è nota come IQR (interquartile range): ed è un altro indice di variabilità dei dati. Esso rappresenta un indice più robusto rispetto alla deviazione standard. Robustezza di un indice= stabilità rispetto alla presenza di outliers. OUTLIERS? 9 Alla Ricerca degli Outliers. Il BOX - PLOT +/ IQR/sqrt(n) OUTLIERS 10 5
6 Specie in presenza di outliers, può essere utile conoscerne il loro valore e la loro collocazione all interno del campione casuale. Con la seguente sintassi, si ottengono le seguenti informazioni: outliers<-boxplot(dati) outliers $stats [,1] [1,] [2,] [3,] [4,] [5,] Gli estremi necessari alla costruzione del box-plot $n [1] 20 Gli outliers $out [1] Per gestire gli outliers: outliers$out [1] Per conoscere la loro posizione nel campione casuale: dati %in% outliers$out [1] FALSE FALSE FALSE TRUE TRUE TRUE FALSE FALSE TRUE FALSE FALSE FALSE [13] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE 11 Indici di Asimmetria Il confronto tra media e mediana non garantisce la caratterizzazione dell asimmetria. Quello che segue è un controesempio. Supponiamo di costruire i seguenti sets di dati: primo<-c(1,rep(2,2),rep(3,3),rep(4,4),rep(5,5),rep(6,6),rep(7,7)) primo [1] secondo<-c(rep(1,7),rep(2,6),rep(3,5),rep(4,4),rep(5,3),rep(6,2),rep(7,1)) secondo [1]
7 summary(primo) Min. 1st Qu. Median Mean3rd Qu. Max summary(secondo) Min. 1st Qu. Median Mean3rd Qu. Max Le due distribuzioni stesso segno di media mediana=0 Eppure guardando i due istogrammi si vede che le code delle due distribuzioni sono diverse Usando la function skewnessdella libreria e1071 si ha: skewness(primo) [1] skewness(secondo) [1] Indice di curtosi E un indice che misura la variabilità della distribuzione del campione rispetto alla gaussiana standard. 0 distribuzione appuntita =0 distribuzione come quella gaussiana <0 distribuzione piatta kurtosis(dati) [1] Tale indice ha significato soprattutto per quelle distribuzioni con indice di simmetria prossimo allo zero. 14 7
8 Coefficiente di variazione Una proprietà desiderabile per un indice di variabilità è che non dipenda dalla unità di misura in cui è espresso il carattere. Es: altezza di 5 studenti: 172, 175, 176, 178, 180 La media risulta essere cm e la devstandard risulta essere Se esprimiamo gli indici in metri, la media diviene e la dev.standard Esempio: Un processo industriale produce bustine di camomilla del peso medio di 2 grammi. La dev. standard è Un secondo processo industriale produce confezioni di pasta alimentare del peso di 500 grammi. La dev. standard è 2.7. Quale tra i due processi è più preciso? Questa comparazione può essere effettuata in modo appropriato esprimendo la deviazione standard di ciascun processo come percentuale della rispettiva media = = CV = s x sd(dati)/mean(dati) [1] = 1 la media non è un indice corretto = 0 la media è un indice perfetto 0.5 la media non è un indice corretto 0.5 la media è un indice corretto In che senso la media non è un indice corretto? ERRORE STANDARD e= s n Misura la dispersione della media campionaria ossia è una misura della sua imprecisione sd(dati)/sqrt(20) [1]
9 Stima DISTRIBUZIONE EMPIRICA CUMULATIVA Per stimare la funzione di guasto, è possibile usare la functionecdf() che stima la funzione di distribuzione empirica cumulativa Per conoscere i valori dei gradini: Teoricamente In R: ) F x ( ) num. dati x = N cf<-ecdf(dati) cf(sort(dati)) [1] [16] sort(dati) [1] [13] Per stimare la funzione di affidabilità: Stima FUNZIONE DI AFFIDABILITA plot(sort(dati),1-cf(sort(dati)),type='s') title('funzione di affidabilità') points(sort(dati),1-cf(sort(dati)),pch=20) 18 9
10 Se i dati sono in Tabella. Età in mesi Frequenza dei guasti TOTALE 262 Le formule relative a media e varianza vanno corrette con i centri delle classi: k k fi 2 2 fi x = ci e s = ( ci x) n n i= 1 i= 1 Per il loro calcolo conviene usare un ciclo forin R 19 Per calcolare la media classi<-c(0,26.99,54.99,82.99,110.99,138.99,166.99,194.99,222.99,250.99) freq<-c(127,70,27,15,11,7,3,1,1) sum<-0 for(i in 1:9){ + centro<-(classi[i]+classi[i+1])/2 + sum<-sum+centro*freq[i]/262 + } sum [1] Per calcolare la VARIANZA sum1<-0 for(i in 1:9){ + centro<-(classi[i]+classi[i+1])/2 + sum1<-sum1+(centro-sum)^2*freq[i]/262 + } sum1 [1]
11 Per calcolare la Mediana e i QUARTILI Età in mesi Frequenza dei guasti TOTALE 262 Frequenza cumulata 0,48 0,75 0,85 0,91 0,95 0,98 0,992 0, freqcumulate<-cumsum(freq)/262 cumsum(freq)/262 [1] [8] Va prima determinata la classe mediana (ossia quella contenente la frequenza cumulata 0.5, oppure 0.25/0.75 per i quartili) e poi va intersecata la retta y=0.5 con quella ottenuta Interpolando linearmente i valori della frequenza cumulata nella classe così determinata. Per la mediana, la classe di riferimento è (26.99;54.99) 21 Pertanto y = ( x 26.99) y= 0.50 x=29.96 Più in generale risulta 0.50 F( c ) M = c + ( c c ) i i i+ 1 i F( ci+ 1) F( ci) 0.25 F( c ) Q = c + ( c c ) i 1 i i+ 1 i F( ci+ 1) F( ci) 0.75 F( c ) Q = c + ( c c ) i 3 i i+ 1 i F( ci+ 1) F( ci) Qui ( c, c i i+ 1 ] denota la classe contenente rispettivamente M, Q, Q 1 3 Nella tabella, i valori della funzione di ripartizione empirica vengono assegnati all estremo destro dell intervallo. Si assume F( c ) = 0 1 Età in mesi Frequenza dei guasti , , , , , , , , TOTALE
12 Per costruire il Box Plot con questi valori Senza ricorrere a specifici pacchetti software Costruire un vettore dove inserire il min, il maxdei dati e i quartili. Fornire quel vettore come input alla function boxplot() dati<-c(0, 14.1,29.96,54.99,250.99) boxplot(dati) In questo caso, il maxviene segnalato come outliernel grafico 23 Come ripartire i dati in tabella Specialmente in presenza di database estesi, può essere utile costruire una tabella delle frequenze come quella che abbiamo appena visto. Questa tabella si riferisce a un dataset disponibile in rete che riguarda tempi di attesa ad un centralino telefonico. Come procedere 1) Copiare ed incollare il contenuto del file tempi.txt in un file 2) Salvare il file con estensione tempi.txt sul desktop e aggiungere il nome del vettore alla colonna (ad esempio tempi) 3) Spostarsi sulla cartella setwd( C:/Users/ /Desktop ) tempi<-read.table('c:/users/ /Desktop/tempi.txt,header=TRUE) 4) E stato creato un vettore tempicontenente i dati attach(tempi) 5) Stabilire gli estremi delle classi al seguente modo: 24 12
13 Passo 1: Stabilire il numero delle classi Una regola empirica consiste nel determinare quel valore di ktale che 2^k n In tal caso k=9 poiché length(tempi) [1] 262 Passo 2: Determinare l ampiezza delle classi max min h k e 2^8=256, 2^9=512 diff(range(tempi))/9 [1] Il valore viene arrotondato a 28. Passo 3: Determinare gli estremi delle classi Arrotondando l ampiezza della classe, l unione delle classi copre un intervallo di ampiezza maggiore del campo di variazione Unione classi= 252 Campo di variazione= 249 Siccome 28 9= , la quantità = va equamente ripartita a sinistra del minimo e a destra del massimo. 25 Ossia min( tempi) = estremo sinistro I classe Quindi la prima classe è ( , = ) La seconda classe è ( , =.) Per costruire il vettore degli estremi in R, bisogna prima inizializzare un vettore numerico: clas<-numeric(10) Poi calcolare gli estremi delle classi e memorizzarli in clas: clas[1]< for(i in 2:10) { + clas[i]=clas[i-1]+28 + } clas [1] [10] clas[1]<
14 Infine, ripartire i dati nelle classi con la function cut() tempi.cut=cut(tempi,clas,right=true) Calcolare le frequenze di occorrenza nelle classi con la function table() tempi.freq=table(tempi.cut) tempi.freq tempi.cut (0,27] (27,55] (55,83] (83,111] (111,139] (139,167] (167,195] (195,223] (223,251] 1 1 xx<-cbind(tempi.freq) Istruzione per assegnare al vettore XX le frequenze assolute 27 Ad esempio per La funzione di ripartizione plot(clas[2:10],cumsum(xx),type='s',col='red',lwd=4, + main='frequenze cumulate',xlab='tempi',ylab='freq. ass cum') 28 14
Elementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 5-Indici di variabilità (vers. 1.0c, 20 ottobre 2015) Germano Rossi 1 [email protected] 1 Dipartimento di Psicologia, Università di Milano-Bicocca
Statistica descrittiva
Statistica descrittiva La statistica descrittiva mette a disposizione il calcolo di indicatori sintetici che individuano, con un singolo valore, proprieta` statistiche di un campione/popolazione rispetto
Grafici delle distribuzioni di frequenza
Grafici delle distribuzioni di frequenza L osservazione del grafico può far notare irregolarità o comportamenti anomali non direttamente osservabili sui dati; ad esempio errori di misurazione 1) Diagramma
Indici di dispersione
Indici di dispersione 1 Supponiamo di disporre di un insieme di misure e di cercare un solo valore che, meglio di ciascun altro, sia in grado di catturare le caratteristiche della distribuzione nel suo
LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE
LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE DESCRIZIONE DEI DATI DA ESAMINARE Sono stati raccolti i dati sul peso del polmone di topi normali e affetti da una patologia simile
LABORATORIO EXCEL XLSTAT 2008 SCHEDE 2 e 3 VARIABILI QUANTITATIVE
Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) LABORATORIO EXCEL
Corso integrato di informatica, statistica e analisi dei dati sperimentali Altri esercizi_esercitazione V
Corso integrato di informatica, statistica e analisi dei dati sperimentali Altri esercizi_esercitazione V Sui PC a disposizione sono istallati diversi sistemi operativi. All accensione scegliere Windows.
Un po di statistica. Christian Ferrari. Laboratorio di Matematica
Un po di statistica Christian Ferrari Laboratorio di Matematica 1 Introduzione La statistica è una parte della matematica applicata che si occupa della raccolta, dell analisi e dell interpretazione di
Facciamo qualche precisazione
Abbiamo introdotto alcuni indici statistici (di posizione, di variabilità e di forma) ottenibili da Excel con la funzione Riepilogo Statistiche Facciamo qualche precisazione Al fine della partecipazione
La distribuzione Gaussiana
Università del Piemonte Orientale Corso di Laurea in Biotecnologie Corso di Statistica Medica La distribuzione Normale (o di Gauss) Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione
IN MATLAB distribuzione di frequenza. >> x(1)=7.5; >> for i=2:7 x(i)=x(i-1)+5; end. IN MATLAB distribuzione di frequenza
IN MATLAB distribuzione di frequenza 2-1 4. Usare la function histc(dati,x) 2-2 1. Riportare i dati in un file (ad esempio dati.mat); 2. load ascii dati: viene creata una variabile dati contenente il campione;
Prof.ssa Paola Vicard
Questa nota consiste perlopiù nella traduzione da Descriptive statistics di J. Shalliker e C. Ricketts, 2000, University of Plymouth Consideriamo come esempio il data set contenuto nel foglio excel esercizio2_dati.xls.
OCCUPATI SETTORE DI ATTIVITA' ECONOMICA
ESERCIZIO 1 La tabella seguente contiene i dati relativi alla composizione degli occupati in Italia relativamente ai tre macrosettori di attività (agricoltura, industria e altre attività) negli anni 1971
Analisi di dati di frequenza
Analisi di dati di frequenza Fase di raccolta dei dati Fase di memorizzazione dei dati in un foglio elettronico 0 1 1 1 Frequenze attese uguali Si assuma che dalle risposte al questionario sullo stato
Come descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva. Brugnaro Luca
Come descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva Brugnaro Luca Progetto formativo complessivo Obiettivo: incrementare le competenze degli operatori sanitari nelle metodiche
Prova di autovalutazione Prof. Roberta Siciliano
Prova di autovalutazione Prof. Roberta Siciliano Esercizio 1 Nella seguente tabella è riportata la distribuzione di frequenza dei prezzi per camera di alcuni agriturismi, situati nella regione Basilicata.
Esercitazione di riepilogo 23 Aprile 2013
Esercitazione di riepilogo 23 Aprile 2013 Grafici Grafico a barre Servono principalmente per rappresentare variabili (caratteri) qualitative, quantitative e discrete. Grafico a settori circolari (torta)
Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)
Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B Eventi indipendenti: un evento non influenza l altro Eventi disgiunti: il verificarsi di un evento esclude l altro Evento prodotto:
Prof.ssa Paola Vicard
Questa nota consiste perlopiù nella traduzione (con alcune integrazioni) da Descriptive statistics di J. Shalliker e C. Ricketts, 2000, University of Plymouth Consideriamo i dati nel file esercizio10_dati.xls.
ESERCIZI SVOLTI PER LA PROVA DI STATISTICA
ESERCIZI SVOLTI PER LA PROVA DI STATISTICA Stefania Naddeo (anno accademico 4/5) INDICE PARTE PRIMA: STATISTICA DESCRITTIVA. DISTRIBUZIONI DI FREQUENZA E FUNZIONE DI RIPARTIZIONE. VALORI CARATTERISTICI
I ESERCITAZIONE. Gruppo I 100 individui. Trattamento I Nuovo Farmaco. Osservazione degli effetti sul raffreddore. Assegnazione casuale
I ESERCITAZIONE ESERCIZIO 1 Si vuole testare un nuovo farmaco contro il raffreddore. Allo studio partecipano 200 soggetti sani della stessa età e dello stesso sesso e con caratteristiche simili. i) Che
ESERCIZIO N 4. Fatturato Supermercati [0;500) 340 [500;1000) 368 [1000;5000) 480 [5000;10000) 37 [10000;20000) 15 taglia = 1240
ESERCIZIO N 4 Fatturato Supermercati [0;500) 340 [500;1000) 368 [1000;5000) 480 [5000;10000) 37 [10000;20000) 15 taglia = 1240 PUNTO a CALCOLO MODA E QUARTILI La moda rappresenta quell'elemento del campione
1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:
Esempi di domande risposta multipla (Modulo II) 1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: 1) ha un numero di elementi pari a 5; 2) ha un numero di elementi
La distribuzione Normale. La distribuzione Normale
La Distribuzione Normale o Gaussiana è la distribuzione più importante ed utilizzata in tutta la statistica La curva delle frequenze della distribuzione Normale ha una forma caratteristica, simile ad una
Laboratorio di ST1 Lezione 2
Laboratorio di ST1 Lezione 2 Claudia Abundo Dipartimento di Matematica Università degli Studi Roma Tre Frequenze in R ESEMPIO Fiori preferiti da n=6 ragazze In R: fiori=c("rosa", "orchidea", "violetta",
Indici (Statistiche) che esprimono le caratteristiche di simmetria e
Indici di sintesi Indici (Statistiche) Gran parte della analisi statistica consiste nel condensare complessi pattern di osservazioni in un indicatore che sia capace di riassumere una specifica caratteristica
Ricerca di outlier. Ricerca di Anomalie/Outlier
Ricerca di outlier Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna Ricerca di Anomalie/Outlier Cosa sono gli outlier? L insieme di dati che sono considerevolmente differenti dalla
Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità C
Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità C Cognome Nome: Part time: Numero di matricola: Diurno: ISTRUZIONI: Il punteggio relativo alla prima parte dell esame viene calcolato
Slide Cerbara parte1 5. Le distribuzioni teoriche
Slide Cerbara parte1 5 Le distribuzioni teoriche I fenomeni biologici, demografici, sociali ed economici, che sono il principale oggetto della statistica, non sono retti da leggi matematiche. Però dalle
Statistica. Alfonso Iodice D Enza [email protected]
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 16 Outline 1 () Statistica 2 / 16 Outline 1 2 () Statistica 2 / 16 Outline 1 2 () Statistica 2 / 16
. A primi passi con microsoft a.ccepss SommarIo: i S 1. aprire e chiudere microsoft access Start (o avvio) l i b tutti i pro- grammi
Capitolo Terzo Primi passi con Microsoft Access Sommario: 1. Aprire e chiudere Microsoft Access. - 2. Aprire un database esistente. - 3. La barra multifunzione di Microsoft Access 2007. - 4. Creare e salvare
Esercizio 1. Nella Tabella A sono riportati i tempi di percorrenza, in minuti, di un tratto autostradale da parte di 40 autoveicoli.
Esercizio 1 Nella Tabella A sono riportati i tempi di percorrenza, in minuti, di un tratto autostradale da parte di 40 autoveicoli. Tabella A 138 150 144 149 164 132 125 157 161 135 150 145 145 142 156
Interpolazione ed approssimazione di funzioni
Interpolazione ed approssimazione di funzioni Lucia Gastaldi Dipartimento di Matematica, http://dm.ing.unibs.it/gastaldi/ 9 novembre 2007 Outline 1 Polinomi Valutazione di un polinomio Algoritmo di Horner
Statistica 4038 (ver. 1.2)
Statistica 4038 (ver. 1.2) Software didattico per l insegnamento della Statistica SERGIO VENTURINI, MAURIZIO POLI i Il presente software è utilizzato come supporto alla didattica nel corso di Statistica
GUIDA RAPIDA PER LA COMPILAZIONE DELLA SCHEDA CCNL GUIDA RAPIDA PER LA COMPILAZIONE DELLA SCHEDA CCNL
GUIDA RAPIDA BOZZA 23/07/2008 INDICE 1. PERCHÉ UNA NUOVA VERSIONE DEI MODULI DI RACCOLTA DATI... 3 2. INDICAZIONI GENERALI... 4 2.1. Non modificare la struttura dei fogli di lavoro... 4 2.2. Cosa significano
Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione)
Esercitazione #5 di Statistica Test ed Intervalli di Confidenza (per una popolazione) Dicembre 00 1 Esercizi 1.1 Test su media (con varianza nota) Esercizio n. 1 Il calore (in calorie per grammo) emesso
Matematica II: Calcolo delle Probabilità e Statistica Matematica
Matematica II: Calcolo delle Probabilità e Statistica Matematica ELT A-Z Docente: dott. F. Zucca Esercitazione # Esercizi Statistica Descrittiva Esercizio I gruppi sanguigni di persone sono B, B, AB, O,
Analisi della performance temporale della rete
Analisi della performance temporale della rete In questo documento viene analizzato l andamento nel tempo della performance della rete di promotori. Alcune indicazioni per la lettura di questo documento:
Prof.ssa Paola Vicard
DISTRIBUZIONE DI FREQUENZE PER CARATTERI QUALITATIVI Questa nota consiste per la maggior parte nella traduzione (con alcune integrazioni) da Descriptive statistics di J. Shalliker e C. Ricketts, 2000,
USO DI EXCEL CLASSE PRIMAI
USO DI EXCEL CLASSE PRIMAI In queste lezioni impareremo ad usare i fogli di calcolo EXCEL per l elaborazione statistica dei dati, per esempio, di un esperienza di laboratorio. Verrà nel seguito spiegato:
Progettaz. e sviluppo Data Base
Progettaz. e sviluppo Data Base! Progettazione Basi Dati: Metodologie e modelli!modello Entita -Relazione Progettazione Base Dati Introduzione alla Progettazione: Il ciclo di vita di un Sist. Informativo
I file di dati. Unità didattica D1 1
I file di dati Unità didattica D1 1 1) I file sequenziali Utili per la memorizzazione di informazioni testuali Si tratta di strutture organizzate per righe e non per record Non sono adatte per grandi quantità
PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE
Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) PROBABILITÀ -
UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA
Seconda Lezione DISTRIBUZIONE DI FREQUENZA Frequenza assoluta: è il numero puro di casi per quella modalità Frequenze relative: sono il rapporto tra la frequenza assoluta con cui si manifesta una modalità
Strumenti informatici 2.1 - Realizzare grafici e tabelle con Excel e SPSS
Strumenti informatici 2.1 - Realizzare grafici e tabelle con Excel e SPSS Realizzare un grafico con Excel è molto semplice, e permette tutta una serie di varianti. Il primo passo consiste nell organizzare
STATISTICA DESCRITTIVA. Le misure di tendenza centrale
STATISTICA DESCRITTIVA Le misure di tendenza centrale 1 OBIETTIVO Individuare un indice che rappresenti significativamente un insieme di dati statistici. 2 Esempio Nella tabella seguente sono riportati
2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale
BIOSTATISTICA 2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health [email protected]
Traccia delle lezioni svolte in laboratorio Excel 2003. Excel 2003 Excel 2010
Traccia delle lezioni svolte in laboratorio Excel 2003 Excel 2003 Excel 2010 INTRODUZIONE A EXCEL EXCEL è un programma di Microsoft Office che permette di analizzare grandi quantità di dati (database)
Corso di. Dott.ssa Donatella Cocca
Corso di Statistica medica e applicata Dott.ssa Donatella Cocca 1 a Lezione Cos'è la statistica? Come in tutta la ricerca scientifica sperimentale, anche nelle scienze mediche e biologiche è indispensabile
Excel Terza parte. Excel 2003
Excel Terza parte Excel 2003 TABELLA PIVOT Selezioniamo tutti i dati (con le relative etichette) Dati Rapporto tabella pivot e grafico pivot Fine 2 La tabella pivot viene messa di default in una pagina
Come costruire una distribuzione di frequenze per caratteri quantitativi continui
Come costruire una distribuzione di frequenze per caratteri quantitativi continui Consideriamo i dati contenuti nel primo foglio di lavoro (quello denominato dati) del file esempio2.xls. I dati si riferiscono
Statistica descrittiva
Corso di Laurea in Ingegneria per l Ambiente ed il Territorio Corso di Costruzioni Idrauliche A.A. 2004-05 www.dica.unict.it/users/costruzioni Statistica descrittiva Ing. Antonino Cancelliere Dipartimento
Studente: SANTORO MC. Matricola : 528
CORSO di LAUREA in INFORMATICA Corso di CALCOLO NUMERICO a.a. 2004-05 Studente: SANTORO MC. Matricola : 528 PROGETTO PER L ESAME 1. Sviluppare una versione dell algoritmo di Gauss per sistemi con matrice
Stima per intervalli Nei metodi di stima puntuale è sempre presente un ^ errore θ θ dovuto al fatto che la stima di θ in genere non coincide con il parametro θ. Sorge quindi l esigenza di determinare una
Inferenza statistica. Statistica medica 1
Inferenza statistica L inferenza statistica è un insieme di metodi con cui si cerca di trarre una conclusione sulla popolazione sulla base di alcune informazioni ricavate da un campione estratto da quella
Tabella 1 Figura 1 Figura 2 Figura 3 Figura 4
Tabella 1 La costruzione dei grafici in EXCEL 2007 privilegia l uso del mouse come d uso in tutto Office 2007. Rivedi nel testo 1 le motivazioni della scelta del tipo di un grafico; mentre in queste brevi
ESERCIZI DI STATISTICA DESCRITTIVA
ESERCIZI DI STATISTICA DESCRITTIVA ES1 Data la seguente serie di dati su Sesso e Altezza di 8 pazienti, riempire opportunamente due tabelle per rappresentare le distribuzioni di frequenze dei due caratteri,
CORSO DI MISURE ANALISI DEI SEGNALI NEL DOMINIO DEL TEMPO
CORSO DI MISURE ANALISI DEI SEGNALI NEL DOMINIO DEL EMPO ing Emanuele Zappa SEGNALI: grandezze di base nel dominio del tempo: Ampiezza picco-picco (pk.pk) Ampiezza massima positiva empo Ampiezza massima
MODULO 4: FOGLIO ELETTRONICO (EXCEL)
MODULO 4: FOGLIO ELETTRONICO (EXCEL) 1. Introduzione ai fogli elettronici I fogli elettronici sono delle applicazioni che permettono di sfruttare le potenzialità di calcolo dei Personal computer. Essi
Statistica. Lezione 6
Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 6 a.a 011-01 Dott.ssa Daniela Ferrante
IL SOFTWARE EXCEL 4 I GRAFICI
IL SOFTWARE EXCEL 4 I GRAFICI I GRAFICI E se questi dati volessimo trasformarli in grafico? I GRAFICI: I GRAFICI: Ogni tipo di grafico ha una sua peculiarità. Dal punto di vista statistico i grafici NON
STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione2: 04-03-2005
esercitazione 2 p. 1/12 STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione2: 04-03-2005 Luca Monno Università degli studi di Pavia [email protected] http://www.lucamonno.it
Prof.ssa Paola Vicard
Questa nota consiste perlopiù nella traduzione da Descriptive statistics di J. Shalliker e C. Ricketts, 2000, University of Plymouth Consideriamo come esempio il data set contenuto nel foglio excel esercizio1_dati.xls.
Esplorazione dei dati
Esplorazione dei dati Introduzione L analisi esplorativa dei dati evidenzia, tramite grafici ed indicatori sintetici, le caratteristiche di ciascun attributo presente in un dataset. Il processo di esplorazione
EXCEL PER WINDOWS95. sfruttare le potenzialità di calcolo dei personal computer. Essi si basano su un area di lavoro, detta foglio di lavoro,
EXCEL PER WINDOWS95 1.Introduzione ai fogli elettronici I fogli elettronici sono delle applicazioni che permettono di sfruttare le potenzialità di calcolo dei personal computer. Essi si basano su un area
ESAME DI STATISTICA Nome: Cognome: Matricola:
ESAME DI STATISTICA Nome: Cognome: Matricola: ISTRUZIONI: Per la prova è consentito esclusivamente l uso di una calcolatrice tascabile, delle tavole della normale e della t di Student. I risultati degli
EPG Metodologia della ricerca e Tecniche Multivariate dei dati. Dott.ssa Antonella Macchia E-mail: [email protected]. www.psicometria.unich.
EPG Metodologia della ricerca e Tecniche Multivariate dei dati Dott.ssa Antonella Macchia E-mail: [email protected] www.psicometria.unich.it GIORNI E ORARI LEZIONI Sabato 01-03-2014 h 08:00-12:00 Sabato
Statistica descrittiva: prime informazioni dai dati sperimentali
SECONDO APPUNTAMENTO CON LA SPERIMENTAZIONE IN AGRICOLTURA Statistica descrittiva: prime informazioni dai dati sperimentali La statistica descrittiva rappresenta la base di partenza per le applicazioni
Misure della dispersione o della variabilità
QUARTA UNITA Misure della dispersione o della variabilità Abbiamo visto che un punteggio di per sé non ha alcun significato e lo acquista solo quando è posto a confronto con altri punteggi o con una statistica.
Capitolo 12 La regressione lineare semplice
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara
CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI
VERO FALSO CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI 1. V F Un ipotesi statistica è un assunzione sulle caratteristiche di una o più variabili in una o più popolazioni 2. V F L ipotesi nulla unita
Fogli Elettronici: MS Excel
Fogli Elettronici: MS Excel Informatica - A.A. 2010/2011 - Excel 7.0 Foglio Elettronico Un foglio elettronico (o spreadsheet) è un software applicativo nato dall esigenza di: organizzare insiemi di dati
Modulo: Fogli elettronici
Corso: Abilità Informatiche Modulo: Fogli elettronici Pagina 1 di 18 Autori del Modulo: Bruno fadini; Pino Cepparulo Presentazione del Modulo: Versione Italiano Il modulo, corrispondente al modulo 4 dell'ecdl
Corso di Laurea in Ingegneria Informatica Anno Accademico 2014/2015 Calcolo delle Probabilità e Statistica Matematica
Corso di Laurea in Ingegneria Informatica Anno Accademico 2014/2015 Calcolo delle Probabilità e Statistica Matematica Nome N. Matricola Ancona, 14 luglio 2015 1. Tre macchine producono gli stessi pezzi
Il sofware è inoltre completato da una funzione di calendario che consente di impostare in modo semplice ed intuitivo i vari appuntamenti.
SH.MedicalStudio Presentazione SH.MedicalStudio è un software per la gestione degli studi medici. Consente di gestire un archivio Pazienti, con tutti i documenti necessari ad avere un quadro clinico completo
Excel. A cura di Luigi Labonia. e-mail: [email protected]
Excel A cura di Luigi Labonia e-mail: [email protected] Introduzione Un foglio elettronico è un applicazione comunemente usata per bilanci, previsioni ed altri compiti tipici del campo amministrativo
Università di L Aquila Facoltà di Biotecnologie Agro-alimentari
RIFERIMENTI Università di L Aquila Facoltà di Biotecnologie Agro-alimentari Esame di Laboratorio di informatica e statistica Parte 3 (versione 1.0) Il riferimento permette di identificare univocamente
Gestione ed analisi di base dati nell epidemiologia. delle malattie infettive
Università degli Studi di Torino - Facoltà di Medicina Veterinaria Laboratorio di epidemiologia delle malattie infettive Scuola Specializzazione in Sanità Animale, Allevamento e Produzioni Zootecniche
Elementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 12-Il t-test per campioni appaiati vers. 1.2 (7 novembre 2014) Germano Rossi 1 [email protected] 1 Dipartimento di Psicologia, Università di Milano-Bicocca
EXCEL FUNZIONI PRINCIPALI
EXCEL FUNZIONI PRINCIPALI Funzione SE() Sintassi: SE(VERIFICA, VALORE SE VERO, VALORE SE FALSO): verifica un valore e ritorna una risposta in base al risultato vero/falso Esempio: =SE(A2=15; "OK"; "NO")
2.2.2.1 Identificare le diverse parti di una finestra: barra del titolo, barra dei menu, barra degli strumenti, barra di stato, barra di scorrimento.
Uso del computer e gestione dei file 57 2.2.2.1 Identificare le diverse parti di una finestra: barra del titolo, barra dei menu, barra degli strumenti, barra di stato, barra di scorrimento. All interno
MANUALE PARCELLA FACILE PLUS INDICE
MANUALE PARCELLA FACILE PLUS INDICE Gestione Archivi 2 Configurazioni iniziali 3 Anagrafiche 4 Creazione prestazioni e distinta base 7 Documenti 9 Agenda lavori 12 Statistiche 13 GESTIONE ARCHIVI Nella
Pro e contro delle RNA
Pro e contro delle RNA Pro: - flessibilità: le RNA sono approssimatori universali; - aggiornabilità sequenziale: la stima dei pesi della rete può essere aggiornata man mano che arriva nuova informazione;
Excel Whatisand whatisnot. Introduzione Funzioni Formule Riferimenti a celle Grafici I problemi ed excel
Excel Whatisand whatisnot Introduzione Funzioni Formule Riferimenti a celle Grafici I problemi ed excel Prima di stampare pensa all ambiente think to environment before printing Introduzione ai primi concetti
Analisi di scenario File Nr. 10
1 Analisi di scenario File Nr. 10 Giorgio Calcagnini Università di Urbino Dip. Economia, Società, Politica [email protected] http://www.econ.uniurb.it/calcagnini/ http://www.econ.uniurb.it/calcagnini/forecasting.html
Il foglio elettronico. Excel 2013 3 PARTE
Il foglio elettronico Excel 2013 3 PARTE Versione 15/10/2013 Le tabelle PIVOT Tabelle PIVOT Le tabelle pivot sono tabelle interattive che consentono all'utente di raggruppare e riassumere grandi quantità
Metodi Matematici e Informatici per la Biologia----31 Maggio 2010
Metodi Matematici e Informatici per la Biologia----31 Maggio 2010 COMPITO 4 (3 CREDITI) Nome: Cognome: Matricola: ISTRUZIONI Gli esercizi che seguono sono di tre tipi: Domande Vero/Falso: cerchiate V o
Analisi sensitività. Strumenti per il supporto alle decisioni nel processo di Valutazione d azienda
Analisi sensitività. Strumenti per il supporto alle decisioni nel processo di Valutazione d azienda Premessa Con l analisi di sensitività il perito valutatore elabora un range di valori invece di un dato
Elementi di Psicometria
Elementi di Psicometria E2-Riepilogo finale vers. 1.2 Germano Rossi 1 [email protected] 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2010-2011 G. Rossi (Dip. Psicologia) ElemPsico 2010-2011
Il concetto di valore medio in generale
Il concetto di valore medio in generale Nella statistica descrittiva si distinguono solitamente due tipi di medie: - le medie analitiche, che soddisfano ad una condizione di invarianza e si calcolano tenendo
[email protected] http://www.disp.uniroma2.it/users/iovanella Verifica di ipotesi
[email protected] http://www.disp.uniroma2.it/users/iovanella Verifica di ipotesi Idea di base Supponiamo di avere un idea del valore (incognito) di una media di un campione, magari attraverso
Il calendario di Windows Vista
Il calendario di Windows Vista Una delle novità introdotte in Windows Vista è il Calendario di Windows, un programma utilissimo per la gestione degli appuntamenti, delle ricorrenze e delle attività lavorative
Potenzialità statistiche Excel
Potenzialità statistiche Excel INTRODUZIONE A MS EXCEL Prof. Raffaella Folgieri Email [email protected] Fogli di calcolo MS Excel Prof. Folgieri 1 I Fogli Elettronici (Microsoft Excel) Sono strumenti
CREAZIONE DI UN DATABASE E DI TABELLE IN ACCESS
CONTENUTI: CREAZIONE DI UN DATABASE E DI TABELLE IN ACCESS Creazione database vuoto Creazione tabella Inserimento dati A) Creazione di un database vuoto Avviamo il programma Microsoft Access. Dal menu
[ Analisi della. concentrazione] di Luca Vanzulli. Pag. 1 di 1
[ Analisi della concentrazione] di Luca Vanzulli Pag. 1 di 1 LA CONCENTRAZIONE NELL ANALISI DELLE VENDITE L analisi periodica delle vendite rappresenta un preziosissimo indicatore per il monitoraggio del
LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010
LEZIONE 3 "Educare significa aiutare l'animo dell'uomo ad entrare nella totalità della realtà. Non si può però educare se non rivolgendosi alla libertà, la quale definisce il singolo, l'io. Quando uno
STATISTICA DESCRITTIVA UNIVARIATA
Capitolo zero: STATISTICA DESCRITTIVA UNIVARIATA La STATISTICA è la scienza che si occupa di fenomeni collettivi che richiedono lo studio di un grande numero di dati. Il termine STATISTICA deriva dalla
Metodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2014-2015 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
Indice Statistiche Univariate Statistiche Bivariate
Indice 1 Statistiche Univariate 1 1.1 Importazione di un file.data.............................. 1 1.2 Medie e variabilità................................... 6 1.3 Distribuzioni di frequenze...............................
