Validazione dei modelli Strumenti quantitativi per la gestione
|
|
|
- Ricardo Papi
- 10 anni fa
- Просмотров:
Транскрипт
1 Validazione dei modelli Strumenti quantitativi per la gestione Emanuele Taufer Validazione dei modelli Il data set Auto I dati Il problema analizzato Validation set approach Diagramma a dispersione Test set e training set Regressione lineare semplice RLS: Test MSE Regressione quadratica Rq: Test MSE Regressione cubica Rc: Test MSE Regressione KNN Input nella funzione knn.reg.1() Calcolare le previsioni con KNN Plot Test MSE e training MSE Plot degli MSE Confronto test MSE Validazione dei modelli In questo esempio consideriamo il data set Auto e: adattiamo un modello di regressione lineare adattiamo una regressione polinomiale adattiamo una regressione KNN (nonparametrica) compariamo i modelli attraverso il calcolo del test MSE Il data set Auto In questo data set vi sono alcuni valori mancanti indicati con?. Nella lettura del file specifichiamo che? indica un valore mancante ( NA ) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/validation.html 1/17
2 Auto< read.csv(" str(auto) ## 'data.frame': 397 obs. of 9 variables: ## $ mpg : num ## $ cylinders : int ## $ displacement: num ## $ horsepower : int ## $ weight : int ## $ acceleration: num ## $ year : int ## $ origin : int ## $ name : Factor w/ 304 levels "amc ambassador brougham",..: I dati Nel data.frame eliminiamo le righe con i valori mancanti attraverso la funzione complete.cases che crea un vettore logico (T,F,T...) con F in corrispondenza di una riga con uno o più valori mancanti Auto< Auto[complete.cases(Auto),] ## elimino le righe con "NA" head(auto) ## mpg cylinders displacement horsepower weight acceleration year origin ## ## ## ## ## ## ## name ## 1 chevrolet chevelle malibu ## 2 buick skylark 320 ## 3 plymouth satellite ## 4 amc rebel sst ## 5 ford torino ## 6 ford galaxie 500 nrow(auto) ## [1] 392 Il problema analizzato file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/validation.html 2/17
3 Poiché l obiettivo di questa esercitazione è l applicazione di tecniche di scelta dei modelli, consideriamo un solo predittore: questo ci permetterà di visualizzare i risultati. Proviamo a prevedere il consumo (mpg) in funzione della potenza del motore (horsepower) L obiettivo è dunque stimare f nel modello Stimiamo f attraverso diversi modelli: 1. regressione lineare semplice, quadratica e cubica (modello parametrico) 2. regressione KNN (non parametrico) Validation set approach Per validare i modelli utilizzeremo il cd validation set approach, in cui una parte dei dati a disposizione è messa da parte e utilizzata come test set. Il test MSE calcolato dai dati test sarà utilizzato per scegliere K nella regressione KNN comparare i diversi modelli stimati Diagramma a dispersione plot(auto$horsepower,auto$mpg) mpg = f(horsepower) + ε file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/validation.html 3/17
4 Test set e training set Il dataset è composto da 392 unità. Suddividiamo casualmente il dataset in due parti: il training set il test set unità unità Individuiamo le unità del training set con la funzione sample(). Il vettore train definito sotto contiene le posizioni selezionate set.seed(1) train=sample(392,292) train file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/validation.html 4/17
5 [1] [18] [35] [52] [69] [86] [103] [120] [137] [154] [171] [188] [205] [222] [239] [256] [273] [290] Costruiamo i due data set, test e training, utilizzando i risultati del campionamento: Auto.test< Auto[ train,] nrow(auto.test) [1] 100 Auto.train< Auto[train,] nrow(auto.train) [1] 292 Regressione lineare semplice rls< lm(mpg~horsepower, data=auto.train) summary(rls) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/validation.html 5/17
6 Call: lm(formula = mpg ~ horsepower, data = Auto.train) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) <2e 16 *** horsepower <2e 16 *** Signif. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: on 290 degrees of freedom Multiple R squared: , Adjusted R squared: F statistic: on 1 and 290 DF, p value: < 2.2e 16 plot(auto$horsepower,auto$mpg) abline(rls,col="red",lwd=2) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/validation.html 6/17
7 RLS: Test MSE Il calcolo del test MSE può essere fatto molto semplicemente definendo la media delle differenze al quadrato tra i valori di mpg nel test set e la loro previsione in base al modello rls test.mse.rls< mean((auto.test$mpg predict(rls,auto.test))^2) test.mse.rls [1] Regressione quadratica rq< lm(mpg~poly(horsepower,2), data=auto.train) summary(rq) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/validation.html 7/17
8 Call: lm(formula = mpg ~ poly(horsepower, 2), data = Auto.train) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) < 2e 16 *** poly(horsepower, 2) < 2e 16 *** poly(horsepower, 2) e 15 *** Signif. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: on 289 degrees of freedom Multiple R squared: , Adjusted R squared: F statistic: on 2 and 289 DF, p value: < 2.2e 16 plot(auto$horsepower,auto$mpg) lines(sort(auto$horsepower),predict(rq,auto)[order(auto$horsepower)],col="red",lwd=2) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/validation.html 8/17
9 Rq: Test MSE test.mse.rq< mean((auto.test$mpg predict(rq,auto.test))^2) test.mse.rq [1] Regressione cubica rc< lm(mpg~poly(horsepower,3), data=auto.train) summary(rc) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/validation.html 9/17
10 Call: lm(formula = mpg ~ poly(horsepower, 3), data = Auto.train) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) <2e 16 *** poly(horsepower, 3) <2e 16 *** poly(horsepower, 3) e 15 *** poly(horsepower, 3) Signif. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: on 288 degrees of freedom Multiple R squared: , Adjusted R squared: F statistic: on 3 and 288 DF, p value: < 2.2e 16 plot(auto$horsepower,auto$mpg) lines(sort(auto$horsepower),predict(rc,auto)[order(auto$horsepower)],col="red",lwd=2) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/validation.html 10/17
11 Rc: Test MSE test.mse.rc< mean((auto.test$mpg predict(rc,auto.test))^2) test.mse.rc ## [1] Regressione KNN Per adattare una regressione KNN ai dati è necessario costruire una funzione ad hoc. La funzione knn.reg.1() disponibile nel file KNNR.r è appropriata per il caso di un solo regressore e automaticamente produce le previsioni per il vettore di dati x.test dato l input x.train e l output y.train. E possibile specificare una lista (o anche solo uno) di valori di K da considerare file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/validation.html 11/17
12 Per indicare ad R dove trovare la funzione knn.reg.1(), copiare il file KNNR.r nella directory di lavoro di R e richiamarlo con la funzione source() knn.reg.1 < function(klist,x.train,y.train,x.test) # Regressione k nearest neighbors # # klist è la lista dei valori K da usare # x.train, y.train: il training set (indipendente dipendente) # x.test: il test set # Output: una matrice di valori previsti per il test set (una colonna per ogni K in kl ist) source("knnr.r") Input nella funzione knn.reg.1() In questo caso, la funzione knn.reg.1(), ci chiede di fornire come input i dati separati in variabile dipendente indipendente, test e training. x.train< Auto.train$horsepower y.train< Auto.train$mpg x.test< Auto.test$horsepower y.test< Auto.test$mpg Calcolare le previsioni con KNN Con il codice seguente calcoliamo le previsioni del modello KNN per valori di K da 1 a 60 ( klist=seq(60) ): y.pred.train contiene i valori previsti per il training set y.pred.test contiene i valori previsti per il test set klist< seq(60) # testiamo i risultati per k=1,2, y.pred.train< knn.reg.1(klist,x.train,y.train,x.train) y.pred.test< knn.reg.1(klist,x.train,y.train,x.test) Plot file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/validation.html 12/17
13 plot(auto.train$horsepower,auto.train$mpg) lines(sort(auto.train$horsepower),knn.reg.1(292,x.train,y.train,x.train)[order(auto.trai n$horsepower)],col=1,lwd=2) lines(sort(auto.train$horsepower),knn.reg.1(50,x.train,y.train,x.train)[order(auto.trai n$horsepower)],col=2,lwd=2) lines(sort(auto.train$horsepower),knn.reg.1(10,x.train,y.train,x.train)[order(auto.trai n$horsepower)],col=3,lwd=2) lines(sort(auto.train$horsepower),knn.reg.1(1,x.train,y.train,x.train)[order(auto.train$h orsepower)],col=4,lwd=2) legend("topright",legend=c('k=292','k=50','k=10','k=1'),text.col=seq(4), lty=1, col=se q(4)) Test MSE e training MSE mse.train < apply((y.pred.train y.train)^2, 2, mean) mse.test < apply((y.pred.test y.test)^2, 2, mean) MSE.table< data.frame("k"=klist, "test MSE"=mse.test,"training MSE"=mse.train) knitr::kable(mse.table) K test.mse training.mse file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/validation.html 13/17
14 file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/validation.html 14/17
15 file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/validation.html 15/17
16 Plot degli MSE Riportiamo in un grafico i valori di MSE ottenuti. Dalla tavola precedente notiamo che il valore di test MSE più basso corrisponde al caso K = 10. Tuttavia per un intervallo di valori K piuttosto ampio questo rimane molto basso. Il valore K = 50 produce una adattamento molto più smussato rispetto al caso K = 10 plot(mse.train, type='l', xlab='k', ylab='mse', col=1, lwd=2) lines(mse.test, col=2, lwd=2) legend("bottomright",legend=c('train','test'),text.col=seq(2), lty=1, col=seq(2)) Confronto test MSE file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/validation.html 16/17
17 1. RLS: test MSE = RQ: test MSE = RC: test MSE = K = KNN, : test MSE = K = KNN, : test MSE = file:///c:/users/emanuele.taufer/dropbox/3%20sqg/labs/validation.html 17/17
Regressione lineare multipla Strumenti quantitativi per la gestione
Regressione lineare multipla Strumenti quantitativi per la gestione Emanuele Taufer Regressione lineare multipla (RLM) Esempio: RLM con due predittori Stima dei coefficienti e previsione Advertising data
Quiz di verifica - Alberi e FC Strumenti Quantitativi per la gestione
Quiz di verifica - Alberi e FC Strumenti Quantitativi per la gestione Le domande 1-6 si riferiscono al seguente problema Un data set contiene i dati sui consumi di diversi tipi di automobili e alcune loro
Esercitazione Statistica Computazionale B Modelli di regressione lineare semplice Verifica di ipotesi - Analisi della varianza
Esercitazione Statistica Computazionale B Modelli di regressione lineare semplice Verifica di ipotesi - Analisi della varianza 3 maggio 2005 Esercizio 1 Consideriamo l esempio del libro di testo Annette
R - base Emanuele Taufer
R - base Emanuele Taufer Contents Preliminari................................................. 1 Oggetti................................................... 1 Oggetti - 2.................................................
Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico 2011-12)
Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico 011-1) REGRESSIONE LINEARE SEMPLICE OPEN STATISTICA 8.44 Per 8 settimanali, appartenenti alla medesima fascia di prezzo e presenti in edicola
LABORATORIO DI PROBABILITA E STATISTICA
UNIVERSITA DEGLI STUDI DI VERONA LABORATORIO DI PROBABILITA E STATISTICA Docente: Bruno Gobbi 6 ESERCIZI RIEPILOGATIVI PRIME 3 LEZIONI REGRESSIONE LINEARE: SPORT - COLESTEROLO ESERCIZIO 8: La tabella seguente
Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)
Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Quesito: Posso stimare il numero di ore passate a studiare statistica sul voto conseguito all esame? Potrei calcolare il coefficiente di correlazione.
Analisi grafica residui in R. Da output grafico analisi regressionelm1.csv Vedi dispensa. peso-statura
Analisi grafica residui in R Da output grafico analisi regressionelm1.csv Vedi dispensa peso-statura 1) Il plot in alto a sinistra mostra gli errori residui contro i loro valori stimati. I residui devono
Metodi Stocastici per la Finanza
Metodi Stocastici per la Finanza Tiziano Vargiolu [email protected] 1 1 Università degli Studi di Padova Anno Accademico 2011-2012 Lezione 6 Indice 1 Il metodo bootstrap 2 Esercitazione 3 Interpolazione
Indice. 1 Introduzione ai modelli lineari 2. 2 Dataset 3. 3 Il Modello 8. 4 In pratica 12 4.1 Peso e percorrenza... 12
Indice 1 Introduzione ai modelli lineari 2 2 Dataset 3 3 Il Modello 8 4 In pratica 12 41 Peso e percorrenza 12 1 Capitolo 1 Introduzione ai modelli lineari Quando si analizzano dei dati, spesso si vuole
Capitolo 12 La regressione lineare semplice
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara
Regressione logistica. Strumenti quantitativi per la gestione
Regressione logistica Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/4a_rlg.html#(1) 1/25 Metodi di classificazione I metodi usati per analizzare
ANOVA a un fattore between in R
ANOVA a un fattore between in R Il file Excel Il file sinburn.xlsx contiene i dati dello studio sulla sindrome da burnout in quindici infermieri ospedalieri di tre diversi reparti. Importare dati in R
Modelli con predittori qualitativi e modelli con interazioni
Modelli con predittori qualitativi e modelli con interazioni Strumenti quantitativi per la gestione Emanuele Taufer Utilizzare variabili indipendenti qualitative (VIQ) Codifica binaria 0,1 Esempio: salari
Multicollinearità Strumenti quantitativi per la gestione
Strumenti quantitativi per la gestione Emanuele Taufer Quando non tutto va come dovrebbe I dati Scatter plot Correlazioni RLS e RLM Individuare la MC Variance Inflation Factor Cosa fare in caso di MC Alcune
LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE
LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE DESCRIZIONE DEI DATI DA ESAMINARE Sono stati raccolti i dati sul peso del polmone di topi normali e affetti da una patologia simile
Anova e regressione. Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Universitá degli Studi di Perugia 22 marzo 2011
Anova e regressione Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Universitá degli Studi di Perugia 22 marzo 2011 Nella sperimentazione agronomica e biologica in genere è normale organizzare
Regressione logistica
Regressione logistica Strumenti quantitativi per la gestione Emanuele Taufer Metodi di classificazione Tecniche principali Alcuni esempi Data set Default I dati La regressione logistica Esempio Il modello
LABORATORIO EXCEL XLSTAT 2008 SCHEDE 2 e 3 VARIABILI QUANTITATIVE
Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) LABORATORIO EXCEL
Regressione lineare semplice
Regressione lineare semplice Strumenti quantitativi per la gestione Emanuele Taufer Regressione lineare (RL) La regressione lineare per i dati Advertising Analisi d interesse Regressione lineare semplice
FACOLTÀ DI ECONOMIA Soluzione della Prova di autovalutazione 2012 (primi 6 CFU) ANALISI STATISTICA PER L IMPRESA
FACOLTÀ DI ECONOMIA Soluzione della Prova di autovalutazione 2012 (primi 6 CFU) ANALISI STATISTICA PER L IMPRESA NB Come potete vedere facendo la somma dei punteggi il numero di quesiti è superiore a quello
Soluzioni degli Esercizi del Parziale del 30/06/201 (Ippoliti-Fontanella-Valentini)
Soluzioni degli Esercizi del Parziale del 30/06/201 (Ippoliti-Fontanella-Valentini) Esercizio 1 In uno studio sugli affitti mensili, condotto su un campione casuale di 14 monolocali nella città nella città
Regressione non lineare con un modello neurale feedforward
Reti Neurali Artificiali per lo studio del mercato Università degli studi di Brescia - Dipartimento di metodi quantitativi Marco Sandri ([email protected]) Regressione non lineare con un modello neurale
Regressione Mario Guarracino Data Mining a.a. 2010/2011
Regressione Esempio Un azienda manifatturiera vuole analizzare il legame che intercorre tra il volume produttivo X per uno dei propri stabilimenti e il corrispondente costo mensile Y di produzione. Volume
Strumenti informatici 2.1 - Realizzare grafici e tabelle con Excel e SPSS
Strumenti informatici 2.1 - Realizzare grafici e tabelle con Excel e SPSS Realizzare un grafico con Excel è molto semplice, e permette tutta una serie di varianti. Il primo passo consiste nell organizzare
Fogli Elettronici: MS Excel
Fogli Elettronici: MS Excel Informatica - A.A. 2010/2011 - Excel 7.0 Foglio Elettronico Un foglio elettronico (o spreadsheet) è un software applicativo nato dall esigenza di: organizzare insiemi di dati
LABORATORIO DI PROBABILITA E STATISTICA
UNIVERSITA DEGLI STUDI DI VERONA LABORATORIO DI PROBABILITA E STATISTICA Docente: Bruno Gobbi Corso di laurea in Informatica e Bioinformatica 4 ESERCIZI RIEPILOGATIVI PRIME 3 LEZIONI 1 - STATISTICA DESCRITTIVA
Esercizio 1 GRAFICO 1. X e Y sono indipendenti. X e Y non sono correlate. La correlazione tra X e Y è <1. X e Y sono perfettamente correlate
Esercizio 1 Osservare il grafico 1 riportato in figura che mette in relazione una variabile dipendente Y ed una variabile indipendente X e rispondere alle seguenti domande. 400 300 200 GRAFICO 1 100 0
Laboratorio di Statistica con R
Laboratorio di Statistica con R R è un vero e proprio linguaggio di programmazione. Il suo nome, è dovuto probabilmente al nome dei suoi sviluppatori:robert Gentleman e Ross Ihaka Le principali funzioni
ESERCITAZIONE C. Analisi di dati sperimentali PARTE 3: REGRESIONE
Università degli Studi di Padova Facoltà di Scienze MM.FF.NN. Corso di Laurea Magistrale: Biologia Sanitaria/Biologia Molecolare Insegnamento: Statistica Applicata Docente: Prof.ssa Alessandra R. Brazzale
Laboratorio di ST1 Lezione 2
Laboratorio di ST1 Lezione 2 Claudia Abundo Dipartimento di Matematica Università degli Studi Roma Tre Frequenze in R ESEMPIO Fiori preferiti da n=6 ragazze In R: fiori=c("rosa", "orchidea", "violetta",
Excel Terza parte. Excel 2003
Excel Terza parte Excel 2003 TABELLA PIVOT Selezioniamo tutti i dati (con le relative etichette) Dati Rapporto tabella pivot e grafico pivot Fine 2 La tabella pivot viene messa di default in una pagina
3. Piano di lavoro: - applicazione di alcune semplici procedure, con il confronto tra le diverse soluzioni possibili nell ambito del programma SPSS
Per utilizzare SPSS sui PC dell aula informatica occorre accedere come: ID: SPSS Password: winidams Testo rapido di consultazione: Fideli R. Come analizzare i dati al computer. ed. Carocci, Urbino, 2002.
PULSANTI E PAGINE Sommario PULSANTI E PAGINE...1
Pagina 1 Sommario...1 Apertura...2 Visualizzazioni...2 Elenco...2 Testo sul pulsante e altre informazioni...3 Comandi...3 Informazioni...4 Flow chart...5 Comandi...6 Pulsanti Principali e Pulsanti Dipendenti...6
Statistical learning Strumenti quantitativi per la gestione
Statistical learning Strumenti quantitativi per la gestione Emanuele Taufer Vendite Simbologia Reddito Statistical learning A cosa ci serve f? 1 Previsione 2 Inferenza Previsione Errore riducibile e errore
TOP DOWN. Compiti in classe proposti Modulo 1 JUVENILIA SCUOLA. Iacobelli Ajme Marrone
Compiti in classe proposti Modulo 1 Scrivere un programma che carichi in un vettore i tempi ottenuti da un atleta in una serie di gare (massimo 30) e stampi la media dei tempi dell atleta, il tempo migliore
Prof.ssa Paola Vicard
Questa nota consiste perlopiù nella traduzione (con alcune integrazioni) da Descriptive statistics di J. Shalliker e C. Ricketts, 2000, University of Plymouth Consideriamo i dati nel file esercizio10_dati.xls.
STATISTICA DESCRITTIVA SCHEDA N. 5: REGRESSIONE LINEARE
STATISTICA DESCRITTIVA SCHEDA N. : REGRESSIONE LINEARE Nella Scheda precedente abbiamo visto che il coefficiente di correlazione fra due variabili quantitative X e Y fornisce informazioni sull esistenza
Algoritmi di clustering
Algoritmi di clustering Dato un insieme di dati sperimentali, vogliamo dividerli in clusters in modo che: I dati all interno di ciascun cluster siano simili tra loro Ciascun dato appartenga a uno e un
Excel. A cura di Luigi Labonia. e-mail: [email protected]
Excel A cura di Luigi Labonia e-mail: [email protected] Introduzione Un foglio elettronico è un applicazione comunemente usata per bilanci, previsioni ed altri compiti tipici del campo amministrativo
Guida Software GestioneSpiaggia.it
Caratteristiche Guida Software GestioneSpiaggia.it 1. Gestione prenotazioni articoli (ombrellone, cabina, ecc ) ed attrezzature (sdraio, lettino ecc ) 2. Visualizzazione grafica degli affitti sia giornaliera
Concetti Fondamentali
EXCEL Modulo 1 Concetti Fondamentali Excel è un applicazione che si può utilizzare per: Creare un foglio elettronico; costruire database; Disegnare grafici; Cos è un Foglio Elettronico? Un enorme foglio
CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI
VERO FALSO CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI 1. V F Un ipotesi statistica è un assunzione sulle caratteristiche di una o più variabili in una o più popolazioni 2. V F L ipotesi nulla unita
RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL
RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL 1 RAPPRESENTAZIONE GRAFICA Per l analisi dati con Excel si fa riferimento alla versione 2007 di Office, le versioni successive non differiscono
Elaborazione dei dati su PC Regressione Multipla
21 Elaborazione dei dati su PC Regressione Multipla Analizza Regressione Statistiche Grafici Metodo di selezione Analisi dei dati 21.1 Introduzione 21.2 Regressione lineare multipla con SPSS 21.3 Regressione
Operazioni fondamentali
Foglio elettronico Le seguenti indicazioni valgono per Excel 2007, ma le procedure per Excel 2010 sono molto simile. In alcuni casi (per esempio, Pulsante Office /File) ci sono indicazioni entrambe le
LABORATORIO DI PROBABILITA E STATISTICA
LABORATORIO DI PROBABILITA E STATISTICA Docente: Bruno Gobbi 3 LA REGRESSIONE LINEARE ES. STUDIO RELAZIONE ALTEZZA - PESO Soggetto Altezza Peso A 174 75 B 166 63 C 173 70 D 171 71 E 168 68 F 167 68 G 165
REGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori
REGRESSIONE lineare e CORRELAZIONE Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori Y X La NATURA e la FORZA della relazione tra variabili si studiano con la REGRESSIONE
General Linear Model. Esercizio
Esercizio General Linear Model Una delle molteplici applicazioni del General Linear Model è la Trend Surface Analysis. Questa tecnica cerca di individuare, in un modello di superficie, quale tendenza segue
Traccia delle lezioni svolte in laboratorio Excel 2003. Excel 2003 Excel 2010
Traccia delle lezioni svolte in laboratorio Excel 2003 Excel 2003 Excel 2010 INTRODUZIONE A EXCEL EXCEL è un programma di Microsoft Office che permette di analizzare grandi quantità di dati (database)
Dai dati al modello teorico
Dai dati al modello teorico Analisi descrittiva univariata in R 1 Un po di terminologia Popolazione: (insieme dei dispositivi che verranno messi in produzione) finito o infinito sul quale si desidera avere
Esame di Informatica CHE COS È UN FOGLIO ELETTRONICO CHE COS È UN FOGLIO ELETTRONICO CHE COS È UN FOGLIO ELETTRONICO. Facoltà di Scienze Motorie
Facoltà di Scienze Motorie CHE COS È UN FOGLIO ELETTRONICO Una tabella che contiene parole e numeri che possono essere elaborati applicando formule matematiche e funzioni statistiche. Esame di Informatica
Ricerca di outlier. Ricerca di Anomalie/Outlier
Ricerca di outlier Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna Ricerca di Anomalie/Outlier Cosa sono gli outlier? L insieme di dati che sono considerevolmente differenti dalla
Modelli statistici per l analisi dei dati e la valutazione d efficacia Il caso del Comune di Perugia
Modelli statistici per l analisi dei dati e la valutazione d efficacia Il caso del Comune di Perugia Alessandra Pelliccia Matteo Cataldi Matteo Filippo Donadi 0 AGENDA Fonti Descrizione dei dati Variabili
Strumenti per la costruzione di modelli economici in Excel. Parte 4. Altre Funzioni
Strumenti per la costruzione di modelli economici in Excel Parte 4. Altre Funzioni Agenda 1. Obiettivi del documento 2. Funzioni basilari 3. Strumenti per analisi di sensitività 4. Strumenti di ottimizzazione
Obiettivi del corso. Creare, modificare e formattare un semplice database costituito da tabelle, query, maschere e report utilizzando Access 2000.
ECDL Excel 2000 Obiettivi del corso Creare, modificare e formattare un semplice database costituito da tabelle, query, maschere e report utilizzando Access 2000. Progettare un semplice database Avviare
NUOVA PROCEDURA COPIA ED INCOLLA PER L INSERIMENTO DELLE CLASSIFICHE NEL SISTEMA INFORMATICO KSPORT.
NUOVA PROCEDURA COPIA ED INCOLLA PER L INSERIMENTO DELLE CLASSIFICHE NEL SISTEMA INFORMATICO KSPORT. Con l utilizzo delle procedure di iscrizione on line la società organizzatrice ha a disposizione tutti
I ESERCITAZIONE. Gruppo I 100 individui. Trattamento I Nuovo Farmaco. Osservazione degli effetti sul raffreddore. Assegnazione casuale
I ESERCITAZIONE ESERCIZIO 1 Si vuole testare un nuovo farmaco contro il raffreddore. Allo studio partecipano 200 soggetti sani della stessa età e dello stesso sesso e con caratteristiche simili. i) Che
Strumenti informatici 13.1
1 Strumenti informatici 1.1 I test post-hoc nel caso del confronto fra tre o più proporzioni dipendenti e la realizzazione del test Q di Cochran in SPSS Nel caso dei test post-hoc per il test Q di Cochran,
per immagini guida avanzata Organizzazione e controllo dei dati Geometra Luigi Amato Guida Avanzata per immagini excel 2000 1
Organizzazione e controllo dei dati Geometra Luigi Amato Guida Avanzata per immagini excel 2000 1 Il raggruppamento e la struttura dei dati sono due funzioni di gestione dati di Excel, molto simili tra
Esempio di prova di laboratorio
Esempio di prova di laboratorio Messa a punto di un modello mediante: Utilizzo dell interprete Matlab Utilizzo del toolbox Fuzzy Logic Utilizzo del toolbox Neuro Network Creazione di funzioni Analisi critica
Fac-simile prova di esame
UNIVERSITÀ CA FOSCARI DI VENEZIA FACOLTÀ DI ECONOMIA Statistica Computazionale I Prof. Stefano Tonellato COGNOME.................................... NOME.................................... MATRICOLA....................................
A intervalli regolari ogni router manda la sua tabella a tutti i vicini, e riceve quelle dei vicini.
Algoritmi di routing dinamici (pag.89) UdA2_L5 Nelle moderne reti si usano algoritmi dinamici, che si adattano automaticamente ai cambiamenti della rete. Questi algoritmi non sono eseguiti solo all'avvio
Interpolazione ed approssimazione di funzioni
Interpolazione ed approssimazione di funzioni Lucia Gastaldi Dipartimento di Matematica, http://dm.ing.unibs.it/gastaldi/ 9 novembre 2007 Outline 1 Polinomi Valutazione di un polinomio Algoritmo di Horner
FORMEZ - Centro di Formazione e Studi. Banca dati Consiglio di Stato 2010
FORMEZ - Centro di Formazione e Studi Banca dati Consiglio di Stato 0 Area logico-matematica N domande: 00 RAGIONAMENTO NUMERICO I quesiti sono composti da numeri posti in serie. Di ogni serie è stato
Strumenti e metodi per la redazione della carta del pericolo da fenomeni torrentizi
Versione 2.0 Strumenti e metodi per la redazione della carta del pericolo da fenomeni torrentizi Corso anno 2011 E. MANUALE UTILIZZO HAZARD MAPPER Il programma Hazard Mapper è stato realizzato per redarre,
età sesso luogo-abitazione scuola superiore esperienza insegnamento 1 2 2 2 1 2 2 2 2 2 1 2 3 2 2 2 1 2 4 2 2 2 1 2 5 3 2 2 1 2 6 2 2 2 1 2 7 3 2 1 1
età sesso luogo-abitazione scuola superiore esperienza insegnamento 1 1 1 3 1 4 1 5 3 1 6 1 7 3 1 1 8 3 1 9 3 1 10 3 1 11 3 1 1 1 13 4 1 1 14 3 1 15 1 16 1 17 1 18 1 19 1 0 1 1 1 1 3 3 1 4 1 Come analizzare
Corso integrato di informatica, statistica e analisi dei dati sperimentali Altri esercizi_esercitazione V
Corso integrato di informatica, statistica e analisi dei dati sperimentali Altri esercizi_esercitazione V Sui PC a disposizione sono istallati diversi sistemi operativi. All accensione scegliere Windows.
Modulo 3 - Elaborazione Testi 3.6 Preparazione stampa
Università degli Studi dell Aquila Corso ECDL programma START Modulo 3 - Elaborazione Testi 3.6 Preparazione stampa Maria Maddalena Fornari Impostazioni di pagina: orientamento È possibile modificare le
LE CARTE DI CONTROLLO (4)
LE CARTE DI CONTROLLO (4) Tipo di carta di controllo Frazione difettosa Carta p Numero di difettosi Carta np Dimensione campione Variabile, solitamente >= 50 costante, solitamente >= 50 Linea centrale
EXCEL PER WINDOWS95. sfruttare le potenzialità di calcolo dei personal computer. Essi si basano su un area di lavoro, detta foglio di lavoro,
EXCEL PER WINDOWS95 1.Introduzione ai fogli elettronici I fogli elettronici sono delle applicazioni che permettono di sfruttare le potenzialità di calcolo dei personal computer. Essi si basano su un area
Statistiche campionarie
Statistiche campionarie Sul campione si possono calcolare le statistiche campionarie (come media campionaria, mediana campionaria, varianza campionaria,.) Le statistiche campionarie sono stimatori delle
Capitolo 13. Interrogare una base di dati
Capitolo 13 Interrogare una base di dati Il database fisico La ridondanza è una cosa molto, molto, molto brutta Non si devono mai replicare informazioni scrivendole in più posti diversi nel database Per
Altre funzioni utili SINTASSI ED ESEMPI
Altre funzioni utili SINTASSI ED ESEMPI Sintassi della funzione CONTA.SE Sintassi della funzione SOMMA.SE È tra le funzioni matematiche e trigonometriche Sintassi della funzione MAX È tra le funzioni statistiche
Temi di Esame a.a. 2012-2013. Statistica - CLEF
Temi di Esame a.a. 2012-2013 Statistica - CLEF I Prova Parziale di Statistica (CLEF) 11 aprile 2013 Esercizio 1 Un computer è collegato a due stampanti, A e B. La stampante A è difettosa ed il 25% dei
EXCEL FUNZIONI PRINCIPALI
EXCEL FUNZIONI PRINCIPALI Funzione SE() Sintassi: SE(VERIFICA, VALORE SE VERO, VALORE SE FALSO): verifica un valore e ritorna una risposta in base al risultato vero/falso Esempio: =SE(A2=15; "OK"; "NO")
