Regressione K-Nearest Neighbors. Strumenti quantitativi per la gestione

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Regressione K-Nearest Neighbors. Strumenti quantitativi per la gestione"

Transcript

1 Regressione K-Nearest Neighbors Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/classes/5-5_knn.html#(1) 1/13

2 Regressione non parametrica I metodi parametrici fanno ipotesi circa la forma di f. Al contrario, i metodi non parametrici, non assumendo esplicitamente alcuna forma per f, forniscono un alternativa flessibile per l analisi nei problemi di regressione. Un metodo non parametrico tra i più semplici e i più noti è quello della regressione K-nearest neighbors (KNN) file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/classes/5-5_knn.html#(1) 2/13

3 Regressione KNN {(, ), (, )} Per un insieme di dati training x 1 y 1 x n y n e dato un valore K, la previsione f^ ( x0 ) per un qualsiasi punto nella regressione KNN : x 0 1. individua l insieme, indicato con N 0, delle K osservazioni training { x 1, x n } più vicine a x 0 f( ) 2. stima x 0 usando la media di tutte le risposte training { y 1, y n } in N 0 In altre parole, 1 f^ ( x0 ) = y i K x i N 0 file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/classes/5-5_knn.html#(1) 3/13

4 Si noti che nella regressione KNN non esiste una funzione in senso proprio come nella regressione lineare f^ Piuttosto, per ciascun punto in un vicinato N 0 di dimensione K, la regressione KNN usa la media delle corrispondenti alle x i N 0 y i La dimensione del vicinato N 0 aumenta o diminuisce con K file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/classes/5-5_knn.html#(1) 4/13

5 Esempio KNN KNN su un set di dati con p = 2 predittori. K = 1 - diagramma a sinistra; K = 9 - diagramma a destra file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/classes/5-5_knn.html#(1) 5/13

6 Scelta di K In generale, il valore ottimale di bias-varianza K dipende dal trade-off K piccolo fornisce un adattamento più flessibile, con bassa distorsione, ma varianza elevata. Valori più elevati di K forniscono un adattamento più omogeneo e quindi meno variabile poiché la previsione in una regione è una media di più punti. Tuttavia, questo può causare distorsione, mascherando parte della struttura in f. Esistono metodi computazionali per determinare il valore di K ottimale che vedremo nelle prossime lezioni ed esercitazioni. file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/classes/5-5_knn.html#(1) 6/13

7 Confronto regressione parametrica-non parametrica In generale l approccio parametrico supera quello non parametrico se la forma parametrica che è stata selezionata è vicino alla vera forma di f. Fig. 3.17; f lineare (in nero) f^ da regressione KNN (in blu); K = 1 K = 9 (destra) (sinistra), file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/classes/5-5_knn.html#(1) 7/13

8 f lineare Fig. 3.18: f^ Sinistra: f lineare (Nero); da RLS (Blu) Destra: Test MSE RLS (Nero), Test MSE KNN (Verde) file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/classes/5-5_knn.html#(1) 8/13

9 f non lineare Fig. 3.19: Sinistra: non-lineare (Nero); da KNN, (Blu) e (Rosso) f f^ K = 1 K = 9 Destra: Test MSE RLS (Nero), Test MSE KNN (Verde) file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/classes/5-5_knn.html#(1) 9/13

10 file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/classes/5-5_knn.html#(1) 10/13

11 f non-lineare, p elevato alt text Nella figura sopra i predittori aggiuntivi non sono legati a Y e giocano il ruolo di disturbo. Test MSE per RLM (Nero) e KNN (Verde) per la stessa f non-lineare del grafico precedente (in basso); p = 1, 2, 3, 4, 10, 20 All aumentre di p la performance della RLM peggiora di poco mentre quello di KNN peggiora decisamente file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/classes/5-5_knn.html#(1) 11/13

12 Curse of dimensionality La spiegazione del fenomeno visto nella figura precedente sta nel fatto che in uno spazio a p dimensioni la numerosità dei dati, di fatto, si riduce sostanzialmente. In questo caso ci sono unità che, disperse, ad esempio in uno spazio a p = 20 dimensioni non hanno in pratica alcun Nearest Neighbor. n = 100 Il fenomeno è conosciuto come curse of dimensionality. Ossia i K NN di x 0 possono essere effettivamente molto lontani da x 0 in uno spazio altamente dimensionale, dando luogo a previsioni molto imprecise. f^ x0 ( ) file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/classes/5-5_knn.html#(1) 12/13

13 Riferimenti bibliografici An Introduction to Statistical Learning, with applications in R. (Springer, 2013) Alcune delle figure in questa presentazione sono tratte dal testo con il permesso degli autori: G. James, D. Witten, T. Hastie e R. Tibshirani file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/classes/5-5_knn.html#(1) 13/13

Selezione del modello Strumenti quantitativi per la gestione

Selezione del modello Strumenti quantitativi per la gestione Selezione del modello Strumenti quantitativi per la gestione Emanuele Taufer Migliorare il modello di regressione lineare (RL) Metodi Selezione Best subset Selezione stepwise Stepwise forward Stepwise

Dettagli

Analisi Discriminante Strumenti quantitativi per la gestione

Analisi Discriminante Strumenti quantitativi per la gestione Analisi Discriminante Strumenti quantitativi per la gestione Emanuele Taufer Un esempio introduttivo Approccio con Bayes Perchè un altro metodo di classificazione? Classificazione con Bayes Analisi discriminante

Dettagli

Analisi Discriminante. Strumenti quantitativi per la gestione

Analisi Discriminante. Strumenti quantitativi per la gestione Analisi Discriminante Strumenti quantitativi per la gestione Emanuele Taufer file:///g:/il%20mio%20drive/2%20corsi/3%20sqg/classes/4-2_ad.html#(33) 1/39 AD Tecnica di classificazione che sfrutta combinazioni

Dettagli

Metodi per la riduzione della dimensionalità. Strumenti quantitativi per la gestione

Metodi per la riduzione della dimensionalità. Strumenti quantitativi per la gestione Metodi per la riduzione della dimensionalità Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/6c_pca.html#(1) 1/25 Introduzione Gli approcci

Dettagli

Regressione logistica. Strumenti quantitativi per la gestione

Regressione logistica. Strumenti quantitativi per la gestione Regressione logistica Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/classes/4a_rlg.html#(22) 1/28 Metodi di classificazione I

Dettagli

Statistical learning. Strumenti quantitativi per la gestione. Emanuele Taufer

Statistical learning. Strumenti quantitativi per la gestione. Emanuele Taufer Statistical learning Strumenti quantitativi per la gestione Emanuele Taufer Vendite (Sales) Supponiamo di voler capire come migliorare le vendite di un determinato prodotto. Il Set di dati Advertising

Dettagli

Regolarizzazione (Shrinkage) Strumenti quantitativi per la gestione

Regolarizzazione (Shrinkage) Strumenti quantitativi per la gestione Regolarizzazione (Shrinkage) Strumenti quantitativi er la gestione Emanuele Taufer Metodi di regolarizzazione o shrinkage Regressione ridge Standardizzare i redittori Dati Credit.csv Ridge er i dati Credit.csv

Dettagli

Strumenti quantitativi per la gestione (121210) A.a / 2019.

Strumenti quantitativi per la gestione (121210) A.a / 2019. LAUREA MAGISTRALE IN MANAGEMENT Dipartimento di Economia e Management Università degli Studi di Trento Strumenti quantitativi per la gestione (121210) A.a. 2018 / 2019. Docente: Prof. Emanuele Taufer 1.

Dettagli

Statistical learning. Strumenti quantitativi per la gestione

Statistical learning. Strumenti quantitativi per la gestione Statistical learning Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/2_statistical_learning.html#(1) 1/42 Vendite Supponiamo di voler capire

Dettagli

Alberi di decisione con R

Alberi di decisione con R Alberi di decisione con R Emanuele Taufer file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/labs/l8-alberi_di_decisione.html#(1) 1/14 Implementare gli alberi decisionali con R Per adattare

Dettagli

Quiz di verifica Classificazione

Quiz di verifica Classificazione Quiz di verifica Classificazione Strumenti Quantitativi per la gestione Le domande 1 4 si riferiscono al seguente problema: Supponiamo di raccogliere dati per un gruppo di studenti della classe di SQG

Dettagli

Richiami di inferenza statistica. Strumenti quantitativi per la gestione. Emanuele Taufer

Richiami di inferenza statistica. Strumenti quantitativi per la gestione. Emanuele Taufer Richiami di inferenza statistica Strumenti quantitativi per la gestione Emanuele Taufer Inferenza statistica Inferenza statistica: insieme di tecniche che si utilizzano per ottenere informazioni su una

Dettagli

Richiami di inferenza statistica Strumenti quantitativi per la gestione

Richiami di inferenza statistica Strumenti quantitativi per la gestione Richiami di inferenza statistica Strumenti quantitativi per la gestione Emanuele Taufer Inferenza statistica Parametri e statistiche Esempi Tecniche di inferenza Stima Precisione delle stime Intervalli

Dettagli

Statistical learning Strumenti quantitativi per la gestione

Statistical learning Strumenti quantitativi per la gestione Statistical learning Strumenti quantitativi per la gestione Emanuele Taufer Vendite Simbologia Reddito Statistical learning A cosa ci serve f? 1 Previsione 2 Inferenza Previsione Errore riducibile e errore

Dettagli

Analisi discriminante in R Strumenti quantitativi per la gestione

Analisi discriminante in R Strumenti quantitativi per la gestione Analisi discriminante in R Strumenti quantitativi per la gestione Emanuele Taufer Default data LDA con R Output Plot Previsione Tabella di classificazione Cambiare il criterio di classificazione Costruire

Dettagli

e applicazioni al dominio del Contact Management Andrea Brunello Università degli Studi di Udine

e applicazioni al dominio del Contact Management Andrea Brunello Università degli Studi di Udine e applicazioni al dominio del Contact Management Parte V: combinazione di Università degli Studi di Udine In collaborazione con dott. Enrico Marzano, CIO Gap srl progetto Active Contact System 1/10 Contenuti

Dettagli

Regressione logistica

Regressione logistica Regressione logistica Strumenti quantitativi per la gestione Emanuele Taufer Metodi di classificazione Tecniche principali Alcuni esempi Data set Default I dati La regressione logistica Esempio Il modello

Dettagli

Regressione logistica. Strumenti quantitativi per la gestione

Regressione logistica. Strumenti quantitativi per la gestione Regressione logistica Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/4a_rlg.html#(1) 1/25 Metodi di classificazione I metodi usati per analizzare

Dettagli

Classificazione k-nn con R. Strumenti quantitativi per la gestione

Classificazione k-nn con R. Strumenti quantitativi per la gestione Classificazione k-nn con R Strumenti quantitativi per la gestione Emanuele Taufer file:///g:/il%20mio%20drive/2%20corsi/3%20sqg/labs/l1-knn.html#(1) 1/16 Altezza e peso degli adulti Le statistiche sull

Dettagli

Modelli con predittori qualitativi e modelli con interazioni. Strumenti quantitativi per la gestione

Modelli con predittori qualitativi e modelli con interazioni. Strumenti quantitativi per la gestione Modelli con predittori qualitativi e modelli con interazioni Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/3d_viq.html#(1) 1/26 Utilizzare

Dettagli

Validazione dei modelli. Strumenti quantitativi per la gestione

Validazione dei modelli. Strumenti quantitativi per la gestione Validazione dei modelli Strumenti quantitativi per la gestione Emanuele Taufer file:///g:/il%20mio%20drive/2%20corsi/3%20sqg/labs/l5-validazione.html#(1) 1/27 Validazione dei modelli In questo esempio

Dettagli

Valutazione dei modelli matematici

Valutazione dei modelli matematici Valutazione dei modelli matematici Andrea Onofri 30 aprile 2013 Indice 1 Introduzione 2 2 Metodi grafici di valutazione 2 3 Metodi numerici 3 3.1 Il coefficiente di determinazione................... 5

Dettagli

Modelli non lineari e cross validazione. Strumenti quantitativi per la gestione

Modelli non lineari e cross validazione. Strumenti quantitativi per la gestione Modelli non lineari e cross validazione Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/labs/l3-temperature_max.html#(24) 1/28 Metodi

Dettagli

Strumenti quantitativi per la gestione. Introduzione al corso A.A

Strumenti quantitativi per la gestione. Introduzione al corso A.A Strumenti quantitativi per la gestione Introduzione al corso A.A. 2018-2019 Un esempio introduttivo: salari dei manager Y = Salario annuale (in dollari) x 1 = Anni di esperienza (Experience) x 2 = Anni

Dettagli

Modelli con predittori qualitativi e modelli con interazioni

Modelli con predittori qualitativi e modelli con interazioni Modelli con predittori qualitativi e modelli con interazioni Strumenti quantitativi per la gestione Emanuele Taufer Utilizzare variabili indipendenti qualitative (VIQ) Codifica binaria 0,1 Esempio: salari

Dettagli

Regressione lineare semplice

Regressione lineare semplice Regressione lineare semplice Strumenti quantitativi per la gestione Emanuele Taufer Regressione lineare (RL) La regressione lineare per i dati Advertising Analisi d interesse Regressione lineare semplice

Dettagli

Regressione lineare semplice. Strumenti quantitativi per la gestione

Regressione lineare semplice. Strumenti quantitativi per la gestione Regressione lineare semplice Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/3a_rls.html#(1) 1/33 Regressione lineare (RL) La RL è uno degli

Dettagli

Algoritmi di classificazione supervisionati

Algoritmi di classificazione supervisionati Corso di Bioinformatica Algoritmi di classificazione supervisionati Giorgio Valentini DI Università degli Studi di Milano 1 Metodi di apprendimento supervisionato per problemi di biologia computazionale

Dettagli

Analisi discriminante in R. Strumenti quantitativi per la gestione

Analisi discriminante in R. Strumenti quantitativi per la gestione Analisi discriminante in R Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/labs/l4-lda.html#(1) 1/25 Default data Carichiamo il

Dettagli

e applicazioni al dominio del Contact Management Andrea Brunello Università degli Studi di Udine

e applicazioni al dominio del Contact Management Andrea Brunello Università degli Studi di Udine al e applicazioni al dominio del Contact Management Parte I: Il Processo di, Principali tipologie di al Cos è il Il processo di Università degli Studi di Udine Unsupervised In collaborazione con dott.

Dettagli

Apprendimento basato sulle istanze

Apprendimento basato sulle istanze Apprendimento basato sulle istanze Apprendimento basato sulle istanze Apprendimento: semplice memorizzazione di tutti gli esempi Classificazione di una nuova istanza x j : reperimento degli

Dettagli

e applicazioni al dominio del Contact Management Andrea Brunello Università degli Studi di Udine

e applicazioni al dominio del Contact Management Andrea Brunello Università degli Studi di Udine e applicazioni al dominio del Contact Management Parte IV: valutazione dei Università degli Studi di Udine Cross- In collaborazione con dott. Enrico Marzano, CIO Gap srl progetto Active Contact System

Dettagli

Multicollinearità Strumenti quantitativi per la gestione

Multicollinearità Strumenti quantitativi per la gestione Strumenti quantitativi per la gestione Emanuele Taufer Quando non tutto va come dovrebbe I dati Scatter plot Correlazioni RLS e RLM Individuare la MC Variance Inflation Factor Cosa fare in caso di MC Alcune

Dettagli

Sistemi di Elaborazione dell Informazione 170. Caso Non Separabile

Sistemi di Elaborazione dell Informazione 170. Caso Non Separabile Sistemi di Elaborazione dell Informazione 170 Caso Non Separabile La soluzione vista in precedenza per esempi non-linearmente separabili non garantisce usualmente buone prestazioni perchè un iperpiano

Dettagli

DESCRIZIONE DEL DATA SET

DESCRIZIONE DEL DATA SET DESCRIZIONE DEL DATA SET Fonte: UC Irvine Machine Learning Repository Autore: Michael Redmond Nome data set: Communities and Crime CONTENUTI DEL DATA SET DI PARTENZA 125 POTENZIALI PREDITTORI Dati socio-economici

Dettagli

Laboratorio di Apprendimento Automatico. Fabio Aiolli Università di Padova

Laboratorio di Apprendimento Automatico. Fabio Aiolli Università di Padova Laboratorio di Apprendimento Automatico Fabio Aiolli Università di Padova Underfitting e Overfitting Complessità spazio ipotesi SVM: aumenta con kernel non lineari, RBF con maggiore pendenza, aumenta con

Dettagli

Regressione lineare multipla Strumenti quantitativi per la gestione

Regressione lineare multipla Strumenti quantitativi per la gestione Regressione lineare multipla Strumenti quantitativi per la gestione Emanuele Taufer Regressione lineare multipla (RLM) Esempio: RLM con due predittori Stima dei coefficienti e previsione Advertising data

Dettagli

Intelligenza Artificiale. Clustering. Francesco Uliana. 14 gennaio 2011

Intelligenza Artificiale. Clustering. Francesco Uliana. 14 gennaio 2011 Intelligenza Artificiale Clustering Francesco Uliana 14 gennaio 2011 Definizione Il Clustering o analisi dei cluster (dal termine inglese cluster analysis) è un insieme di tecniche di analisi multivariata

Dettagli

Metodi per la riduzione della dimensionalità Strumenti quantitativi per la gestione

Metodi per la riduzione della dimensionalità Strumenti quantitativi per la gestione Metodi er la riduzione della dimensionalità Strumenti quantitativi er la gestione Emanuele Taufer Introduzione Combinazioni lineari Regressione lineare sulle variabili trasformate Dettaglio teorico Metodi

Dettagli

Analisi delle CP. Dati USArrests

Analisi delle CP. Dati USArrests Analisi delle CP Dati USArrests Emanuele Taufer file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/labs/l10-pca-usarrests.html#(1) 1/12 Dati USArrests Per ciascuno dei 50 stati degli USA,

Dettagli

Validazione dei modelli Strumenti quantitativi per la gestione

Validazione dei modelli Strumenti quantitativi per la gestione Validazione dei modelli Strumenti quantitativi per la gestione Emanuele Taufer Validazione dei modelli Il data set Auto I dati Il problema analizzato Validation set approach Diagramma a dispersione Test

Dettagli

Multicollinearità. Strumenti quantitativi per la gestione

Multicollinearità. Strumenti quantitativi per la gestione Multicollinearità Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/3c_mc.html#(1) 1/13 Quando non tutto va come dovrebbe Si parla di multi-collinearità

Dettagli

STATISTICA. Esercitazione 5

STATISTICA. Esercitazione 5 STATISTICA Esercitazione 5 Esercizio 1 Ad un esame universitario sono stati assegnati in modo casuale due compiti diversi con i seguenti risultati: Compito A Compito B Numero studenti 102 105 Media dei

Dettagli

Analisi della varianza

Analisi della varianza Università degli Studi di Padova Facoltà di Medicina e Chirurgia Facoltà di Medicina e Chirurgia - A.A. 2009-10 Scuole di specializzazione Lezioni comuni Disciplina: Statistica Docente: dott.ssa Egle PERISSINOTTO

Dettagli

Regressione ridge e LASSO Strumenti quantitativi per la gestione

Regressione ridge e LASSO Strumenti quantitativi per la gestione Regressione ridge e LASSO Strumenti quantitativi per la gestione Emanuele Taufer Dati Credit.csv La funzione glmnet() La funzione model.matrix() Regressione ridge Output CV Ridge Output Regressione LASSO

Dettagli

High Return on Engagement. Analytics Report. per SAMPLE PROJECT

High Return on Engagement. Analytics Report. per SAMPLE PROJECT High Return on Engagement Analytics Report per SAMPLE PROJECT Data di elaborazione: 13 Maggio 2016 2 La versione ANALYTICS del report High Return on engagement è stata condotta su un campione di 77 persone

Dettagli

High Return on Engagement

High Return on Engagement High Return on Engagement Analytics Report PER SAMPLE PROJECT DATA DI ELABORAZIONE: 13 MAGGIO 2016 La versione ANALYTICS del report High Return on engagement è stata condotta su un campione di 77 persone

Dettagli

L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale

L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile Corso di Metodologia della ricerca sociale L analisi della varianza (ANOVA) La tecnica con cui si esplorano le relazioni

Dettagli

Esercitazione del

Esercitazione del Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36

Dettagli

Statistica computazionale. Informazioni sul docente. Parte I. Informazioni preliminari. Stefano Tonellato. Anno Accademico

Statistica computazionale. Informazioni sul docente. Parte I. Informazioni preliminari. Stefano Tonellato. Anno Accademico Statistica computazionale Stefano Tonellato Dipartimento di Statistica Università Ca Foscari Venezia Anno Accademico 2007-2008 sul docente Parte I preliminari Nome: Stefano Tonellato e-mail: stone@unive.it

Dettagli

Quiz di verifica - Alberi e FC Strumenti Quantitativi per la gestione

Quiz di verifica - Alberi e FC Strumenti Quantitativi per la gestione Quiz di verifica - Alberi e FC Strumenti Quantitativi per la gestione Le domande 1-6 si riferiscono al seguente problema Un data set contiene i dati sui consumi di diversi tipi di automobili e alcune loro

Dettagli

Matematica Lezione 22

Matematica Lezione 22 Università di Cagliari Corso di Laurea in Farmacia Matematica Lezione 22 Sonia Cannas 14/12/2018 Indici di posizione Indici di posizione Gli indici di posizione, detti anche misure di tendenza centrale,

Dettagli

Modelli Statistici per l Economia. Regressione lineare con un singolo regressore (terza parte)

Modelli Statistici per l Economia. Regressione lineare con un singolo regressore (terza parte) Modelli Statistici per l Economia Regressione lineare con un singolo regressore (terza parte) 1 Verifica di ipotesi su β 1 H 0 : β 1 = β 1,0 H 1 : β 1 β 1,0 Se è vera H 0 (cioè sotto H 0 ) e n è grande,

Dettagli

Tecniche di sondaggio

Tecniche di sondaggio SMID a.a. 2005/2006 Corso di Statistica per la Ricerca Sperimentale Tecniche di sondaggio 24/1/2006 Nomenclatura Indicheremo con P una popolazione, con N la sua numerosità, con k la sua etichetta e con

Dettagli

Metodi statistici per la ricerca sociale

Metodi statistici per la ricerca sociale Metodi statistici per la ricerca sociale Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università degli Studi di Firenze mattei@disia.unifi.it LM 88 SOCIOLOGIA E RICERCA

Dettagli

Calcolo I, a.a Primo esonero 11 novembre k + 2 k

Calcolo I, a.a Primo esonero 11 novembre k + 2 k Calcolo I, a.a. 015 016 Primo esonero 11 novembre 015 1) 6 punti Dimostrare per induzione che 5 n +, n 1. Se n = 1 la disuguaglianza si riduce a 5 + che è vera. Supponiamo ora che la disuguaglianza sia

Dettagli

Test di ipotesi. Test

Test di ipotesi. Test Test di ipotesi Test E una metodologia statistica che consente di prendere una decisione. Esempio: Un supermercato riceve dal proprio fornitore l assicurazione che non più del 5% delle mele di tipo A dell

Dettagli

Introduzione al Test in Itinere

Introduzione al Test in Itinere Introduzione al Test in Itinere Roberto Basili Università di Roma, Tor Vergata Argomenti oggetto di esame Rappresentazioni vettoriali per la classificazione Clustering Algoritmi di apprendimento automatico

Dettagli

Classificatore K-NN 1

Classificatore K-NN 1 Classificatore K-NN 1 Esercizio: Implementare il classificatore K-NN: [labelassegnate_test error_test] = mio_knn( ds_train, ds_test, k) Traccia: La funzione DIST(A,B') del toolbox reti neurali calcola

Dettagli

Università degli Studi di Roma Tor Vergata

Università degli Studi di Roma Tor Vergata Funzioni kernel Note dal corso di Machine Learning Corso di Laurea Specialistica in Informatica a.a. 2010-2011 Prof. Giorgio Gambosi Università degli Studi di Roma Tor Vergata 2 Queste note derivano da

Dettagli

Ricerca di outlier. Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna

Ricerca di outlier. Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna Ricerca di outlier Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna Ricerca di Anomalie/Outlier Cosa sono gli outlier? L insieme di dati che sono considerevolmente differenti dalla

Dettagli

Multi classificatori. Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna

Multi classificatori. Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna Multi classificatori Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna Combinazione di classificatori Idea: costruire più classificatori di base e predire la classe di appartenza di

Dettagli

sperimentale L analisi di sensitività, infine, ci consente di dire che:

sperimentale L analisi di sensitività, infine, ci consente di dire che: 300 240 180 Livello d'attenzione 120 60 0 sperimentale simulato L analisi di sensitività, infine, ci consente di dire che: i fattori che più contribuiscono alla determinazione dei risultati della rete

Dettagli

29 maggio Distinzione importante: giochi simultanei giochi sequenziali: uno dei giocatori ha la prima mossa; l altro deve rispondere.

29 maggio Distinzione importante: giochi simultanei giochi sequenziali: uno dei giocatori ha la prima mossa; l altro deve rispondere. ESERCITAZIONE 8 29 maggio 204. Premessa. Trattando della teoria dei giochi, bisogna ricordare questi concetti: * strategia dominante: ogni giocatore dispone di una scelta strategica ottima, quale che sia

Dettagli

Il mercato dei beni e la curva IS

Il mercato dei beni e la curva IS Il mercato dei beni e la curva IS L equilibrio sul mercato dei beni attraverso la condizione di uguaglianza tra produzione, Y, e domanda, Z, è definito dalla relazione IS. Assumendo che il consumo sia

Dettagli

6 Coerenza temporale e politica monetaria ottimale: discrezionalità versus regole

6 Coerenza temporale e politica monetaria ottimale: discrezionalità versus regole 6 Coerenza temporale e politica monetaria ottimale: discrezionalità versus regole Il modello di riferimento Si consideri un economia descritta dal seguente modello. Le variabili sono espresse in logaritmi.

Dettagli

La codifica delle immagini

La codifica delle immagini Lettere e numeri non costituiscono le uniche informazioni utilizzate dagli elaboratori ma si stanno diffondendo sempre di più applicazioni che utilizzano ed elaborano anche altri tipi di informazione:

Dettagli

Capitolo 3 La scelta razionale del consumatore

Capitolo 3 La scelta razionale del consumatore Capitolo 3 La scelta razionale del consumatore OBIETTIVI Comprendere il meccanismo decisionale che genera la domanda : Tracciare il vincolo di bilancio del consumatore Costruire la curva di indifferenza

Dettagli

ANALISI E COMMENTO DEGLI ESITI DELLE PROVE INVALSI 2016

ANALISI E COMMENTO DEGLI ESITI DELLE PROVE INVALSI 2016 ANALISI E COMMENTO DEGLI ESITI DELLE PROVE INVALSI 2016 Gli esiti delle prove INVALSI effettuate su tutte le classi seconde dell a.s. 2015-16 sono stati pubblicati nel mese di ottobre 2016. La percentuale

Dettagli

Registro Lezioni di Algebra lineare del 15 e 16 novembre 2016.

Registro Lezioni di Algebra lineare del 15 e 16 novembre 2016. Registro Lezioni di Algebra lineare del 15 e 16 novembre 2016 Di seguito si riporta il riassunto degli argomenti svolti; i riferimenti sono a parti del Cap8 Elementi di geometria e algebra lineare Par5

Dettagli

1.1 Obiettivi della statistica Struttura del testo 2

1.1 Obiettivi della statistica Struttura del testo 2 Prefazione XV 1 Introduzione 1.1 Obiettivi della statistica 1 1.2 Struttura del testo 2 2 Distribuzioni di frequenza 2.1 Informazione statistica e rilevazione dei dati 5 2.2 Distribuzioni di frequenza

Dettagli

Fondamenti statistici : Test d Ipotesi (1)

Fondamenti statistici : Test d Ipotesi (1) Fondamenti statistici : Test d Ipotesi (1) Ipotesi statistica: È una assunzione formulata su un particolare aspetto della popolazione considerazioni teoriche Informazioni relative a popolazioni analoghe

Dettagli

Computazione per l interazione naturale: processi gaussiani

Computazione per l interazione naturale: processi gaussiani Computazione per l interazione naturale: processi gaussiani Corso di Interazione uomo-macchina II Prof. Giuseppe Boccignone Dipartimento di Scienze dell Informazione Università di Milano boccignone@dsi.unimi.it

Dettagli

L OPINIONE DEGLI STUDENTI CHE FREQUENTANO I CORSI

L OPINIONE DEGLI STUDENTI CHE FREQUENTANO I CORSI L OPINIONE DEGLI STUDENTI CHE FREQUENTANO I CORSI a.a. 2009-200 Progetto e realizzazione grafica: Patrizia Amadori Maurizio Mariotti 2 INDICE. I principali risultati. 2. Tabella riassuntiva. 3. Distribuzioni

Dettagli

Esercizi di statistica

Esercizi di statistica Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..

Dettagli

Nel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0.

Nel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0. Regressione [] el modello di regressione lineare si assume una relazione di tipo lineare tra il valore medio della variabile dipendente Y e quello della variabile indipendente X per cui Il modello si scrive

Dettagli

STATISTICA. Regressione-3 L inferenza per il modello lineare semplice

STATISTICA. Regressione-3 L inferenza per il modello lineare semplice STATISTICA Regressione-3 L inferenza per il modello lineare semplice Regressione lineare: GRAFICO DI DISPERSIONE & & analisi residui A. Valutazione preliminare se una retta possa essere una buona approssimazione

Dettagli

PIXEL. Il valore quantizzato misurato da ciascun sensore diventa un. PICTURE ELEMENT = PIXEL dell immagine. Interazione & Multimedia

PIXEL. Il valore quantizzato misurato da ciascun sensore diventa un. PICTURE ELEMENT = PIXEL dell immagine. Interazione & Multimedia La risoluzione PIXEL Il valore quantizzato misurato da ciascun sensore diventa un PICTURE ELEMENT = PIXEL dell immagine La risoluzione Definizione: si dice risoluzione il numero di pixel per unità di misura.

Dettagli

Digitalizzazione delle immagini

Digitalizzazione delle immagini Digitalizzazione delle immagini Informazione multimediale Lettere e numeri non costituiscono le uniche informazioni utilizzate dai computer ma sempre più applicazioni utilizzano ed elaborano anche altri

Dettagli

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Introduzione : analisi delle relazioni tra due caratteristiche osservate sulle stesse unità statistiche studio del comportamento di due caratteri

Dettagli

Economia Politica e Istituzioni Economiche

Economia Politica e Istituzioni Economiche Economia Politica e Istituzioni Economiche Barbara Pancino Lezione 6 I mercati dei beni e i mercati finanziari: il modello IS-LM Il mercato dei beni e la curva IS L equilibrio sul mercato dei beni attraverso

Dettagli

La codifica delle immagini

La codifica delle immagini Lettere e numeri non costituiscono le uniche informazioni utilizzate dagli elaboratori ma si stanno diffondendo sempre di più applicazioni che utilizzano ed elaborano anche altri tipi di informazione:

Dettagli

Fondamenti di Data Processing

Fondamenti di Data Processing Fondamenti di Data Processing Vincenzo Suraci Automazione INTRODUZIONE AL DATA PROCESSING ACQUISIZIONE DATI SCHEMA COSTRUTTIVO SCHEDA INPUT OSCILLATORE A FREQUENZA COSTANTE BANDA PASSANTE ACCORDATA AL

Dettagli

ESERCITAZIONI Di ECONOMIA POLITICA Canale A-D Prof. E. Felli

ESERCITAZIONI Di ECONOMIA POLITICA Canale A-D Prof. E. Felli ESERCITAZIONI Di ECONOMIA OLITICA Canale A-D rof. E. Felli FOGLIO 10-7 MAGGIO 2015 IL ROGRESSO TECNICO NEL MODELLO DI SOLOW - CRESCITA ENDOGENA DOMANDA E OFFERTA AGGREGATE: IL MODELLO CLSICO 1) La Figura

Dettagli

Argomenti della lezione:

Argomenti della lezione: Lezione 7 Argomenti della lezione: La regressione semplice Il modello teorico Il calcolo dei parametri Regressione lineare Esamina la relazione lineare tra una o più variabili esplicative (o indipendenti,

Dettagli

LEZIONI DI STATISTICA MEDICA

LEZIONI DI STATISTICA MEDICA LEZIONI DI STATISTICA MEDICA Lezione n.11 - Principi dell inferenza statistica - Campionamento - Distribuzione campionaria di una media e di una proporzione - Intervallo di confidenza di una media e di

Dettagli

Dipartimento di Samità Pubblica e Malattie Infettive Sapienza Università di Roma

Dipartimento di Samità Pubblica e Malattie Infettive Sapienza Università di Roma I bias negli studi epidemiologici. Elementi di statistica descrittiva ed inferenziale.l epidemiologia sperimentale Paolo Villari paolo.villari@uniroma1.it Dipartimento di Samità Pubblica e Malattie Infettive

Dettagli

STATISTICA A K (60 ore)

STATISTICA A K (60 ore) STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta

Dettagli

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Strumenti statistici in Excell Pacchetto Analisi di dati Strumenti di analisi: Analisi varianza: ad un fattore Analisi

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unina.it Università degli studi di Cassino () Statistica 1 / 1 Outline 1 () Statistica 2 / 1 Outline 1 2 () Statistica 2 / 1 Outline 1 2 3 () Statistica 2 / 1

Dettagli

Σ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica

Σ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica 13. Regressione lineare parametrica Esistono numerose occasioni nelle quali quello che interessa è ricostruire la relazione di funzione che lega due variabili, la variabile y (variabile dipendente, in

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 07-Coefficienti di correlazione vers. 1.0 (29 ottobre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

L interruttore viene montato su un dispositivo di accoppiamento bus.

L interruttore viene montato su un dispositivo di accoppiamento bus. L interruttore viene montato su un dispositivo di accoppiamento bus. I pulsanti possono inviare comandi di commutazione, regolazione di lampade, controllo di tapparelle o telegrammi da 1 byte agli attuatori

Dettagli

1 ISCRIVERSI AL SITO. Alla pagina cliccare su «desidero iscrivermi»

1 ISCRIVERSI AL SITO. Alla pagina   cliccare su «desidero iscrivermi» 1 ISCRIVERSI AL SITO Alla pagina www.ornitho.it cliccare su «desidero iscrivermi» Inserire i propri dati. L indirizzo e-mail di registrazione funziona come username. E possibile rendere visibile il proprio

Dettagli

Anova e regressione. Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Universitá degli Studi di Perugia 22 marzo 2011

Anova e regressione. Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Universitá degli Studi di Perugia 22 marzo 2011 Anova e regressione Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Universitá degli Studi di Perugia 22 marzo 2011 Nella sperimentazione agronomica e biologica in genere è normale organizzare

Dettagli

La curva di regressione è il luogo dei punti aventi come ordinate le medie condizionate

La curva di regressione è il luogo dei punti aventi come ordinate le medie condizionate Correlazione e regressione Correlazione: le due variabili casuali sono considerate in modo per così dire simmetrico. Regressione: una delle due variabili dipende dall'altra, che per così dire la precede

Dettagli

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1 lezione n. 6 (a cura di Gaia Montanucci) METODO MASSIMA VEROSIMIGLIANZA PER STIMARE β 0 E β 1 Distribuzione sui termini di errore ε i ε i ~ N (0, σ 2 ) ne consegue : ogni y i ha ancora distribuzione normale,

Dettagli

Classificazione Mario Guarracino Data Mining a.a. 2010/2011

Classificazione Mario Guarracino Data Mining a.a. 2010/2011 Classificazione Mario Guarracino Data Mining a.a. 2010/2011 Introduzione I modelli di classificazione si collocano tra i metodi di apprendimento supervisionato e si rivolgono alla predizione di un attributo

Dettagli

STATISTICA ESERCITAZIONE 13

STATISTICA ESERCITAZIONE 13 STATISTICA ESERCITAZIONE 13 Dott. Giuseppe Pandolfo 9 Marzo 2015 Errore di I tipo: si commette se l'ipotesi nulla H 0 viene rifiutata quando essa è vera Errore di II tipo: si commette se l'ipotesi nulla

Dettagli

Computazione per l interazione naturale: Regressione probabilistica

Computazione per l interazione naturale: Regressione probabilistica Computazione per l interazione naturale: Regressione probabilistica Corso di Interazione Naturale Prof. Giuseppe Boccignone Dipartimento di Informatica Università di Milano boccignone@di.unimi.it boccignone.di.unimi.it/in_2018.html

Dettagli