Esercitazione di Social Media Management A.A Regressione Lineare

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Esercitazione di Social Media Management A.A Regressione Lineare"

Transcript

1 Esercitazione di Social Media Management A.A Regressione Lineare Antonino Furnari Prof. Giovanni Maria Farinella In questa esercitazione impareremo come: Si consiglia la consultazione online Analizzare un insieme di osservazione mediante Principal Component Analysis (PCA); Costruire un modello di regressione lineare per predire la memorability di una immagine a partire da features di tipo Bag Of Visual Words; Stimare l accuratezza del modello mediante errore assoluto medio (Mean Absolute Error MAE) e indice di correlazione per ranghi di Spearman. 1. Convenzioni Lo scopo di questa esercitazione è guidare il lettore attraverso la comprensione di concetti chiave e la loro implementazione pratica. Per facilitare la comprensione degli argomenti proposti, durante l'esercitazione, viene richiesto al lettore di rispondere ad alcune domande e risolvere alcuni esercizi pratici. Tali richieste sono indicate dai seguenti simboli:

2 Questo simbolo è presente laddove viene richiesto al lettore di rispondere a una domanda. Questo simbolo è presente laddove viene richiesto a lettore di svolgere un esercizio. Questo simbolo indica una nota al lettore. Questa icona contrassegna i contenuti non essenziali ai fini dell'esercitazione. L'esercitazione può essere svolta in modalità "fast track" saltando i contenuti contrassegnati da questo simbolo. L'icona è generalmente riportata in alto a sinistra nel paragrafo interessato. Questa icona indica un collegamento a una pagina di approfondimento. Si tratta di materiale non indispensabile ai fini dell'esercitazione ma che può comunque tornare utile. L'icona è generalmente riportata in alto a destra nel paragrafo interessato, cliccandovi sopra è possibile accedere al contenuto di approfondimento. Gli approfondimenti segnalati da questa icona sono anche riportati tra le referenze. Durante l'esercitazione, verrà richiesto di sviluppare alcune funzioni necessarie a svolgere i passi successivi. Le soluzioni non sono riportate in questa esercitazione Le funzioni richieste si trovano nel modulo solution che verrà fornito al completamento dell'esercitazione.

3 In [1]: #importiamo tutte le funzioni del package solution che ci serviranno in seguito #Nota: questa istruzione è qui solo per "motivi tecnici" #Ai fini di questa esercitazione, non è richiesta l'esecuzione di questa istruzione #che non andrebbe a buon fine vista l'assenza del modulo "solution" from solution import * 2. Requisiti Ambiente di lavoro basato su python 2.7 (consigliato IPython + IDE). L'ambiente di lavoro può essere impostato installando una delle principali distribuzioni Python: Anaconda ( Canopy ( Librerie richieste: scipy ( numpy ( matplotlib ( scikit image ( image.org/). È inoltre richiesto aver seguito le seguenti esercitazioni: Gestione di dataset di immagini: Bag of Visual Word Models: In particolare, il file dataset.py (scaricabile da qui) deve essere posizionato nella directory di lavoro. Utilizzeremo anche le funzioni sviluppate nell'esercitazione su Bag of Visual Word Models, che sono riportate nel file bovw.py (scaricabile da qui). Posizionare anche questo file nella directory di lavoro.

4 3. Dataset In questa esercitazione utilizzeremo un dataset di immagini acquisite nel contesto di uno studio su Image Memorability (vedi referenza [1]). Il dataset contiene 2222 immagini di risoluzione pixels. Le immagini sono corredate da una serie di valori stimati mediante un gioco di memoria visuale al quale hanno partecipato diversi soggetti utilizzando la piattaforma Amazon Mechanical Turk. Tra i valori forniti, noi considereremo gli hits, ovvero il numero di volte in cui ogni immagine è stata effettivamente riconosciuta come già vista quando ripresentata ai partecipanti. Il dataset è disponibile all indirizzo Tuttavia, considerate le dimensioni dell archivio (1.7 GB), per questa esercitazione utilizzeremo una versione più leggera del dataset in cui tutte le immagini sono state compresse in formato JPEG. Il dataset è già stato diviso in training e test set dopo un riordinamento casuale delle immagini. Per risparmiare tempo, ai fini di questa esercitazione, vengono inoltre fornite le rappresentazioni estratte dalle immagine a partire da un modello di tipo Bag of Visual Words. Scarichiamo il dataset da e scompattiamo l archivio nella nostra directory di lavoro. All interno della cartella "memorability" troveremo: Una cartella "training_set" contenente una cartella "Images" con 1555 immagini in formato JPEG (immagini di training). Il nome di ogni immagine rappresenta un indice numerico che definisce un ordinamento univoco; Una cartella "test_set" contenente una cartella "Images" con 667 immagini in formato JPEG (immagini di test). Il nome di ogni immagine rappresenta un indice numerico che definisce un ordinamento univoco; Il file training_hits.npy, che contiene il numero hits per ogni immagine di training. I valori sono ordinati secondo la numerazione definita dai nomi dei file JPG; Il file test_hits.npy, che contiene il numero hits per ogni immagine di test. I valori sono ordinati secondo la numerazione definita dai nomi dei file JPG; Il file features.pkl, che contiene le features di tipo Bag Of Visual Words pre computate per ogni immagine come specificato di seguito. Iniziamo costruendo due oggetti di tipo Dataset a partire dalle immagini di training e test appena estratte dall'archivio: In [2]: from dataset import Dataset training_set = Dataset('memorability/training_set') test_set = Dataset('memorability/test_set') La classe Dataset è stata progettata per gestire dataset di immagini appartenenti a più classi. In questa esercitazione, affronteremo un problema di regressione e non di classificazione. Pertanto, il dataset conterrà una unica "pseudo classe" chiamata "Images".

5 Verifichiamo che il dataset sia stato correttamente caricato e visualizziamo alcune immagini: In [3]: print "Number of images in the training set:{0}".format(training_set.getlength()) print "Number of images in the test set:{0}".format(test_set.getlength()) print "Total number of images: {0}".format(training_set.getLength()+test_set.getLength()) print "List of classes ", training_set.getclasses() training_set.showimage('images',18) print "Shown image path: %s" % training_set.getimagepath('images',18) Number of images in the training set:1555 Number of images in the test set:667 Total number of images:2222 List of classes ['Images'] Shown image path: memorability/training_set\images\0019.jpg Carichiamo dunque il numero di "hits" per ogni immagine del training set: In [4]: import numpy as np training_hits=np.load('memorability/training_hits.npy') test_hits=np.load('memorability/test_hits.npy') print training_hits.shape print test_hits.shape (1555L,) (667L,) Possiamo dunque ispezionare il numero di hits relativo a una data immagine:

6 In [5]: from skimage import io as sio from matplotlib import pyplot as plt im=sio.imread(training_set.getimagepath('images',23)) plt.figure() plt.imshow(im) plt.title("hits: {0}".format(training_hits[23])) plt.show() Esercizio 3.1 Scrivere il codice per visualizzare tutte le immagini del training set con i rispettivi numeri di hits in sequenza. Suggerimento: utilizzare la funzione `plt.pause(n)` tra due esecuzioni consecutive di `imshow` in modo da visualizzare l'immagine per `n` secondi.

7 Domanda 3.1 Notate una correlazione tra contenuto visivo dell immagine e numero di hits? Esercizio 3.2 Visualizzare le immagini con il numero più basso e più alto di hits. Suggerimento: vedere la documentazione della funzione di numpy argmax. 4. Rappresentazione Adesso eseguiamo tutti i passi necessari per creare un modello di tipo Bag Of Visual Words e estrarre le feature da tutto il dataset. Ci avvarremo delle funzioni sviluppate nell'esercitazione precedente. La costruzione di un modello di tipo Bag Of Visual Words e la rappresentazione di tutte le immagini del training e test set possono essere dispendiose in termini di tempo. Pertanto, ai fini di questa esercitazione, sono state fornite le feature precomputate per ogni immagine di training e test. E' dunque possibile saltare il punto 4.1 (o leggerlo velocemente) per passare direttamente al punto 4.2. Si consiglia di ritornare sul punto 4.1 a casa, una volta ultimata l'esercitazione. 4.1 Rappresentazione delle immagini e salvataggio su file (da fare a casa)

8 Per creare il modello di tipo Bag Of Visual Words, utilizzeremo alcune delle funzioni sviluppate nell'esercitazione su Bag Of Visual Words model. Per ottenere una rappresentazione più accurata, utilizzeremo step=4 (valore di default) nel processo di estrazione delle feature locali DAISY. Le funzioni, modificate in modo da utlizzare il corretto valore di step sono definite all'interno del file bovw.py (scaricabile da qui), che va posizionato nella directory di lavoro. from bovw import extract_features training_local_features = extract_features(training_set) from bovw import describe_dataset from sklearn.cluster import MiniBatchKMeans as KMeans kmeans = KMeans(500) kmeans.fit(training_local_features) training_features,_,_=describe_dataset(training_set,kmeans) test_features,_,_=describe_dataset(test_set,kmeans) Normalizziamo le feature mediante norma L2: from sklearn.preprocessing import Normalizer norm = Normalizer(norm='l2') training_features=norm.transform(training_features) test_features=norm.transform(test_features) Quando si affrontano problemi di regressione, è comune chiamare le feature X e i target y. Pertanto poniamo: X_training = training_features y_training = training_targets["images"] X_test = test_features y_test = test_targets["images"] Salviamo dunque le feature su file: import cpickle with open("memorability/features.pkl","wb") as f: cpickle.dump({ "X_training" : X_training, "y_training" : y_training, "X_test" : X_test, "y_test" : y_test },f) 4.2 Caricamento delle feature da file (se si è saltato il passo 4.1) Dato che l operazione può essere molto dispendiosa in termini di tempo computazionale, carichiamo il modello e le feature pre computate per questa esercitazione:

9 In [6]: import cpickle with open("memorability/features.pkl") as f: data = cpickle.load(f) X_training = data["x_training"] y_training = data["y_training"] X_test = data["x_test"] y_test = data["y_test"] Domanda 4.1 Che dimensioni hanno le matrici X_training e X_test? Questo tipo di matrice ha un nome particolare in machine learning, quale?

10 5. Principal Component Analysis Quando si utilizza l equazione normale per trovare i parametri ottimali di un regressore lineare, si possono avere problemi relativi alla non invertibilità di ( X T X) 1, dove X è la matrice delle osservazioni. Ciò è generalmente dovuto alla presenza di ridondanza tra le feature (diverse parole visuali che codificano pattern visivi molto simili, nel nostro caso) o all eccessivo numero di feature rispetto al numero di osservazioni. Per prevenire questo tipo di problema, trasformeremo i nostri dati utilizzando una tecnica chiamata Principal Component Analysis (PCA). Data una matrice di osservazioni X[n m] (con n numero di osservazioni e m numero di feature), la PCA trova una matrice tale che: C[m p] W = X ( C T ) 1 dove X è la matrice delle osservazioni centrata nello zero ( X i = X i μ i, con μ i valore medio di X i nel training set), (C T ) 1 è la pseudo inversa di C T e W è una matrice [n p] contenente n osservazioni di dimensionalità generalmente ridotta p m. In questa sede, non scenderemo nei dettagli matematici della PCA (per i quali si è rimandati alla relativa pagina di wikipedia. Ci basta solo sapere che la nuova matrice delle osservazioni W, ha le seguenti caratteristiche: Le features sono ordinate dalla più importante alla meno importante. Ciò vuol dire che la maggior parte dell informazione è contenuta nelle prime features; Le features sono generalmente decorrelate e quindi sono meno inclini a presentare dipendenza lineare. Le medie μ i e la matrice di proiezione C dipendono dai dati di training che abbiamo utilizzato per stimarli. Si suppone che, se la trasformazione PCA definita da questi valori è "buona" per i dati di training, essa sarà altrettanto "buona" per quelli di test. Pertanto, una volta stimate le medie μ i e la matrice C, è possibile applicare la stessa trasformazione PCA al training e al test set in modo da avere dati dalle caratteristiche analoghe. Il calcolo dei valori di μ i e C e l'applicazione di una data trasformazione PCA su nuovi dati, può essere ottenuta mediante l'oggetto PCA di sklearn. In particolare, possiamo "allenare" il modello PCA mediante le seguenti righe di codice: In [7]: from sklearn.decomposition import PCA as PCA pca = PCA() pca.fit(x_training); Il metodo fit ha stimato le medie μ i e la matrice C a partire dai dati di training passati in input. E' possibile accedere ai valori stimati come segue:

11 In [8]: mu = pca.mean_ C = pca.components_ print mu.shape print C.shape (500L,) (500L, 500L) A questo punto, per applicare la trasformazione PCA imparata, potremmo utilizzare la formula vista prima: C T ) 1 che si traduce in python come segue: W = X ( In [9]: W=np.dot((X_training mu),np.linalg.inv(c)) print W.shape (1555L, 500L) Tuttavia, mediante la libreria scikit learn è sufficiente scrivere: In [10]: X_training_pca = pca.transform(x_training) X_test_pca = pca.transform(x_test) print X_training.shape, X_training_pca.shape print X_test.shape, X_test_pca.shape (1555L, 500L) (1555L, 500L) (667L, 500L) (667L, 500L) In questo caso le dimensioni di X_training_pca e X_test_pca sono rimaste invariate (500 feature). Tuttavia, le feature sono adesso state ordinate in maniera "più significativa". Per capire in che modo sono stati trasformati i dati, proviamo a plottare in uno spazio 2D i campioni presenti in X_training e X_training_pca selezionando solo le prime due componenti:

12 In [11]: from matplotlib import pyplot as plt plt.figure(figsize=(10,4)) plt.subplot(121) plt.plot(x_training[:,0],x_training[:,1],'bx') plt.subplot(122) plt.plot(x_training_pca[:,0],x_training_pca[:,1],'rx') plt.show() Domanda 5.1 Che differenze notate tra i due plot? Quale insieme appare centrato rispetto allo zero? Quale insieme sembra contenere meno ridondanza? In pratica, questa nuova rappresentazione delle osservazioni ci permette di: Avere meno problemi quando si utilizza la regressione in forma normale; Avere un idea del modo in cui i nostri dati si dispongono nello spazio selezionando solo le prime due componenti. 6. Costruire un regressore lineare multivariato per predire la memorability di una immagine

13 Alleneremo un modello di regressione lineare che, presa in input la rappresentazione di una immagine X = ( X1, X2,, X n ) ne stimi il numero di hits (ovvero la "memorability") y mediante il modello: Nell'equazione riportata sopra, y è la variabile dipendente (numero di hits), X1,, X500 sono i 500 predittori (le 500 feature estratte mediante BOVW e trasformate secondo PCA) θ0 è l intercetta, e sono i regressori. Per poter utilizzare il modello di regressione riportato sopra, dobbiamo prima "allenarlo", cioè stimare i parametri (regressori) a partire dalle immagini del training set. θ1,, θ500 y = θ0 + X1θ1 + X2θ2 + + X500θ500 θ0,, θ500 Per allenare il modello, utilizzeremo l'oggetto LinearRegression della librearia scikit learn che ha una interfaccia analoga a quella di PCA: In [12]: from sklearn.linear_model import LinearRegression lr = LinearRegression() lr.fit(x_training_pca,y_training); E' possibile accedere ai parametri stimati come segue: In [13]: theta_0 = lr.intercept_ theta_1_500 = lr.coef_ print theta_0 print theta_1_500.shape (500L,) Domanda 6.1 Perché il parametro regressione lineare? θ0 viene chiamato "intercept_" all'interno del modello di Se vogliamo rappresentare graficamente come il numero di hits varia al variare delle osservazioni e come si comporta il nostro regressore lineare, selezioneremo un solo predittore, ignorando gli altri. Dal momento che la PCA ha ordinato le feature per importanza, considereremo la prima feature. Il modello si riduce a: y = + θ0 X1θ1 Visualizziamo innanzitutto come la variabile dipendente y varia al variare del predittore X1:

14 In [14]: plt.figure() X1 = X_training_pca[:,0] plt.plot(x1,y_training,'x') plt.show() A questo punto possiamo visualizzare la retta di regressione definita dal nostro modello lineare semplificato:

15 In [15]: plt.figure() plt.plot(x1,y_training,'x') theta_1=theta_1_500[0] x=np.arange( 0.6,0.8,0.1) plt.plot(x,theta_0+x*theta_1,'r') plt.show() Dato che stiamo effettuando una regressione multivariata, questo plot cattura cosa succederebbe se i valori delle feature superiori alla prima fossero nulli. Per avere un idea di come la regressione si comporta all aumentare del numero di feature, passiamo dallo spazio bidimensionale a quello tridimensionale considerando i primi due predittori X1 e X2. Il nostro modello lineare diventa: Y = θ0 + X1θ1 + X2θ2 Visualizziamo i dati in tre dimensioni, mediante i comandi:

16 In [16]: from mpl_toolkits.mplot3d import Axes3D fig = plt.figure() plt.subplot(111, projection='3d') X1 = X_training_pca[:,0] X2 = X_training_pca[:,1] plt.plot(x1,x2,y_training,'o') plt.show() Il plot appena ottenuto è un plot tridimensionale. Pertanto è possibile "esplorarlo" cambiandone il punto di vista. Per farlo, provate a cliccare su un punto qualsiasi del grafico e trascinare con il mouse. Si noti che, nel caso in cui si utilizza jupyter, sarà generata una immagine statica. Per ottenere una versione esplorabile del grafico si digiti: ```python %matplotlib qt ``` prima di lanciare il plot. Per poter effettuare i plot in 3 dimensioni, abbiamo inserito un subplot all'interno della figura appena creata e utilizzato la keyword projection='3d' per specificare che il plot sarebbe stato in 3 dimensioni. Per maggiori informazioni sui plot 3D è possibile consultare la documentazione di matplotlib. Il modello di regressione lineare in 3 dimensioni non è più una retta ma un piano individuato dall'equazione: z = θ0 + θ1x + θ2y Dove x e y sono due variabili indipendenti, mentre z è la variabile dipendente. Possiamo visualizzare il piano come segue:

17 In [17]: fig = plt.figure() plt.subplot(111, projection='3d') theta_2 = theta_1_500[1] x_range= np.arange( 1,1,0.1) y_range= np.arange( 1,1,0.1) x,y=np.meshgrid(x_range,y_range) plt.plot(x1,x2,y_training,'x') plt.gca().plot_surface(x,y,theta_0+theta_1*x+theta_2*y,shade=false,color='r') plt.show() La funzione meshgrid permette di creare una griglia bidimensionale di valori a partire da due vettori unidimensionali.

18 In [18]: x=[1,2,3,4,5] y=[1,2,3,4,5,6,7,8] [x_grid,y_grid]=np.meshgrid(x,y) print "x:",x print "y:",y print "x_grid:\n",x_grid print "y_grid:\n",y_grid x: [1, 2, 3, 4, 5] y: [1, 2, 3, 4, 5, 6, 7, 8] x_grid: [[ ] [ ] [ ] [ ] [ ] [ ] [ ] [ ]] y_grid: [[ ] [ ] [ ] [ ] [ ] [ ] [ ] [ ]] La funzione plot_surface permette di plottare una superficie nel mondo 3D (un piano nel nostro caso). Domanda 6.2 la retta e il piano di regressione sono ragionevoli rispetto ai dati considerati? Quanto errore pensate che il regressore stia compiendo? Esercizio 6.1 Visualizzare i due grafici come quelli di sopra anche per il test set. Che risultati abbiamo? La retta e il piano di regressione si comportano in maniera simile rispetto ai nuovi dati?

19 In [19]: fig = plt.figure() plt.subplot(111, projection='3d') X1=X_test_pca[:,0] X2=X_test_pca[:,1] theta_2 = theta_1_500[1] x_range= np.arange( 1,1,0.1) y_range= np.arange( 1,1,0.1) x,y=np.meshgrid(x_range,y_range) plt.plot(x1,x2,y_test,'x') plt.gca().plot_surface(x,y,theta_0+theta_1*x+theta_2*y,shade=false,color='r') plt.show() A questo punto possiamo ottenere le predizioni relative a training e test set mediante il metodo predict : In [20]: training_predictions = lr.predict(x_training_pca) test_predictions = lr.predict(x_test_pca)

20 Esercizio 6.2 Scrivere una funzione predict_and_show che prenda in input: un oggetto di tipo Dataset; le rappresentazioni X delle immagini del dataset (già trasformate mediante PCA); il modello di regressione imparato; i valori target relativi alle immgini del dataset (ad esempio `y_training` o `y_test`); un indice numerico; e mostri l'immagine del dataset corrispondente all'indice specificato, con il numero di hits predetto e il relativo valore di ground truth. La funzione dovrà dare un risultato simile al seguente:

21 In [21]: predict_and_show(training_set,x_training_pca,lr,y_test,1) predict_and_show(test_set,x_test_pca,lr,y_test,18) Domanda 6.3 Il regressore lineare che abbiamo allenato funziona? Come potremmo valutarne la bontà?

22 7.2 Mean Absolute Error (MAE) Il Mean Absolute Error (MAE) è l errore assoluto medio che compiamo nelle predizioni. In pratica, date le variabili target y i e le predizioni y^i restituite dal nostro modello, il MAE è definito come: 1 n MAE( y i, y^i ) = y i y^i n i=1 Esercizio 7.1 Calcolare il MAE relativo a training e test set. Quale valore è più basso? Domanda 7.1 Considerando che il MAE rappresenta l errore medio in valore assoluto che compiamo quando cerchiamo di predire il numero di hits che una immagine totalizzerebbe nel memory game, l errore che commettiamo è alto o basso? 7.3 Indice di correlazione per ranghi di Spearman L indice di correlazione per ranghi di Spearman indica quanto due variabili siano dipendenti. Si tratta di un numero compreso tra 1 (massima anticorrelazione) e 1 (massima correlazione). Secondo questo indice, due variabili sono correlate positivamente (rips. negativamente) quando una può essere espressa come una funzione monotona crescente (risp. decrescente) dell altra. Più la monotonia è perfetta più il numero si avvicina a 1 o 1, come mostrato negli esempi di seguito: L'indice di correlazione di spearman può essere calcolato mediante la funzione spearmanr di scipy (si veda la documentazione):

Carichiamo il contenuto del file hits.mat e costruiamo una struttura di tipo ImageSet :

Carichiamo il contenuto del file hits.mat e costruiamo una struttura di tipo ImageSet : Esercitazione di Social Media Management A. A. 2015 2016 Regressione Lineare Antonino Furnari http://www.dmi.unict.it/~furnari/ furnari@dmi.unict.it Prof. Giovanni Maria Farinella http://www.dmi.unict.it/~gfarinella/

Dettagli

Flickr image classification

Flickr image classification Flickr image classification Relazione progetto Social Media Management Università degli studi di Catania Dipartimento di Matematica e Informatica CANCEMI DAMIANO - W82000075 1 Introduzione Questo progetto

Dettagli

IL CRITERIO DELLA MASSIMA VEROSIMIGLIANZA

IL CRITERIO DELLA MASSIMA VEROSIMIGLIANZA Metodi per l Analisi dei Dati Sperimentali AA009/010 IL CRITERIO DELLA MASSIMA VEROSIMIGLIANZA Sommario Massima Verosimiglianza Introduzione La Massima Verosimiglianza Esempio 1: una sola misura sperimentale

Dettagli

Introduzione ai Laboratori di Fondamenti di Analisi dei Dati. Antonino Furnari

Introduzione ai Laboratori di Fondamenti di Analisi dei Dati. Antonino Furnari Introduzione ai Laboratori di Fondamenti di Analisi dei Dati Antonino Furnari furnari@dmi.unict.it www.dmi.unict.it/~furnari/ Laboratori di FAD Docente: Antonino Furnari (www.dmi.unict.it/~furnari/); Ricevimento:

Dettagli

Tesina Intelligenza Artificiale Maria Serena Ciaburri s A.A

Tesina Intelligenza Artificiale Maria Serena Ciaburri s A.A Tesina Intelligenza Artificiale Maria Serena Ciaburri s231745 A.A. 2016-2017 Lo scopo di questa tesina è quello di clusterizzare con l algoritmo K-Means i dati presenti nel dataset MNIST e di calcolare

Dettagli

Classificazione k-nn con R. Strumenti quantitativi per la gestione

Classificazione k-nn con R. Strumenti quantitativi per la gestione Classificazione k-nn con R Strumenti quantitativi per la gestione Emanuele Taufer file:///g:/il%20mio%20drive/2%20corsi/3%20sqg/labs/l1-knn.html#(1) 1/16 Altezza e peso degli adulti Le statistiche sull

Dettagli

Data Journalism. Analisi dei dati. Angelica Lo Duca

Data Journalism. Analisi dei dati. Angelica Lo Duca Data Journalism Analisi dei dati Angelica Lo Duca angelica.loduca@iit.cnr.it Obiettivo L obiettivo dell analisi dei dati consiste nello scoprire trend, pattern e relazioni nascosti nei dati. di analisi

Dettagli

Esercitazione del

Esercitazione del Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36

Dettagli

7. STATISTICA DESCRITTIVA

7. STATISTICA DESCRITTIVA 7. STATISTICA DESCRITTIVA Quando si effettua un indagine statistica si ha a che fare con un numeroso insieme di oggetti, detto popolazione del quale si intende esaminare una o più caratteristiche (matricole

Dettagli

Naïve Bayesian Classification

Naïve Bayesian Classification Naïve Bayesian Classification Di Alessandro rezzani Sommario Naïve Bayesian Classification (o classificazione Bayesiana)... 1 L algoritmo... 2 Naive Bayes in R... 5 Esempio 1... 5 Esempio 2... 5 L algoritmo

Dettagli

Ordinamento dati La funzione Ordina disponibile nel menù consente di ordinare la matrice dati in base alla variabile scelta

Ordinamento dati La funzione Ordina disponibile nel menù consente di ordinare la matrice dati in base alla variabile scelta Excel è un applicazione di foglio elettronico che permette di raccogliere ed elaborare i dati inseriti dall utente. Inserimento dati I dati vengono raccolti in tabelle. Tabella: insieme di celle disposte

Dettagli

BLAND-ALTMAN PLOT. + X 2i 2 la differenza ( d ) tra le due misure per ognuno degli n campioni; d i. X i. = X 1i. X 2i

BLAND-ALTMAN PLOT. + X 2i 2 la differenza ( d ) tra le due misure per ognuno degli n campioni; d i. X i. = X 1i. X 2i BLAND-ALTMAN PLOT Il metodo di J. M. Bland e D. G. Altman è finalizzato alla verifica se due tecniche di misura sono comparabili. Resta da comprendere cosa si intenda con il termine metodi comparabili

Dettagli

Computazione per l interazione naturale: Regressione lineare (MSE)

Computazione per l interazione naturale: Regressione lineare (MSE) Computazione per l interazione naturale: Regressione lineare (MSE) Corso di Interazione Naturale Prof. Giuseppe Boccignone Dipartimento di Informatica Università di Milano boccignone@di.unimi.it boccignone.di.unimi.it/in_2015.html

Dettagli

Risoluzione di problemi ingegneristici con Excel

Risoluzione di problemi ingegneristici con Excel Risoluzione di problemi ingegneristici con Excel Problemi Ingegneristici Calcolare per via numerica le radici di un equazione Trovare l equazione che lega un set di dati ottenuti empiricamente (fitting

Dettagli

1. Calcolo dell indice di condizionamento di una matrice

1. Calcolo dell indice di condizionamento di una matrice 1 Esercizi sul condizionamento con matlab laboratorio di Calcolo Scientifico per Geofisici Prof. A. Murli a.a. 2006/07 1. Calcolo dell indice di condizionamento di una matrice Determinare una function

Dettagli

EsercitazioneII. In questa esercitazione faremi un ripasso generale: rappresentazioni grafiche, medie e varianze;

EsercitazioneII. In questa esercitazione faremi un ripasso generale: rappresentazioni grafiche, medie e varianze; EsercitazioneII In questa esercitazione faremi un ripasso generale: rappresentazioni grafiche, medie e varianze; la correlazione; la regressione; introduzione alla probabilità. 1 Esercizio 1 Gli stipendi

Dettagli

Laboratorio Apprendimento Automatico

Laboratorio Apprendimento Automatico Laboratorio Apprendimento Automatico Laurea Magistrale in Informatica Mirko Polato 14 novembre 2016 Python Perché python? Molti moduli per l analisi e la visualizzazione dei dati pre esistenti; Facile

Dettagli

Un grafico utilizza i valori contenuti in un foglio di lavoro per creare una rappresentazione grafica delle relazioni esistenti tra loro;

Un grafico utilizza i valori contenuti in un foglio di lavoro per creare una rappresentazione grafica delle relazioni esistenti tra loro; EXCEL Modulo 3 I Grafici Grafici Un grafico utilizza i valori contenuti in un foglio di lavoro per creare una rappresentazione grafica delle relazioni esistenti tra loro; Quando si crea un grafico ogni

Dettagli

Regressione Lineare e Regressione Logistica

Regressione Lineare e Regressione Logistica Regressione Lineare e Regressione Logistica Stefano Gualandi Università di Pavia, Dipartimento di Matematica email: twitter: blog: stefano.gualandi@unipv.it @famo2spaghi http://stegua.github.com 1 Introduzione

Dettagli

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Quesito: Posso stimare il numero di ore passate a studiare statistica sul voto conseguito all esame? Potrei calcolare il coefficiente di correlazione.

Dettagli

Analisi Numerica. Debora Botturi ALTAIR. Debora Botturi. Laboratorio di Sistemi e Segnali

Analisi Numerica. Debora Botturi ALTAIR.  Debora Botturi. Laboratorio di Sistemi e Segnali Analisi Numerica ALTAIR http://metropolis.sci.univr.it Argomenti Argomenti Argomenti Rappresentazione di sistemi con variabili di stato; Tecniche di integrazione numerica Obiettivo: risolvere sistemi di

Dettagli

STEREONET3D AGOSTO 2018 DEBORAH PAOLINI NOME PROGRAMMA ALUNNO DATA!

STEREONET3D AGOSTO 2018 DEBORAH PAOLINI NOME PROGRAMMA ALUNNO DATA! NOME PROGRAMMA DATA STEREONET3D AGOSTO 2018 ALUNNO DEBORAH PAOLINI SPECIFICHE DEL PROGRAMMA ICONA DEL PROGRAMMA - SISTEMA OPERATIVO : OSX 10.9 O VERSIONI PRECEDENTI - VERSIONE 5.8 - AUTORI : RICK ALLMENDINGER

Dettagli

Generazione di Numeri Casuali- Parte 2

Generazione di Numeri Casuali- Parte 2 Esercitazione con generatori di numeri casuali Seconda parte Sommario Trasformazioni di Variabili Aleatorie Trasformazione non lineare: numeri casuali di tipo Lognormale Trasformazioni affini Numeri casuali

Dettagli

Regressione Lineare Semplice e Correlazione

Regressione Lineare Semplice e Correlazione Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)

Dettagli

STATISTICA. Esercitazione 5

STATISTICA. Esercitazione 5 STATISTICA Esercitazione 5 Esercizio 1 Ad un esame universitario sono stati assegnati in modo casuale due compiti diversi con i seguenti risultati: Compito A Compito B Numero studenti 102 105 Media dei

Dettagli

Metodo dei Minimi Quadrati. Dott. Claudio Verona

Metodo dei Minimi Quadrati. Dott. Claudio Verona Metodo dei Minimi Quadrati Dott. Claudio Verona E in generale interessante studiare l andamento di una variabile in funzione di un altra e capire se c è una funzione matematica che le lega. Viceversa è

Dettagli

Esercitazione n 2. Costruzione di grafici

Esercitazione n 2. Costruzione di grafici Esercitazione n 2 Costruzione di grafici I grafici I grafici sono rappresentazione di dati numerici e/o di funzioni. Devono facilitare all utente la visualizzazione e la comprensione dei numeri e del fenomeno

Dettagli

ESERCITAZIONE 1 ELEMENTI DI MATEMATICA

ESERCITAZIONE 1 ELEMENTI DI MATEMATICA ESERCITAZIONE ELEMENTI DI MATEMATICA Potenze e radicali. Potenze: La potenza n-esima di un numero x, x n, si calcola moltiplicando x per se stesso n volte. Ad esempio, elevare alla quinta significa moltiplicare

Dettagli

Regressione. Lineare Simple linear regression Multiple linear regression Regression vs Geometrical fitting

Regressione. Lineare Simple linear regression Multiple linear regression Regression vs Geometrical fitting Lineare Simple linear regression Multiple linear regression Regression vs Geometrical fitting Non lineare Variabile indipendente non lineare Ottimizzazione numerica (metodi iterativi) 1 Definizioni Nei

Dettagli

STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7:

STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7: esercitazione 7 p. 1/13 STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7: 20-05-2004 Luca Monno Università degli studi di Pavia luca.monno@unipv.it http://www.lucamonno.it

Dettagli

Implementazione degli algoritmi.

Implementazione degli algoritmi. Implementazione degli algoritmi. 4.1. Introduzione. In questo capitolo sarà discussa l implementazione software per l ambiente MATLAB 6.1 che è stata fatta degli algoritmi di identificazione presentati

Dettagli

Vivisezione di un algoritmo di machine learning. Francesco ESPOSITO Youbiquitous

Vivisezione di un algoritmo di machine learning. Francesco ESPOSITO Youbiquitous Vivisezione di un algoritmo di machine learning Francesco ESPOSITO Youbiquitous Argomenti Panoramica di algoritmi e problemi Dentro un algoritmo Definire un approssimazione Definire un errore Minimizzare

Dettagli

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello Metodi Quantitativi per Economia, Finanza e Management Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello 1. Introduzione ai modelli di regressione 2. Obiettivi 3. Le

Dettagli

Principi di Programmazione Prova del 10/6/2008 (ore 10.30)

Principi di Programmazione Prova del 10/6/2008 (ore 10.30) Prova del 10/6/2008 (ore 10.30) Scrivere (commentandole) le linee di codice Matlab per costruire i seguenti vettori (5x1): e il vettore di numeri complessi C tali che il singolo elemento c k ha come parte

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Associazione, correlazione e dipendenza tra caratteri In un collettivo di 11 famiglie è stata

Dettagli

Parte 1: tipi primitivi e istruzioni C

Parte 1: tipi primitivi e istruzioni C Parte 1: tipi primitivi e istruzioni C Esercizio 1 Scrivere un programma che stampa la somma di una sequenza di N numeri inseriti dall utente. Esercizio 2 Scrivere un programma che stampa la somma di una

Dettagli

PSICOMETRIA. Esercitazione n.1. C.d.L. Comunicazione e Psicologia a.a. 2012/13

PSICOMETRIA. Esercitazione n.1. C.d.L. Comunicazione e Psicologia a.a. 2012/13 PSICOMETRIA Esercitazione n.1 C.d.L. Comunicazione e Psicologia a.a. 2012/13 ESERCITAZIONE 1: INDICE 1. Informazioni di carattere generale sulle esercitazioni 2. Il foglio di calcolo (Excel) 3. Avviare

Dettagli

Esercitazione di Matematica Computazionale del 16/12/2008

Esercitazione di Matematica Computazionale del 16/12/2008 Esercitazione di Matematica Computazionale del 16/12/2008 Applicazioni della Singular Value Decomposition Riconoscimento di Volti mediante Eigenface 1. Rappresentazione di un volto nella base dei suoi

Dettagli

L A B C di R. Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010

L A B C di R. Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010 L A B C di R 0 20 40 60 80 100 2 3 4 5 6 7 8 Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010 La scelta del test statistico giusto La scelta della analisi

Dettagli

Analisi Multivariata Prova intermedia del 20 aprile 2011

Analisi Multivariata Prova intermedia del 20 aprile 2011 Analisi Multivariata Prova intermedia del 20 aprile 20 Esercizio A Sia X N 3 (µ, Σ) con µ = [ 3,, 4] e 2 0 Σ = 2 5 0 0 0 2 Quali delle seguenti variabili casuali è indipendente? Motivare la risposta. A.

Dettagli

ESERCITAZIONE REGRESSIONE MULTIPLA

ESERCITAZIONE REGRESSIONE MULTIPLA ESERCITAZIONE REGRESSIONE MULTIPLA Dati delle Nazioni Unite del 2005 riferiti, per diverse nazioni, al tasso di feconditá (bambini per donna) (variabile Fert), alla percentuale di donne che usa contraccettivi

Dettagli

Regressione. Monica Marabelli. 15 Gennaio 2016

Regressione. Monica Marabelli. 15 Gennaio 2016 Regressione Monica Marabelli 15 Gennaio 2016 La regressione L analisi di regressione é una tecnica statistica che serve a studiare la relazione tra variabili. In particolare, nel modello di regressione

Dettagli

Corso di laurea in Matematica Laboratorio di Programmazione e Calcolo Prof. A. Murli. Esercizi di riepilogo - LABORATORIO

Corso di laurea in Matematica Laboratorio di Programmazione e Calcolo Prof. A. Murli. Esercizi di riepilogo - LABORATORIO Cognome: Nome: 1 Matricola: Corso di laurea in Matematica Laboratorio di Programmazione e Calcolo Prof. A. Murli Esercizi di riepilogo - LABORATORIO Creare una directory nominata cognome nome dove cognome

Dettagli

Esercitazione n 2 Costruzione di grafici

Esercitazione n 2 Costruzione di grafici Esercitazione n 2 Costruzione di grafici 1/31 I grafici I grafici sono rappresentazione di dati numerici e/o di funzioni. Devono facilitare all utente la visualizzazione e la comprensione dei numeri e

Dettagli

Validazione dei modelli. Strumenti quantitativi per la gestione

Validazione dei modelli. Strumenti quantitativi per la gestione Validazione dei modelli Strumenti quantitativi per la gestione Emanuele Taufer file:///g:/il%20mio%20drive/2%20corsi/3%20sqg/labs/l5-validazione.html#(1) 1/27 Validazione dei modelli In questo esempio

Dettagli

Esercitazioni Infostat ConfInt

Esercitazioni Infostat ConfInt Esercitazioni Infostat ConfInt Matteo Re, Alessandro Di Domizio 3 Maggio 2019 1 Introduzione In questa esercitazione vedremo come stimare l intervallo di confidenza da un campione che assumiamo essere

Dettagli

Variabili tutte osservabili: regressione Si parla di regressione quando si ha a disposizione un campione sperimentale di numerosità n della forma X 1

Variabili tutte osservabili: regressione Si parla di regressione quando si ha a disposizione un campione sperimentale di numerosità n della forma X 1 Modelli lineari Come motivazione di ciò che stiamo per fare, pensiamo ai dati indicatori_benessere.txt. Quando li abbiamo esaminati nella lezione 1 tramite la rappresentazione nel piano delle componenti

Dettagli

Il Modello di Scomposizione

Il Modello di Scomposizione Approccio Classico: Metodi di Scomposizione Il Modello di Scomposizione Il modello matematico ipotizzato nel metodo classico di scomposizione è: y t =f(s t, T t, E t ) dove y t è il dato riferito al periodo

Dettagli

Corso di Microsoft. Access. Marco P. Locatelli.

Corso di Microsoft. Access. Marco P. Locatelli. Corso di Microsoft Access Marco P. Locatelli locatelli@disco.unimib.it Esempio Lo schema Entità Relazione rappresenta parte di un modello relativo ad una palestra, con informazioni sugli istruttori, sulle

Dettagli

Corso sul PACCHETTO OFFICE. Modulo Access

Corso sul PACCHETTO OFFICE. Modulo Access Corso sul PACCHETTO OFFICE Modulo Access Docente: dott. Marco Cardani Lezione 2 Come creare un database 1 2 Come creare un database Impareremo ora come creare un nuovo database in modo da raggiungere un

Dettagli

Laboratorio di Programmazione Esercitazione 4

Laboratorio di Programmazione Esercitazione 4 Laboratorio di Programmazione Esercitazione 4 Prof. Michele Scarpiniti Prof. Danilo Comminiello Dipartimento di Ingegneria dell Informazione, Elettronica e Telecomunicazioni Sapienza Università di Roma

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative

Dettagli

La Retta Ogni funzione di primo grado rappresenta, graficamente, una retta. L equazione della retta può essere scritta in due modi

La Retta Ogni funzione di primo grado rappresenta, graficamente, una retta. L equazione della retta può essere scritta in due modi La Retta Ogni funzione di primo grado rappresenta, graficamente, una retta. L equazione della retta può essere scritta in due modi Forma implicita Forma esplicita a x b y c 0 y m x q a c y x b b Esempio

Dettagli

PARERE DELL ORGANO DI REVISIONE SULLA PROPOSTA DI BILANCIO DI PREVISIONE

PARERE DELL ORGANO DI REVISIONE SULLA PROPOSTA DI BILANCIO DI PREVISIONE PARERE DELL ORGANO DI REVISIONE SULLA PROPOSTA DI BILANCIO DI PREVISIONE 2016 2018 Il parere al bilancio 2016-2018 predisposto da ANCREL è disponibile in un file.zip oppure.rar. Si consiglia di salvare

Dettagli

francesca fattori speranza bozza gennaio 2018

francesca fattori speranza bozza gennaio 2018 DERIVATE APPLICATE ALLO STUDIO DI FUNZIONE. OM Le derivate servono a trovare eventuali massimi e minimi delle funzioni. Ho pensato questo modulo in questo modo: concetto di derivata; calcolo di una derivata

Dettagli

Fondamenti di Informatica. Ipotesi fondamentale. Irrisolubilità. Prof. V.L. Plantamura Informatica e Comunicazione Digitale a.a.

Fondamenti di Informatica. Ipotesi fondamentale. Irrisolubilità. Prof. V.L. Plantamura Informatica e Comunicazione Digitale a.a. Fondamenti di Informatica Prof. V.L. Plantamura Informatica e Comunicazione Digitale a.a. 2006-2007 Ipotesi fondamentale Tesi di Church Qualunque algoritmo può essere espresso sotto forma di matrice funzionale

Dettagli

Foglio elettronico Microsoft Office Excel 2003

Foglio elettronico Microsoft Office Excel 2003 Foglio elettronico Microsoft Office Excel 2003 04/06/2015 Nonni su internet 2015 1 Il foglio elettronico è un programma che possiamo usare per creare tabelle di numeri e calcolare automaticamente somme,

Dettagli

Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di:

Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di: Teoria dei Fenomeni Aleatori AA 01/13 Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di: N-pla o Sequenza

Dettagli

Analisi dei dati con DataMatrix/Editor

Analisi dei dati con DataMatrix/Editor Analisi dei dati con DataMatrix/Editor Il documento è tratto da : Fisica on-line con la TI-92 e il CBL: CIUITO, CARICA E SCARICA DI UN CONDENSATORE, 4/10/98 versione definitiva scheda a cura di Ottavia

Dettagli

Capitolo 12 La regressione lineare semplice

Capitolo 12 La regressione lineare semplice Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università

Dettagli

Cultura Tecnologica di Progetto

Cultura Tecnologica di Progetto Cultura Tecnologica di Progetto Politecnico di Milano Facoltà di Disegno Industriale - FOGLI DI CALCOLO - A.A. 2003-2004 2004 Foglio Elettronico Un foglio elettronico è un potente strumento di calcolo,

Dettagli

Esame di Matematica e Abilità Informatiche - 12 Luglio Le soluzioni

Esame di Matematica e Abilità Informatiche - 12 Luglio Le soluzioni Esame di Matematica e Abilità Informatiche - Luglio 3 Le soluzioni. Data la funzione f ( ln( a. trova il dominio di f b. scrivi, esplicitamente e per esteso, quali sono gli intervalli in cui f( risulta

Dettagli

Corso in Statistica Medica

Corso in Statistica Medica Corso in Statistica Medica Introduzione alle tecniche statistiche di elaborazione dati Regressione e correlazione Dott. Angelo Menna Università degli Studi di Chieti G. d Annunziod Annunzio Anno Accademico

Dettagli

Statistica descrittiva in due variabili

Statistica descrittiva in due variabili Statistica descrittiva in due variabili 1 / 65 Statistica descrittiva in due variabili 1 / 65 Supponiamo di misurare su un campione statistico due diverse variabili X e Y. Indichiamo come al solito con

Dettagli

Vogliamo determinare una funzione lineare che meglio approssima i nostri dati sperimentali e poter decidere sulla bontà di questa approssimazione.

Vogliamo determinare una funzione lineare che meglio approssima i nostri dati sperimentali e poter decidere sulla bontà di questa approssimazione. S.S.I.S. TOSCANA F.I.M. II anno FUNZIONI DI REGRESSIONE E METODO DEI MINIMI QUADRATI Supponiamo di star conducendo uno studio sulla crescita della radice di mais in funzione del contenuto di saccarosio

Dettagli

SCRIZIONI ON LINE AI SERVIZI SCOLASTICI A.S. 2019/20

SCRIZIONI ON LINE AI SERVIZI SCOLASTICI A.S. 2019/20 SCRIZIONI ON LINE AI SERVIZI SCOLASTICI A.S. 2019/20 GUIDA PRATICA PER I GENITORI PASSO DOPO PASSO La presente guida pratica per l utilizzo del programma di inserimento delle domande on-line è stata predisposta

Dettagli

Statistica a.a Autovalutazione 1

Statistica a.a Autovalutazione 1 Statistica a.a. 016-17 Autovalutazione 1 CORSO: Diritto per le Imprese e le Istituzioni ATTENZIONE: alle domande aperte è stato dato un possibile esempio di risposta, altre parole possono essere usate

Dettagli

Sistemi di Elaborazione dell Informazione 170. Caso Non Separabile

Sistemi di Elaborazione dell Informazione 170. Caso Non Separabile Sistemi di Elaborazione dell Informazione 170 Caso Non Separabile La soluzione vista in precedenza per esempi non-linearmente separabili non garantisce usualmente buone prestazioni perchè un iperpiano

Dettagli

A titolo di esempio proponiamo la risoluzione del sistema sia con il metodo della matrice inversa sia con il metodo di Cramer.

A titolo di esempio proponiamo la risoluzione del sistema sia con il metodo della matrice inversa sia con il metodo di Cramer. ) Trovare le soluzioni del seguente sistema lineare: x+ y+ z = 3x y + z = 0 x + 5y 4z = 5 Osserviamo in primo luogo che il sistema dato è un sistema quadrato di tre equazioni in tre incognite, precisamente

Dettagli

STATISTICA MULTIVARIATA SSD MAT/06

STATISTICA MULTIVARIATA SSD MAT/06 Università degli studi di Ferrara Dipartimento di Matematica A.A. 2018/2019 I semestre STATISTICA MULTIVARIATA SSD MAT/06 LEZIONE 4 - Questioni di analisi e applicazione della regressione lineare Pratica

Dettagli

I Circuiti combinatori: LOGISIM

I Circuiti combinatori: LOGISIM 1 ISTITUTO DI ISTRUZIONE SUPERIORE ANGIOY I Circuiti combinatori: LOGISIM Prof. G. Ciaschetti 1. Le porte logiche Un circuito combinatorio (o sistema combinatorio o rete combinatoria) è un circuito elettrico,

Dettagli

Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di:

Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di: Teoria dei Fenomeni Aleatori AA 01/13 Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di: N-pla o Sequenza

Dettagli

Rappresentazioni grafiche di distribuzioni doppie

Rappresentazioni grafiche di distribuzioni doppie Rappresentazioni grafiche di distribuzioni doppie Distribuzione doppia di frequenze Tabella di contingenza Tabella di correlazione Stereogramma Distribuzione unitaria doppia di 2 caratteri quantitativi

Dettagli

Statistica multivariata 27/09/2016. D.Rodi, 2016

Statistica multivariata 27/09/2016. D.Rodi, 2016 Statistica multivariata 27/09/2016 Metodi Statistici Statistica Descrittiva Studio di uno o più fenomeni osservati sull INTERA popolazione di interesse (rilevazione esaustiva) Descrizione delle caratteristiche

Dettagli

Vettori Matrici Grafi Introduzione al Fuzzy-tool. Renato Mainetti

Vettori Matrici Grafi Introduzione al Fuzzy-tool. Renato Mainetti Vettori Matrici Grafi Introduzione al Fuzzy-tool Renato Mainetti Vettore In Matematica: Un vettore è un elemento di uno spazio vettoriale. I vettori sono quindi elementi che possono essere sommati fra

Dettagli

STATISTICA 1 ESERCITAZIONE 6

STATISTICA 1 ESERCITAZIONE 6 STATISTICA 1 ESERCITAZIONE 6 Dott. Giuseppe Pandolfo 5 Novembre 013 CONCENTRAZIONE Osservando l ammontare di un carattere quantitativo trasferibile su un collettivo statistico può essere interessante sapere

Dettagli

Laboratorio di Statistica e Analisi dei Dati

Laboratorio di Statistica e Analisi dei Dati Laboratorio di Statistica e Analisi dei Dati Nicolò Campolongo Università degli Studi di Milano nicolo.campolongo@unimi.it November 16, 2018 Nicolò Campolongo (UniMi) Lezione 3 November 16, 2018 1 / 17

Dettagli

lezione 10 AA Paolo Brunori

lezione 10 AA Paolo Brunori AA 2016-2017 Paolo Brunori Redditi svedesi - il dataset contiene i dati di reddito di 838 individui - il dataset contiene le variabili: sex = sesso age = età edu = anni di istruzione y_gross = reddito

Dettagli

GRAFICO DI PARETO. variabile rispetto a cui si vuole ordinare (ossia nel nostro esempio

GRAFICO DI PARETO. variabile rispetto a cui si vuole ordinare (ossia nel nostro esempio Si consideri il data set nel file Pareto.xls. GRAFICO DI PARETO Vediamo come costruire il grafico di Pareto con Excel. Questo grafico non costituisce un output standard pertanto sarà necessario compiere

Dettagli

Esercizi vari sulle schede di statistica

Esercizi vari sulle schede di statistica Esercizi vari sulle schede di statistica December 4, 2008 1 Introduzione Nelle prove scritte ci sarà un esercizio relativo alla parte di statistica e la sua implementazione con R. Tale parte dello scritto

Dettagli

Primi passi con Geogebra

Primi passi con Geogebra Primi passi con Geogebra La finestra di GeoGebra - versione 4 A. Aprire l applicazione GeoGebra 1. Sul desktop, fare doppio click sull icona di Geogebra B. Dopo l avvio di GeoGebra La finestra che normalmente

Dettagli

Calcolo Numerico (CdS in Matematica) A.A. 2012/13

Calcolo Numerico (CdS in Matematica) A.A. 2012/13 Calcolo Numerico (CdS in Matematica) A.A. 2012/13 Esercitazione di Laboratorio sulla risoluzione di sistemi di equazioni lineari Parte 1. Fattorizzazione di matrici Scrivere una funzione Matlab che implementi

Dettagli

Laboratorio di INFORMATICA. 15 ottobre 2009

Laboratorio di INFORMATICA. 15 ottobre 2009 Laboratorio di INFORMATICA 15 ottobre 2009 GRAFICI Per ottenere il grafico di una funzione, devo: Preparare un vettore di ascisse Preparare un vettore di ordinate Scegliere la figura (opzionale)(istruzione

Dettagli

Rappresentazione di curve in tre dimensioni

Rappresentazione di curve in tre dimensioni Rappresentazione di curve in tre dimensioni Il comando plot3, con la sintassi >>plot3(x,y,z) Analoga al semplice plot, permette di tracciare nello spazio curve i cui punti hanno coordinate rispettivamente

Dettagli

Applicazioni eliminazione di Gauss

Applicazioni eliminazione di Gauss Applicazioni eliminazione di Gauss. Premessa Nel seguito supporremo sempre di applicare il metodo di eliminazione di Gauss allo scopo di trasformare la matrice del sistema Ax = b in una matrice triangolare

Dettagli

Il software consente di costruire tabelle e grafici e di esportare il proprio lavoro in formato pdf o excel.

Il software consente di costruire tabelle e grafici e di esportare il proprio lavoro in formato pdf o excel. Guida all uso Premessa... 1 1. Home page... 1 2. Accesso al software e alla base dati da consultare... 2 3. Costruzione di una tabella personalizzata... 3 4. Impostazione dei filtri... 5 5. Impostazione

Dettagli

UNIVERSITÀ DEGLI STUDI DI TERAMO FACOLTÀ DI SCIENZE POLITICHE CORSO DI LAUREA IN ECONOMIA BANCARIA FINANZIARIA ED ASSICURATIVA

UNIVERSITÀ DEGLI STUDI DI TERAMO FACOLTÀ DI SCIENZE POLITICHE CORSO DI LAUREA IN ECONOMIA BANCARIA FINANZIARIA ED ASSICURATIVA UNIVERSITÀ DEGLI STUDI DI TERAMO FACOLTÀ DI SCIENZE POLITICHE CORSO DI LAUREA IN ECONOMIA BANCARIA FINANZIARIA ED ASSICURATIVA II Parziale - Compito C 3/5/25 A. A. 24 25 ) Risolvere il seguente sistema

Dettagli

INDICAZIONI 2012: Calcolare l area di semplici figure scomponendole in figure elementari, ad esempio triangoli

INDICAZIONI 2012: Calcolare l area di semplici figure scomponendole in figure elementari, ad esempio triangoli PROPOSTA DI LAVORO Lo scopo delle seguenti attività è quello di analizzare i quesiti di G13 individuandone le caratteristiche (Manutenzione/Ricontestualizzazione) e gli aspetti di continuità con domande

Dettagli

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre R - Esercitazione 6 Andrea Fasulo fasulo.andrea@yahoo.it Università Roma Tre Venerdì 22 Dicembre 2017 Il modello di regressione lineare semplice (I) Esempi tratti da: Stock, Watson Introduzione all econometria

Dettagli

PARERE DELL ORGANO DI REVISIONE SULLA PROPOSTA DI BILANCIO DI PREVISIONE estrai qui.

PARERE DELL ORGANO DI REVISIONE SULLA PROPOSTA DI BILANCIO DI PREVISIONE estrai qui. PARERE DELL ORGANO DI REVISIONE SULLA PROPOSTA DI BILANCIO DI PREVISIONE 2017-2019 Il parere dell Organo di Revisione sul bilancio di previsione 2017-2019 predisposto da ANCREL è disponibile in un file.zip

Dettagli

Dispensa di Statistica

Dispensa di Statistica Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza

Dettagli

Si assuma di avere portato a termine le seguenti rilevazioni di produzione e di alimento somministrato

Si assuma di avere portato a termine le seguenti rilevazioni di produzione e di alimento somministrato Regressione Lineare Semplice Si assuma di avere portato a termine le seguenti rilevazioni di produzione e di alimento somministrato QUANTITA' DI ALIMENTO PRODUZIONE 2 10 2 9 1.5 5 1 2 1 3 1.5 4 2 7 2 9

Dettagli

nb3-derivata_numerica Derivata numerica

nb3-derivata_numerica Derivata numerica nb3-derivata_numerica October 16, 2017 Derivata numerica Vogliamo calcolare la derivata di una funzione f(x) in un dato punto x. Sappiamo dalla definizione che dobbiamo calcolare un rapporto incrementale

Dettagli

Analisi Numerica. Debora Botturi ALTAIR. Debora Botturi. Laboratorio di Sistemi e Segnali

Analisi Numerica. Debora Botturi ALTAIR.   Debora Botturi. Laboratorio di Sistemi e Segnali Analisi Numerica ALTAIR http://metropolis.sci.univr.it Argomenti Rappresentazione di sistemi con variabili di stato; Tecniche di integrazione numerica Obiettivo: risolvere sistemi di equazioni differenziali

Dettagli

SOLUZIONI. = x x x

SOLUZIONI. = x x x . Data la funzione a) scrivi qual è il dominio di f SOLUZIONI f ( b) scrivi quali sono gli intervalli in cui f( risulta positiva e quelli in cui risulta negativa c) determina le eventuali intersezioni

Dettagli

SOLUZIONI Data la funzione. = x. a) scrivi qual è il dominio di f

SOLUZIONI Data la funzione. = x. a) scrivi qual è il dominio di f . Data la funzione a) scrivi qual è il dominio di f SOLUZIONI f ) ( b) scrivi quali sono gli intervalli in cui f() risulta positiva e quelli in cui risulta negativa c) determina le eventuali intersezioni

Dettagli

Esercitazione 1. 6 Marzo 2019

Esercitazione 1. 6 Marzo 2019 Esercitazione 1 6 Marzo 019 Esercizio 1 Su un collettivo di 100 appartamenti ubicati nella stessa zona della città vengono rilevati i seguenti caratteri: X 1 affitto mensile pagato dal locatario (in Euro)

Dettagli