I modelli lineari generalizzati per la tariffazione nel ramo RCA: applicazione

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "I modelli lineari generalizzati per la tariffazione nel ramo RCA: applicazione"

Transcript

1 I modelli lineari generalizzati per la tariffazione nel ramo RCA: applicazione Giuseppina Bozzo Giuseppina Bozzo

2 Considerazioni preliminari La costruzione di un GLM è preceduta da alcune importanti fasi: Raggruppamento Territoriale: negli ultimi anni le imprese di assicurazione utilizzano per ogni CAP un coefficiente tariffario. Questo comporta una sovra parametrizzazione del modello, con conseguenti problemi di significatività dei parametri e conseguente AIC alto dato l elevato numero di parametri. Inoltre, è naturale pensare che zone vicine siano similmente rischiose. Per tale raggruppamento, quindi, utilizzeremo le tecniche di cluster analysis, sfruttando delle variabili rappresentative del rischio, ma anche variabili volte a tener conto della vicinanza territoriale. Selezione delle variabili: i modelli di regressione sono spesso utilizzati in situazioni in cui ci sono numerose variabili esplicative potenzialmente influenti sulla valutazione della variabile risposta. La costruzione di un modello con molte variabili comporta l introduzione di molti parametri, mentre una desiderabile proprietà di ogni modello statistico è quella della parsimonia nel numero dei parametri. I procedimenti di selezione delle variabili hanno l obiettivo di determinare un sottoinsieme di variabili esplicative significative, in modo che il modello stimato realizzi un buon adattamento ai valori osservati, ma che dipenda da un numero relativamente basso di parametri.

3 Descrizione del database Il database è costituito da record: Le variabili considerate sono: PROVINCIA CLASSE BONUS-MALUS ETA DEL VEICOLO ETA DEL CONDUCENTE Le variabili numeriche che saranno modellate con i GLM: numero dei sinistri NO CARD costo NO CARD MIN MAX MEDIA TOTALE NUMERO SX 0 3 0, COSTO SX Ricordiamo che La CARD, ovvero la Convenzione tra gli Assicuratori per il Risarcimento Diretto, è la convenzione tra le compagnie assicuratrici con lo scopo di regolamentare i rapporti tra esse nell'ambito dell RC Auto. Consente al proprietario dell'auto che subisce un danno, causato da un incidente stradale, di rivolgersi direttamente alla propria agenzia per ottenere il rimborso dei danni. Vi sarà poi una compensazione tra le Imprese.

4 Analisi territoriali e cluster analysis La cluster analysis è una tecnica di analisi multivariata attraverso la quale è possibile raggruppare le unità statistiche, in modo da minimizzare la lontananza logica interna a ciascun gruppo e di massimizzare quella tra i gruppi. La lontananza logica viene quantificata per mezzo di misure di similarità/dissimilarità definite tra le unità statistiche. La regola in base alla quale si formano i gruppi dipende dal tipo di dati. Infatti, per dati quantitativi si hanno misure di distanza, mentre per dati qualitativi si hanno misure di associazione. DISTANZA EUCLIDEA Le tecniche di cluster analysis possono essere gerarchiche e non gerarchiche. Queste a sua volta possono essere di tipo aggregativo o divisivo. L algoritmo che utilizzeremo per creare i gruppi è l algoritmo di Ward, un algoritmo di tipo gerarchico aggregativo, che mira a minimizzare la varianza all interno dei gruppi. Per tale motivo, questo algoritmo può essere utilizzato solo per variabili quantitative.

5 I cluster ottenuti Nel database sono presenti le 110 provincie italiane. Si è scelto di suddividerle in gruppi sulla base di tre variabili: Latitudine Longitudine VICINANZA TERRITORIALE Quota danni media per provincia, definita come il rapporto tra il costo e il numero dei veicoli. I cluster vengono creati in modo iterativo con l algoritmo di Ward. Tra i diversi raggruppamenti ottenuti, è necessario scegliere quello più appropriato. Per fare fronte a questa delicata scelta, si utilizza un criterio di arresto noto come criterio di Elbow. In particolare, si stabilisce una «soglia di aumento» della varianza spiegata (ev) e si sceglie il numero di cluster che garantisce una differenza sulla varianza spiegata inferiore alla soglia di aumento.

6 I risultati del test di Elbow ll numero di classi derivante dal test di Elbow è pari a 11 e corrisponde al numero di classi, che comporta un incremento della varianza spiegata inferiore a 0,01 k ev differenze , , , , , , , , , , , , , , , , , , , , , ,

7 Il dendogramma AVELLINO, BENEVENTO, CAMPOBASSO, CESENA, ISERNIA, NAPOLI, SALERNO

8 Il modello per il numero sinistri e la selezione delle variabili Ricordiamo che, per la variabile risposta «numero dei sinistri», il relativo GLM avrà le seguenti caratteristiche: Regressori: PROVINCIA, CLASSE BONUS-MALUS, ETA DEL VEICOLO, ETA DEL CONDUCENTE. Distribuzione della variabile risposta: Poisson Link: Logaritmo Offset: Logaritmo delle esposizioni Passando alla fase di selezione delle variabili, solitamente si utilizzano dei procedimenti automatici di selezione. Quest ultimi hanno una duplice funzione: Riducono il numero di modelli da analizzare Guidano nella selezione I più diffusi sono procedimenti automatici iterativi di tipo forward, backward e stepwise e si basano sul confronto tra modelli, uno annidato nell'altro. Questi modelli sono guidati dall Akaike Information Criterion e dal p-value.

9 Procedimento forward Si parte dal modello con sola intercetta e si aggiunge una variabile ad ogni passo, partendo dalla più significativa. Le variabili vengono aggiunte tramite l AIC: Si parte dal modello con sola intercetta e si calcola il primo AIC, che chiameremo AIC0 Si fanno girare 4 modelli di tipo intercetta+variabile1 (un modello per ognuna delle 4 variabili da scegliere) e si vede quello che tra questi genera l AIC minimo. Indichiamo tale valore con AIC1 Successivamente, si guarda alla Differenza tra i due AIC, scegliendo come soglia il valore 5 In particolare, se la differenza AIC0 AIC1> 5 allora si procede con il passo 2, inserendo una nuova variabile tra quelle rimanenti e si fanno girare 3 modelli del tipo intercetta+variabile1+variabile2, altrimenti mi fermo alle variabili selezionate fino a quel momento

10 Procedimento backward e procedimento stepwise Il procedimento backward è il procedimento opposto rispetto al «forward». Infatti, in questo caso, si parte dal modello completo con tutte le variabili inserite. Successivamente, al primo passo, si toglie dal modello la variabile meno significativa, ovvero quella tra le non significative (con p-value α) e alla quale corrisponde il p- value più elevato Anche in questo tipo di procedimento, è sempre doveroso guardare all AIC del modello, o meglio alla differenza di AIC sui modelli che si vanno a creare. Infine, il procedimento stepwise, combina il procedimento forward con il procedimento backward. In un generico passo, quello che si fa è considerare un passo forward, quindi inserire una nuova variabile, e un passo backward per verificare se la variabile appena inserita renda superflua qualcuna delle variabili precedentemente inserite nel modello. Il procedimento termina quando si trova un modello uguale ad uno già ottenuto.

11 Il modello GLM Mediante il software R, è possibile creare il modello utilizzando la seguente sintassi Effettuiamo in modo automatico la procedura stepwise

12 La variabile Bonus-Malus La variabile Bonus-Malus è una variabile particolare, perché ne conosciamo l andamento «a priori». Essa infatti, deve essere crescente al crescere delle classi Ho a disposizione due approcci: Scelgo dei parametri fissati dall impresa e li inserisco nel modello Effettuo un variate, ovvero trasformo la variabile da qualitativa a quantitativa e inserisco un polinomio con andamento crescente

13 Variate per la variabile Bonus-Malus FASE 1 FASE 2 FASE 3

14 Modello finale AIC(FINALE)=12610

15 Il predittore lineare Ricordiamo le ipotesi alla base dei GLM OFFSET Per ogni combinazione di variabili è possibile calcolare il predittore lineare e quindi E N, ovvero il numero atteso di sinistri VALORI OTTENUTI DALLA VARIATE POLINOMIALE

16 Modello per il costo medio Ricordiamo le scelte fatte per la costruzione del glm per il costo medio dei sinistri: VARIABILE RISPOSTA: costo medio dei sinistri VARIABILI ESPLICATIVE: province(cluster), classi bonusmalus, età del veicolo, età del conducente DISTRIBUZIONE DELLA VARIABILE RISPOSTA: Gamma FUNZIONE LINK: logaritmo PESI: numero dei sinistri

17 Stepwise regression

18 Variate per la variabile Bonus-Malus FASE 1 FASE 2 FASE 3 FASE 1

19 Modello finale AIC(FINALE)=61333

Statistica multivariata 27/09/2016. D.Rodi, 2016

Statistica multivariata 27/09/2016. D.Rodi, 2016 Statistica multivariata 27/09/2016 Metodi Statistici Statistica Descrittiva Studio di uno o più fenomeni osservati sull INTERA popolazione di interesse (rilevazione esaustiva) Descrizione delle caratteristiche

Dettagli

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla Introduzione E la generalizzazione del modello di regressione lineare semplice: per spiegare il fenomeno d interesse Y vengono introdotte p, con p > 1, variabili esplicative. Tale generalizzazione diventa

Dettagli

Cluster Analysis Distanze ed estrazioni Marco Perugini Milano-Bicocca

Cluster Analysis Distanze ed estrazioni Marco Perugini Milano-Bicocca Cluster Analysis Distanze ed estrazioni M Q Marco Perugini Milano-Bicocca 1 Scopi Lo scopo dell analisi dei Clusters è di raggruppare casi od oggetti sulla base delle loro similarità in una serie di caratteristiche

Dettagli

Esempi di confronti grafici

Esempi di confronti grafici Esempi di confronti grafici Esempi di confronti grafici 7/3 Capitolo 3 LE MEDIE La media aritmetica La media geometrica La trimmed mean La mediana La moda I percentili Statistica - Metodologie per

Dettagli

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)

Dettagli

Data Mining. Prova parziale del 20 aprile 2017: SOLUZIONE

Data Mining. Prova parziale del 20 aprile 2017: SOLUZIONE Università degli Studi di Padova Corso di Laurea Magistrale in Informatica a.a. 2016/2017 Data Mining Docente: Annamaria Guolo Prova parziale del 20 aprile 2017: SOLUZIONE ISTRUZIONI: La durata della prova

Dettagli

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Quesito: Posso stimare il numero di ore passate a studiare statistica sul voto conseguito all esame? Potrei calcolare il coefficiente di correlazione.

Dettagli

Statistica Applicata all edilizia Lezione: approccio stocastico all analisi delle serie storiche

Statistica Applicata all edilizia Lezione: approccio stocastico all analisi delle serie storiche Lezione: approccio stocastico all analisi delle serie storiche E-mail: orietta.nicolis@unibg.it 3 maggio 2011 Programma 1 Approccio stocastico all analisi delle serie storiche Programma Approccio stocastico

Dettagli

Intelligenza Artificiale. Clustering. Francesco Uliana. 14 gennaio 2011

Intelligenza Artificiale. Clustering. Francesco Uliana. 14 gennaio 2011 Intelligenza Artificiale Clustering Francesco Uliana 14 gennaio 2011 Definizione Il Clustering o analisi dei cluster (dal termine inglese cluster analysis) è un insieme di tecniche di analisi multivariata

Dettagli

Regressione Lineare Semplice e Correlazione

Regressione Lineare Semplice e Correlazione Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)

Dettagli

Regressione Lineare Multipla

Regressione Lineare Multipla Regressione Lineare Multipla Fabio Ruini Abstract La regressione ha come scopo principale la previsione: si mira, cioè, alla costruzione di un modello attraverso cui prevedere i valori di una variabile

Dettagli

Statistica associativa ramo infortuni Anni 2013 e 2014

Statistica associativa ramo infortuni Anni 2013 e 2014 Statistica associativa ramo infortuni Anni 2013 e 2014 Ed. maggio 2017 Agenda Obiettivo della statistica Oggetto della statistica Grado di partecipazione Alcuni confronti con la statistica precedente Analisi

Dettagli

Esercitazione n 2. Costruzione di grafici

Esercitazione n 2. Costruzione di grafici Esercitazione n 2 Costruzione di grafici I grafici I grafici sono rappresentazione di dati numerici e/o di funzioni. Devono facilitare all utente la visualizzazione e la comprensione dei numeri e del fenomeno

Dettagli

La regressione lineare. Rappresentazione analitica delle distribuzioni

La regressione lineare. Rappresentazione analitica delle distribuzioni La regressione lineare Rappresentazione analitica delle distribuzioni Richiamiamo il concetto di dipendenza tra le distribuzioni di due caratteri X e Y. Ricordiamo che abbiamo definito dipendenza perfetta

Dettagli

GRUPPO QUATTRO RUOTE. Alessandro Tondo Laura Lavazza Matteo Scordo Alessandro Giosa Gruppo Quattro Ruote 1

GRUPPO QUATTRO RUOTE. Alessandro Tondo Laura Lavazza Matteo Scordo Alessandro Giosa Gruppo Quattro Ruote 1 GRUPPO QUATTRO RUOTE Alessandro Tondo 19632 Laura Lavazza 19758 Matteo Scordo 19813 Alessandro Giosa 19894 Gruppo Quattro Ruote 1 3.1 Analisi fattoriale (continua) Confrontando dal punto di vista interpretativo

Dettagli

Cluster Analysis. La Cluster Analysis è il processo attraverso il quale vengono individuati raggruppamenti dei dati. per modellare!

Cluster Analysis. La Cluster Analysis è il processo attraverso il quale vengono individuati raggruppamenti dei dati. per modellare! La Cluster Analysis è il processo attraverso il quale vengono individuati raggruppamenti dei dati. Le tecniche di cluster analysis vengono usate per esplorare i dati e non per modellare! La cluster analysis

Dettagli

GUIDA RAPIDA t O preven va O n co RC -au o

GUIDA RAPIDA t O preven va O n co RC -au o GUIDA RAPIDA tuopreventivatore ti to Unico RC-auto INDICE CHE COS È? 1 COME SI ACCEDE? 2 SU QUALI FORMULE TARIFFARIE SI BASA? 3 REGISTRAZIONE AL SERVIZIO 4 INSERIRE I DATI 5 DOVE CONSULTO I PREVENTIVI?

Dettagli

Capitolo 9 La produzione

Capitolo 9 La produzione Capitolo 9 La produzione LA PRODUZIONE Le risorse che le imprese usano per produrre beni e servizi sono dette fattori produttivi o input I beni e i servizi realizzati dalle imprese sono definiti semplicemente

Dettagli

LE OPINIONI DEI CONSUMATORI CIRCA LE NUOVE TIPOLOGIE DI ALIMENTAZIONE PER AUTOMOBILI

LE OPINIONI DEI CONSUMATORI CIRCA LE NUOVE TIPOLOGIE DI ALIMENTAZIONE PER AUTOMOBILI LE OPINIONI DEI CONSUMATORI CIRCA LE NUOVE TIPOLOGIE DI ALIMENTAZIONE PER AUTOMOBILI - GRUPPO Codari Stefano (19492) Ferrigno Chiara (19853) De Agostini Karin (19507) Giraldo Andrea (19723) Analisi fattoriale

Dettagli

Fasi del modello di regressione

Fasi del modello di regressione Fasi del modello di regressione Specificazione del modello: scelta del tipo di funzione da utilizzare per descrivere un fenomeno; definizione delle ipotesi di base Stima dei parametri: uso di stimatori

Dettagli

STATISTICA (2) ESERCITAZIONE 2. Dott.ssa Antonella Costanzo

STATISTICA (2) ESERCITAZIONE 2. Dott.ssa Antonella Costanzo STATISTICA (2) ESERCITAZIONE 2 5.02.2014 Dott.ssa Antonella Costanzo Esercizio 1. La v.c. Normale: uso delle tavole E noto che un certo tipo di dati si distribuiscono secondo una gaussiana di media 10

Dettagli

Matricola: Corso: 1. (4 Punti) Stimare la variazione del reddito quando il prezzo del prodotto finale raddoppia.

Matricola: Corso: 1. (4 Punti) Stimare la variazione del reddito quando il prezzo del prodotto finale raddoppia. Facoltà di Economia Statistica Esame 3-12/04/2010: A Cognome, Nome: Matricola: Corso: Problema 1. Per 5 imprese imprese è stato rilevato il reddito quinquennale medio (in milioni di euro), y, e il corrispondente

Dettagli

Analisi della varianza

Analisi della varianza Analisi della varianza Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona ANALISI DELLA VARIANZA - 1 Abbiamo k gruppi, con un numero variabile di unità statistiche.

Dettagli

Elementi di Statistica

Elementi di Statistica Università degli Studi di Palermo Dipartimento di Ingegneria Informatica Informatica ed Elementi di Statistica 3 c.f.u. Anno Accademico 2010/2011 Docente: ing. Salvatore Sorce Elementi di Statistica Statistica

Dettagli

Statistica multivariata Donata Rodi 17/10/2016

Statistica multivariata Donata Rodi 17/10/2016 Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare

Dettagli

Excel. È data la distribuzione di 1863 famiglie italiane secondo il numero di componenti:

Excel. È data la distribuzione di 1863 famiglie italiane secondo il numero di componenti: Excel È data la distribuzione di 1863 famiglie italiane secondo il numero di componenti: Calcolare per ogni classe della distribuzione: (a) le frequenze relative; Sia data la distribuzione degli studenti

Dettagli

Esercitazione. 24 Aprile 2012

Esercitazione. 24 Aprile 2012 Esercitazione 24 Aprile 2012 Il modello di regressione logistica viene utilizzato quando si è interessati a studiare o analizzare la relazione causale tra una variabile dipendente dicotomica e una o più

Dettagli

Appunti su Indipendenza Lineare di Vettori

Appunti su Indipendenza Lineare di Vettori Appunti su Indipendenza Lineare di Vettori Claudia Fassino a.a. Queste dispense, relative a una parte del corso di Matematica Computazionale (Laurea in Informatica), rappresentano solo un aiuto per lo

Dettagli

L A B C di R. Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010

L A B C di R. Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010 L A B C di R 0 20 40 60 80 100 2 3 4 5 6 7 8 Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010 La scelta del test statistico giusto La scelta della analisi

Dettagli

LEZIONE N. 11 ( a cura di MADDALENA BEI)

LEZIONE N. 11 ( a cura di MADDALENA BEI) LEZIONE N. 11 ( a cura di MADDALENA BEI) F- test Assumiamo l ipotesi nulla H 0 :β 1,...,Β k =0 E diverso dal verificare che H 0 :B J =0 In realtà F - test è più generale H 0 :Aβ=0 H 1 :Aβ 0 A è una matrice

Dettagli

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva Fondamenti di Informatica Ester Zumpano Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva Lezione 5 Statistica descrittiva La statistica descrittiva mette a disposizione il calcolo di

Dettagli

IL CRITERIO DELLA MASSIMA VEROSIMIGLIANZA

IL CRITERIO DELLA MASSIMA VEROSIMIGLIANZA Metodi per l Analisi dei Dati Sperimentali AA009/010 IL CRITERIO DELLA MASSIMA VEROSIMIGLIANZA Sommario Massima Verosimiglianza Introduzione La Massima Verosimiglianza Esempio 1: una sola misura sperimentale

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2 Dott.ssa Antonella Costanzo a.costanzo@unicas.it TIPI DI MEDIA: GEOMETRICA, QUADRATICA, ARMONICA Esercizio 1. Uno scommettitore puntando una somma iniziale

Dettagli

Derivazione numerica. Introduzione al calcolo numerico. Derivazione numerica (II) Derivazione numerica (III)

Derivazione numerica. Introduzione al calcolo numerico. Derivazione numerica (II) Derivazione numerica (III) Derivazione numerica Introduzione al calcolo numerico Il calcolo della derivata di una funzione in un punto implica un processo al limite che può solo essere approssimato da un calcolatore. Supponiamo

Dettagli

Obiettivo: assegnazione di osservazioni a gruppi di unità statistiche non definiti a priori e tali che:

Obiettivo: assegnazione di osservazioni a gruppi di unità statistiche non definiti a priori e tali che: Cluster Analysis Obiettivo: assegnazione di osservazioni a gruppi di unità statistiche non definiti a priori e tali che: le unità appartenenti ad uno di essi sono il più possibile omogenee i gruppi sono

Dettagli

Riconoscimento automatico di oggetti (Pattern Recognition)

Riconoscimento automatico di oggetti (Pattern Recognition) Riconoscimento automatico di oggetti (Pattern Recognition) Scopo: definire un sistema per riconoscere automaticamente un oggetto data la descrizione di un oggetto che può appartenere ad una tra N classi

Dettagli

Prova Scritta di METODI STATISTICI PER L AMMINISTRAZIONE DELLE IMPRESE (Milano, )

Prova Scritta di METODI STATISTICI PER L AMMINISTRAZIONE DELLE IMPRESE (Milano, ) Università degli Studi di Milano Bicocca Scuola di Economia e Statistica Corso di Laurea in Economia e Amministrazione delle Imprese (ECOAMM) Prova Scritta di METODI STATISTICI PER L AMMINISTRAZIONE DELLE

Dettagli

Claudio Estatico Equazioni non-lineari

Claudio Estatico Equazioni non-lineari Claudio Estatico (claudio.estatico@uninsubria.it) Equazioni non-lineari 1 Equazioni non-lineari 1) Equazioni non-lineari e metodi iterativi. 2) Metodo di bisezione, metodo regula-falsi. 3) Metodo di Newton.

Dettagli

REGRESSIONE E CORRELAZIONE

REGRESSIONE E CORRELAZIONE REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.

Dettagli

Statistica a breve termine: metodo delle onde apparenti

Statistica a breve termine: metodo delle onde apparenti Esercitazione 1 Statistica a breve termine: metodo delle onde apparenti Si calcolino, applicando il metodo delle onde apparenti, le seguenti proprietà della registrazione ondametrica fornita nelle figure

Dettagli

Test delle Ipotesi Parte I

Test delle Ipotesi Parte I Test delle Ipotesi Parte I Test delle Ipotesi sulla media Introduzione Definizioni basilari Teoria per il caso di varianza nota Rischi nel test delle ipotesi Teoria per il caso di varianza non nota Test

Dettagli

Ulteriori conoscenze di informatica Elementi di statistica Esercitazione3

Ulteriori conoscenze di informatica Elementi di statistica Esercitazione3 Ulteriori conoscenze di informatica Elementi di statistica Esercitazione3 Sui PC a disposizione sono istallati diversi sistemi operativi. All accensione scegliere Windows. Immettere Nome utente b## (##

Dettagli

Figura 1: 1) Si scriva la formulazione del problema come problema di PLI (con un numero minimo di vincoli) e la matrice dei vincoli.

Figura 1: 1) Si scriva la formulazione del problema come problema di PLI (con un numero minimo di vincoli) e la matrice dei vincoli. ESERCIZIO 1 Sia dato il grafo orientato in Figura 1. Si consideri il problema di flusso a 1 2 4 Figura 1: costo minimo su tale grafo con b 1 = 4 b 2 = 2 b = b 4 = e c 12 = 2 c 1 = 4 c 14 = 1 c 2 = 1 c

Dettagli

Analisi della regressione multipla

Analisi della regressione multipla Analisi della regressione multipla y = β 0 + β 1 x 1 + β 2 x 2 +... β k x k + u 2. Inferenza Assunzione del Modello Classico di Regressione Lineare (CLM) Sappiamo che, date le assunzioni Gauss- Markov,

Dettagli

MODELLI RIDOTTI COME SI EFFETTUA IL TEST DI NULLITÀ DI UN SOTTOINSIEME DI COEFFICIENTI IN SAS

MODELLI RIDOTTI COME SI EFFETTUA IL TEST DI NULLITÀ DI UN SOTTOINSIEME DI COEFFICIENTI IN SAS MODELLI RIDOTTI COME SI EFFETTUA IL TEST DI NULLITÀ DI UN SOTTOINSIEME DI COEFFICIENTI IN SAS proc reg data=fitness; model Oxygen=Age Weight RunTime RunPulse RestPulse MaxPulse ; test Weight, RestPulse;

Dettagli

Statistica Applicata all edilizia: il modello di regressione

Statistica Applicata all edilizia: il modello di regressione Statistica Applicata all edilizia: il modello di regressione E-mail: orietta.nicolis@unibg.it 27 aprile 2009 Indice Il modello di Regressione Lineare 1 Il modello di Regressione Lineare Analisi di regressione

Dettagli

obbligatorio - n. iscrizione sulla lista

obbligatorio - n. iscrizione sulla lista 02.09.2015 - appello di STATISTICA per studenti ENE - docente: E. Piazza obbligatorio - n. iscrizione sulla lista il presente elaborato si compone di 5 (cinque) pagine se non ve lo ricordate siete fritti;

Dettagli

Esercizi di statistica

Esercizi di statistica Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..

Dettagli

ESERCITAZIONI 1 e 2: calcoli

ESERCITAZIONI 1 e 2: calcoli ESERCITAZIONI 1 e 2: calcoli L uso del foglio elettronico nel laboratorio di ispezione degli alimenti. Funzioni utilizzate negli esercizi e traduzione in inglese americano per l utilizzo su computer con

Dettagli

Ulteriori applicazioni del test del Chi-quadrato (χ 2 )

Ulteriori applicazioni del test del Chi-quadrato (χ 2 ) Ulteriori applicazioni del test del Chi-quadrato (χ 2 ) Finora abbiamo confrontato con il χ 2 le numerosità osservate in diverse categorie in un campione con le numerosità previste da un certo modello

Dettagli

0 altimenti 1 soggetto trova lavoroentro 6 mesi}

0 altimenti 1 soggetto trova lavoroentro 6 mesi} Lezione n. 16 (a cura di Peluso Filomena Francesca) Oltre alle normali variabili risposta che presentano una continuità almeno all'interno di un certo intervallo di valori, esistono variabili risposta

Dettagli

Regressione lineare semplice

Regressione lineare semplice Regressione lineare semplice Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Statistica con due variabili var. nominale, var. nominale: gruppo sanguigno - cancro

Dettagli

ESERCIZI SVOLTI Giuliano Bonollo - Michele Bonollo

ESERCIZI SVOLTI Giuliano Bonollo - Michele Bonollo ESERCIZI SVOLTI Giuliano Bonollo - Michele Bonollo 1 La seguente tabella riporta le frequenze relative riguardanti gli studenti di un università e gli esiti dell esame da essi sostenuto. Qual è la percentuale

Dettagli

Capitolo 9 La produzione. Robert H. Frank Microeconomia - 5 a Edizione Copyright The McGraw-Hill Companies, srl

Capitolo 9 La produzione. Robert H. Frank Microeconomia - 5 a Edizione Copyright The McGraw-Hill Companies, srl Capitolo 9 La produzione LA PRODUZIONE Le imprese utilizzano i fattori produttivi (input) per produrre beni e servizi (output) La produzione trasforma un insieme di input in un insieme di output Tra gli

Dettagli

Il problema del commesso viaggiatore e problemi di vehicle routing

Il problema del commesso viaggiatore e problemi di vehicle routing Il problema del commesso viaggiatore e problemi di vehicle routing Laura Galli Dipartimento di Informatica Largo B. Pontecorvo 3, 56127 Pisa laura.galli@unipi.it http://www.di.unipi.it/~galli 2 Dicembre

Dettagli

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre R - Esercitazione 6 Andrea Fasulo fasulo.andrea@yahoo.it Università Roma Tre Venerdì 22 Dicembre 2017 Il modello di regressione lineare semplice (I) Esempi tratti da: Stock, Watson Introduzione all econometria

Dettagli

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1 lezione n. 6 (a cura di Gaia Montanucci) METODO MASSIMA VEROSIMIGLIANZA PER STIMARE β 0 E β 1 Distribuzione sui termini di errore ε i ε i ~ N (0, σ 2 ) ne consegue : ogni y i ha ancora distribuzione normale,

Dettagli

Assunzioni (Parte I)

Assunzioni (Parte I) Assunzioni (Parte I) A M D Marcello Gallucci marcello.gallucci@unimib.it Lezione 10 Modello Lineare Generale La regressione semplice e multipla e l'anova sono sottocasi del modello lineare generale (GLM)

Dettagli

0.1 Percorrenza e Cilindrata

0.1 Percorrenza e Cilindrata 0.1 Percorrenza e Cilindrata Iniziamo ora un analisi leggermente più complessa basata sempre sui concetti appena introdotti. Innanzi tutto possiamo osservare, dal grafico ottenuto con il comando pairs,

Dettagli

Statistica Descrittiva Soluzioni 6. Indici di variabilità, asimmetria e curtosi

Statistica Descrittiva Soluzioni 6. Indici di variabilità, asimmetria e curtosi ISTITUZIONI DI STATISTICA A A 2007/2008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona

Dettagli

Analisi delle componenti principali

Analisi delle componenti principali Analisi delle componenti principali Serve a rappresentare un fenomeno k-dimensionale tramite un numero inferiore o uguale a k di variabili incorrelate, ottenute trasformando le variabili osservate Consiste

Dettagli

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1 Statistica Capitolo 1 Regressione Lineare Semplice Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Spiegare il significato del coefficiente di correlazione lineare

Dettagli

Presentazione dell edizione italiana

Presentazione dell edizione italiana 1 Indice generale Presentazione dell edizione italiana Prefazione xi xiii Capitolo 1 Una introduzione alla statistica 1 1.1 Raccolta dei dati e statistica descrittiva... 1 1.2 Inferenza statistica e modelli

Dettagli

Complementi ed Esercizi di Informatica Teorica II

Complementi ed Esercizi di Informatica Teorica II Complementi ed Esercizi di Informatica Teorica II Vincenzo Bonifaci 21 maggio 2008 4 Problemi di ottimizzazione: il Bin Packing Il problema bin packing è il seguente: dato un insieme di n oggetti di dimensioni

Dettagli

Argomenti della lezione. Introduzione agli Algoritmi e alle Strutture Dati. Lista Lineare. Lista Lineare come Tipo di Dato Astratto

Argomenti della lezione. Introduzione agli Algoritmi e alle Strutture Dati. Lista Lineare. Lista Lineare come Tipo di Dato Astratto Argomenti della lezione Introduzione agli Algoritmi e alle Strutture Dati Operazioni su Liste Dr. Emanuela Merelli Tipi di Dato Astratto Lista Lineare Pila Coda Concetto di Struttura dati dinamiche Lista

Dettagli

Esercitazione del

Esercitazione del Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36

Dettagli

Il modello spazio temporale per la previsione dell'erosione nel breve termine. Note Metodologiche

Il modello spazio temporale per la previsione dell'erosione nel breve termine. Note Metodologiche Il modello spazio temporale per la previsione dell'erosione nel breve termine Note Metodologiche 1 Analisi della dinamica temporale dei fenomeni meteo marini sulla Spiaggia di Alimini Descrizione dei dati

Dettagli

Politecnico di Milano - Scuola di Ingegneria Industriale. II Prova in Itinere di Statistica per Ingegneria Energetica 25 luglio 2011

Politecnico di Milano - Scuola di Ingegneria Industriale. II Prova in Itinere di Statistica per Ingegneria Energetica 25 luglio 2011 Politecnico di Milano - Scuola di Ingegneria Industriale II Prova in Itinere di Statistica per Ingegneria Energetica 25 luglio 2011 c I diritti d autore sono riservati. Ogni sfruttamento commerciale non

Dettagli

2. ALGORITMO DEL SIMPLESSO

2. ALGORITMO DEL SIMPLESSO . ALGORITMO DEL SIMPLESSO R. Tadei Una piccola introduzione R. Tadei SIMPLESSO L obiettivo del capitolo è quello di fornire un algoritmo, l algoritmo del simplesso, che risolve qualsiasi problema di programmazione

Dettagli

STATISTICA AZIENDALE Modulo Controllo di Qualità

STATISTICA AZIENDALE Modulo Controllo di Qualità STATISTICA AZIENDALE Modulo Controllo di Qualità A.A. 009/10 - Sottoperiodo PROA DEL 14 MAGGIO 010 Cognome:.. Nome: Matricola:.. AERTENZE: Negli esercizi in cui sono richiesti calcoli riportare tutte la

Dettagli

Concetti di teoria dei campioni ad uso degli studenti di Statistica Economica e Finanziaria, A.A. 2016/2017. Giovanni Lafratta

Concetti di teoria dei campioni ad uso degli studenti di Statistica Economica e Finanziaria, A.A. 2016/2017. Giovanni Lafratta Concetti di teoria dei campioni ad uso degli studenti di Statistica Economica e Finanziaria, A.A. 2016/2017 Giovanni Lafratta ii Indice 1 Spazi, Disegni e Strategie Campionarie 1 2 Campionamento casuale

Dettagli

Ottimizzazione numerica

Ottimizzazione numerica Funzioni univariate 28 Ottobre 2010 Funzioni univariate Outline 1 Funzioni univariate 2 optim Funzioni univariate I metodi di ottimizzazione consentono di trovare i punti estremanti (massimi, minimi) di

Dettagli

Conoscere le assicurazioni Gli elementi costitutivi dell assicurazione. Copertina

Conoscere le assicurazioni Gli elementi costitutivi dell assicurazione. Copertina Copertina 1/21 Indice e obiettivo 2/21 Introduzione In questa lezione vedremo che cos è il rischio e come viene gestito dalla Compagnia assicurativa. Le assicurazioni, infatti, sono nate proprio per aiutare

Dettagli

INDAGINE SUI PREZZI R.C.A. AL 1 LUGLIO 2014

INDAGINE SUI PREZZI R.C.A. AL 1 LUGLIO 2014 INDAGINE SUI PREZZI R.C.A. AL 1 LUGLIO 2014 L IVASS esegue un monitoraggio trimestrale dell andamento dei prezzi dell assicurazione r.c.a. praticati in 21 provincie italiane, di cui, 18 capoluoghi di regione,

Dettagli

Differenze tra metodi di estrazione

Differenze tra metodi di estrazione Lezione 11 Argomenti della lezione: L analisi fattoriale: il processo di estrazione dei fattori Metodi di estrazione dei fattori Metodi per stabilire il numero di fattori Metodi di Estrazione dei Fattori

Dettagli

Statistica 1 A.A. 2015/2016

Statistica 1 A.A. 2015/2016 Corso di Laurea in Economia e Finanza Statistica 1 A.A. 2015/2016 (8 CFU, corrispondenti a 48 ore di lezione frontale e 24 ore di esercitazione) Prof. Luigi Augugliaro 1 / 35 Il modello di regressione

Dettagli

STATISTICA A K (60 ore)

STATISTICA A K (60 ore) STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta

Dettagli

ISTITUTO TECNICO INDUSTRIALE STATALE FOCACCIA DISCIPLINA : CALCOLO PROGRAMMAZIONE MODULARE ANNO SCOLASTICO 2010/2011 CLASSI : III, IV, V

ISTITUTO TECNICO INDUSTRIALE STATALE FOCACCIA DISCIPLINA : CALCOLO PROGRAMMAZIONE MODULARE ANNO SCOLASTICO 2010/2011 CLASSI : III, IV, V ISTITUTO TECNICO INDUSTRIALE STATALE FOCACCIA DISCIPLINA : CALCOLO PROGRAMMAZIONE MODULARE ANNO SCOLASTICO 010/011 CLASSI : III, IV, V Docenti Marino Teresa Scaramella Franca Napoli Raffaele Matarazzo

Dettagli

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli. Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Indici di posizione variabilità e forma per caratteri qualitativi Il seguente data set riporta la rilevazione

Dettagli

CODICE DELLE ASSICURAZIONI: decreto legislativo 7 settembre 2005, n. 209;

CODICE DELLE ASSICURAZIONI: decreto legislativo 7 settembre 2005, n. 209; Istruzioni per la compilazione dei registri assicurativi, dei moduli di vigilanza allegati al bilancio di esercizio e dei prospetti di vigilanza da allegare alla relazione semestrale nonchè per la trasmissione

Dettagli

Statistica Descrittiva Soluzioni 7. Interpolazione: minimi quadrati

Statistica Descrittiva Soluzioni 7. Interpolazione: minimi quadrati ISTITUZIONI DI STATISTICA A. A. 2007/2008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona

Dettagli

Prima di iniziare: Inviare una mail all indirizzo : Scaricare i files per la lezione di oggi dal sito:

Prima di iniziare: Inviare una mail all indirizzo : Scaricare i files per la lezione di oggi dal sito: Prima di iniziare: Inviare una mail all indirizzo : rmgmrc@unife.it Scaricare i files per la lezione di oggi dal sito: http://www.unife.it/ing/lm.meccanica/insegnamenti/statistica-e-modellidi-dati-sperimentali

Dettagli

Regole associative Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007

Regole associative Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007 Regole associative Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 26/27 Introduzione Le regole associative si collocano tra i metodi di apprendimento non supervisionato e sono volte

Dettagli

VALUTAZIONI PRELIMINARI SUGLI INDICI DI PRESTAZIONE ENERGETICA NEL SETTORE DELLA PRODUZIONE DEL VETRO

VALUTAZIONI PRELIMINARI SUGLI INDICI DI PRESTAZIONE ENERGETICA NEL SETTORE DELLA PRODUZIONE DEL VETRO AGENZIA NAZIONALE PER LE NUOVE TECNOLOGIE, L ENERGIA E LO SVILUPPO ECONOMICO SOSTENIBILE VALUTAZIONI PRELIMINARI SUGLI INDICI DI PRESTAZIONE ENERGETICA NEL SETTORE DELLA PRODUZIONE DEL VETRO 2 AGENZIA

Dettagli

PON Liceo Scientifico Leonardo da Vinci Vallo della Lucania Nuovi percorsi matematici: Osservare, descrivere, costruire.

PON Liceo Scientifico Leonardo da Vinci Vallo della Lucania Nuovi percorsi matematici: Osservare, descrivere, costruire. PON 2007 2013 Liceo Scientifico Leonardo da Vinci Vallo della Lucania Nuovi percorsi matematici: Osservare, descrivere, costruire. Derive - 1 INTRODUZIONE ALL USO DI DERIVE COMANDI FONDAMENTALI Vallo della

Dettagli

VALUTAZIONI PRELIMINARI SUGLI INDICI DI PRESTAZIONE ENERGETICA NEL SETTORE DELLA PRODUZIONE DEL VETRO

VALUTAZIONI PRELIMINARI SUGLI INDICI DI PRESTAZIONE ENERGETICA NEL SETTORE DELLA PRODUZIONE DEL VETRO VALUTAZIONI PRELIMINARI SUGLI INDICI DI PRESTAZIONE ENERGETICA NEL SETTORE DELLA PRODUZIONE DEL VETRO Premessa... 1 Processo di costruzione degli IPE di riferimento... 2 Fabbricazione di vetro cavo...

Dettagli

La regressione lineare multipla

La regressione lineare multipla 13 La regressione lineare multipla Introduzione 2 13.1 Il modello di regressione multipla 2 13.2 L analisi dei residui nel modello di regressione multipla 9 13.3 Il test per la verifica della significatività

Dettagli

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2010/2011 Statistica Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza

Dettagli

Procedura operativa per la gestione della funzione di formazione classi prime

Procedura operativa per la gestione della funzione di formazione classi prime Procedura operativa per la gestione della funzione di formazione classi prime Questa funzione viene fornita allo scopo di effettuare la formazione delle classi prime nel rispetto dei parametri indicati

Dettagli

ESAME. 9 Gennaio 2017 COMPITO B

ESAME. 9 Gennaio 2017 COMPITO B ESAME 9 Gennaio 2017 COMPITO B Cognome Nome Numero di matricola 1) Approssimare tutti i calcoli alla quarta cifra decimale. 2) Ai fini della valutazione si terrà conto solo ed esclusivamente di quanto

Dettagli

Analisi della varianza

Analisi della varianza Università degli Studi di Padova Facoltà di Medicina e Chirurgia Facoltà di Medicina e Chirurgia - A.A. 2009-10 Scuole di specializzazione Lezioni comuni Disciplina: Statistica Docente: dott.ssa Egle PERISSINOTTO

Dettagli

DESCRIZIONE DEL DATA SET

DESCRIZIONE DEL DATA SET DESCRIZIONE DEL DATA SET Fonte: UC Irvine Machine Learning Repository Autore: Michael Redmond Nome data set: Communities and Crime CONTENUTI DEL DATA SET DI PARTENZA 125 POTENZIALI PREDITTORI Dati socio-economici

Dettagli

IVASS/MISE/GARANTE PRIVACY

IVASS/MISE/GARANTE PRIVACY Legenda Documento di consultazione n.1/2013 (Regolamento IVASS/MISE/GARANTE PRIVACY su scatola nera ) Attuativo dell art. 32, comma 1 bis, del decreto legge 24 gennaio 2012 n. 1, convertito in legge 24

Dettagli

Introduzione al Metodo del Simplesso. 1 Soluzioni di base e problemi in forma standard

Introduzione al Metodo del Simplesso. 1 Soluzioni di base e problemi in forma standard Introduzione al Metodo del Simplesso Giacomo Zambelli 1 Soluzioni di base e problemi in forma standard Consideriamo il seguente problema di programmazione lineare (PL), relativo all esempio di produzione

Dettagli

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURA/TECNICA DI ANALISI DEI DATI SPECIFICAMENTE DESTINATA A STUDIARE LA RELAZIONE TRA UNA VARIABILE NOMINALE (ASSUNTA

Dettagli

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Strumenti statistici in Excell Pacchetto Analisi di dati Strumenti di analisi: Analisi varianza: ad un fattore Analisi

Dettagli

UNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II DIPARTIMENTO DI INGEGNERIA AEROSPAZIALE D.I.A.S. STATISTICA PER L INNOVAZIONE. a.a.

UNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II DIPARTIMENTO DI INGEGNERIA AEROSPAZIALE D.I.A.S. STATISTICA PER L INNOVAZIONE. a.a. UNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II DIPARTIMENTO DI INGEGNERIA AEROSPAZIALE D.I.A.S. STATISTICA PER L INNOVAZIONE a.a. 2007/2008 1,00 0,90 0,80 0,70 0,60 0,50 0,40 0,30 0,20 0,10 0,00 CDF empirica

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 4-Misure della tendenza centrale (vers. 1.0c, 27 marzo 2017) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

Appunti di matematica per le Scienze Sociali Parte 1

Appunti di matematica per le Scienze Sociali Parte 1 Appunti di matematica per le Scienze Sociali Parte 1 1 Equazioni 1.1 Definizioni preliminari 1.1.1 Monomi Si definisce monomio ogni prodotto indicato di fattori qualsiasi, cioè uguali o diseguali, numerici

Dettagli