Statistica II Laurea magistrale in Ing. Gestionale a.a. 2012/13 Esempi di domande brevi. 1. Definizione di quantile gaussiano standard

Documenti analoghi
Statistica II Laurea magistrale in Ing. Gestionale a.a. 2012/13 Registro delle lezioni

Probablità, Statistica e Processi Stocastici

Statistica II, Laurea magistrale in Ing. Gestionale, a.a. 2013/14 10/01/2014

Calcolo di Probabilità e Processi Stocastici, Laurea magistrale in Ing. Robotica e dell Automazione, a.a. 2011/12 Registro delle lezioni

()Probablità, Statistica e Processi Stocastici

Probablità, Statistica e Processi Stocastici

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza

Probablità, Statistica e Processi Stocastici

()Probablità, Statistica e Processi Stocastici

Probabilità e Statistica

MMMPG 2008/09 Registro delle lezioni

Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1

Presentazione dell edizione italiana

Università degli Studi Roma Tre Anno Accademico 2014/2015 ST410 Statistica 1

1.1 Obiettivi della statistica Struttura del testo 2

Università degli Studi Roma Tre Anno Accademico 2017/2018 ST410 Statistica 1

ANALISI DELLE SERIE STORICHE

1 PROCESSI STOCASTICI... 11

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura

Indice. Prefazione. 4 Sintesi della distribuzione di un carattere La variabilità Introduzione La variabilità di una distribuzione 75

ARGOMENTI TRATTATI NEL CORSO DI ANALISI II

Sommario. 2 I grafici Il sistema di coordinate cartesiane Gli istogrammi I diagrammi a torta...51

A.A. 2014/2015 Corso di Algebra Lineare

Indice. Presentazione

Dispensa di Statistica

REGISTRO DELLE LEZIONI*

Calcolo delle Probabilità e Statistica Matematica previsioni 2003/04

Esercizi vari sulle schede di statistica

Scheda n. 7: primi elementi sui legami tra più variabili

1 Serie temporali. 1.1 Processi MA

Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di:

1. ANALISI DEI RESIDUI recupero dati----- X = scan("clipboard") accessori.auto = ts(x, frequency=12, start=c(1995,1)) plot(accessori.

()Probablità, Statistica e Processi Stocastici

Statistica II, Laurea magistrale in Ing. Gestionale, a.a /11 Esempi di domande e dissertazioni

Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di:

Capitolo 12 La regressione lineare semplice

VIII Indice 2.6 Esperimenti Dicotomici Ripetuti: Binomiale ed Ipergeometrica Processi Stocastici: Bernoul

Elementi di statistica per l econometria

Statistica. Alfonso Iodice D Enza

Serie storiche Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007

Computazione per l interazione naturale: fondamenti probabilistici (2)

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6

STATISTICA A K (60 ore)

Regressione Lineare Semplice e Correlazione

REGISTRO DELLE LEZIONI

MODULO 1: EQUAZIONI E DISEQUAZIONI 15 ore 1 quadrimestre

ISIS C. Facchinetti Sede: via Azimonti, Castellanza

PROGRAMMA DEL CORSO DI GEOMETRIA E ALGEBRA. A.A

Brevi richiami su variabili aleatorie e processi stocastici

Registro di Matematica Applicata /18 - Dott.ssa L. Fermo 2

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

Metodi e Modelli Matematici di Probabilità per la Gestione Prova scritta 15/12/2008 Compito B

Nel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0.

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell

I VETTORI GAUSSIANI E. DI NARDO

Capitolo 6. La distribuzione normale

TEORIA DEI SISTEMI E DEL CONTROLLO LM in Ingegneria Informatica e Ingegneria Elettronica

Generazione di Numeri Casuali- Parte 2


0 altimenti 1 soggetto trova lavoroentro 6 mesi}

Probabilità e Statistica

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Matematica II, aa

Laurea Magistrale in Scienze Statistiche Finanziarie e Attuariali Econometria Finanziaria c.a. A.A. 2016/2017 Appello 15 Settembre 2017

Argomenti della lezione:

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla

Autovalori e autovettori, matrici simmetriche e forme quadratiche (cenni) (prof. M. Salvetti)

STATISTICA. Regressione-2

LEZIONE N.8 (a cura di Teresa Fanelli) Questa forma risulta importante nel modello di regressione con più variabili.

Analisi della disponibilità d acqua. Valutazione dell impianto attraverso il calcolo di un indice economico (criterio)

Istituzioni di Statistica

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2014/2015 Appello B - 5 Febbraio 2015

1. Mercoledì 27/09/2017, ore: 2(2) Introduzione al corso: problemi ben posti, condizionamento, stabilità, complessità

4. Sottospazi vettoriali Piani e rette in E 3 O

Parte I Identificazione di modelli dinamici. 5: Analisi di sistemi dinamici alimentati da processi stazionari. Parte I 5, 1

x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y )

PROGRAMMA DEL CORSO DI GEOMETRIA E ALGEBRA. A.A

Distribuzioni di Probabilità

Capitolo 6 La distribuzione normale

Statistica Metodologica Avanzato Test 1: Concetti base di inferenza

Classificazione delle coniche.

1. Lunedì 26/09/2016, ore: 2(2) Introduzione al corso: problemi ben posti, condizionamento, stabilità, complessità

Maria Prandini Dipartimento di Elettronica e Informazione Politecnico di Milano

SOMMARIO CAPITOLO I - NOZIONI DI ALGEBRA DELLE MATRICI

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)

Statistica multivariata Donata Rodi 17/10/2016

Università degli Studi di Enna Kore Facoltà di Ingegneria ed Architettura

Old Faithful, Yellowstone Park. Statistica e biometria. D. Bertacchi. Dati congiunti. Tabella. Scatterplot. Covarianza. Correlazione.

1. Martedì 27/09/2016, ore: 2(2) Introduzione al corso: problemi ben posti, condizionamento, stabilità, complessità

REGISTRO DELLE LEZIONI*

Regressione lineare semplice

Analisi Stocastica Programma del corso 2009/10

REGRESSIONE E CORRELAZIONE

PROGRAMMAZIONE MATEMATICA classe seconda economico/turistico:

Bologna 15 settembre. Spazializzazione dati meteo

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2013/2014. I Esonero - 29 Ottobre Tot.

Analisi delle serie storiche parte II Approccio classico

Transcript:

Statistica II Laurea magistrale in Ing. Gestionale a.a. 2012/13 Esempi di domande brevi 1. Definizione di quantile gaussiano standard 2. Cosa calcola il comando pnorm (risp. qnorm, dnorm, rnorm) 3. Come tracciare il grafico di una densità gaussiana con R 4. Come tracciare un istogramma relativo a dati sperimentali 5. Definizione di covarianza (risp. correlazione, loro corrispondenti empiriche) 6. Invarianza di scala (o meno) di covarianza (risp. correlazione) 7. Legami tra indipendenza e condizioni sulla covarianza (risp. correlazione) 8. Vicinanza a zero di ρ rispetto a vicinanza a zero di Ĉov 9. Com è fatta una tabella di dati sperimentali relativi ad una coppia di variabili (X, Y ) 10. Interpretazione grafica del segno di Ĉov 11. Proprietà della matrice di covarianza di un vettore aleatorio (solo enunciato) (esempi: definizione, cosa appare sulla diagonale, simmetria ecc., come si trasforma per trasformazioni lineari) 12. Densità congiunta e marginali, legami (senza dimostrazione) 13. Definizione di vettore gaussiano standard 14. Definizione di vettore gaussiano qualsiasi 15. Vettore medio e matrice di covarianza di un vettore gaussiano standard (risp. qualsiasi) 16. Cosa si può dire su autovalori e autovettori per una matrice di covarianza 1

17. Formule per i coeffi cienti della regressione multipla (senza dimostrazione) 18. Definizione di varianza spiegata nella regressione 19. Definizione di residui e formulazione del metodo dei minimi quadrati 20. Legami tra varianza spiegata, coeffi ciente di correlazione e coeffi ciente angolare nella regressione semplice (senza dimostrazione) 21. Quando coeffi ciente di correlazione e coeffi ciente angolare coincidono 22. Cosa produce il plot di una tabella 23. Due diversi plot dei residui 24. Problemi causati da allineamenti di fattori 25. Come scorrelare fattori allineati 26. Regressione come modello di previsione temporale 27. Regressione come modello di previsione spaziale 28. Cosa rappresenta il piano principale di PCA (senza dimostrazione) 29. Cosa rappresenta il vettore principale di PCA (senza dimostrazione) 30. Perché il piano generato da {e 1, e 2 } permette una visione particolarmente buona dei dati 31. Cosa sono le proporzioni di varianza offerte da PCA, come vengono calcolare 32. Definizione di varianza spiegata dal vettore (risp. piano) principale di PCA 33. Definizione di loadings di PCA 34. Cosa può accadere se non si standardizzano i dati per PCA 35. Cosa si cerca di vedere tramite il comando acf e come questo può essere mascherato 36. Debolezze predittive del modello X n+1 = ax n + b + ε 2

37. Cosa sono le variabili dummy 38. I comandi decompose e stl agiscono su una semplice stringa di dati? 39. Forniscono entrambi un trend lungo come la serie originaria? 40. La lunghezza del trend di decompose a cosa è dovuta? 41. Cosa calcola ccf e cosa può servire? 42. Com è definito l errore quadratico medio nella regressione multipla. 43. Cosa si intende per overfitting nella regressione multipla. 44. Diffi coltà implementative della regressione senza fattori esogeni (serie storiche). 45. Diffi coltà implementative della regressione con fattori esogeni (serie storiche). 46. Un pregio ed un difetto del metodo di media mobile. 47. Un pregio ed un difetto del comando decompose. 48. Un pregio ed un difetto del metodo di smorzamento esponenziale. 49. Come ci si aspetta sia la previsione (sui dati noti) fatta dal metodo di smorzamento esponenziale con α 0? 50. Un pregio ed un difetto del metodo di smorzamento esponenziale con trend. 51. Il metodo di smorzamento esponenziale con trend cattura sempre quello che noi pensiamo essere il trend? Perché agisce come si è detto? 52. Come ci si aspetta sia la previsione (sui dati noti) fatta dal metodo di smorzamento esponenziale con trend con β 0? 53. Un pregio ed un difetto del metodo di Holt-Winters. 54. A cosa può servire l eliminazione del trend? 55. Difetti dell uso di Decompose (ad esempio) per l eliminazione del trend. 3

56. I metodi sono equivalenti per eliminare il trend o per scoprire come si prolunga nel futuro? 57. Pericoli nell eliminazione simultanea di fattori. 58. A cosa serve il fit di densità nell ambito delle serie storiche. 59. Come si calcola un intervallo di confidenza sulla previsione. 60. Come si può quantificazione l incertezza di una previsione. 61. Come si calcolano i quantili direttamente dai dati. 62. Quando può essere preferibile l uso delle densità di Weibull. 63. Che effetto hanno sul grafico delle densità di Weibull i parametri a ed s. 64. Come si raffi gura una densità sopra un istogramma. 65. A cosa serve il qqplot e da cosa si vede se il fit è buono. 66. Cosa è equivalente nel caso gaussiano, a livello di processi stocastici. 67. Come si lega il teorema ergodico ad utilità pratiche. 68. Come ritracciare un trend col comando stl? 69. Che differenza c è tra un usuale modello basato sulla regressione per le serie storiche ed un modello AR (a livello di modello, non di implementazione)? 70. Scrivere un esempio usuale di modello basato sulla regressione per le serie storiche. 71. Scrivere le equazioni di un modello AR e di un modello MA. 72. Visto il legame con la stazionarietà, a cosa possono servire i modelli AR? 73. Il White noise è stazionario? Come appare la sua funzione di autocorrelazione? 4

74. In quali modi si possono trovare i coeffi cienti dei modelli AR e che pregi e difetti ci sono? 75. L ordine di un modello AR dev essere assegnato, nell uso del SW? 76. Cos è la varianza spiegata da un modello di serie storiche? 77. Da un modello AR(1) vi aspettate un elevata varianza spiegata ed un ottima capacità previsiva? 78. Come si può vedere la regressione classica come "generalized linear model"? 79. In che senso PCA può essere un modello a fattori non misurabili o nascosti? 80. Nel modello di regressione logistica, dov è l aleatorietà? E nella regressione classica? 81. Che necessità c è di introdurre la link function nella regressione logistica? 82. Che differenza c è tra il gruppo training e quello test, nei metodi di classificazione? 83. Analisi discriminante: pregi e difetti del caso lineare rispetto a quello quadratico. Esempi di domande più dettagliate Ĉov, sulla base della formula em- 1. Interpretazione grafica del segno di pirica 2. Proprietà della matrice di covarianza e del vettore dei valori medi di un vettore aleatorio (dimostrazioni), anche sotto trasformazioni lineari 3. Trasformazione della densità congiunta sotto trasformazioni lineari (dimostrata partendo dalla formula generale delle trasformazioni di densità sotto applicazioni biunivoche) 4. Diverse raffi gurazioni di un vettore gaussiano standard o meno: comprensione delle curve di livello nel caso generale; come generare punti gaussiani relativi a diverse situazioni (rotazioni, dilatazioni) 5

5. Fornire esempi di vettori gaussiani particolari (es. le cui componenti sono N (0, 1) ma, come vettori, non sono standard; es. gaussiana degenere) 6. Le trasformazioni affi ni di gaussiane sono gaussiane 7. Costruzione della radice quadrata di una matrice simmetrica semidefinita positiva. Conseguenze sulla costruzione di un vettore aleatorio gaussiano con matrice data 8. Due formule per i coeffi cienti della regressione multipla (con relative dimostrazioni), diverse ipotesi di partenza 9. Legami tra varianza spiegata, coeffi ciente di correlazione e coeffi ciente angolare nella regressione semplice (dimostrazione) 10. Idea intuitiva e geometrica del metodo PCA, basata sulla struttura geometrica dei vettori gaussiani. Formalizzazione tramite la decomposizione spettrale di Q; Teorema V ar [V i ] = λ i (con dimostrazione) 11. Spiegazione della doppia rappresentazione X = X 1 u 1 +... + X n u n = V 1 e 1 +... + V n e n di un vettore aleatorio, legame con tabella dati, significato delle V i ecc. 12. Correlazione elevata o buon modello di regressione implicano relazione causa-effetto? 13. Coeffi cienti di regressione multipla nel caso standardizzato: quando a i = ρ (X i, Y ) 14. Allineamenti: motivo dell eccessiva propagazione degli errori statistici 15. Dimostrazione del fatto che R 2 aumenta all aumentare dei fattori 16. Metodi di scelta di un modello regressivo guidati dai p-value e dalle correlazioni 17. Come si può applicare la regressione a serie storiche (modello, tabella dati, vettori ritardati, fattori esogeni, predizione ecc.) 18. Metodo di Monte Carlo per trovare la distribuzione del coeffi ciente di correlazione empirico, determinazione di quantili e di p-value 6

19. Struttura di un generico test statistico ed esempi 20. Regressione multipla: p-value dei singoli fattori 21. Perché il comando acf dovrebbe evidenziare le componenti periodiche 22. Come può un trend offuscare l esito del comando acf 23. Perché molto spesso, negli esempi, il modello X n+1 = ax n + b + ε ha R 2 molto elevato 24. Regressione multipla secondo l impostazione vettoriale: formulazione e teorema sui coeffi cienti. 25. Cosa si intende per overfitting nella regressione multipla: descrivere il caso estremo e le sue caratteristiche matematiche. 26. Stimatore dei parametri: sue caratteristiche statistiche (media e matrice di covarianza) (ache solo nel caso di errori indipendenti). 27. L allieneamento tra fattori visto dal punto di vista strettamente matematico. 28. Il p-value dei singoli fattori. 29. Implementazione del metodo di regressione senza e con fattori esogeni e della predizione di serie storiche: formule, diffi coltà e problema della propagazione dell errore. 30. Descrizione del metodo di media mobile e sue caratteristiche, anche grafiche. 31. Descrizione del comando decompose, metodo con cui calcola il trend e stagionalità, sue caratteristiche. 32. Descrivere il metodo di smorzamento esponenziale. 33. Descrivere il metodo di smorzamento esponenziale con trend. 34. Descrivere il metodo di Holt-Winters. 35. Metodi per il confronto tra modelli (cross-validation ed RMS sui dati stessi). Difetti di ciascun metodo. 7

36. Problema dell eliminazione del trend: diversi metodi, loro funzionamento per questo scopo, pregi e difetti; differenze col problema di trovare un trend per la previsione futura. 37. Fit di densità applicato alle serie storiche (motivazioni, metodologie, calcolo intervalli di confidenza e soglie, caso gaussiano e Weibull, metodi non parametrici, quantili direttamente dai dati, ecc.). 38. Descrizione matematica del metodo grafico del qqplot, uso ed utilità. 39. Processi stocastici (anche stazionari): definizioni generali e risultato nel caso gaussiano. 40. Teorema ergodico (enunciato, dimostrazione, utilità). 41. Verifiche relative alla stazionarietà del White noise e del modello AR(1). 42. Equazioni di Yule-Walker (enunciato e dimostrazione; utilità). 43. Regressione logistica (impostazione teorica, calcolo dei coeffi cienti, trafila dati -> risultati, ecc.). 44. Panoramica sui modelli lineari di varia natura (fattori misurabili o meno, modelli generalizzati). 45. Problema della classificazione, diversi approcci. 46. Visione geometrica dei problemi di classificazione, esempi della regressione logistica e dell analisi discriminante. 47. Analisi discriminante quadratica e lineare, visione geometrica e visione bayesiana. 8