Analisi Multivariata Prova intermedia del 20 aprile 2011

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Analisi Multivariata Prova intermedia del 20 aprile 2011"

Transcript

1 Analisi Multivariata Prova intermedia del 20 aprile 20 Esercizio A Sia X N 3 (µ, Σ) con µ = [ 3,, 4] e 2 0 Σ = Quali delle seguenti variabili casuali è indipendente? Motivare la risposta. A. X e X 2 A2. X 2 e X 3 A3. (X, X 2 ) e X 3 A4. (X + X 2 )/2 e X 3 Esercizio B Supponiamo che X e Z seguono una distribuzione normale bivariata, entrambe con media nulla e con σx 2 = 4, σ2 Z = 7/9 e E[XZ] = 2. B. Sia Y = 2X 3Z. Determinare la distribuzione di Y e scriverne la funzione di densità f y (y). B2. Determinare la distribuzione condizionata di X dato Z. B3. Determinare la distribuzione congiunta di Y e Y 2 = X + Z. Esercizio C Il file FRENCH FOOD.XLS contiene i dati sulla spesa media mensile per alcuni tipi di cibo delle famiglie francesi distinte per tipologia. Le tipologie sono: operaio= MA, impiegato=em, manager = CA. Le famiglie sono inoltre distinte in base al numero dei figli (2,3,4 o 5 figli): per esempio la tipologia MA2 corrisponde ad una famiglia con 2 figli il cui capofamiglia lavora come

2 operaio. Le variabili registrate nell archivio sono 8: la tipologia delle famiglie tipo, e la spesa relativa a 7 categorie alimentari, cioè pane, verdura, f rutta, carne, pollame, latte, vino. C. Costruire il vettore delle medie e la matrice di covarianza campionaria. C2. Valutare se la distribuzione congiuta delle 7 variabili quantitative è approssimabile con una distribuzione normale multivariata. C3. Determinare le componenti principali campionarie e le varianze ad esse relative. C4. Mostrare che la varianza totale è uguale alla somma degli autovalori della matrice di covarianza. C5. Calcolare la proporzione di varianza totale spiegata dalla prima componente e disegnare lo scree-plot. C6. Determinare le componenti principali dalla matrice di correlazione campionaria. C7. In base ai risultati del punto C6, quante componenti principali sono sufficienti a rappresentare i dati? Motivare la risposta. C8. Scrivere l espressione della prima componente principale derivata da R, come si possono interpretare i coefficienti della combinazione lineare? C9. Scrivere la formula per il calcolo del coefficiente di correlazione tra la j- ma componente principale e la k-ma variabile standardizzata. Eseguire il calcolo per la prima componente principale e commentare il risultato ottenuto. C0. Calcolare per ogni variabile la proporzione di varianza spiegata dalle prime due componenti principali e commentare brevemente il risultato ottenuto. C. Rappresentare graficamente le famiglie in base alle prime due componenti principali. Commentare brevemente il grafico ottenuto. C2. Quale tipologia di famiglia presenta il valore più alto rispetto alla prima componente principale? E il più basso? 2

3 Soluzione Esercizio A Ricordiamo che in una distribuzione normale multivariata, covarianza nulla implica indipendenza. (a) No, σ 2 0 (b) Sì, σ 23 = 0 (c) Sì, σ 3 = σ 23 = 0 (d) Sì, (X +X 2 )/2 e X 3 sono congiuntamente normali con covarianza 2 σ σ 23 = 0. Ricordare che se X N p (µ, Σ) le q combinazioni lineari A q p X p sono ancora normali N q (Aµ, AΣA ) Esercizio B B. Una funzione lineare di due variabili normali è ancora normale. Pertanto Y è normale con media zero e varianza pari a σy 2 = E[(2X 3Z)2 ] = 4E[X 2 ] + 9E[Z 2 ] 2E[XZ] = = 9. Quindi Y 9 ha distribuzione normale con funzione di densità f y (y) = 3 2π e y2 /8 B2. X dato Z ha distribuzione normale univariata con media E(X Z) = µ X + σ 2 (z µ σz 2 z ) e σx Z 2 = σ2 X σ2 2. Sostituendo si ottiene E(X σz 2 Z) = z = 8z =.059z e 7 7 σ2 X Z = = 32 =, B3. La distribuzione congiunta di Y e Y 2 = X + Z è normale bivariata con vettore delle medie Aµ e matrice di covarianza AΣA, dove Σ è la matrice di covarianza di (X, Z) e ( ) 2 3 A = Per cui si ottiene ( Y Y 2 ) [( 0 0 ) ( 9 /3, /3 89/9 )] 3

4 Esercizio C si veda programma SAS prova sas C. per costruire il vettore delle medie e la matrice di covarianza campionaria usare PROC CORR. C2. Valutare se la distribuzione congiuta delle 7 variabili quantitative è approssimabile con una distribuzione normale multivariata: studiare le distribuzioni marginale con PROC UNIVARIATE, calcolare le distanze generalizzate al quadrato e vedere qual è l aproporzione di osservazioni che cade nell ellissi di isodensità dello 0.50 della distribuzione normale multivariata con p=7: in questo caso il 50%. C3. Per determinare le componenti principali campionarie e le varianze ad esse relative utilizzare PROC PRINCOMP con opzione COV. La varianza di ciascuna componente è data dall autovalore corrispondente: V ar(y j ) = λ j. C4. Varianza totale uguale alla somma degli autovalori della matrice di covarianza: j λ j = k s2 k sommare gli autovalori e confrontare con la somma delle varianze delle variabili. C5. La proporzione di varianza totale spiegata dalla prima componente è pari all 88% e si ottiene dividendo il primo autovalore per la varianza totale; per e disegnare lo scree-plot si può utilizzare l opzione plots(only)=(scree) di PROC PRINCOMP, oppure l opzione scree di PROC FACTOR. C6. Per determinare le componenti principali dalla matrice di correlazione campionaria utilizzare PROC PRINCOMP. Inserire lopzione out= per ottenere il valore delle CP calcolate per tutte le osservazioni, ossia i c.d. punteggi (ci serviranno ai punti C9 e C) C7. In base ai risultati del punto C6, possiamo decidere di rappresentare i dati con 2 componenti principali. Infatti la proporzione di varianza spigata dalle prime due CP è dell 88% e le prime due CP hanno autovalori maggiori di. C8. Espressione della prima componente principale derivata da R: Y = z z 7 ; i coefficienti della combinazione lineare 4

5 rappresentano il peso che ciascuna variabile standardizzata ha nel determinare la componente principale. In questo caso sono tutti positivi, tranne quello associato alla variabile vino. C9. Il coefficiente di correlazione tra la j-ma componente principale e la k- ma variabile standardizzata è dato da ρ jk = e jk λj. Per calcolare i ρ jk si può utilizzare PROC CORR sul data set creato con l opzione out= di PROC PRINCOMP, oppure utilizzare PROC FACTOR, in tal caso i coefficienti di correlazione si leggono dalla tabella Pattern fattoriale. La prima componente è positivamente correlata con tutte le variabili, tranne vino. Sono particolarmente alte le correlazioni con verdura, frutta, carne e pollame. C0. La proporzione di varianza spiegata dalle prime due componenti principali per ogni variabile si ottiene sommando i due coefficienti di correlazione corrispondenti al quadrato, cioè R,2;k 2 = ρ2 k + ρ2 2k. Questo conto può essere fatto a mano, oppure letto nella tabella Stime di comunanza finali dell output di PROC FACTOR. Osserviamo che tutte le variabili sono ben rappresentate, con R 2 parziali superiori all 80%, tranne vino. C. Per rappresentare graficamente le famiglie in base alle prime due componenti principali possiamo utilizazre: la macro %plotit o PROC GPLOT sul data set creato con l opzione out= di PROC PRINCOMP, oppure l opzione plots(only)=(score(ncomp=2) scree) di PROC PRINCOMP per ottenere il grafico con ODS, in tal caso ricordarsi di utilizzare ods graphics on; e ods graphics off; C2. Per individuare la tipologia di famiglia che presenta il valore più alto rispetto alla prima componente principale e quella con il valore più basso ordinare con PROC SORT il data set creato con l opzione out= di PROC PRINCOMP. 5

Analisi Statistica Multivariata Modulo Modelli Statistici

Analisi Statistica Multivariata Modulo Modelli Statistici Analisi Statistica Multivariata Modulo Modelli Statistici Gianna Monti 8 novembre 013 1 Approfondimenti 1 1.1 Esercizi Esercizio 1 Galton e il suo allievo Karl Pearson condussero alcuni studi in merito

Dettagli

Analisi delle componenti principali

Analisi delle componenti principali Analisi delle componenti principali Serve a rappresentare un fenomeno k-dimensionale tramite un numero inferiore o uguale a k di variabili incorrelate, ottenute trasformando le variabili osservate Consiste

Dettagli

Distribuzione normale multidimensionale

Distribuzione normale multidimensionale Capitolo 2 Distribuzione normale multidimensionale La funzione di densità normale undimensionale ha la forma seguente Anderson, 1984 fx ce 1 2 Ax b2 ce 1 2 x bax b La costante di normalizzazione c è data

Dettagli

Vettore (o matrice) casuale (o aleatorio): vettore (o matrice) i cui elementi sono variabili aleatorie

Vettore (o matrice) casuale (o aleatorio): vettore (o matrice) i cui elementi sono variabili aleatorie Variabili (vettori e matrici) casuali Variabile casuale (o aleatoria): Variabile che può assumere un insieme di valori ognuno con una certa probabilità La variabile aleatoria rappresenta la popolazione

Dettagli

Esercizi del 10 maggio 2012 da riconsegnare il 17 maggio 2012

Esercizi del 10 maggio 2012 da riconsegnare il 17 maggio 2012 Analisi Multivariata Esercizi del 10 maggio 2012 da riconsegnare il 17 maggio 2012 La Tabella 1 contiene la classificazione in base alla qualifica e all abitudine al fumo di 193 dirigenti e impiegati di

Dettagli

Rappresentazione dei dati multivariati

Rappresentazione dei dati multivariati Rappresentazione dei dati multivariati Quando si hanno più di due varabili la posizione di ciascuna unità rispetto alle altre può essere rappresentata nel diagramma relativo alle prime due CP l importanza

Dettagli

Corso di probabilità e statistica

Corso di probabilità e statistica Università degli Studi di Verona Facoltà di Scienze MM.FF.NN. Corso di Laurea in Informatica Corso di probabilità e statistica (Prof. L.Morato) Esercizi Parte III: variabili aleatorie dipendenti e indipendenti,

Dettagli

Analisi della correlazione canonica

Analisi della correlazione canonica Analisi della correlazione canonica Su un collettivo di unità statistiche si osservano due gruppi di k ed m variabili L analisi della correlazione canonica ha per obiettivo lo studio delle relazioni di

Dettagli

Regressione & Correlazione

Regressione & Correlazione Regressione & Correlazione Monia Ranalli Ranalli M. Dipendenza Settimana # 4 1 / 20 Sommario Regressione Modello di regressione lineare senplice Stima dei parametri Adattamento del modello ai dati Correlazione

Dettagli

Esercitazione del

Esercitazione del Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36

Dettagli

Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di:

Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di: Teoria dei Fenomeni Aleatori AA 01/13 Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di: N-pla o Sequenza

Dettagli

ECONOMETRIA: Laboratorio I

ECONOMETRIA: Laboratorio I ECONOMETRIA: Laboratorio I Luca De Angelis CLASS - Università di Bologna Programma Laboratorio I Valori attesi e varianze Test di ipotesi Stima di un modello lineare attraverso OLS Valore atteso Data una

Dettagli

STATISTICA. Esercitazione 5

STATISTICA. Esercitazione 5 STATISTICA Esercitazione 5 Esercizio 1 Ad un esame universitario sono stati assegnati in modo casuale due compiti diversi con i seguenti risultati: Compito A Compito B Numero studenti 102 105 Media dei

Dettagli

Analisi Multivariata Corso di laurea in Statistica

Analisi Multivariata Corso di laurea in Statistica Analisi Multivariata Corso di laurea in Statistica Carla Rampichini 1 Distribuzione Normale multivariata L utilizzo di computer sempre più potenti consente oggi di considerare distribuzioni campionare

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 3

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 3 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 3 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. La variabile casuale normale Da un analisi di bilancio è emerso che, durante i giorni feriali

Dettagli

Prova d esame di Statistica - II canale - nuovo ordinamento Dott.ssa C. Conigliani 19/06/2003

Prova d esame di Statistica - II canale - nuovo ordinamento Dott.ssa C. Conigliani 19/06/2003 19/06/2003 Compito A Esercizio 1. [14 punti] Data la seguente distribuzione doppia secondo i caratteri reddito familiare mensile () e spesa alimentare mensile (): 0 300 300 600 600 e più tot 0 1000 25

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Misura dell associazione tra due caratteri Uno store manager è interessato a studiare la relazione

Dettagli

Prova finale del 6 giugno 2011

Prova finale del 6 giugno 2011 Prova finale del 6 giugno 2011 Esercizio A, da svolgere con carta e penna Si consideri la seguente matrice dei dati relativa a 3 unità statistiche e 3 variabili, X 1 e X 2 quantitative, X 3 dicotomica.

Dettagli

Analisi Multivariata Prova finale del 3 giugno 2010

Analisi Multivariata Prova finale del 3 giugno 2010 Analisi Multivariata Prova finale del 3 giugno 2010 Esercizi da svolgere con carta e penna Esercizio A A1 Descrivere brevemente qual è l obiettivo principale dell analisi fattoriale. A2 Scrivere il modello

Dettagli

I VETTORI GAUSSIANI E. DI NARDO

I VETTORI GAUSSIANI E. DI NARDO I VETTOI GAUSSIANI E. DI NADO. L importanza della distribuzione gaussiana I vettori di v.a. gaussiane sono senza dubbio uno degli strumenti più utili in statistica. Nell analisi multivariata, per esempio,

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Associazione, correlazione e dipendenza tra caratteri In un collettivo di 11 famiglie è stata

Dettagli

Esercizi di statistica

Esercizi di statistica Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unina.it Università degli studi di Cassino () Statistica 1 / 24 Outline 1 () Statistica 2 / 24 Outline 1 2 () Statistica 2 / 24 Outline 1 2 3 () Statistica 2 /

Dettagli

Analisi delle corrispondenze

Analisi delle corrispondenze Analisi delle corrispondenze Obiettivo: analisi delle relazioni tra le modalità di due (o più) caratteri qualitativi Individuazione della struttura dell associazione interna a una tabella di contingenza

Dettagli

Statistica computazionale. Informazioni sul docente. Parte I. Informazioni preliminari. Stefano Tonellato. Anno Accademico

Statistica computazionale. Informazioni sul docente. Parte I. Informazioni preliminari. Stefano Tonellato. Anno Accademico Statistica computazionale Stefano Tonellato Dipartimento di Statistica Università Ca Foscari Venezia Anno Accademico 2007-2008 sul docente Parte I preliminari Nome: Stefano Tonellato e-mail: stone@unive.it

Dettagli

62 CAPITOLO 3. STATISTICA DESCRITTIVA

62 CAPITOLO 3. STATISTICA DESCRITTIVA 62 CAPITOLO 3. STATISTICA DESCRITTIVA Raccogliamo su una popolazione di n individui i dati relativi a m caratteri (variabili) e riportiamoli in una matrice, dove le righe (n) sono relative ad individui

Dettagli

Università di Pavia Econometria. Richiami di teoria delle distribuzioni statistiche. Eduardo Rossi

Università di Pavia Econometria. Richiami di teoria delle distribuzioni statistiche. Eduardo Rossi Università di Pavia Econometria Richiami di teoria delle distribuzioni statistiche Eduardo Rossi Università di Pavia Distribuzione di Bernoulli La variabile casuale discreta Y f Y (y; θ) = 0 θ 1, dove

Dettagli

Corso di Laurea in Informatica Calcolo delle Probabilità e Statistica (269AA) A.A. 2016/17 - Prova del

Corso di Laurea in Informatica Calcolo delle Probabilità e Statistica (269AA) A.A. 2016/17 - Prova del Corso di Laurea in Informatica Calcolo delle Probabilità e Statistica (269AA) A.A. 206/7 - Prova del 207-09-08 La durata della prova è di tre ore. Le risposte devono essere adeguatamente giustificate.

Dettagli

1.1 Obiettivi della statistica Struttura del testo 2

1.1 Obiettivi della statistica Struttura del testo 2 Prefazione XV 1 Introduzione 1.1 Obiettivi della statistica 1 1.2 Struttura del testo 2 2 Distribuzioni di frequenza 2.1 Informazione statistica e rilevazione dei dati 5 2.2 Distribuzioni di frequenza

Dettagli

con distribuzione gaussiana standard e si ponga

con distribuzione gaussiana standard e si ponga Laurea Triennale in Matematica, Università La Sapienza Corso di Probabilità, AA 6/7 Prova di Esonero Maggio 7 Testi e soluzioni degli esercizi proposti Siano Z, Z, Z variabili aleatorie indipendenti e

Dettagli

ESERCITAZIONI N. 3 corso di statistica

ESERCITAZIONI N. 3 corso di statistica ESERCITAZIONI N 3corso di statistica p 1/18 ESERCITAZIONI N 3 corso di statistica Marco Picone Università Roma Tre ESERCITAZIONI N 3corso di statistica p 2/18 Introduzione Decomposizione della devianza

Dettagli

Cognome e Nome:... Matricola e corso di laurea:...

Cognome e Nome:... Matricola e corso di laurea:... Statistica - corso base Prof. B. Liseo Prova di esame dell 8 gennaio 2014 Cognome e Nome:................................................................... Matricola e corso di laurea:...................................................

Dettagli

Materiale didattico per il corso di Statistica I Quinta esercitazione SOLUZIONI

Materiale didattico per il corso di Statistica I Quinta esercitazione SOLUZIONI Materiale didattico per il corso di Statistica I Quinta esercitazione SOLUZIONI Claudia Furlan Anno Accademico 006-007 Ringrazio Carlo Gaetan, Nicola Sartori e Aldo Solari per il materiale, aggiunte e

Dettagli

lezione 4 AA Paolo Brunori

lezione 4 AA Paolo Brunori AA 2016-2017 Paolo Brunori dove eravamo arrivati - abbiamo individuato la regressione lineare semplice (OLS) come modo immediato per sintetizzare una relazione fra una variabile dipendente (Y) e una indipendente

Dettagli

Generazione di Numeri Casuali- Parte 2

Generazione di Numeri Casuali- Parte 2 Esercitazione con generatori di numeri casuali Seconda parte Sommario Trasformazioni di Variabili Aleatorie Trasformazione non lineare: numeri casuali di tipo Lognormale Trasformazioni affini Numeri casuali

Dettagli

COGNOME.NOME...MATR..

COGNOME.NOME...MATR.. STATISTICA 29.01.15 - PROVA GENERALE (CHALLENGE) Modalità A (A) ai fini della valutazione verranno considerate solo le risposte riportate dallo studente negli appositi riquadri bianchi: in caso di necessità

Dettagli

Regressione Lineare Semplice e Correlazione

Regressione Lineare Semplice e Correlazione Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)

Dettagli

Corso di Psicometria Progredito

Corso di Psicometria Progredito Corso di Psicometria Progredito 5. La correlazione lineare Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014 Sommario 1 Tipi di relazione

Dettagli

Cognome e Nome:... Corso di laurea:...

Cognome e Nome:... Corso di laurea:... Statistica - corso base Prof. B. Liseo Prova di esame dell 8 gennaio 201 Cognome e Nome:................................................................... Corso di laurea:.......................................................................

Dettagli

Esercizi Svolti. 2. Costruire la distribuzione delle frequenze cumulate del tempo di attesa

Esercizi Svolti. 2. Costruire la distribuzione delle frequenze cumulate del tempo di attesa Esercizi Svolti Esercizio 1 Per una certa linea urbana di autobus sono state effettuate una serie di rilevazioni sui tempi di attesa ad una determinata fermata; la corrispondente distribuzione di frequenza

Dettagli

Esplorazione grafica di dati multivariati. N. Del Buono

Esplorazione grafica di dati multivariati. N. Del Buono Esplorazione grafica di dati multivariati N. Del Buono Scatterplot Scatterplot permette di individuare graficamente le possibili associazioni tra due variabili Variabile descrittiva (explanatory variable)

Dettagli

Computazione per l interazione naturale: fondamenti probabilistici (2)

Computazione per l interazione naturale: fondamenti probabilistici (2) Computazione per l interazione naturale: fondamenti probabilistici (2) Corso di Interazione uomo-macchina II Prof. Giuseppe Boccignone Dipartimento di Scienze dell Informazione Università di Milano boccignone@di.unimi.it

Dettagli

PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE

PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) PROBABILITÀ SCHEDA

Dettagli

CP110 Probabilità: Esame 13 settembre Testo e soluzione

CP110 Probabilità: Esame 13 settembre Testo e soluzione Dipartimento di Matematica, Roma Tre Pietro Caputo 2011-12, II semestre 13 settembre, 2012 CP110 Probabilità: Esame 13 settembre 2012 Testo e soluzione 1. (6 pts) Una scatola contiene 10 palline, 8 bianche

Dettagli

Statistica multivariata Donata Rodi 21/11/2016

Statistica multivariata Donata Rodi 21/11/2016 Statistica multivariata Donata Rodi 21/11/2016 PCA Tecnica di riduzione delle dimensioni che descrive la struttura multivariata dei dati per analisi descrittive e inferenziali Descrive la variazione di

Dettagli

Analisi delle Componenti Principali con R

Analisi delle Componenti Principali con R Università di Bologna - Facoltà di Scienze Statistiche Laurea Triennale in Statistica e Ricerca Sociale Corso di Analisi di Serie Storiche e Multidimensionali Prof.ssa Marilena Pillati Analisi delle Componenti

Dettagli

distribuzione normale

distribuzione normale distribuzione normale Si tratta della più importante distribuzione di variabili continue, in quanto: 1. si può assumere come comportamento di molti fenomeni casuali, tra cui gli errori accidentali; 2.

Dettagli

Corso in Statistica Medica

Corso in Statistica Medica Corso in Statistica Medica Introduzione alle tecniche statistiche di elaborazione dati Regressione e correlazione Dott. Angelo Menna Università degli Studi di Chieti G. d Annunziod Annunzio Anno Accademico

Dettagli

Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di:

Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di: Teoria dei Fenomeni Aleatori AA 01/13 Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di: N-pla o Sequenza

Dettagli

L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale

L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile Corso di Metodologia della ricerca sociale L analisi della varianza (ANOVA) La tecnica con cui si esplorano le relazioni

Dettagli

Esercizi: fascicolo 4

Esercizi: fascicolo 4 Esercizi: fascicolo 4 Esercizio 1 Dimostrare le seguenti proprietà (1), (2) e (3): (1) X 1 = 0 X 0; (2) X L 1 (Ω, P ), λ R λx 1 = λ X 1 ; (3) X, Y L 1 (Ω, P ) X + Y 1 X 1 + Y 1. Esercizio 2 Si estraggono

Dettagli

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2010/2011 Statistica Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza

Dettagli

Corso di Laurea in MQEGA

Corso di Laurea in MQEGA Corso di Laurea in MQEGA Insegnamento di Statistica (Prof. P.F. Perri) Esercizi di riepilogo sulle distribuzioni bivariate Esercizio 1 La rilevazione congiunta dei caratteri e Y su 100 unità statistiche

Dettagli

Università degli Studi Roma Tre Anno Accademico 2017/2018 ST410 Statistica 1

Università degli Studi Roma Tre Anno Accademico 2017/2018 ST410 Statistica 1 Università degli Studi Roma Tre Anno Accademico 2017/2018 ST410 Statistica 1 Lezione 1 - Mercoledì 27 Settembre 2017 Introduzione al corso. Richiami di probabilità: spazi di probabilità, variabili aleatorie,

Dettagli

Calcolo delle probabilità (3/7/2001) (Ing. Elettronica, Informatica, Telecomunicazioni - Latina)

Calcolo delle probabilità (3/7/2001) (Ing. Elettronica, Informatica, Telecomunicazioni - Latina) Calcolo delle probabilità (3/7/00). La distribuzione di probabilità di un numero aleatorio X non negativo soddisfa la condizione P (X > x + y X > y) = P (X > x), x > 0, y > 0. Inoltre la previsione di

Dettagli

Distribuzioni Doppie e Relazioni tra Variabili Esercitazione n 03

Distribuzioni Doppie e Relazioni tra Variabili Esercitazione n 03 Distribuzioni Doppie e Relazioni tra Variabili Esercitazione n 03 ESERCIZIO 1 Tra le famiglie del Comune di Vigata sono stati rilevati congiuntamente la PROFESSIONE DEL CA- POFAMIGLIA () e l AMMONTARE

Dettagli

Corso di STATISTICA EGA - Classe 1 aa Docenti: Luca Frigau, Claudio Conversano

Corso di STATISTICA EGA - Classe 1 aa Docenti: Luca Frigau, Claudio Conversano Corso di STATISTICA EGA - Classe 1 aa 2017-2018 Docenti: Luca Frigau, Claudio Conversano Il corso è organizzato in 36 incontri, per un totale di 72 ore di lezione. Sono previste 18 ore di esercitazione

Dettagli

Esercitazioni di Statistica

Esercitazioni di Statistica Esercitazioni di Statistica Variabili casuali Prof. Livia De Giovanni statistica@dis.uniroma.it Esercizio Determinare se le funzioni seguenti: 0.0 se x < 0. se x = g(x) = 0.5 se x = 0.7 se x = 3 se x =

Dettagli

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURA/TECNICA DI ANALISI DEI DATI SPECIFICAMENTE DESTINATA A STUDIARE LA RELAZIONE TRA UNA VARIABILE NOMINALE (ASSUNTA

Dettagli

Distribuzioni di due variabili aleatorie

Distribuzioni di due variabili aleatorie Statistica e analisi dei dati Data: 6 Maggio 206 Distribuzioni di due variabili aleatorie Docente: Prof. Giuseppe Boccignone Scriba: Noemi Tentori Distribuzioni congiunte e marginali Consideriamo due variabili

Dettagli

Università degli Studi Roma Tre Anno Accademico 2014/2015 ST410 Statistica 1

Università degli Studi Roma Tre Anno Accademico 2014/2015 ST410 Statistica 1 Università degli Studi Roma Tre Anno Accademico 2014/2015 ST410 Statistica 1 Lezione 1 - Martedì 23 Settembre 2014 Introduzione al corso. Richiami di probabilità: spazi di probabilità, variabili aleatorie,

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri

Dettagli

Regressione lineare. Lucio Demeio Dipartimento di Ingegneria Industriale e Scienze Matematiche Università Politecnica delle Marche.

Regressione lineare. Lucio Demeio Dipartimento di Ingegneria Industriale e Scienze Matematiche Università Politecnica delle Marche. Regressione lineare Lucio Demeio Dipartimento di Ingegneria Industriale e Scienze Matematiche Università Politecnica delle Marche Siano x ed y due variabili legate tra loro da una forma funzionale del

Dettagli

docente: J. Mortera/P. Vicard Nome

docente: J. Mortera/P. Vicard Nome A opportuni passaggi). Verrà accettato in consegna solo il presente plico. 2. [9] Una certa zona è servita da 4 compagnie telefoniche. Per ciascuna compagnia è stato rilevato il costo al minuto (in centesimi

Dettagli

Facoltà di ECONOMIA Università di Pavia 26 Aprile 2006 Prova scritta di Analisi dei dati

Facoltà di ECONOMIA Università di Pavia 26 Aprile 2006 Prova scritta di Analisi dei dati Facoltà di ECONOMIA Università di Pavia 26 Aprile 2006 Prova scritta di Analisi dei dati MODALITÀ A Riportare sul foglio nome, cognome, numero di matricola e modalità del testo d esame. Problema 1 (8 PUNTI)

Dettagli

Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010.

Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010. Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010 Statistica Esercitazione 4 12 maggio 2010 Dipendenza in media. Covarianza e

Dettagli

Regressione lineare semplice

Regressione lineare semplice Regressione lineare semplice Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Statistica con due variabili var. nominale, var. nominale: gruppo sanguigno - cancro

Dettagli

Esercizio 1. La variabile casuale G, somma di due V.C. normali, si distribuisce anch essa come una normale.

Esercizio 1. La variabile casuale G, somma di due V.C. normali, si distribuisce anch essa come una normale. Esercizio 1. La V.C. Y segue una distribuzione normale con media 45 e varianza 9. La V.C. X segue una legge normale con media 12 e varianza 4. Calcolare come si distribuisce e quali sono i parametri della

Dettagli

Facoltà di ECONOMIA Università di Pavia 20 Aprile 2004 Prova scritta di Analisi dei dati MODALITÀ A

Facoltà di ECONOMIA Università di Pavia 20 Aprile 2004 Prova scritta di Analisi dei dati MODALITÀ A MODALITÀ A Riportare sul foglio nome, cognome, numero di matricola e modalità del testo d esame. Problema 1 (8 PUNTI) Su un collettivo di 10 clienti iscritti al programma frequent flyer di una nota compagnia

Dettagli

Nuovo Ordinamento Esame di Statistica 20 Giugno 2003 docente: P. Vicard Nome

Nuovo Ordinamento Esame di Statistica 20 Giugno 2003 docente: P. Vicard Nome Nuovo Ordinamento Esame di Statistica 20 Giugno 2003 Cognome docente: P. Vicard Nome Al termine di ogni esercizio è lasciato lo spazio per scrivere la soluzione (corredata degli opportuni passaggi). La

Dettagli

Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1

Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1 Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1 Lezione 1 - Mercoledì 28 Settembre 2016 Introduzione al corso. Richiami di probabilità: spazi di probabilità, variabili aleatorie,

Dettagli

Tutorato di Complementi di Analisi Matematica e Statistica 30 maggio 2016

Tutorato di Complementi di Analisi Matematica e Statistica 30 maggio 2016 Tutorato di Complementi di Analisi Matematica e Statistica 30 maggio 2016 Esercizi possibili di probabilità e statistica Notazioni: U(a, b) è la distribuzione di probabilità uniforma nell intervallo (a,

Dettagli

Università di Pavia Econometria Esercizi 4 Soluzioni

Università di Pavia Econometria Esercizi 4 Soluzioni Università di Pavia Econometria 2008-2009 Esercizi 4 Soluzioni Maggio, 2009 Istruzioni: I commenti devono essere concisi! 1. Dato il modello di regressione lineare, con K regressori con E(ɛ) = 0 e E(ɛɛ

Dettagli

Capitolo 12. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 12.1: Suggerimento

Capitolo 12. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 12.1: Suggerimento Capitolo Suggerimenti agli esercizi a cura di Elena Siletti Esercizio.: Suggerimento Per verificare se due fenomeni sono dipendenti in media sarebbe necessario confrontare le medie condizionate, in questo

Dettagli

La matrice delle correlazioni è la seguente:

La matrice delle correlazioni è la seguente: Calcolo delle componenti principali tramite un esempio numerico Questo esempio numerico puó essere utile per chiarire il calcolo delle componenti principali e per introdurre il programma SPAD. IL PROBLEMA

Dettagli

PRIMA PROVA INTERMEDIA DI STATISTICA CLEA, CLEFIN (COD. 5047/4038/371/377) 3 Novembre 2004 COMPITO B1

PRIMA PROVA INTERMEDIA DI STATISTICA CLEA, CLEFIN (COD. 5047/4038/371/377) 3 Novembre 2004 COMPITO B1 PRIMA PROVA INTERMEDIA DI STATISTICA CLEA, CLEFIN (COD. 5047/4038/371/377) 3 Novembre 2004 Cognome Numero di matricola Nome COMPITO B1 Ai fini della valutazione si terrà conto solo ed esclusivamente di

Dettagli

Analisi in Componenti Principali (ACP)

Analisi in Componenti Principali (ACP) Analisi in Componenti Principali (ACP) Metodi di analisi fattoriale Obiettivo: individuazione di variabili di sintesi = dimensioni = variabili latenti = variabili non osservate Approccio: Ordinamenti tra

Dettagli

Variabili aleatorie discrete. Giovanni M. Marchetti Statistica Capitolo 5 Corso di Laurea in Economia

Variabili aleatorie discrete. Giovanni M. Marchetti Statistica Capitolo 5 Corso di Laurea in Economia Variabili aleatorie discrete Giovanni M. Marchetti Statistica Capitolo 5 Corso di Laurea in Economia 2015-16 1 / 45 Variabili aleatorie Una variabile aleatoria è simile a una variabile statistica Una variabile

Dettagli

Approssimazione numerica

Approssimazione numerica Approssimazione numerica Laboratorio di programmazione e calcolo (Chimica e Tecnologie chimiche) Pierluigi Amodio Dipartimento di Matematica Università di Bari Approssimazione numerica p.1/10 Problema

Dettagli

Statistica multivariata Donata Rodi 08/11/2016

Statistica multivariata Donata Rodi 08/11/2016 Statistica multivariata Donata Rodi 08/11/2016 MANOVA: Multivariate Analysis of Variance Due o più variabili dipendenti quantitative Una o più variabili indipendenti categoriali (con più livelli) Residui

Dettagli

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17 C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica

Dettagli

Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale)

Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale) Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale) Esercizio 1: Un indagine su 10.000 famiglie ha dato luogo, fra le altre, alle osservazioni riportate nella

Dettagli

SCOPO DELL ANALISI DI CORRELAZIONE

SCOPO DELL ANALISI DI CORRELAZIONE CORRELAZIONE 1 SCOPO DELL ANALISI DI CORRELAZIONE STUDIARE LA RELAZIONE TRA DUE VARIABILI X E Y 2 diagrammi di dispersione un diagramma di dispersione (o grafico di dispersione) èuna rappresentazione grafica

Dettagli

Esercizi su leggi Gaussiane

Esercizi su leggi Gaussiane Esercizi su leggi Gaussiane. Siano X e Y v.a. indipendenti e con distribuzione normale standard. Trovare le densità di X, X +Y e X, X. Mostrare che queste due variabili aleatorie bidimensionali hanno le

Dettagli

STATISTICA PER LA DIGITAL ECONOMY Marco Riani

STATISTICA PER LA DIGITAL ECONOMY Marco Riani STATISTICA PER LA DIGITAL ECONOMY 2018 Marco Riani mriani@unipr.it http://www.riani.it Ponderazione delle unità Unità statistiche: con la stessa importanza con importanza diversa: ponderazione Vettore

Dettagli

Tutorato di Complementi di Analisi Matematica e Statistica 26 maggio 2016

Tutorato di Complementi di Analisi Matematica e Statistica 26 maggio 2016 Tutorato di Complementi di Analisi Matematica e Statistica 26 maggio 2016 Esercizi possibili di probabilità e statistica Notazioni: U(a, b) è la distribuzione di probabilità uniforma nell intervallo (a,

Dettagli

Esercitazione del 16/04/2019 Istituzioni di Calcolo delle Probabilità

Esercitazione del 16/04/2019 Istituzioni di Calcolo delle Probabilità Esercitazione del 6/04/09 Istituzioni di Calcolo delle Probabilità David Barbato Nozioni di riepilogo con esercizi Distribuzione di una funzione di una variabile aleatoria discreta. Sia X una variabile

Dettagli

Diario delle lezioni. 1. Analisi di Fourier discreta e applicazioni alla statistica e alla probabilità: Lezioni I IV

Diario delle lezioni. 1. Analisi di Fourier discreta e applicazioni alla statistica e alla probabilità: Lezioni I IV 1 Diario delle lezioni 1. Analisi di Fourier discreta e applicazioni alla statistica e alla probabilità: Lezioni I IV (a) Richiami sui numeri complessi. Spazi vettoriali con prodotto scalare. Teorema di

Dettagli

Scheda n. 7: primi elementi sui legami tra più variabili

Scheda n. 7: primi elementi sui legami tra più variabili Scheda n. 7: primi elementi sui legami tra più variabili October 27, 2008 Matrice di covarianza e di correlazione Supponiamo di esaminare n variabili X,..., X n, ad esempio X = reddito medio, X 2 = tasso

Dettagli

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli Dipartimento di Sociologia e Ricerca Sociale Corso di Laurea in Sociologia Insegnamento di Statistica (a.a. 2018-2019) dott.ssa Gaia Bertarelli Esercitazione n. 6 1. Si consideri un campione di 69 persone

Dettagli

Statistica descrittiva: analisi di regressione

Statistica descrittiva: analisi di regressione Statistica descrittiva: analisi di regressione L analisi di regressione permette di esplorare le relazioni tra due insiemi di valori (p.e. i valori di due attributi di un campione) alla ricerca di associazioni.

Dettagli

Corso di Laurea in Informatica Calcolo delle Probabilità e Statistica (269AA) A.A. 2016/17 - Prova del

Corso di Laurea in Informatica Calcolo delle Probabilità e Statistica (269AA) A.A. 2016/17 - Prova del Corso di Laurea in Informatica Calcolo delle Probabilità e Statistica (69AA) A.A. 06/7 - Prova del 07-07-07 La durata della prova è di tre ore. Le risposte devono essere adeguatamente giustificate. Problema

Dettagli

PROBABILITA. Distribuzione di probabilità

PROBABILITA. Distribuzione di probabilità DISTRIBUZIONI di PROBABILITA Distribuzione di probabilità Si definisce distribuzione di probabilità il valore delle probabilità associate a tutti gli eventi possibili connessi ad un certo numero di prove

Dettagli

Analisi in Componenti Principali

Analisi in Componenti Principali Analisi in Componenti Principali 1/20 Analisi in Componenti Principali tecnica di riduzione e interpretazione dei dati spesso gioca un ruolo ausiliario rispetto ad altre tecniche (es. analisi fattoriale,

Dettagli

IL CRITERIO DELLA MASSIMA VEROSIMIGLIANZA

IL CRITERIO DELLA MASSIMA VEROSIMIGLIANZA Metodi per l Analisi dei Dati Sperimentali AA009/010 IL CRITERIO DELLA MASSIMA VEROSIMIGLIANZA Sommario Massima Verosimiglianza Introduzione La Massima Verosimiglianza Esempio 1: una sola misura sperimentale

Dettagli

I. Foglio di esercizi su vettori linearmente dipendenti e linearmente indipendenti. , v 2 = α v 1 + β v 2 + γ v 3. α v 1 + β v 2 + γ v 3 = 0. + γ.

I. Foglio di esercizi su vettori linearmente dipendenti e linearmente indipendenti. , v 2 = α v 1 + β v 2 + γ v 3. α v 1 + β v 2 + γ v 3 = 0. + γ. ESERCIZI SVOLTI DI ALGEBRA LINEARE (Sono svolti alcune degli esercizi proposti nei fogli di esercizi su vettori linearmente dipendenti e vettori linearmente indipendenti e su sistemi lineari ) I. Foglio

Dettagli

ESERCITAZIONI N. 2 corso di statistica

ESERCITAZIONI N. 2 corso di statistica ESERCITAZIONI N. 2corso di statistica p. 1/23 ESERCITAZIONI N. 2 corso di statistica Marco Picone Università Roma Tre ESERCITAZIONI N. 2corso di statistica p. 2/23 Introduzione Tabelle di contingenza Dipendenza

Dettagli

Statistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione

Statistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2011/2012 Statistica Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate.

Dettagli

Università di Pavia Econometria. Richiami di Statistica. Eduardo Rossi

Università di Pavia Econometria. Richiami di Statistica. Eduardo Rossi Università di Pavia Econometria Richiami di Statistica Eduardo Rossi Università di Pavia Campione casuale Siano (Y 1, Y 2,..., Y N ) variabili casuali tali che le y i siano realizzazioni mutuamente indipendenti

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2017-2018 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli