Analisi in Componenti Principali
|
|
- Valentino Di Mauro
- 8 anni fa
- Visualizzazioni
Transcript
1 Analisi in Componenti Principali ( Esempio sul dataset Cars ) (azzurro = teoria) Introduzione Si effettuano p rilevazioni statistiche su n unità. Ciascuna unità può essere visualizzata con un punto di R p (le cui coordinate sono i risultati delle rilevazioni relative a tale unità). Esempio con tre variabili: 1
2 Notazioni: siano x 1,..., x p p vettori di dimensione n contenenti i risultati delle rilevazioni (variabili); sia X la matrice (n,p) che ha come colonne i vettori x 1,..., x p ; sia x( i) il vettore di lunghezza p contenente i valori delle p rilevazioni dell'i-esima unità (riga i-esima di X). matrice X x( 1)... x( i)... x( n) x 1 x 2... x p Problema: Come studiare una nube di punti di R p se p>3? Come ridurre la dimensione dello spazio in modo da "perdere" il minor numero di informazioni possibili? ovvero: Come sostituire alle p variabili di partenza un numero q, inferiore a p, di nuove variabili (dette componenti principali CP ) combinazioni lineari delle variabili originali in modo che queste q variabili rappresentino il più "fedelmente" possibile le p variabili iniziali? Traccia : Si centrano i dati nel baricentro e si effettua una rotazione degli assi in modo che la varianza delle proiezioni della nuvola degli n punti sul primo nuovo asse sia massima, che quella sul secondo nuovo asse sia massima una volta fissato il primo asse, e così via. Si trova che una base ortonormale per i nuovi assi che soddisfa le condizioni precedenti è quella formata dagli autovettori associati agli autovalori della matrice delle correlazioni (o covarianze) di X; indicheremo tale base con (u 1,..., x p ). Proiettando i punti di R p sullo spazio generato da (u 1,..., x q ), con q <p, si trova la "miglior" approssimazione della nuvola in uno spazio di dimensione q. 2
3 Esempio sul dataset cars I dati che esamineremo sono tratti da H.V. Henderson & P.F. Velleman, Building Multiple Regression Models Interactively, Biometrics, 1981, pag I dati riguardano : modello nazione di fabbricazione consumo (litro/km) peso (in kg) rapporto di trasmissione al ponte potenza (in HP) cilindrata (in cm3) numero cilindri ripresa (sec./1 miglio da fermo) 3
4 Dati esaminati (file cars.xls): C N C D P I R A O R O L I Z N I T I N P T I S P V E N U R O I O U E E N D M E B P N M S _ Z R _ S S O E O O R A A C A 1 Buick Estate Wagon U.S Ford Country Squire Wagon U.S Chevy Malibu Wagon U.S Chrysler LeBaron Wagon U.S Chevette U.S Toyota Corona Japan Datsun 510 Japan Dodge Omni U.S Audi 5000 Germany Volvo 240 GL Sweden Saab 99 GLE Sweden Peugeot 694 SL France Buick Century Special U.S Mercury Zephyr U.S Dodge Aspen U.S AMC Concord D/L U.S Chevy Caprice Classic U.S Ford LTD U.S Mercury Grand Marquis U.S Dodge St Regis U.S Ford Mustang 4 U.S Ford Mustang Ghia U.S Mazda GLC Japan Dodge Colt Japan AMC Spirit U.S VW Scirocco Germany Honda Accord LX Japan Buick Skylark U.S Chevy Citation U.S Olds Omega U.S Pontiac Phoenix U.S Plymouth Horizon U.S Datsun 210 Japan Fiat Strada Italy VW Dasher Germany Datsun 810 Japan BMW 320i Germany VW Rabbit Germany
5 Statistiche elementari: Libellé Effectif Poids Moyenne Ecart-type Minimum Maximum consumo peso rapportot potenza cilindrata ncilindri ripresa nazione Effectif % / Total % / Expr. U.S Japan Germany Sweden France Italy Total É possibile notare che la maggior parte delle auto analizzate viene fabbricata negli Stati Uniti. Analisi bivariata: 5
6 Dal grafico sono evidenti le correlazioni tra consumo, peso, potenza, cilindrata e il numero cilindri. La variabile ripresa risulta essere meno correlata con le altre. Matrice di correlazione: Matrice des corrélations consumo peso rapporto potenza cilindrat ncilindri ripresa t a consumo 1.00 peso rapportot potenza cilindrata ncilindri ripresa Matrice des valeurs-tests consumo peso rapporto potenza cilindrat ncilindri ripresa t a consumo peso rapportot potenza cilindrata ncilindri ripresa Utilizzando la matrice dei valori Test si osserva che la variabile ripresa é meno correlata con le altre variabili. Cambiamento di coordinate Traslazione dell'origine nel baricentro Sia = ( 1,..., p ) il baricentro della nuvola. Sia Y la matrice dei punti centrati nel baricentro: Y = X - 1 n1 '. La matrice di varianza/covarianza di X e di Y è Y' Y. Per ottenere un'analisi indipendente dall'unità di misura di ciascuna variabile, i dati della matrice Y, oltre che centrati, vanno anche "standardizzati", ponendo: y i =. In questo caso la matrice = Y' Y è la matrice di correlazione. 6
7 Rotazione degli assi Viene effettuata quella rotazione tale che: la maggior intensità della dispersione dei punti coincida con la direzione del primo asse; lungo la direzione del secondo asse vi sia una dispersione maggiore di tutti i successivi, e così via. Esempio con due variabili Proiezione dei punti su un vettore Se v è un vettore di R p, v = (v 1,..., v p ), di lunghezza 1 (cioè v i 2 = 1) allora: - y( i)' v è la "lunghezza" della proiezione di y( i) sulla retta che ha la direzione di v - Y v è il vettore contenente le n proiezioni. Nuovi assi Come nuovo sistema di coordinate consideriamo la base ortonormale costituita dagli autovettori u 1,...,u p della matrice associati agli autovalori 1... p. Indichiamo con c j = Y u j il vettore delle proiezioni degli n punti y( i) sull'asse u j ; Questa base ha i requisiti voluti, infatti: i. 2 (c j) = j la varianza dei punti proiettati "lungo" il j-esimo vettore u j è uguale al j- esimo autovalore j ii. (c i, c j ) = 0 i vettori delle proiezioni dei punti sugli u 1,...,u p sono a due a due non correlati iii. Se v R p, v' v = 1 a. 2 (c 2 1) = sup v { (Y v) } la varianza dei punti proiettati "lungo" u 1 è la più grande fra le varianze dei punti proiettati "lungo" un generico vettore di R p b. 2 (c j) = sup v { Y v t.c. Y v è non correlato con c 1,..., c j-1 } la varianza dei punti proiettati lungo u j è la più grande fra le varianze dei punti proiettati lungo un generico vettore non correlato con c 1,..., c j-1 7
8 Autovalori della matrice di correlazione Tableau des valeurs propres Trace de la matrice: Numéro Valeur propre Pourcent age Pourcent age cumulé Intervalles laplaciens d'anderson (seuil: 0.95) Numéro Borne inférieur e Valeur propre Borne supérieu re IC Autovalori 95% Autovalore Ordine Autovalore Borne inférieure Valeur propre Borne supérieure Le prime due componenti spiegano l 88% della varianza presente nei dati. Possiamo ridurre il problema originale da 7 a 2 variabili con solamente il 22% di variabilitá non spiegata. 8
9 Autovettori Anciens axes unitaires Libellé de la Axe 1 Axe 2 Axe 3 Axe 4 Axe 5 variable consumo peso rapportot potenza cilindrata ncilindri ripresa Gli autovettori u j vengono detti assi principali (o assi fattoriali) della nuvola. Il vettore c j viene detto j-esima componente principale (o fattore principale) ed è determinata in modo univoco a meno del segno se j è un autovalore semplice. Le componenti principali c j possono essere interpretate come nuove variabili, essendo combinazioni lineari delle variabili di partenza. Ad esempio il valore della j-esima componente principale per la i-esima unità è: c j ( i) = y 1 ( i) u 1j + y 2 ( i) u 2j y p ( i) u pj Come già osservato le componenti principali c 1,..., c p hanno le seguenti proprietà: hanno media 0 hanno varianza 1,..., p decrescente, 1... p sono tra loro a due a due non correlate Fedeltà della rappresentazione in uno spazio di dimensione minore. La dispersione della nuvola attorno al baricentro, detta anche inerzia, è: I = x( i) - 2 = y( i) 2 = (y( i). u j ) 2 = 2 (c j) = j = traccia ( ) Se si rimpiazza la nuvola di punti y( i) con la sua proiezione nel sottospazio generato da (u 1,...,u q ), con q<p, la dispersione della nuvola proiettata è q. Se questa somma è grande in rapporto a q p si può dire che la proiezione è una buona rappresentazione della nuvola. 9
10 Più precisamente: si chiama fedeltà di una proiezione il rapporto fra la dispersione della nuvola proiettata e la dispersione della nuvola originale. Per quanto visto precedentemente, lo spazio generato da (u 1,...,u q ) è lo spazio di dimensione q più fedele possibile. La fedeltà della proiezione su tale spazio è: cioè il rapporto dell'inerzia nello spazio di dimensione minore rispetto all'inerzia originale. Per avere una rappresentazione piana delle proiezioni dei punti nello spazio generato da (u 1,...,u q ) in genere si proiettano i punti (c 1 ( i), c j ( i)), con j = 2,...,q. Tali rappresentazioni sono anche chiamate carte degli individui. (Proiezione degli individui) Carta degli individui carta degli individui sul primo piano fattoriale (perc.var. 88%) con indicata la nazione di fabbricazione 10
11 Dalle tabelle seguenti si puó osservare che é forte la rappresentazione nella prima CP della nazione di fabbricazione. Valeurs-Tests des modalités illustratives Libellé Effectif Poids absolu Distance à l'origine nazione U.S Japan Germany Sweden France Italy Axe 1 Axe 2 Axe 3 Axe 4 Axe 5 COORDONNEES, CONTRIBUTIONS ET COSINUS CARRES DES INDIVIDUS AXES 1 A INDIVIDUS COORDONNEES CONTRIBUTIONS COSINUS CARRES IDENTIFICATEUR P.REL DISTO Buick Estate Wagon Ford Country Squire Wago Chevy Malibu Wagon Chrysler LeBaron Wagon Chevette Toyota Corona Datsun Dodge Omni Audi Volvo 240 GL Saab 99 GLE Peugeot 694 SL Buick Century Special Mercury Zephyr Dodge Aspen AMC Concord D/L Chevy Caprice Classic Ford LTD Mercury Grand Marquis Dodge St Regis Ford Mustang Ford Mustang Ghia Mazda GLC Dodge Colt AMC Spirit VW Scirocco Honda Accord LX Buick Skylark Chevy Citation Olds Omega Pontiac Phoenix Plymouth Horizon Datsun Fiat Strada VW Dasher Datsun BMW 320i VW Rabbit
12 Correlazione fra le variabili e le componenti principali Supponiamo, per semplicità, di lavorare con variabili "standardizzate". La correlazione fra la variabile i-esima e la componente principale j-esima è: Consideriamo la matrice P = U ( ) 1/2 : (y i,c j ) = u ij j u 1 1 u u p p u ij j Nella colonna j-esima si può leggere quali variabili sono meglio correlate con la j-esima componente principale e quindi quali sono meglio rappresentate sul j-esimo asse principale. Nella riga i-esima si può leggere su quali assi principali è meglio rappresentata la i-esima variabile. Corrélations des variables actives avec les facteurs Libellé de la variable Axe 1 Axe 2 Axe 3 Axe 4 Axe 5 consumo peso rapportot potenza cilindrata ncilindri ripresa Commento: lettura per colonne: sul primo asse fattoriale sono ben rappresentate le variabili peso, potenza, cilindrata e numero cilindri (orientamento negativo per l'algoritmo utilizzato) e in misura minore le variabili consumo e drive ratio (orientamento positivo). sul secondo asse fattoriale è ben rappresentata la variabile ripresa (orientamento negativo) sul terzo asse la variabile rapporto di trasmissione al ponte, sul quarto il numero dei cilindri. 12
13 lettura per righe: il consumo, il peso, la potenza, la cilindrata e il numero cilindri sono meglio rappresentati sul primo asse la ripresa sul secondo il drive ratio sul terzo. Correlazione fra due variabili Indicando con p i una riga della matrice P precedente, la correlazione fra la variabile h-esima e la variabile k-esima sarà: (y h, y k ) = p h ' p k cioè il prodotto scalare fra le due righe di P. Disegnando i punti p ij = ( u i1 1, u ij j ), con j = 2,...,p si ottengono le cosiddette carte delle variabili (o cerchio delle correlazioni) che visualizzano la correlazione fra le variabili e le componenti principali 1 e j. Attraverso tali grafici (in particolare se j = 2) si può in qualche modo anche interpretare la correlazione fra le variabili, essendo p hj ' p hj una approssimazione di p h ' p k. L'analisi comparata delle carte degli individui e delle carte dei caratteri permette una descrizione delle rilevazioni statistiche considerate. Carta delle variabili o cerchio delle correlazioni 13
14 Commento: Essendo l'analisi in componenti normalizzate, le coordinate dei punti nella carta dei caratteri sono inferiori a 1 in valore assoluto; in effetti i punti sono a distanza 1 dall'origine in R 7 e l'operazione di proiezione non può che diminuire le distanze. Peso, potenza, cilindrata, numero cilindri e Consumo si trovano da uno stesso lato del primo asse fattoriale (e sono ben rappresentate su questo come visto precedentemente); una tale disposizione traduce il fatto che tali variabili sono in effetti ben correlate positivamente fra loro: se per un auto una variabile assume un valore elevato, tutte le altre assumono un valore elevato. drive ratio si trova ben rappresentavo dall'altro lato del primo perché correlato negativamente con le variabili precedenti. Questa caratteristica di numerosi dati sperimentali di avere molte variabili ben rappresentate sul primo asse viene detto fattore di scala. Qui il fattore di scala oppone le auto "grosse" dalle auto "medie". La ripresa si trova sul secondo asse (ed è ben rappresentata su questo come visto precedentemente) e ha in effetti una correlazione bassa con tutte le altre variabili e pertanto é rappresentata su un asse ortogonale alle precedenti. 14
15 Carta degli individui sul primo piano fattoriale La dimensione del cerchio é proporzionale al consumo (litri per km), mentre i colori rappresentano le nazioni secondo il grafico precedente. Commento: - dall'esame dei dati si osserva che: l'orientamento negativo del primo asse fattoriale corrisponde a valori alti di peso, cilindrata, numero cilindri e potenza e a valori alti di consumo (l/km) e drive-ratio (e queste variabili sono ben rappresentate su tale asse); l'orientamento negativo del secondo asse corrisponde a valori alti per la ripresa (e questa variabile è ben rappresentata su tale asse) - dall'esame complessivo della carta delle auto suddivise per nazione si può concludere che: le auto tedesche, italiane e giapponesi sono caratterizzate complessivamente da valori bassi per peso, cilindrata, numero cilindri e potenza e consumo e drive-ratio; in particolare un'auto giapponese pur avendo bassi valori per le variabili precedenti ha la ripresa massima e ciò è evidenziato dalla sua posizione in basso a destra; le auto statunitensi sono per lo più posizionate (ma non totalmente) sull'orientamento negativo del primo asse mentre si distribuiscono più o meno uniformemente rispetto al secondo: questo corrisponde a valori medio-alti per le variabili peso, cilindrata, numero cilindri e potenza e medio-alti per consumo e drive-ratio e a valori sia alti che bassi per la variabile ripresa. 15
Relazioni statistiche: regressione e correlazione
Relazioni statistiche: regressione e correlazione È detto studio della connessione lo studio si occupa della ricerca di relazioni fra due variabili statistiche o fra una mutabile e una variabile statistica
DettagliIl concetto di valore medio in generale
Il concetto di valore medio in generale Nella statistica descrittiva si distinguono solitamente due tipi di medie: - le medie analitiche, che soddisfano ad una condizione di invarianza e si calcolano tenendo
DettagliDott.ssa Caterina Gurrieri
Dott.ssa Caterina Gurrieri Le relazioni tra caratteri Data una tabella a doppia entrata, grande importanza riveste il misurare se e in che misura le variabili in essa riportata sono in qualche modo
DettagliGEOMETRIA DELLE MASSE
1 DISPENSA N 2 GEOMETRIA DELLE MASSE Si prende in considerazione un sistema piano, ossia giacente nel pian x-y. Un insieme di masse posizionato nel piano X-Y, rappresentato da punti individuati dalle loro
DettagliLezione del 28-11-2006. Teoria dei vettori ordinari
Lezione del 8--006 Teoria dei vettori ordinari. Esercizio Sia B = {i, j, k} una base ortonormale fissata. ) Determinare le coordinate dei vettori v V 3 complanari a v =,, 0) e v =, 0, ), aventi lunghezza
DettagliScheda n. 10: PCA - parte seconda
Scheda n. 10: PCA - parte seconda November 25, 2008 1 Il piano principale Con il comando: > biplot(pca) si ottiene un immagine del piano principale, con la proiezione dei dati e dei vecchi assi (le vecchie
DettagliCapitolo 2 Distribuzioni di frequenza
Edizioni Simone - Vol. 43/1 Compendio di statistica Capitolo 2 Distribuzioni di frequenza Sommario 1. Distribuzioni semplici. - 2. Distribuzioni doppie. - 3. Distribuzioni parziali: condizionate e marginali.
DettagliEsempi di funzione. Scheda Tre
Scheda Tre Funzioni Consideriamo una legge f che associa ad un elemento di un insieme X al più un elemento di un insieme Y; diciamo che f è una funzione, X è l insieme di partenza e X l insieme di arrivo.
DettagliGIROSCOPIO. Scopo dell esperienza: Teoria fisica. Verificare la relazione: ω p = bmg/iω
GIROSCOPIO Scopo dell esperienza: Verificare la relazione: ω p = bmg/iω dove ω p è la velocità angolare di precessione, ω è la velocità angolare di rotazione, I il momento principale d inerzia assiale,
Dettagli4. Operazioni elementari per righe e colonne
4. Operazioni elementari per righe e colonne Sia K un campo, e sia A una matrice m n a elementi in K. Una operazione elementare per righe sulla matrice A è una operazione di uno dei seguenti tre tipi:
DettagliLa distribuzione Normale. La distribuzione Normale
La Distribuzione Normale o Gaussiana è la distribuzione più importante ed utilizzata in tutta la statistica La curva delle frequenze della distribuzione Normale ha una forma caratteristica, simile ad una
DettagliGrandezze scalari e vettoriali
Grandezze scalari e vettoriali Esempio vettore spostamento: Esistono due tipi di grandezze fisiche. a) Grandezze scalari specificate da un valore numerico (positivo negativo o nullo) e (nel caso di grandezze
DettagliLa statistica multivariata
Cenni di Statistica Multivariata Dr Corrado Costa La statistica multivariata La statistica multivariata è quella parte della statistica in cui l'oggetto dell'analisi è per sua natura formato da almeno
DettagliLA CORRELAZIONE LINEARE
LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad esempio, si può supporre che vi sia una relazione tra l insoddisfazione
DettagliOCCUPATI SETTORE DI ATTIVITA' ECONOMICA
ESERCIZIO 1 La tabella seguente contiene i dati relativi alla composizione degli occupati in Italia relativamente ai tre macrosettori di attività (agricoltura, industria e altre attività) negli anni 1971
DettagliTrasformazioni Geometriche 1 Roberto Petroni, 2011
1 Trasformazioni Geometriche 1 Roberto etroni, 2011 Trasformazioni Geometriche sul piano euclideo 1) Introduzione Def: si dice trasformazione geometrica una corrispondenza biunivoca che associa ad ogni
DettagliA.1 Definizione e rappresentazione di un numero complesso
441 APPENDICE A4 NUMERI COMPLESSI A.1 Definizione e rappresentazione di un numero complesso Si riepilogano i concetti e le operazioni elementari relativi ai numeri complessi. Sia z un numero complesso;
DettagliDimensione di uno Spazio vettoriale
Capitolo 4 Dimensione di uno Spazio vettoriale 4.1 Introduzione Dedichiamo questo capitolo ad un concetto fondamentale in algebra lineare: la dimensione di uno spazio vettoriale. Daremo una definizione
DettagliUniversita degli Studi di Roma Tor Vergata Facolta di Ingegneria Elettronica
Universita degli Studi di Roma Tor Vergata Facolta di Ingegneria Elettronica Terzo Appello del corso di Geometria e Algebra II Parte - Docente F. Flamini, Roma, 7/09/2007 SVOLGIMENTO COMPITO III APPELLO
DettagliRICHIAMI SULLE MATRICI. Una matrice di m righe e n colonne è rappresentata come
RICHIAMI SULLE MATRICI Una matrice di m righe e n colonne è rappresentata come A = a 11 a 12... a 1n a 21 a 22... a 2n............ a m1 a m2... a mn dove m ed n sono le dimensioni di A. La matrice A può
Dettagli2.1 Definizione di applicazione lineare. Siano V e W due spazi vettoriali su R. Un applicazione
Capitolo 2 MATRICI Fra tutte le applicazioni su uno spazio vettoriale interessa esaminare quelle che mantengono la struttura di spazio vettoriale e che, per questo, vengono dette lineari La loro importanza
DettagliCALCOLO COMBINATORIO
CALCOLO COMBINATORIO 1 Modi di formare gruppi di k oggetti presi da n dati 11 disposizioni semplici, permutazioni Dati n oggetti distinti a 1,, a n si chiamano disposizioni semplici di questi oggetti,
DettagliIndice Statistiche Univariate Statistiche Bivariate
Indice 1 Statistiche Univariate 1 1.1 Importazione di un file.data.............................. 1 1.2 Medie e variabilità................................... 6 1.3 Distribuzioni di frequenze...............................
DettagliINTEGRALI DEFINITI. Tale superficie viene detta trapezoide e la misura della sua area si ottiene utilizzando il calcolo di un integrale definito.
INTEGRALI DEFINITI Sia nel campo scientifico che in quello tecnico si presentano spesso situazioni per affrontare le quali è necessario ricorrere al calcolo dell integrale definito. Vi sono infatti svariati
DettagliRETI DI TELECOMUNICAZIONE
RETI DI TELECOMUNICAZIONE SISTEMI M/G/1 e M/D/1 Sistemi M/G/1 Nei sistemi M/G/1: i clienti arrivano secondo un processo di Poisson con parametro λ i tempi di servizio hanno una distribuzione generale della
DettagliDiagonalizzazione di matrici e applicazioni lineari
CAPITOLO 9 Diagonalizzazione di matrici e applicazioni lineari Esercizio 9.1. Verificare che v = (1, 0, 0, 1) è autovettore dell applicazione lineare T così definita T(x 1,x 2,x 3,x 4 ) = (2x 1 2x 3, x
DettagliParte 2. Determinante e matrice inversa
Parte. Determinante e matrice inversa A. Savo Appunti del Corso di Geometria 013-14 Indice delle sezioni 1 Determinante di una matrice, 1 Teorema di Cramer (caso particolare), 3 3 Determinante di una matrice
DettagliFUNZIONI ELEMENTARI - ESERCIZI SVOLTI
FUNZIONI ELEMENTARI - ESERCIZI SVOLTI 1) Determinare il dominio delle seguenti funzioni di variabile reale: (a) f(x) = x 4 (c) f(x) = 4 x x + (b) f(x) = log( x + x) (d) f(x) = 1 4 x 5 x + 6 ) Data la funzione
DettagliLE FIBRE DI UNA APPLICAZIONE LINEARE
LE FIBRE DI UNA APPLICAZIONE LINEARE Sia f:a B una funzione tra due insiemi. Se y appartiene all immagine di f si chiama fibra di f sopra y l insieme f -1 y) ossia l insieme di tutte le controimmagini
DettagliMetodi Matematici e Informatici per la Biologia----31 Maggio 2010
Metodi Matematici e Informatici per la Biologia----31 Maggio 2010 COMPITO 4 (3 CREDITI) Nome: Cognome: Matricola: ISTRUZIONI Gli esercizi che seguono sono di tre tipi: Domande Vero/Falso: cerchiate V o
DettagliANALISI DELLE FREQUENZE: IL TEST CHI 2
ANALISI DELLE FREQUENZE: IL TEST CHI 2 Quando si hanno scale nominali o ordinali, non è possibile calcolare il t, poiché non abbiamo medie, ma solo frequenze. In questi casi, per verificare se un evento
DettagliStatistica. Le rappresentazioni grafiche
Statistica Le rappresentazioni grafiche Introduzione Le rappresentazioni grafiche costituiscono uno dei mezzi più efficaci, sia per descrivere in forma visiva i risultati di numerose osservazioni riguardanti
DettagliESERCIZI SVOLTI PER LA PROVA DI STATISTICA
ESERCIZI SVOLTI PER LA PROVA DI STATISTICA Stefania Naddeo (anno accademico 4/5) INDICE PARTE PRIMA: STATISTICA DESCRITTIVA. DISTRIBUZIONI DI FREQUENZA E FUNZIONE DI RIPARTIZIONE. VALORI CARATTERISTICI
DettagliAnalisi della performance temporale della rete
Analisi della performance temporale della rete In questo documento viene analizzato l andamento nel tempo della performance della rete di promotori. Alcune indicazioni per la lettura di questo documento:
Dettagli1. PRIME PROPRIETÀ 2
RELAZIONI 1. Prime proprietà Il significato comune del concetto di relazione è facilmente intuibile: due elementi sono in relazione se c è un legame tra loro descritto da una certa proprietà; ad esempio,
DettagliUna sperimentazione. Probabilità. Una previsione. Calcolo delle probabilità. Nonostante ciò, è possibile dire qualcosa.
Una sperimentazione Probabilità Si sta sperimentando l efficacia di un nuovo farmaco per il morbo di Parkinson. Duemila pazienti partecipano alla sperimentazione: metà di essi vengono trattati con il nuovo
Dettagli19 Il campo elettrico - 3. Le linee del campo elettrico
Moto di una carica in un campo elettrico uniforme Il moto di una particella carica in un campo elettrico è in generale molto complesso; il problema risulta più semplice se il campo elettrico è uniforme,
DettagliLEZIONI DI ALGEBRA LINEARE PER LE APPLICAZIONI FINANZIARIE
LEZIONI DI ALGEBRA LINEARE PER LE APPLICAZIONI FINANZIARIE FLAVIO ANGELINI Sommario Queste note hanno lo scopo di indicare a studenti di Economia interessati alla finanza quantitativa i concetti essenziali
DettagliVisione d insieme DOMANDE E RISPOSTE SULL UNITÀ
Visione d insieme DOMANDE E RISPOSTE SULL UNITÀ Che cos è la corrente elettrica? Nei conduttori metallici la corrente è un flusso di elettroni. L intensità della corrente è il rapporto tra la quantità
DettagliMetodologia per l analisi dei dati sperimentali L analisi di studi con variabili di risposta multiple: Regressione multipla
Il metodo della regressione può essere esteso dal caso in cui si considera la variabilità della risposta della y in relazione ad una sola variabile indipendente X ad una situazione più generale in cui
DettagliCodifiche a lunghezza variabile
Sistemi Multimediali Codifiche a lunghezza variabile Marco Gribaudo marcog@di.unito.it, gribaudo@elet.polimi.it Assegnazione del codice Come visto in precedenza, per poter memorizzare o trasmettere un
Dettagli1 Appunti a cura di prof.ssa MINA Maria Letizia integrati e pubblicati in data 12/10/10
FUNZIONE OMOGRAFICA ASINTOTO VERTICALE: ASINTOTO ORIZZONTALE: 1 abbiamo verificato che, applicando all iperbole equilatera base, la dilatazione verticale di coefficiente 7 e la traslazione di vettore di
DettagliDALLE CARTE ALLE SEZIONI GEOLOGICHE
DALLE CARTE ALLE SEZIONI GEOLOGICHE PROFILO TOPOGRAFICO Il profilo topografico, detto anche profilo altimetrico, è l intersezione di un piano verticale con la superficie topografica. Si tratta quindi di
DettagliCapitolo 10 Z Elasticità della domanda
Capitolo 10 Z Elasticità della domanda Sommario Z 1. L elasticità della domanda rispetto al prezzo. - 2. La misura dell elasticità. - 3. I fattori determinanti l elasticità. - 4. L elasticità rispetto
Dettagli4. Proiezioni del piano e dello spazio
4. Proiezioni del piano e dello spazio La visualizzazione di oggetti tridimensionali richiede di ottenere una vista piana dell'oggetto. Questo avviene mediante una sequenza di operazioni. Innanzitutto,
DettagliLezione 6: Forma di distribuzione Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria
Lezione 6: Forma di distribuzione Corso di Statistica Facoltà di Economia Università della Basilicata Prof. Massimo Aria aria@unina.it Standardizzazione di una variabile Standardizzare una variabile statistica
Dettagli1. Distribuzioni campionarie
Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 2012/2013 lezioni di statistica del 3 e 6 giugno 2013 - di Massimo Cristallo - 1. Distribuzioni campionarie
DettagliESAME DI STATO DI LICEO SCIENTIFICO CORSO SPERIMENTALE P.N.I. 2004
ESAME DI STAT DI LICE SCIENTIFIC CRS SPERIMENTALE P.N.I. 004 Il candidato risolva uno dei due problemi e 5 dei 0 quesiti in cui si articola il questionario. PRBLEMA Sia la curva d equazione: ke ove k e
Dettagli15 febbraio 2010 - Soluzione esame di geometria - 12 crediti Ingegneria gestionale - a.a. 2009-2010 COGNOME... NOME... N. MATRICOLA...
15 febbraio 010 - Soluzione esame di geometria - 1 crediti Ingegneria gestionale - a.a. 009-010 COGNOME.......................... NOME.......................... N. MATRICOLA............. La prova dura
DettagliRegressione Mario Guarracino Data Mining a.a. 2010/2011
Regressione Esempio Un azienda manifatturiera vuole analizzare il legame che intercorre tra il volume produttivo X per uno dei propri stabilimenti e il corrispondente costo mensile Y di produzione. Volume
DettagliCapitolo 5. Funzioni. Grafici.
Capitolo 5 Funzioni. Grafici. Definizione: Una funzione f di una variabile reale,, è una corrispondenza che associa ad ogni numero reale appartenente ad un insieme D f R un unico numero reale, y R, denotato
DettagliESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE
ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE e-mail: tommei@dm.unipi.it web: www.dm.unipi.it/ tommei Ricevimento: su appuntamento Dipartimento di Matematica, piano terra, studio 114
DettagliUn po di statistica. Christian Ferrari. Laboratorio di Matematica
Un po di statistica Christian Ferrari Laboratorio di Matematica 1 Introduzione La statistica è una parte della matematica applicata che si occupa della raccolta, dell analisi e dell interpretazione di
DettagliComplementi di Analisi per Informatica *** Capitolo 2. Numeri Complessi. e Circuiti Elettrici. a Corrente Alternata. Sergio Benenti 7 settembre 2013
Complementi di Analisi per nformatica *** Capitolo 2 Numeri Complessi e Circuiti Elettrici a Corrente Alternata Sergio Benenti 7 settembre 2013? ndice 2 Circuiti elettrici a corrente alternata 1 21 Circuito
DettagliB. Vogliamo determinare l equazione della retta
Risoluzione quesiti ordinamento Quesito N.1 Indicata con α la misura dell angolo CAB, si ha che: 1 Area ( ABC ) = AC AB sinα = 3 sinα π 3 sinα = 3 sinα = 1 α = Il triangolo è quindi retto in A. La misura
Dettagli2 FUNZIONI REALI DI VARIABILE REALE
2 FUNZIONI REALI DI VARIABILE REALE 2.1 CONCETTO DI FUNZIONE Definizione 2.1 Siano A e B due insiemi. Una funzione (o applicazione) f con dominio A a valori in B è una legge che associa ad ogni elemento
DettagliSlide Cerbara parte1 5. Le distribuzioni teoriche
Slide Cerbara parte1 5 Le distribuzioni teoriche I fenomeni biologici, demografici, sociali ed economici, che sono il principale oggetto della statistica, non sono retti da leggi matematiche. Però dalle
DettagliESERCIZI DI ALGEBRA LINEARE E GEOMETRIA
ESERCIZI DI ALGEBRA LINEARE E GEOMETRIA Francesco Bottacin Padova, 24 febbraio 2012 Capitolo 1 Algebra Lineare 1.1 Spazi e sottospazi vettoriali Esercizio 1.1. Sia U il sottospazio di R 4 generato dai
DettagliRELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della
RELAZIONE TRA VARIABILI QUANTITATIVE Lezione 7 a Accade spesso nella ricerca in campo biomedico, così come in altri campi della scienza, di voler studiare come il variare di una o più variabili (variabili
DettagliCapitolo 25: Lo scambio nel mercato delle assicurazioni
Capitolo 25: Lo scambio nel mercato delle assicurazioni 25.1: Introduzione In questo capitolo la teoria economica discussa nei capitoli 23 e 24 viene applicata all analisi dello scambio del rischio nel
DettagliSISTEMI DI NUMERAZIONE E CODICI
SISTEMI DI NUMERAZIONE E CODICI Il Sistema di Numerazione Decimale Il sistema decimale o sistema di numerazione a base dieci usa dieci cifre, dette cifre decimali, da O a 9. Il sistema decimale è un sistema
DettagliLEZIONE 23. Esempio 23.1.3. Si consideri la matrice (si veda l Esempio 22.2.5) A = 1 2 2 3 3 0
LEZIONE 23 231 Diagonalizzazione di matrici Abbiamo visto nella precedente lezione che, in generale, non è immediato che, data una matrice A k n,n con k = R, C, esista sempre una base costituita da suoi
DettagliLABORATORIO EXCEL XLSTAT 2008 SCHEDE 2 e 3 VARIABILI QUANTITATIVE
Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) LABORATORIO EXCEL
Dettagli(a cura di Francesca Godioli)
lezione n. 12 (a cura di Francesca Godioli) Ad ogni categoria della variabile qualitativa si può assegnare un valore numerico che viene chiamato SCORE. Passare dalla variabile qualitativa X2 a dei valori
DettagliCorso di Informatica Generale (C. L. Economia e Commercio) Ing. Valerio Lacagnina Rappresentazione in virgola mobile
Problemi connessi all utilizzo di un numero di bit limitato Abbiamo visto quali sono i vantaggi dell utilizzo della rappresentazione in complemento alla base: corrispondenza biunivoca fra rappresentazione
DettagliTutorato di GE110. Universitá degli Studi Roma Tre - Corso di Laurea in Matematica
Universitá degli Studi Roma Tre - Corso di Laurea in Matematica Tutorato di GE110 A.A. 2014-2015 - Docente: Prof. Angelo Felice Lopez Tutori: Federico Campanini e Giulia Salustri Soluzioni Tutorato 13
DettagliSTATISTICA DESCRITTIVA SCHEDA N. 5: REGRESSIONE LINEARE
STATISTICA DESCRITTIVA SCHEDA N. : REGRESSIONE LINEARE Nella Scheda precedente abbiamo visto che il coefficiente di correlazione fra due variabili quantitative X e Y fornisce informazioni sull esistenza
DettagliMATEMATICA DEL DISCRETO elementi di teoria dei grafi. anno acc. 2009/2010
elementi di teoria dei grafi anno acc. 2009/2010 Grafi semplici Un grafo semplice G è una coppia ordinata (V(G), L(G)), ove V(G) è un insieme finito e non vuoto di elementi detti vertici o nodi di G, mentre
DettagliBasi di matematica per il corso di micro
Basi di matematica per il corso di micro Microeconomia (anno accademico 2006-2007) Lezione del 21 Marzo 2007 Marianna Belloc 1 Le funzioni 1.1 Definizione Una funzione è una regola che descrive una relazione
DettagliLABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE
LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE DESCRIZIONE DEI DATI DA ESAMINARE Sono stati raccolti i dati sul peso del polmone di topi normali e affetti da una patologia simile
Dettagli13. Campi vettoriali
13. Campi vettoriali 1 Il campo di velocità di un fluido Il concetto di campo in fisica non è limitato ai fenomeni elettrici. In generale il valore di una grandezza fisica assegnato per ogni punto dello
DettagliTrasformazioni nello spazio Grafica 3d
Trasformazioni nello spazio Grafica 3d Giancarlo RINALDO rinaldo@dipmat.unime.it Dipartimento di Matematica Università di Messina Trasformazioni nello spaziografica 3d p. 1 Introduzione In questa lezione
DettagliVARIANZA CAMPIONARIA E DEVIAZIONE STANDARD. Si definisce scarto quadratico medio o deviazione standard la radice quadrata della varianza.
VARIANZA CAMPIONARIA E DEVIAZIONE STANDARD Si definisce varianza campionaria l indice s 2 = 1 (x i x) 2 = 1 ( xi 2 n x 2) Si definisce scarto quadratico medio o deviazione standard la radice quadrata della
Dettaglia) Il campo di esistenza di f(x) è dato da 2x 0, ovvero x 0. Il grafico di f(x) è quello di una iperbole -1 1
LE FUNZIONI EALI DI VAIABILE EALE Soluzioni di quesiti e problemi estratti dal Corso Base Blu di Matematica volume 5 Q[] Sono date le due funzioni: ) = e g() = - se - se = - Determina il campo di esistenza
DettagliAnalisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it
Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Introduzione : analisi delle relazioni tra due caratteristiche osservate sulle stesse unità statistiche studio del comportamento di due caratteri
Dettaglix 1 + x 2 3x 4 = 0 x1 + x 2 + x 3 = 0 x 1 + x 2 3x 4 = 0.
Problema. Sia W il sottospazio dello spazio vettoriale R 4 dato da tutte le soluzioni dell equazione x + x 2 + x = 0. (a. Sia U R 4 il sottospazio dato da tutte le soluzioni dell equazione Si determini
DettagliProva di autovalutazione Prof. Roberta Siciliano
Prova di autovalutazione Prof. Roberta Siciliano Esercizio 1 Nella seguente tabella è riportata la distribuzione di frequenza dei prezzi per camera di alcuni agriturismi, situati nella regione Basilicata.
DettagliLezione 9: Cambio di base
Lezione 9: Cambio di base In questa lezione vogliamo affrontare uno degli argomenti piu ostici per lo studente e cioè il cambio di base all interno di uno spazio vettoriale, inoltre cercheremo di capire
DettagliLa spirale iperbolica: Fu descritta per la prima volta da Pierre Varignon (1654-1722). L equazione, espressa in coordinate polari, è del tipo:
Esistono delle forme geometriche che sono in grado, per complessi fattori psicologici non del tutto chiariti, di comunicarci un senso d equilibrio, di gradimento e di benessere. Tra queste analizzeremo
DettagliStudio di funzioni ( )
Studio di funzioni Effettuare uno studio qualitativo e tracciare un grafico approssimativo delle seguenti funzioni. Si studi in particolare anche la concavità delle funzioni e si indichino esplicitamente
DettagliL analisi dei dati. Capitolo 4. 4.1 Il foglio elettronico
Capitolo 4 4.1 Il foglio elettronico Le più importanti operazioni richieste dall analisi matematica dei dati sperimentali possono essere agevolmente portate a termine da un comune foglio elettronico. Prenderemo
DettagliTrasformazioni 2D. Grande differenza rispetto alla grafica raster!
Trasformazioni 2D Il grande vantaggio della grafica vettoriale è che le immagini vettoriali descrivono entità matematiche È immediato manipolare matematicamente tali entità In quasi tutte le manipolazioni
DettagliELEMENTI DI ALGEBRA LINEARE E GEOMETRIA Corso di Laurea Ingegneria Edile-Architettura
Cognome Nome Matricola ELEMENTI DI ALGEBRA LINEARE E GEOMETRIA Corso di Laurea Ingegneria Edile-Architettura (Primo appello/ii prova parziale 15/6/15 - Chiarellotto-Urbinati) Per la II prova: solo esercizi
DettagliCORSO DI STATISTICA (parte 1) - ESERCITAZIONE 1
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 1 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Un breve riepilogo: caratteri, unità statistiche e collettivo UNITA STATISTICA: oggetto dell osservazione
DettagliProbabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)
Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B Eventi indipendenti: un evento non influenza l altro Eventi disgiunti: il verificarsi di un evento esclude l altro Evento prodotto:
DettagliExcel Terza parte. Excel 2003
Excel Terza parte Excel 2003 TABELLA PIVOT Selezioniamo tutti i dati (con le relative etichette) Dati Rapporto tabella pivot e grafico pivot Fine 2 La tabella pivot viene messa di default in una pagina
DettagliLE FUNZIONI E LE LORO PROPRIETÀ
LE FUNZIONI E LE LORO PROPRIETÀ LE FUNZIONI REALI DI VARIABILE REALE COSA SONO LE FUNZIONI Dati due sottoinsiemi A e B non vuoti di R, una FUNZIONE da A a B è una relazione che associa ad ogni numero reale
DettagliUsando il pendolo reversibile di Kater
Usando il pendolo reversibile di Kater Scopo dell esperienza è la misurazione dell accelerazione di gravità g attraverso il periodo di oscillazione di un pendolo reversibile L accelerazione di gravità
DettagliESTRAZIONE DI DATI 3D DA IMMAGINI DIGITALI. (Visione 3D)
ESTRAZIONE DI DATI 3D DA IMMAGINI DIGITALI () Una immagine (digitale) permette di percepire solo una rappresentazione 2D del mondo La visione 3D si pone lo scopo di percepire il mondo per come è in 3 dimensioni
DettagliEpoca k Rata Rk Capitale Ck interessi Ik residuo Dk Ek 0 S 0 1 C1 Ik=i*S Dk=S-C1. n 0 S
L AMMORTAMENTO Gli ammortamenti sono un altra apllicazione delle rendite. Il prestito è un operazione finanziaria caratterizzata da un flusso di cassa positivo (mi prendo i soldi in prestito) seguito da
Dettagli1. la probabilità che siano tutte state uccise con pistole; 2. la probabilità che nessuna sia stata uccisa con pistole;
Esercizi di Statistica della 5 a settimana (Corso di Laurea in Biotecnologie, Università degli Studi di Padova). Esercizio 1. L FBI ha dichiarato in un rapporto che il 44% delle vittime di un omicidio
DettagliTecniche di analisi multivariata
Tecniche di analisi multivariata Metodi che fanno riferimento ad un modello distributivo assunto per le osservazioni e alla base degli sviluppi inferenziali - tecniche collegate allo studio della dipendenza
DettagliE naturale chiedersi alcune cose sulla media campionaria x n
Supponiamo che un fabbricante stia introducendo un nuovo tipo di batteria per un automobile elettrica. La durata osservata x i delle i-esima batteria è la realizzazione (valore assunto) di una variabile
DettagliIl coefficiente di correlazione di Spearman per ranghi
Il coefficiente di correlazione di Spearman per ranghi Questo indice di correlazione non parametrico viene indicato con r s o Spearman rho e permette di valutare la forza del rapporto tra due variabili
DettagliCONTINUITÀ E DERIVABILITÀ Esercizi proposti. 1. Determinare lim M(sinx) (M(t) denota la mantissa di t)
CONTINUITÀ E DERIVABILITÀ Esercizi proposti 1. Determinare lim M(sin) (M(t) denota la mantissa di t) kπ/ al variare di k in Z. Ove tale limite non esista, discutere l esistenza dei limiti laterali. Identificare
Dettagli0. Piano cartesiano 1
0. Piano cartesiano Per piano cartesiano si intende un piano dotato di due assi (che per ragioni pratiche possiamo scegliere ortogonali). Il punto in comune ai due assi è detto origine, e funziona da origine
DettagliMisure di base su una carta. Calcoli di distanze
Misure di base su una carta Calcoli di distanze Per calcolare la distanza tra due punti su una carta disegnata si opera nel modo seguente: 1. Occorre identificare la scala della carta o ricorrendo alle
DettagliPROGRAMMA SVOLTO NELLA SESSIONE N.
Università C. Cattaneo Liuc, Corso di Statistica, Sessione n. 1, 2014 Laboratorio Excel Sessione n. 1 Venerdì 031014 Gruppo PZ Lunedì 061014 Gruppo AD Martedì 071014 Gruppo EO PROGRAMMA SVOLTO NELLA SESSIONE
Dettagli