Regressione e correlazione
|
|
|
- Elisabetta Mancuso
- 9 anni fa
- Просмотров:
Транскрипт
1 Regressione e correlazione Quando l osservazione statistica porta alla rilevazionedi dati esprimibili come coppie ordinate di numeri (x i ;y i ) si pone sia il problema di trovare, ammesso che ci sia, la funzione che permette di collegare i valori di x i con quelli di y i. Tale funzione viene chiamata funzione interpolante. Esempio 1. Un indagine statistica ha rilevato contemporaneamente il reddito e la spesa per il vitto di dieci famiglie. Tali dati sono riportati nella tabella sottostante. Famiglia Reddito Spesa R R (R R ) 2 V V (V V ) Totale Vitto/Euro Grafico esempio 1 Famiglie Reddito/Euro Tabella 1. Grafico tra reddito e spese di vitto Si osservi come i punti tendono ad addensari attorno ad una retta. Questo fenomeno è tipico quando si è in presenza di una correlazione tra le due grandezze osservate. L osservazione del grafico chiaramente non è una vautazione oggettiva della correlazione tra le due grandezze che invece viene determinata tramite il calcolo della covarianza a del coefficiente di correlazione. La covarianza Definizione 1. Si dice covarianza fra X e Y la media aritmetica dei prodotti degli scarti semplici (Xi X ) (Y i Ȳ ) cov(x,y)= n 1
2 Avviso 1. Se a scarti positivi (negativi) di X corrispondono scarti positivi (negativi) di Y la relazione lineare fra i due fenomeni è diretta (punti nel I e III quadrante). In questo caso la somma dei prodotti degli scarti è positiva e quindi cov(x,y)>0. Avviso 2. Se a scarti positivi (negativi) di X corrispondono scarti negativi (positivi) di Y la relazione lineare fra i due fenomeni è inversa (punti nel II e IV quadrante). In questo caso la somma dei prodotti degli scarti è negativa e quindi si ha cov(x,y)<0. Avviso 3. Se la covarianza è uguale a 0 vuol dire che non c è relazione di tipo lineare tra i due fenomeni. Ciò però non esclude che ci sia una relazione di un altro tipo (parabolico, esponenziale, ecc) Il coefficiente di correlazione lineare Definizione 2. Il coefficiente di correlazione lineare è la media aritmetica dei prodotti dei valori osservati espressi in unità standard. Il coefficiente di correlazione lineare è simbolizzato con una r (oppure con una ρ dell alfabeto greco). r = X i X Yi Ȳ σ X σ Y (Xi X ) (Y i Ȳ ) r = n σ X σ Y r = cov(x,y) σ X σ Y Nota 1. Il valore di r è compreso tra 1 e 1 1 r 1 Avviso 4. Valori positivi di r indicano l esistenza di una relazione linere diretta. Aumentando (diminuendo) i valori di X aumentano (diminuiscono) i valori di Y. Avviso 5. Valori negativi di r indicano l esistenza di una relazione lineare inversa. Aumentando (diminuendo) i valori di X diminuiscono (aumentano) quelli di Y. Avviso 6. Se r = 0 non esiste una relazione lineare tra i valori X e Y. Ciò non esclude che possa sussistere una relazione di altro tipo. Esercizio 1. Si calcolino la covarianza e il coefficiente di correlazione lineare dei dati dell esempio 1, completando opportunamente la tabella. La regressione Considerando ancora una volta l esempio 1 ci si potrebbe chiedere quale sia la retta migliore che ci descrive la relazione tra reddito e vitto. Si potrebbe procedere in modo grafico (e soggettivo) provando a disegnare una retta di regressione in modo che sia il più possibile al centro dei dati del grafico. Esiste un metodo algebrico per eseguire tale operazione. Tale metodo si chiama metodo dei minimi quadrati. Con tale metodo cerchiama la pendenza (a) e l ordinata all origine (b) della retta che meglio esprime la relazione tra i valori di X e di Y tale che f(x)=y=ax+b 2
3 Chiaramente nessun punto (tranne casi eccezionali) si troverà esattamente sulla retta. Bisognerà far in modo che la distanza misurata in verticale dal punto effettivo (X i ; Y i ) e il punto teorico calcolato con la funzione (X i :Y ī ) sia la minore possibile. Pertanto, sussistendo anche il problema dato dal fatto che alcune differenze risulteranno negative e altre positive, si cercherà di rendere minima i quadrati delle differenze tra i valori di Y ī calcolati e quelli reali Y i (Yi Ȳi) 2 = minimo Graficamente parlando il miglio accostamento è trovato riducendo gli scarti verticali dalla retta. Per operare la determinazione di tale minimo si deve ricorrere a strumenti matematici molto avanzati (differenziali parziali di funzioni a più variabili) e quindi una dimostrazione dettagliata del procedimento che porta alla definizione della seguete formula per il calcolo della pendenza e dell ordinata all origine è al di là degli obiettivi. Si può saltare quindi la derivazione matematica della formula e utilizzare direttamente il risultato, qui sotto riportato: a= nσx iy i Σy i Σx i nσx i 2 (Σx i ) 2 b= Σx 2 Σy i i Σx i Σx i y i nσx 2 i (Σx i ) 2 Esempio 2. In uno studio si sono comparate le velocità massime di alcuni veicoli e si è cercato di mettere in relazione questo valore con la potenza del motore in questione. La variabile indipendente è la potenza Potenza Velocità a= b= r= E s = v/[km/h] Grafico esempio 2 Famiglie Reg. Lin. Y indip Potenza/[kW] Tabella 2. Esempio di regressione L errore nelle regressioni Per stimare il grado di accostamento di una regressione ai valori osservati si usa solitamente un parametro chiamato errore standard 3
4 Definizione 3. L errore standard è la media quadratica delle differenze tra i valori osservati e i valori teorici E s = Σ(y i y ) 2 i n Se l accostamento è perfetto il valore di E s è 0. Migliore è l accostamento fra valori osservati e teorici e più piccolo è il valore di E s. Si noti che come nel caso dello scarto quadratico, anche in questo caso l errore standard ha la stessa unità di misura del valore y. Si noti però che spesso i sistemi informatici che calcolano le regressioni lineari offrono r (vedi il paragrafo precedente) al posto di E s come parametro di accostamento. La scelta della variabile indipendente Si faccia attenzione, procedendo nelle regressioni al fatto che se si sceglie x come variabile indipendente si cerca di stimare y a partire da x (come fatto precedentemente). Si può anche optare per una regressione che considera y come variabile indipendente. I due risultati non sono uguali (lo sono solamente nel caso ideale di un accostamento perfetto; infatti il metodo dei minimi quadrati viene applicato per le x e questo graficamente corrisponde al miglior accostamento alla retta in orizzontale). Per il calcolo con y indipendente si usano le seguenti formule: a= nσx iy i Σy i Σx i nσy i 2 (Σy i ) 2 b= Σy 2 Σx i i Σy i Σx i y i nσy 2 i (Σy i ) 2 I coefficienti così calcolati corrispondono ai quelli per la retta inversa. Per paragonarli a quelli calcolati con le formule precedenti bisogna invertire l equazione della retta. Si veda il grafico precedente che riporta entrambe le rette (la seconda tratteggiata). Esercizio 2. Si calcoli la retta di regressione con la variabile y come indipendente per l esempio precedente (esempio 2) che è già riportata nel grafico (funzione tratteggiata). Rapporto tra gli scarti quadratici e la pendeza delle rette di regressione Si lascia dimostrare che la pendenza a della retta di regressione è anche uguale al rapporto tra gli scarti dei valori di y e quelli di x moltiplicato per r a=r σy σ x (Per accostamenti molto buoni (r 1) si può approssimare con il rapporto tra i due scarti quadratici.) Le connessioni e il χ 2 (correlazioni tra mutabili) Quando si è di fronte a situazioni in cui non vi sono valori scalari ma mutabili statistiche l approccio alla correlazione deve necessariamente essere diverso. Tutti i metodi hanno inizio nella determinazione prima delle contingenze e poi dei valore del χ 2 ; questo viene poi utilizzato direttamente per determinare se esiste o meno una dipendenza tra le mutabili oppure in varie formule che indicano il grado di correlazione tra le mutabili. (Mortara, Gini, Tschuprow) Le contingenze Definizione 4. Le contingenze sono le differenze tra le frequenze osservate e quelle teoriche calcolate con il calcolo delle probabilità. 4
5 Esempio 3. Due gruppi A e B, sono composti da 100 individui, tutti sofferenti per una certa malattia. Al gruppo A viene somministrato un siero che invece non viene somministrato al gruppo B. Si vuole valutare se c è dipendenza tra guarigione e somministrazione del siero. DATI OSSERVATI f ij Guariti Non guariti Totali A con siero B senza siero Totali Per calcolare le frequenze teoriche attese se non ci fosse nessuna connessione tra i dati (ipotesi H 0 di ogni singola casella è sufficiente moltiplicare le frequenze marginali della riga e della colonna a cui corrispondono e dividere per il totale. Ecco la tabella delle t ij DATI TEORICI H 0 t ij Guariti Non guariti Totali A con siero B senza siero Totali E le contingenze c ij si trovano con le rispettive differenze (f ij t ij ): CONTINGENZE c ij =(f ij t ij ) Guariti Non guariti A con siero 5-5 B senza siero -5 5 La determinazione del χ 2 (Chi quadrato) Il calcolo del χ 2 è dato dalla somma del rapporto tra le contingenze al quadrato e i valori attesi (frequenze teoriche) secondo la seguente formula: χ 2 2 c n =Σ i Σ ij j t ij Questo valore è molto usato in statistica, soprattutto in statistica medica per valutare se si può ipotizzare una connessione statistica (dipendenza) tra i dati o se invece le differenze tra i dati osservati e quelli attesi (determinati per esempio con il calcolo delle probabilità) sono di origine puramente casuale. Per tale ragionamento si utilizza il fatto che la distribuzione χ 2 non è null altro che che la somma quadratica di una serie di distribuzioni normali secondo la seguente equazione: χ n 2 =Z 1 2 +Z Z n 2 In questa equazione n sono detti i gradi di libertà della distribuzione χ 2. Per una tabella con k righe e h colonne i gradi di libertà si calcolano con la seguente formula: n=(k 1)(h 1) Siccome la funzione χ n 2 è una funzione normalizzata se ne conoscono le aree e quindi si può procedere ad un ragionamento statistico come nel caso del calcolo dei valori critici descritti per le curve di Gauss e di Student (vedi capitolo sulla statistica inferenziale). Prendendo spundo dall esempio 4 si può dire che: χ 2 n = (5) ( 5)2 + ( 5)2 + (5) =
6 Visto che si ha n = (2 1)(2 1) = 1 grado di libertà si può guardare la tabella del χ 1 2 per il 0.95 dell area (95%) e il vaolre critico è Essendo 2.38 inferiore a 3.84 possiamo dire con la certezza al 95% che la differenza tra dati teorici e osservati non è significativa e che quindi il siero non è efficace. Indice di Gili (indice quadratico medio di contingenza, coefficiente di contingenza) χ C q = 2 χ 2 +N Più grande è il valore di C q, più grande è il grado di associazione. N è il numero totale di osservazioni. Il numero di righe e colonne della tabella di contingenza determina il massimo valore di C q, che non è mai più grande di 1. Se il numero di righe e colonne di una tabella di contingenza è uguale a k (tabelle quadrate con k righe e k colonne il valore massimo che può essere assunto da C q = k 1. k Indice di Tschuprov χ T = 2 (χ 2 +N)(h 1)(k 1) L indice di Tschuprow è simile a quello di Gili ma contiene una correzione per i gradi di libertà (numero di righe e colonne) in modo tale da assumere sempre un valore tra 0 e 1. Indice di Mortara (basato sui valori assoluti delle contingenze) C M = Σ iσ j c ij 2N Anche in questo caso gli estremi di 0 (non connesso) e 1 (perfettamente connesso) sono validi. Esercizio 3. Si calcoli tutti e tre gli indici dell esempio precedente usando le contingenze precalcolate. Esercizio 4. Si provi a costruire col foglio di calcolo un sistema di tabelle di contingenze per poter simulare delle frequenze osservate diverse da quelle dell esercizio, cercando far aumentare o far diminuire gli indici di connessione. La correlazione η di Pearson (tra variabili e mutabili) Il metodo di Pearson viene utilizzata per valutare la correlazione tra una valore scalare (variabile statistica) e una valore che non è scalare (mutabile statistica). Esempio 4. Un indagine su 1000 persone ha cercato di individuare il rapporto tra il grado di formazione scolastico e il reddito dichiarato suddiviso in classi (0-30, 30-60, 60-90, KEuro), ottenendo dati indicati nella tabella sottostante (le classi di reddito sono rapresentate dal valore centrale) freq. marg. obbligo diploma laurea freq. marg
7 Per valutare il grado di connessione fra una mutabile e una variabile si usa l indice di Pearson, che è calcolato seguento questa formula: η= Σ(M y/x i M y ) 2 A i Σ(y j M y ) 2 B j Il valore dell indice η di Pearson va da 0 per nessuna correlazione a 1 per una correlazione perfetta. In cui: A i è la frequenza marginale relativa alla i-esima riga; B j è la frequenza marginale relativa alla j-esima colonna; M y/xi è la media parziale dei valori y i calcolata lungo ogni riga, cioè la somma dei prodotti dei valori y j con le frequenze riportate in ogni riga, divisa per la rispettiva frequenza marginale A i (la media ponderata per la riga); M y è la media generale dei valori y j, cioè la somma dei prodotti degli y j per le frequenze marginali B j, divisa per il totale delle osservazioni (media ponderata per la riga finale delle frequenze marginali); Per l esempio si ottengono i seguenti valori: M y/x1 = M y/x2 = M y/x3 = M y = quindi sostituendo si ha: η= = E si può concludere che sussiste una moderata correlazione tra reddito e titoli di studio. Esercizio 5. Si ricostruisca con un foglio di calcolo una tabella e le formule necessarie per il calcolo dell indice di Pearson dell esempio qui riportato e si provi a modificare le frequenze in modo da far aumentare e/o far diminuire il coefficiente di Pearson. Si provi anche a cambiare l ordine delle righe e osservandone l effetto sull indice. 7
8 Esercizi Esercizio 6. Da una rivista specializzata di automobilismo si hanno i seguenti dati riferiti a 5 autovetture Vettura Cilindrata V. max km con 10l A B C D E Si costruiscano opportuni diagrammi cartesiani mettendo in relazione cilindrata e v. max e cilindrata e consumi. Si determinino poi i coefficienti di correlazione r [0.993; 0.975] Esercizio 7. La tabella sotto riportata indica l indice del costo per le assicurazioni malattia negli USA (100=1967). Si trovi la retta di regressione, si stimi l indice per l anno 1985 e quello per l anno Anno Indice [400.4; 148.5] Esercizio 8. Sono dati i dettagli di otto punti di vendita di una catena di grandi magazzini. Si analizzino questi dati con gli strumenti di correlazione e regressione. Punto di vendita Superficie in m 2 Numero addetti Incassi giornalieri A B C D E F G H Esercizio 9. La tabella sottostante riporta i dati di pressione e volume di un gas. Considerando che i gas genericamente hanno una correlazione tra questi due parametri data dall equazione P V γ =C con γ e C costanti si linearizzino la formula e i dati applicando un logaritmo e si trovino queste due costanti con una regressione lineare. [γ= 1.40;C = ] Esercizio 10. La seguente tabella riporta i voti di alcuni studenti in algebra e fisica. Si trovino le dure rette interpolanti, sia per fisica, sia per algebra come variabile indipendente. Se uno stdente ha ottenuto 75 in algebra quale voto ci si deve attendere abbia ottenuto a fisica? E uno che ha ottenuto 95 in fisica quanto presumibilmente avrà ottenuto in algebra? Si valuti la qualità della correlazione con la determinazione di r. Algebra Fisica Esercizio 11. Dovendo interpolare i dati della seguente tabella cerca di capire qual è il tipo di funzione più opportuno e, linearizzando opportunamente i dati, esegui la regressione x y f(x)= x Esercizio 12. In un circondario scolastico viene eseguita un indagine che analizza il tempo di percorrenza casa-scuola in funzione del ordine scolastico. Valutare la connessione con l indice di Pearson Totale Elementari Medie Superiori Totale [η= ] 8
9 Esercizio 13. Un industria alimentare ha condotto una indagine al fine di scoprire eventuali connessioni tra la professione e il tipo di bevanda usata a colazione fra 1100 persone di una grande città. I risultati sono riportati nella tabella sottostante. Si valuti la connessione con gli indici presentati a lezione Tè Caffè Cioccolata Succo frutta Latte Totale Studenti Operai Impiegati Totale
STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE
STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 2 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1.1
Statistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative
REGRESSIONE E CORRELAZIONE
REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.
Statistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri
Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale)
Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale) Esercizio 1: Un indagine su 10.000 famiglie ha dato luogo, fra le altre, alle osservazioni riportate nella
Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2010/2011 Statistica Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza
Esercitazione di Statistica Indici di associazione
Esercitazione di Statistica Indici di associazione 28/10/2015 La relazione tra caratteri Indipendenza logica Quando si suppone che tra due caratteri non ci sia alcuna relazione di causa-effetto. Indipendenza
Capitolo uno STATISTICA DESCRITTIVA BIVARIATA
Capitolo uno STATISTICA DESCRITTIVA BIVARIATA La statistica unidimensionale si occupa di studiare una sola variabile statistica. La statistica bidimensionale o bivariata si occupa dello studio congiunto
Statistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2011/2012 Statistica Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate.
Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria
Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata Prof. Massimo Aria [email protected] Il concetto di interpolazione In matematica, e in particolare in
Associazione tra caratteri quantitativi: gli indici di correlazione
Associazione tra caratteri quantitativi: gli indici di correlazione Per correlazione si intende una relazione tra due variabili tale che a ciascun valore della prima variabile corrisponda con una certa
Statistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 41 Outline 1 2 3 4 5 () Statistica 2 / 41 Misura del legame Data una variabile doppia (X, Y ), la
Statistica di base per l analisi socio-economica
Laurea Magistrale in Management e comunicazione d impresa Statistica di base per l analisi socio-economica Giovanni Di Bartolomeo [email protected] Definizioni di base Una popolazione è l insieme
METODO DEI MINIMI QUADRATI
METODO DEI MINIMI QUADRATI Torniamo al problema della crescita della radice di mais in funzione del contenuto di saccarosio nel terreno di coltura. Ripetendo varie volte l esperimento con diverse quantità
ESERCIZI SVOLTI Giuliano Bonollo - Michele Bonollo
ESERCIZI SVOLTI Giuliano Bonollo - Michele Bonollo 1 La seguente tabella riporta le frequenze relative riguardanti gli studenti di un università e gli esiti dell esame da essi sostenuto. Qual è la percentuale
Esercizi Svolti. 2. Costruire la distribuzione delle frequenze cumulate del tempo di attesa
Esercizi Svolti Esercizio 1 Per una certa linea urbana di autobus sono state effettuate una serie di rilevazioni sui tempi di attesa ad una determinata fermata; la corrispondente distribuzione di frequenza
Lezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo
UIVERSITA DEGLI STUDI DI BASILICATA FACOLTA DI ECOOMIA Corso di laurea in Economia Aziendale anno accademico 2012/2013 Lezioni di Statistica del 15 e 18 aprile 2013 Docente: Massimo Cristallo LA RELAZIOE
Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill
Statistica - metodologie per le scienze economiche e sociali /e S Borra, A Di Ciaccio - McGraw Hill Es 6 Soluzione degli esercizi del capitolo 6 In base agli arrotondamenti effettuati nei calcoli, si possono
La dipendenza. Antonello Maruotti
La dipendenza Antonello Maruotti Outline 1 Distribuzioni doppie 2 Medie e varianze condizionate 3 Indici di associazione Distribuzione doppia Definizione Una distribuzione doppia si ha quando su di uno
Esercitazione del
Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36
SCOPO DELL ANALISI DI CORRELAZIONE
CORRELAZIONE 1 SCOPO DELL ANALISI DI CORRELAZIONE STUDIARE LA RELAZIONE TRA DUE VARIABILI X E Y 2 diagrammi di dispersione un diagramma di dispersione (o grafico di dispersione) èuna rappresentazione grafica
La distribuzione delle frequenze. T 10 (s)
1 La distribuzione delle frequenze Si vuole misurare il periodo di oscillazione di un pendolo costituito da una sferetta metallica agganciata a un filo (fig. 1). A Figura 1 B Ricordiamo che il periodo
Capitolo 12. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 12.1: Suggerimento
Capitolo Suggerimenti agli esercizi a cura di Elena Siletti Esercizio.: Suggerimento Per verificare se due fenomeni sono dipendenti in media sarebbe necessario confrontare le medie condizionate, in questo
STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo
STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)
DISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a Prerequisiti Popolazione, unità, carattere Come nascono i dati:
DISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a. 2007-2008 Prerequisiti Popolazione, unità, carattere Come nascono i dati: osservazione e sperimentazione Popolazione: reale e virtuale Classificazione
STATISTICA: esercizi svolti sulla DIPENDENZA IN MEDIA
STATISTICA: esercizi svolti sulla DIPEDEZA I MEDIA 1 1 LA DIPEDEZA I MEDIA 2 1 LA DIPEDEZA I MEDIA 1. La popolazione in migliaia di unità occupata in Piemonte nel 1985 per reddito annuo Y (migliaia di
L errore percentuale di una misura è l errore relativo moltiplicato per 100 ed espresso in percentuale. Si indica con e p e risulta: e ( e 100)%
UNITÀ L ELBORZIONE DEI DTI IN FISIC 1. Gli errori di misura.. Errori di sensibilità, errori casuali, errori sistematici. 3. La stima dell errore. 4. La media, la semidispersione e lo scarto quadratico
Intervallo di fiducia del coefficiente angolare e dell intercetta L intervallo di fiducia del coefficiente angolare (b 1 ) è dato da:
Analisi chimica strumentale Intervallo di fiducia del coefficiente angolare e dell intercetta L intervallo di fiducia del coefficiente angolare (b 1 ) è dato da: (31.4) dove s y è la varianza dei valori
Esame di Statistica (10 o 12 CFU) CLEF 11 febbraio 2016
Esame di Statistica 0 o CFU) CLEF febbraio 06 Esercizio Si considerino i seguenti dati, relativi a 00 clienti di una banca a cui è stato concesso un prestito, classificati per età e per esito dell operazione
0 altimenti 1 soggetto trova lavoroentro 6 mesi}
Lezione n. 16 (a cura di Peluso Filomena Francesca) Oltre alle normali variabili risposta che presentano una continuità almeno all'interno di un certo intervallo di valori, esistono variabili risposta
E la rappresentazione grafica, in questo caso, è la dispersione x,y, cioè una nuvola di punti nel piano cartesiano
Capitolo uno STATISTICA DESCRITTIVA BIVARIATA La statistica bidimensionale o bivariata si occupa dello studio del grado di dipendenza di due caratteri distinti della stessa unità statistica. E possibile,
Elementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 05-Deviazione standard e punteggi z vers. 1.1 (22 ottobre 2014) Germano Rossi 1 [email protected] 1 Dipartimento di Psicologia, Università di Milano-Bicocca
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 4
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 4 Dott.ssa Antonella Costanzo [email protected] Esercizio 1. Differenze semplici medie, confronti in termini di mutua variabilità La distribuzione del prezzo
Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica
Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Regressione Lineare e Correlazione Argomenti della lezione Determinismo e variabilità Correlazione Regressione Lineare
Elementi di Statistica
Università degli Studi di Palermo Dipartimento di Ingegneria Informatica Informatica ed Elementi di Statistica 3 c.f.u. Anno Accademico 2010/2011 Docente: ing. Salvatore Sorce Elementi di Statistica Statistica
Esercizio 1 Nella seguente tabella sono riportate le lunghezze in millimetri di 40 foglie di platano:
4. STATISTICA DESCRITTIVA ESERCIZI Esercizio 1 Nella seguente tabella sono riportate le lunghezze in millimetri di 40 foglie di platano: 138 164 150 132 144 125 149 157 146 158 140 147 136 148 152 144
ITCS Erasmo da Rotterdam. Anno Scolastico 2014/2015. CLASSE 4^ M Costruzioni, ambiente e territorio
ITCS Erasmo da Rotterdam Anno Scolastico 014/015 CLASSE 4^ M Costruzioni, ambiente e territorio INDICAZIONI PER IL LAVORO ESTIVO DI MATEMATICA e COMPLEMENTI di MATEMATICA GLI STUDENTI CON IL DEBITO FORMATIVO
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5 Dott.ssa Antonella Costanzo [email protected] Esercizio 1. Misura dell associazione tra due caratteri Uno store manager è interessato a studiare la relazione
PIANO CARTESIANO e RETTE classi 2 A/D 2009/2010
PIANO CARTESIANO e RETTE classi 2 A/D 2009/2010 1) PIANO CARTESIANO serve per indicare, identificare, chiamare... ogni PUNTO del piano (ente geometrico) con una coppia di valori numerici (detti COORDINATE).
Quadro riassuntivo di geometria analitica
Quadro riassuntivo di geometria analitica IL PIANO CARTESIANO (detta ascissa o coordinata x) e y quella dall'asse x (detta ordinata o coordinata y). Le coordinate di un punto P sono: entrambe positive
Note sulla probabilità
Note sulla probabilità Maurizio Loreti Dipartimento di Fisica Università degli Studi di Padova Anno Accademico 2002 03 1 La distribuzione del χ 2 0.6 0.5 N=1 N=2 N=3 N=5 N=10 0.4 0.3 0.2 0.1 0 0 5 10 15
1/4 Capitolo 4 Statistica - Metodologie per le scienze economiche e sociali 2/ed Copyright 2008 The McGraw-Hill Companies srl
1/4 Capitolo 4 La variabilità di una distribuzione Intervalli di variabilità Box-plot Indici basati sullo scostamento dalla media Confronti di variabilità Standardizzazione Statistica - Metodologie per
Facoltà di Scienze Politiche Corso di laurea in Servizio sociale. Compito di Statistica del 7/1/2003
Compito di Statistica del 7/1/2003 I giovani addetti all agricoltura in due diverse regioni sono stati classificati per età; la distribuzione di frequenze congiunta è data dalla tabella seguente Età in
Minimi quadrati pesati per la Regressione Lineare
Minimi quadrati pesati per la Regressione Lineare Salto in alto oltre le formule Ing. Ivano Coccorullo Perchè? La tabella che segue riporta il raggio medio dell orbita R ed il periodo di rivoluzione T
La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci
La statistica Elaborazione e rappresentazione dei dati Gli indicatori statistici Introduzione La statistica raccoglie ed analizza gruppi di dati (su cose o persone) per trarne conclusioni e fare previsioni
Statistica. Matematica con Elementi di Statistica a.a. 2015/16
Statistica La statistica è la scienza che organizza e analizza dati numerici per fini descrittivi o per permettere di prendere delle decisioni e fare previsioni. Statistica descrittiva: dalla mole di dati
Anno scolastico 2015/2016 PROGRAMMA SVOLTO. Docente: Catini Romina. Materie: Matematica. Classe : 4 L Indirizzo Scientifico Scienze Applicate
Anno scolastico 2015/2016 PROGRAMMA SVOLTO Docente: Catini Romina Materie: Matematica Classe : 4 L Indirizzo Scientifico Scienze Applicate UNITA DIDATTICA FORMATIVA 1: Statistica Rilevazione dei dati Rappresentazioni
Σ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica
13. Regressione lineare parametrica Esistono numerose occasioni nelle quali quello che interessa è ricostruire la relazione di funzione che lega due variabili, la variabile y (variabile dipendente, in
Capitolo 6 La distribuzione normale
Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 6 La distribuzione normale Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università
PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA
PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURA/TECNICA DI ANALISI DEI DATI SPECIFICAMENTE DESTINATA A STUDIARE LA RELAZIONE TRA UNA VARIABILE NOMINALE (ASSUNTA
Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza.
Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza. Misure ripetute forniscono dati numerici distribuiti attorno ad un valore centrale indicabile con un indice (indice
Covarianza, correlazione e retta di regressione. Paola Lecca, CIBIO UNITN Corso di Matematica e Statistica 2
Covarianza, correlazione e retta di regressione Paola Lecca, CIBIO UNITN Corso di Matematica e Statistica 2 Questa presentazione è stata preparata attingendo dai seguenti testi S. M. Iacus, Statistica,
Istituzioni di Statistica e Statistica Economica
Istituzioni di Statistica e Statistica Economica Università degli Studi di Perugia Facoltà di Economia, Assisi, a.a. 2013/14 Esercitazione n. 1 A. I dati riportati nella seguente tabella si riferiscono
Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo
Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è
ESERCIZI STATISTICA DESCRITTIVA
ESERCIZI STATISTICA DESCRITTIVA Frequenze assolute e relative Titolo di studio Frequenze assolute Frequenze relative Proporzioni Percentuali Senza titolo 30 0,025 2,5 Lic. elementare 509 0,424 42,4 Licenza
Esercitazione II Statistica e Calcolo delle Probabilità (con soluzioni)
Esercitazione II Statistica e Calcolo delle Probabilità (con soluzioni) Esercizio 1: Alla fine di una giornata di lavoro un intervistatore si accorge di aver perso i dati raccolti su un certo numero di
Elementi di Psicometria
Elementi di Psicometria 7-Punti z e punti T vers. 1.0a (21 marzo 2011) Germano Rossi 1 [email protected] 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2010-2011 G. Rossi (Dip. Psicologia)
UNIVERSITÀ DEGLI STUDI DI ROMA LA SAPIENZA
UNIVERSITÀ DEGLI STUDI DI ROMA LA SAPIENZA - 9.Statistica - CTF Matematica - Seconda Parte Codice Compito: - Numero d Ordine D. 1 Un veicolo marcia per 50 km alla velocita v, e per altri 50 km alla velocita
Teoria e tecniche dei test. Concetti di base
Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi
Interpolazione Statistica
Interpolazione Statistica Come determinare una funzione che rappresenti la relazione tra due grandezze x e y a cura di Roberto Rossi novembre 2008 Si parla di INTERPOLAZIONE quando: Note alcune coppie
Distribuzioni secondo due caratteri. Rappresentazioni e prime sintesi
Distribuzioni secondo due caratteri Rappresentazioni e prime sintesi Rappresentazioni delle distribuzioni doppie Quando per ogni unità del collettivo rileviamo due caratteri otteniamo una Esempio. Ad alcuni
PIANO DI LAVORO ANNUALE DEL DIPARTIMENTO DI MATERIA NUCLEI FONDAMENTALI DI CONOSCENZE
Pag. 1 di 7 ANNO SCOLASTICO 2014/2015 DIPARTIMENTO DI MATEMATICA INDIRIZZO AFM, RIM, SIA CLASSE BIENNIO TRIENNIO DOCENTI: Alemagna, Bartalotta, Bergamaschi, Mangione NUCLEI FONDAMENTALI DI CONOSCENZE I
Esercitazioni di statistica
Esercitazioni di statistica Misure di associazione: Indipendenza assoluta e in media Stefania Spina Universitá di Napoli Federico II [email protected] 22 ottobre 2014 Stefania Spina Esercitazioni
Capitolo 6. La distribuzione normale
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 6 La distribuzione normale Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università
Distribuzione Gaussiana - Facciamo un riassunto -
Distribuzione Gaussiana - Facciamo un riassunto - Nell ipotesi che i dati si distribuiscano seguendo una curva Gaussiana è possibile dare un carattere predittivo alla deviazione standard La prossima misura
EQUAZIONE DELLA RETTA
EQUAZIONE DELLA RETTA EQUAZIONE DEGLI ASSI L equazione dell asse x è 0. L equazione dell asse y è 0. EQUAZIONE DELLE RETTE PARALLELE AGLI ASSI L equazione di una retta r parallela all asse x è cioè è uguale
Moltiplicazione. Divisione. Multipli e divisori
Addizione Sottrazione Potenze Moltiplicazione Divisione Multipli e divisori LE QUATTRO OPERAZIONI Una operazione aritmetica è quel procedimento che fa corrispondere ad una coppia ordinata di numeri (termini
ANALISI MULTIDIMENSIONALE DEI DATI (AMD)
ANALISI MULTIDIMENSIONALE DEI DATI (AMD) L Analisi Multidimensionale dei Dati (AMD) è una famiglia di tecniche il cui obiettivo principale è la visualizzazione, la classificazione e l interpretazione della
Statistica Applicata all edilizia: il modello di regressione
Statistica Applicata all edilizia: il modello di regressione E-mail: [email protected] 27 aprile 2009 Indice Il modello di Regressione Lineare 1 Il modello di Regressione Lineare Analisi di regressione
Statistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione.
Statistica inferenziale La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione. Verifica delle ipotesi sulla medie Quando si conduce una
PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE
PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE 1. Distribuzione congiunta Ci sono situazioni in cui un esperimento casuale non si può modellare con una sola variabile casuale,
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3 Dott.ssa Antonella Costanzo [email protected] Esercizio 1. Sintesi a cinque e misure di variabilità rispetto ad un centro Una catena di fast-food ha selezionato
TOPOGRAFIA 2013/2014. Prof. Francesco-Gaspare Caputo
TOPOGRAFIA 2013/2014 L operazione di misura di una grandezza produce un numero reale che esprime il rapporto della grandezza stessa rispetto a un altra, a essa omogenea, assunta come unità di misura. L
Esercizio 1 Questa tabella esprime i tempi di durata di 200 apparecchiature elettriche:
Istituzioni di Statistica 1 Esercizi su indici di posizione e di variabilità Esercizio 1 Questa tabella esprime i tempi di durata di 200 apparecchiature elettriche: Durata (ore) Frequenza 0 100? 100 200
Università degli Studi di Padova Facoltà di Scienze Politiche
Università degli Studi di Padova Facoltà di Scienze Politiche STATISTICA Nuovo ordinamento Scienze Sociologiche Prof.ssa A. Dalla Valle Vecchio ordinamento Prova del 27/6/2007 (A) Cognome e nome: N. matricola:
Appunti su Indipendenza Lineare di Vettori
Appunti su Indipendenza Lineare di Vettori Claudia Fassino a.a. Queste dispense, relative a una parte del corso di Matematica Computazionale (Laurea in Informatica), rappresentano solo un aiuto per lo
TEORIA DEGLI ERRORI DI MISURA, IL CALCOLO DELLE INCERTEZZE
TEORIA DEGLI ERRORI DI MISURA, IL CALCOLO DELLE INCERTEZZE Errore di misura è la differenza fra l indicazione fornita dallo strumento e la dimensione vera della grandezza. Supponendo che la grandezza vera
ESERCITAZIONE IV - Soluzioni
umero di omicidi ESERCITAZIOE IV - Soluzioni Esercizio I. a),00 12,00 10,00 8,00 6,00 4,00 2,00 0,00 0 5 10 15 20 25 Popolazione povera (%) b) Poiché i due caratteri in analisi sono quantitativi per calcolare
Indici di eterogeneità e di concentrazione
Indici di eterogeneità e di concentrazione Dario Malchiodi e Anna Maria Zanaboni 12 gennaio 2016 1 Indici di eterogeneità Nel caso di variabili qualitative nominali la varianza e gli altri indici da essa
Test per la correlazione lineare
10 Test per la correlazione lineare Istituzioni di Matematica e Statistica 2015/16 E. Priola 1 Introduzione alla correlazione lineare Problema: In base ai dati che abbiamo possiamo dire che c è una qualche
Esercitazioni del corso: STATISTICA
A. A. 0-0 Esercitazioni del corso: STATISTICA Sommario Esercitazione 4: Medie e varianze marginali Medie e varianze condizionate Scomposizione della varianza Indipendenza in media ESERCIZIO UNIVERSITÀ
Il teorema di Rouché-Capelli
Luciano Battaia Questi appunti (1), ad uso degli studenti del corso di Matematica (A-La) del corso di laurea in Commercio Estero dell Università Ca Foscari di Venezia, campus di Treviso, contengono un
PROVA SCRITTA DI STATISTICA. cod CLEA-CLAPI-CLEFIN-CLELI cod CLEA-CLAPI-CLEFIN-CLEMIT. 5 Novembre 2003 SOLUZIONI MOD.
PROVA SCRITTA DI STATISTICA cod. 4038 CLEA-CLAPI-CLEFIN-CLELI cod. 5047 CLEA-CLAPI-CLEFIN-CLEMIT 5 Novembre 003 SOLUZIONI MOD. A In 8 facoltà di un ateneo italiano vengono rilevati i seguenti dati campionari
Capitolo 3 Sintesi e descrizione dei dati quantitativi
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 3 Sintesi e descrizione dei dati quantitativi Insegnamento: Statistica Applicata Corso di Laurea in "Scienze e tecnologie Alimentari" Unità
CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)
CHEMIOMETRIA Applicazione di metodi matematici e statistici per estrarre (massima) informazione chimica (affidabile) da dati chimici INCERTEZZA DI MISURA (intervallo di confidenza/fiducia) CONFRONTO CON
UNIVERSITÀ di ROMA TOR VERGATA
UNIVERSITÀ di ROMA TOR VERGATA Corso di Statistica, anno 2010-11 P.Baldi Lista di esercizi 3. Corso di Laurea in Biotecnologie Esercizio 1 Una v.a. X segue una legge N(2, ). Calcolare a1) P(X 1) a2) P(2
Anno Scolastico 2015/16 PROGRAMMAZIONE ANNUALE CLASSE SECONDA LICEO LINGUISTICO LICEO DELLE SCIENZE UMANE LICEO ECONOMICO-SOCIALE LICEO MUSICALE
LICEO LAURA BASSI - BOLOGNA Anno Scolastico 2015/16 PROGRAMMAZIONE ANNUALE CLASSE SECONDA LICEO LINGUISTICO LICEO DELLE SCIENZE UMANE LICEO ECONOMICO-SOCIALE LICEO MUSICALE MATEMATICA ARGOMENTI: EQUAZIONI
Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva
Fondamenti di Informatica Ester Zumpano Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva Lezione 5 Statistica descrittiva La statistica descrittiva mette a disposizione il calcolo di
