Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica"

Transcript

1 Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Regressione Lineare e Correlazione

2 Argomenti della lezione Determinismo e variabilità Correlazione Regressione Lineare Requisiti e valutazione

3 Determinismo e Variabilità

4 Modelli Deterministici approccio scientifico alla medicina si basa sulla definizione di modelli che sono composti da relazioni e da quantità d esempio la Compliance Polmonare:C= V/ P Esiste tuttavia una variabilità in relazione alla legge generale

5 Variabilità 4, 4 Per studiare le relazioni esistenti tra variabili si deve considerare a) una compenente deterministica b) una compenete casuale della loro relazione Variabile Manuale dipendente 3, 3, Variabilità Casuale Legge (Modello) che mette in relazione la variabile indipendente e la variabile dipendente,,, 3 3, 4 Variabile Ultrasuoni indipendente

6 Le Variabili La statistica lavora su VARIABILI, ossia su dati che cambiano valore da un soggetto all altro Ad esempio: Pressione Arteriosa, Altezza, Peso Il valore delle variabili viene misurato a livello di ogni unità statistica (singolo soggetto o aggregato di soggetti) Le variabili statistiche sono dette Aleatorie o Casuali, infatti ad ogni possibile valore di una variabile è associata una specifica ed i valori osservati sono considerate come estratti casualmente da una distribuzione di probabilità

7 Modelli Probabilistici Lo scopo è quello di costruire una rappresentazione statistica (cioè che quantifichi la variabilità esistente tra le osservazioni) adeguata per descrive gli aspetti essenziali del fenomeno che vogliamo studiare Modello: descrizione o riproduzione selettiva, più o meno formalizzata, della realtà Nel nostro caso è un equazione matematica Ad esempio, peso osservato alla nascita e peso stimato prima della nascita con l ecografia

8 Esempio (Peso alla nascita) Soggetto No Peso alla nascita Peso stimato Ecografia,33,,9, 3,9,3 4,64,4 3,,9 6,9, 3,,84 8,48,34 44,,6 4,,3 46,9,6 Si possono studiare (A)la distribuzione del peso alla nascita di un neonato, (B) la distribuzione della stima del peso alla nascita di un neonato (ecografia) (C) la relazione che esiste tra A e B

9 Esempio (Peso alla nascita) 4, Diagramma di dispersione 4 3, 3, Peso (Kg) Nascita Peso (Kg) Ecografia,,, 3 3, 4

10 Esempio (Peso alla nascita) 4, Regressione (lineare) 4 3, 3, Peso (Kg) Nascita Retta che mette in relazione il peso stimato con l ecografia e quello osservato alla nascita Peso (Kg) Ecografia,,, 3 3, 4

11 Esempio (Peso alla nascita) 4, Variabilità 4 3, 3, Peso (Kg) Nascita Variabilità Casuale (non spiegata dal modello) Retta che mette in relazione il peso stimato con l ecografia e quello osservato alla nascita Peso (Kg) Ecografia,,, 3 3, 4

12 Campo di applicazione Analisi della relazione tra due variabili continue ) Correlazione Le variabili sono associate? ) Regressione Come varia il valore di una variabile in conseguenza del variare di un altra variabile? Spiegato dalla componente deterministica del modello ) Variabilità Qual è la variabilità residua non spiegata dall equazione lineare?

13 Correlazione

14 Correlazione Dato un insieme di osservazioni definite da due variabili continue, valutiamo la forza dell associazione tra le due variabili disegnando il diagramma di dispersione e calcolando il coefficiente di correlazione

15 Diagramma di dispersione Si disegna riportando i valori delle osservazioni su un sistema di assi cartesiani, in cui l asse x rappresenta una delle due variabili e l asse y l altra variabile Il diagramma consente di collocare ogni osservazione nello spazio definito dai valori possibili delle due variabili

16 Diagramma di dispersione 4, 4 La forma della nuvola di punti così ottenuta consente una valutazione visiva del grado di associazione tra le due variabili 3, 3, Peso (Kg) Nascita Peso (Kg) Ecografia,,, 3 3, 4

17 Coefficiente di Pearson (definizione( definizione) Il coefficiente di correlazione di Pearson (r) consente la valutazione formale del grado di associazione L intervallo dei valori possibili di r è: - <= r <= Se r = o r = - tutti i punti giacciono su una retta (assenza di variabilità) Se il valore è positivo l associazione è diretta se il valore è negativo l associazione è inversa

18 Coefficiente di Pearson (formula) r = n n i= ( )( ) x x y y i n ( ) ( ) x x y y i i= i= i i n:numero di osservazioni x i ; y i : valore della singola osservazione x ; y : valore medio della variabile indipendente e dipendente

19 Coefficiente di Pearson (esempio( esempio) 36, circonferenza cranica 34, 3, 3, 8, 6, r =, 4,,, età materna

20 Coefficiente di Pearson (esempio( esempio) 36, 34, r =, circonferenza cranica 3, 3, 8, 6, 4,,, lunghezza

21 Esempio (variabili e dati) Relazione tra concentrazione plasmatica di colesterolo e di trigliceridi Colesterolo (x) Trigliceridi (y) 3,4 6,4 3, 6,8 3,9, 4 3, 6, 3,6 6,36 6,3,6,,48 8,8,6 9 8,9 9,4,3 8,4 medie:,669 6,4

22 Esempio (scatterplot) trigliceridi colesterolo

23 Esempio (correlazione) Colesterolo (x) Trigliceri ( x) di (y) ( y) xi y i ( x) ( y y) x i * ( x ) i xi ( y y) i 3,4 6,4 -,49 -,493,8 6,4668,4349 3, 6,8 -,49 -,3,33,838,389,9, -,99 -,33 4,364 8,68,389 3, 6, -,39 -,63,339 4,3,3889 3,6 6,36 -,39 -,33,834,3,399,3,6 -,99 -,63,6363,388,9969,,48 -,89 -,3,36,6448,9,8,6,94 -,63 -,6383 3,648,9969 8,9 9,4,88,66,6836 8,36,889,3 8,4 6,39,66,639 4,84488,8889 Sommatorie: 6,44 83,4389 6,4649 Coeff Pearson r =,6

24 Regressione lineare

25 Regressione lineare Regressione: stima della variazione media di una variabile dipendente in funzione della variazione unitaria di una variabile indipendente Lineare: la funzione in questo caso è quella che definisce una retta

26 Perchè Regressione Lineare? La variazione lineare è spesso una spiegazione adeguata Variazioni non lineari diventano tali dopo una trasformazione matematica di una delle variabili La variazione lineare è un punto di partenza

27 Esempio (Peso alla nascita) 4, Regressione lineare 4 3, 3, Peso (Kg) Nascita Variabilità Casuale (non spiegata dal modello) Retta che mette in relazione il peso stimato con l ecografia e quello osservato alla nascita Peso (Kg) Ecografia,,, 3 3, 4

28 Regressione lineare (variabili) Possibile Effetto (var dipendente) y Variabile indipendente possibile causa sulle ascisse Possibile Causa (var dipendente) x Variabile dipendente possibile effetto sulle ordinate

29 Equazione della Retta Individuare la retta che meglio predice il valore di y (variabile dipendente), dato il valore di x (variabile indipendente) y = a + bx a: intercetta b: pendenza (coefficiente angolare) Come stimiamo i valori dei due coefficienti (a,b)?

30 Quale Retta? y La retta che meglio predice y x passa per la media di x e di y Media di y Per un punto passano infinite rette! Quale retta scegliamo? Con quale criterio? Media di x x

31 Metodo detto dei minimi quadrati y Residuo (o scarto) = valore y osservato valore y predetto valore y osservato Residuo o scarto valore y predetto La retta migliore minimizza la somma dei quadrati dei residui x

32 Equazione della Retta Individuare la retta che meglio predice il valore di y (variabile dipendente), dato il valore di x (variabile indipendente) ( )( ) x x y y ( ) x b = i a = y b x i x i y = a + bx a: intercetta b: pendenza (coefficiente angolare)

33 Esempio (colesterolo e trigliceridi) ( x) ( ) xi y i ( ) ( y ) Colester Triglice olo (x) ridi (y) y x y i i x i x 3,4 6,4 -,9 -,3,89 4,9396 x * ( ) 3, 6,8 -,69 -,9,639 4,46 3,9, -,9 -, 3,4849, , 6, -,899 -,36,6839 3,66 3,6 6,36 -,999 -,,889 3,996 6,3,6 -,39 -,8,89,888,,48 -,69 -,99,6389,336 8,8,6,8 -,8 -,4698 4,66 9 8,9 9,4 3,,99 9,449 9,464,3 8,4 6,63,99,999 43,96 medie:,669 6,4 6,44 83,4389 b=,38

34 Relazione tra Colesterolo e TG trigliceridi (y) a=4,6 b =, colesterolo (x) trigliceridi=4,6 +,3* colesterolo

35 IC del coefficiente di regressione Intervallo di confidenza coeff di regressione (b) CI = b ± t crit SE(b) t ha (n-) gradi di libertà ed il valore è scelto in modo corrispondente all errore di I tipo, con test a code ES( b) = s ( x x) i

36 Varianza intorno alla retta di regressione (stima campionaria) s ( ) y yˆ i i = n

37 Errore standard di b ES( b) = s ( x x) i L errore standard di b si riduce, a parità di s, quando la variabilità di x è maggiore!

38 Relazione tra Colesterolo e TG trigliceridi (y) a=4,6 b =,3 IC(9%) =,6 -, colesterolo (x) trigliceridi=4,6 +,3* colesterolo

39 Intervallo di confidenza dei valori predetti PI ( ) x x i ( ) x x = yˆ ± t s + + gl, α n i

40 Relazione alla nascita tra circonferenza cranica e lunghezza Es il valore di circonferenza cranica predetto per un bambino di lunghezza 4 cm è ŷ =9, ŷ IC( )=,4-3,63

41 Intervallo di confidenza dei valori predetti PI ( ) x x i ( ) x x = yˆ ± t s + + gl, α n i a predizione ha un rrore maggiore llontanandosi dalla edia di x La predizione ha un errore minore con un ampia variabilità di x

42

43 Requisiti ed valutazione

44 Requisiti dell analisi di regressione Il modello lineare è adeguato a rappresentare la relazione tra x ed y (come variabile casuale) se vengono rispettati i seguenti assunti Omogeneità della varianza di y x (Omoscedasticità) Distribuzione normale di y x Linearità della relazione tra x ed y

45 Verifica delle assunzioni del modello La verifica delle assunzioni del modello viene condotta esaminando la distribuzione dei residui Residuo (o scarto) = valore y osservato valore y predetto valore y osservato Residuo valore y predetto

46 Omoscedasticità (omogeneità della varianza) Se la varianza è costante per tutta la distribuzione della x, anche i residui saranno distribuiti in modo uniforme

47 Distribuzione uniforme dei residui

48 Distribuzione non uniforme dei residui

49 Distribuzione non normale dei residui

50 Non-linearit linearità

51 Trasformazioni normalizzanti e linearizzanti Radice quadrata Logaritmo Inversa (meglio se ulteriormente moltiplicata per -)

52 Trasformazioni normalizzanti e linearizzanti Dati trasformati Inversa negativa Log Radice Dati originali

53 FREQUENCY CORPUSCO MI DPOI NT FREQUENCY Trasformazioni Trasformazioni normalizzanti normalizzanti e linearizzanti linearizzanti

54 Valutazione del modello R : proporzione della varianza che è spiegata dal modello di regressione R = (coefficiente di correlazione) ^

55 Relazione tra Colesterolo e TG trigliceridi (y) a=4,6 r =,6 R =, b =,3 IC(9%) =,6 -, colesterolo (x) trigliceridi=4,6 +,3* colesterolo

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione

Dettagli

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione

Dettagli

Università del Piemonte Orientale Corso di Laurea specialistica in Biotecnologie mediche. Corso di Statistica Medica. Correlazione

Università del Piemonte Orientale Corso di Laurea specialistica in Biotecnologie mediche. Corso di Statistica Medica. Correlazione Università del Piemonte Orientale Corso di Laurea specialistica in Biotecnologie mediche Corso di Statistica Medica Correlazione Regressione Lineare Statistica Medica Correlazione e Regressione lineare

Dettagli

Correlazione e regressione

Correlazione e regressione Correlazione e regressione Correlazione 1 Come posso determinare il legame tra due o più variabili? Correlazione COEFFICIENTE DI CORRELAZIONE (r di Pearson) massimo consumo di ossigeno e prestazione nelle

Dettagli

La regressione lineare semplice

La regressione lineare semplice La regressione lineare semplice Il modello di regressione lineare semplice - 1 y = β 0 + βx + ε 10 8 Una retta nel piano Variabile Y 6 4 2 0 0 1 2 3 4 Variabile X 1 Il modello di regressione lineare semplice

Dettagli

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre R - Esercitazione 6 Andrea Fasulo fasulo.andrea@yahoo.it Università Roma Tre Venerdì 22 Dicembre 2017 Il modello di regressione lineare semplice (I) Esempi tratti da: Stock, Watson Introduzione all econometria

Dettagli

Argomenti della lezione:

Argomenti della lezione: Lezione 7 Argomenti della lezione: La regressione semplice Il modello teorico Il calcolo dei parametri Regressione lineare Esamina la relazione lineare tra una o più variabili esplicative (o indipendenti,

Dettagli

Regressione lineare semplice

Regressione lineare semplice Regressione lineare semplice Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Statistica con due variabili var. nominale, var. nominale: gruppo sanguigno - cancro

Dettagli

Metodologie Quantitative

Metodologie Quantitative Metodologie Quantitative Regressione Lineare Nozioni di base M Q Marco Perugini Milano-Bicocca 1 I COMUNICAZIONE MERCOLEDI 11 NOVEMBRE NON CI SARA LEZIONE DI MQ Concetti base Con l analisi di regressione

Dettagli

Capitolo 12 La regressione lineare semplice

Capitolo 12 La regressione lineare semplice Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università

Dettagli

Statistica multivariata Donata Rodi 17/10/2016

Statistica multivariata Donata Rodi 17/10/2016 Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare

Dettagli

Psicometria con Laboratorio di SPSS 2

Psicometria con Laboratorio di SPSS 2 Psicometria con Laboratorio di SPSS 2 Regressione lineare semplice (vers. 1.2, 20 marzo 2018) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2017-18

Dettagli

Facoltà di Psicologia Università di Padova Anno Accademico Corso di Psicometria - Modulo B

Facoltà di Psicologia Università di Padova Anno Accademico Corso di Psicometria - Modulo B Facoltà di Psicologia Università di Padova Anno Accademico 2010-2011 Corso di Psicometria - Modulo B Dott. Marco Vicentini marco.vicentini@unipd.it Rev. 27/12/2010 Regressione lineare Modello geometrico

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Associazione, correlazione e dipendenza tra caratteri In un collettivo di 11 famiglie è stata

Dettagli

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Un breve richiamo sul test t-student Siano A exp (a 1, a 2.a n ) e B exp (b 1, b 2.b m ) due set di dati i cui

Dettagli

Indipendenza, Dipendenza e interdipendenza

Indipendenza, Dipendenza e interdipendenza Indipendenza, Dipendenza e interdipendenza In analisi bivariata la tabella di contingenza consente di esaminare congiuntamente due variabili consente di rilevare le relazioni esistenti tra le variabili

Dettagli

Esercitazione del

Esercitazione del Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36

Dettagli

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza XIII Presentazione del volume XV L Editore ringrazia 3 1. Introduzione alla Statistica 5 1.1 Definizione di Statistica 6 1.2 I Rami della Statistica Statistica Descrittiva, 6 Statistica Inferenziale, 6

Dettagli

Lezione 7 Corso di Statistica. Domenico Cucina

Lezione 7 Corso di Statistica. Domenico Cucina Lezione 7 Corso di Statistica Domenico Cucina Università Roma Tre D. Cucina (domenico.cucina@uniroma3.it) 1 / 12 obiettivi della lezione comprendere la retta di regressione e le sue proprietà D. Cucina

Dettagli

Matematica Lezione 22

Matematica Lezione 22 Università di Cagliari Corso di Laurea in Farmacia Matematica Lezione 22 Sonia Cannas 14/12/2018 Indici di posizione Indici di posizione Gli indici di posizione, detti anche misure di tendenza centrale,

Dettagli

Rappresentazioni grafiche di distribuzioni doppie

Rappresentazioni grafiche di distribuzioni doppie Rappresentazioni grafiche di distribuzioni doppie Distribuzione doppia di frequenze Tabella di contingenza Tabella di correlazione Stereogramma Distribuzione unitaria doppia di 2 caratteri quantitativi

Dettagli

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1 Statistica Capitolo 1 Regressione Lineare Semplice Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Spiegare il significato del coefficiente di correlazione lineare

Dettagli

Regressione Lineare Semplice e Correlazione

Regressione Lineare Semplice e Correlazione Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)

Dettagli

STATISTICA A K (60 ore)

STATISTICA A K (60 ore) STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta

Dettagli

Lezione 7 Corso di Statistica. Francesco Lagona

Lezione 7 Corso di Statistica. Francesco Lagona Lezione 7 Corso di Statistica Francesco Lagona Università Roma Tre F. Lagona (francesco.lagona@uniroma3.it) 1 / 12 Outline 1 2 Rette di regressione e correlazione distribuzioni bivariate quantitative consideriamo

Dettagli

ESERCITAZIONI N. 3 corso di statistica

ESERCITAZIONI N. 3 corso di statistica ESERCITAZIONI N. 3corso di statistica p. 1/18 ESERCITAZIONI N. 3 corso di statistica Marco Picone Università Roma Tre ESERCITAZIONI N. 3corso di statistica p. 2/18 Introduzione Media e Varianza Covarianza

Dettagli

L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale

L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile Corso di Metodologia della ricerca sociale L analisi della varianza (ANOVA) La tecnica con cui si esplorano le relazioni

Dettagli

Lezione 6 Corso di Statistica. Domenico Cucina

Lezione 6 Corso di Statistica. Domenico Cucina Lezione 6 Corso di Statistica Domenico Cucina Università Roma Tre D. Cucina (domenico.cucina@uniroma3.it) 1 / 17 obiettivi della lezione familiarizzare con le ditribuzioni bivariate delle variabili quantitative

Dettagli

Tempo disponibile: 60 minuti

Tempo disponibile: 60 minuti Corso di Specialistica in Biotecnologie Statistica medica. A.A. 005-006 6 Marzo 006 Tempo disponibile: 60 minuti 1. Conducete uno studio clinico controllato randomizzato di fase III per misurare l'effetto

Dettagli

Regressione & Correlazione

Regressione & Correlazione Regressione & Correlazione Monia Ranalli Ranalli M. Dipendenza Settimana # 4 1 / 20 Sommario Regressione Modello di regressione lineare senplice Stima dei parametri Adattamento del modello ai dati Correlazione

Dettagli

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Quesito: Posso stimare il numero di ore passate a studiare statistica sul voto conseguito all esame? Potrei calcolare il coefficiente di correlazione.

Dettagli

RELAZIONE TRA DUE VARIABILI QUANTITATIVE

RELAZIONE TRA DUE VARIABILI QUANTITATIVE RELAZIONE TRA DUE VARIABILI QUANTITATIVE Quando si considerano due o più caratteri (variabili) si possono esaminare anche il tipo e l'intensità delle relazioni che sussistono tra loro. Nel caso in cui

Dettagli

La media e la mediana sono indicatori di centralità, che indicano un centro dei dati.

La media e la mediana sono indicatori di centralità, che indicano un centro dei dati. La media e la mediana sono indicatori di centralità, che indicano un centro dei dati. Un indicatore che sintetizza in un unico numero tutti i dati, nascondendo quindi la molteplicità dei dati. Per esempio,

Dettagli

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill Statistica - metodologie per le scienze economiche e sociali /e S Borra, A Di Ciaccio - McGraw Hill Es 6 Soluzione degli esercizi del capitolo 6 In base agli arrotondamenti effettuati nei calcoli, si possono

Dettagli

LM 88 SOCIOLOGIA E RICERCA SOCIALE. Metodi Statistici per la Ricerca Sociale. Regressione lineare e correlazione

LM 88 SOCIOLOGIA E RICERCA SOCIALE. Metodi Statistici per la Ricerca Sociale. Regressione lineare e correlazione LM 88 SOCIOLOGIA E RICERCA SOCIALE Metodi Statistici per la Ricerca Sociale Regressione lineare e correlazione 1. Su un campione di individui sono rilevati i caratteri X (peso in Kg) e Y (altezza in cm),

Dettagli

Teoria e tecniche dei test. Concetti di base

Teoria e tecniche dei test. Concetti di base Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi

Dettagli

Lezione 6 Corso di Statistica. Francesco Lagona

Lezione 6 Corso di Statistica. Francesco Lagona Lezione 6 Corso di Statistica Francesco Lagona Università Roma Tre F. Lagona (francesco.lagona@uniroma3.it) 1 / 19 obiettivi della lezione familiarizzare con le ditribuzioni bivariate delle variabili quantitative

Dettagli

EsercitazioneII. In questa esercitazione faremi un ripasso generale: rappresentazioni grafiche, medie e varianze;

EsercitazioneII. In questa esercitazione faremi un ripasso generale: rappresentazioni grafiche, medie e varianze; EsercitazioneII In questa esercitazione faremi un ripasso generale: rappresentazioni grafiche, medie e varianze; la correlazione; la regressione; introduzione alla probabilità. 1 Esercizio 1 Gli stipendi

Dettagli

Analisi bivariata. Il caso di caratteri quantitativi

Analisi bivariata. Il caso di caratteri quantitativi Analisi bivariata Il caso di caratteri quantitativi Pagina 382 Rappresentazioni grafiche di distribuzioni doppie Distribuzione doppia di frequenze Tabella di contingenza Tabella di correlazione Stereogramma

Dettagli

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è

Dettagli

Corso in Statistica Medica

Corso in Statistica Medica Corso in Statistica Medica Introduzione alle tecniche statistiche di elaborazione dati Regressione e correlazione Dott. Angelo Menna Università degli Studi di Chieti G. d Annunziod Annunzio Anno Accademico

Dettagli

Lezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo

Lezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo UIVERSITA DEGLI STUDI DI BASILICATA FACOLTA DI ECOOMIA Corso di laurea in Economia Aziendale anno accademico 2012/2013 Lezioni di Statistica del 15 e 18 aprile 2013 Docente: Massimo Cristallo LA RELAZIOE

Dettagli

La media e la mediana sono indicatori di centralità, che indicano un centro dei dati.

La media e la mediana sono indicatori di centralità, che indicano un centro dei dati. La media e la mediana sono indicatori di centralità, che indicano un centro dei dati. Un indicatore che sintetizza in un unico numero tutti i dati, nascondendo quindi la molteplicità dei dati. Per esempio,

Dettagli

Correlazione tra due variabili

Correlazione tra due variabili Correlazione tra due variabili Federico Plazzi 26 Novembre 2015 Correlazione tra due variabili Correlazione tra due variabili Variabili dipendenti e variabili indipendenti La variabile indipendente è quella

Dettagli

Cognome e nome Tempo disponibile: 60 minuti

Cognome e nome Tempo disponibile: 60 minuti Corso di Laurea in Medicina e Chirurgia Statistica medica. A.A. 005-006 6 Marzo 006 Cognome e nome Tempo disponibile: 60 minuti 1. Conducete uno studio clinico controllato randomizzato di fase III per

Dettagli

Esercizio 2: voto e ore dedicate allo studio

Esercizio 2: voto e ore dedicate allo studio La seguente tabella riporta il voto riportato da 10 studenti all esame di Statistica Sociale e il numero di ore di lezione non seguite dallo studente (il corso prevede 30 ore di lezione). Ci si chiede

Dettagli

Relazione tra variabili (cont.) Due variabili continue. Una variabile continua e un altra qualitativa o discreta.

Relazione tra variabili (cont.) Due variabili continue. Una variabile continua e un altra qualitativa o discreta. Relazione tra variabili (cont.) Due variabili continue. Una variabile continua e un altra qualitativa o discreta. María Eugenia Castellanos Nueda (DEIO) Estadística Aplicada a la Publicidad Noviembre de

Dettagli

Statistica13-23/11/2015

Statistica13-23/11/2015 Statistica13-23/11/2015 Voglio studiare due fattori dipendenti uno dall altro L esempio classico sono le rese di macellazione: il peso di un organo aumenta infatti all aumentare del peso dell animale (quale

Dettagli

STATISTICA. Regressione-2

STATISTICA. Regressione-2 STATISTICA Regressione-2 Esempio Su un campione di =5unità sono state osservate due variabili, ed : x i 1 2 3 4 5 y i 1.5 2.5 3 2.5 3.5 1. Rappresentare l andamento congiunto di in funzione di mediante

Dettagli

REGRESSIONE E CORRELAZIONE

REGRESSIONE E CORRELAZIONE REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.

Dettagli

ANALISI MULTIVARIATA

ANALISI MULTIVARIATA ANALISI MULTIVARIATA Marcella Montico Servizio di epidemiologia e biostatistica... ancora sulla relazione tra due variabili: la regressione lineare semplice VD: quantitativa VI: quantitativa Misura la

Dettagli

Correlazione e regressione

Correlazione e regressione Correlazione e regressione Il termine associazione è largamente usato nella letteratura scientifica ed esprime la relazione che esiste tra due variabili Per studiare l associazione tra due variabili bisogna

Dettagli

LA REGRESSIONE LINEARE SEMPLICE

LA REGRESSIONE LINEARE SEMPLICE LA REGRESSIONE LINEARE SEMPLICE Se due variabili X e Y sono tra loro correlate, e sono entrambe su scala a intervalli o rapporti equivalenti, la tecnica statistica della regressione lineare consente di

Dettagli

Statistica descrittiva: analisi di regressione

Statistica descrittiva: analisi di regressione Statistica descrittiva: analisi di regressione L analisi di regressione permette di esplorare le relazioni tra due insiemi di valori (p.e. i valori di due attributi di un campione) alla ricerca di associazioni.

Dettagli

Nel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0.

Nel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0. Regressione [] el modello di regressione lineare si assume una relazione di tipo lineare tra il valore medio della variabile dipendente Y e quello della variabile indipendente X per cui Il modello si scrive

Dettagli

Indice. Prefazione. 4 Sintesi della distribuzione di un carattere La variabilità Introduzione La variabilità di una distribuzione 75

Indice. Prefazione. 4 Sintesi della distribuzione di un carattere La variabilità Introduzione La variabilità di una distribuzione 75 00PrPag:I-XIV_prefazione_IAS 8-05-2008 17:56 Pagina V Prefazione XI 1 La rilevazione dei fenomeni statistici 1 1.1 Introduzione 1 1.2 Caratteri, unità statistiche e collettivo 1 1.3 Classificazione dei

Dettagli

ESERCITAZIONI N. 3 corso di statistica

ESERCITAZIONI N. 3 corso di statistica ESERCITAZIONI N 3corso di statistica p 1/18 ESERCITAZIONI N 3 corso di statistica Marco Picone Università Roma Tre ESERCITAZIONI N 3corso di statistica p 2/18 Introduzione Decomposizione della devianza

Dettagli

Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza.

Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza. Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza. Misure ripetute forniscono dati numerici distribuiti attorno ad un valore centrale indicabile con un indice (indice

Dettagli

La regressione lineare. Rappresentazione analitica delle distribuzioni

La regressione lineare. Rappresentazione analitica delle distribuzioni La regressione lineare Rappresentazione analitica delle distribuzioni Richiamiamo il concetto di dipendenza tra le distribuzioni di due caratteri X e Y. Ricordiamo che abbiamo definito dipendenza perfetta

Dettagli

1.1 Obiettivi della statistica Struttura del testo 2

1.1 Obiettivi della statistica Struttura del testo 2 Prefazione XV 1 Introduzione 1.1 Obiettivi della statistica 1 1.2 Struttura del testo 2 2 Distribuzioni di frequenza 2.1 Informazione statistica e rilevazione dei dati 5 2.2 Distribuzioni di frequenza

Dettagli

1. variabili dicotomiche: 2 sole categorie A e B

1. variabili dicotomiche: 2 sole categorie A e B Variabile X su scala qualitativa (due categorie) modello di regressione: variabili quantitative misurate almeno su scala intervallo (meglio se Y è di questo tipo e preferibilmente anche le X i ) variabili

Dettagli

Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale

Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale DIPARTIMENTO DI SCIENZE AGRARIE E AMBIENTALI PRODUZIONE, TERRITORIO, AGROENERGIA Marco Acutis marco.acutis@unimi.it www.acutis.it CdS Scienze della Produzione e Protezione delle Piante (g59) CdS Biotecnologie

Dettagli

Sommario. 2 I grafici Il sistema di coordinate cartesiane Gli istogrammi I diagrammi a torta...51

Sommario. 2 I grafici Il sistema di coordinate cartesiane Gli istogrammi I diagrammi a torta...51 Sommario 1 I dati...15 1.1 Classificazione delle rilevazioni...17 1.1.1 Esperimenti ripetibili (controllabili)...17 1.1.2 Rilevazioni su fenomeni non ripetibili...18 1.1.3 Censimenti...19 1.1.4 Campioni...19

Dettagli

ESAME. 9 Gennaio 2017 COMPITO B

ESAME. 9 Gennaio 2017 COMPITO B ESAME 9 Gennaio 2017 COMPITO B Cognome Nome Numero di matricola 1) Approssimare tutti i calcoli alla quarta cifra decimale. 2) Ai fini della valutazione si terrà conto solo ed esclusivamente di quanto

Dettagli

ESAME. 9 Gennaio 2017 COMPITO A

ESAME. 9 Gennaio 2017 COMPITO A ESAME 9 Gennaio 2017 COMPITO A Cognome Nome Numero di matricola 1) Approssimare tutti i calcoli alla quarta cifra decimale. 2) Ai fini della valutazione si terrà conto solo ed esclusivamente di quanto

Dettagli

TRACCIA DI STUDIO. Test di confronto per misure qualitative. Verifica di ipotesi

TRACCIA DI STUDIO. Test di confronto per misure qualitative. Verifica di ipotesi TRACCIA DI STUDIO Verifica di ipotesi Nelle analisi statistiche di dati sperimentali riguardanti più gruppi di studio (talvolta più variabili) si pone come ipotesi da verificare la cosiddetta ipotesi zero:

Dettagli

STATISTICA. Esercitazione 5

STATISTICA. Esercitazione 5 STATISTICA Esercitazione 5 Esercizio 1 Ad un esame universitario sono stati assegnati in modo casuale due compiti diversi con i seguenti risultati: Compito A Compito B Numero studenti 102 105 Media dei

Dettagli

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura INDICE GENERALE Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura XI XIV XV XVII XVIII 1 LA RILEVAZIONE DEI FENOMENI

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri

Dettagli

Regressione e Correlazione (cap. 11) Importazione dati da file di testo

Regressione e Correlazione (cap. 11) Importazione dati da file di testo Regressione e Correlazione (cap. 11) Importazione dati da file di testo Introduzione Nella statistica applicata si osserva la relazione (dipendenza) tra due o più grandezze. Esigenza: determinare una funzione

Dettagli

Σ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica

Σ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica 13. Regressione lineare parametrica Esistono numerose occasioni nelle quali quello che interessa è ricostruire la relazione di funzione che lega due variabili, la variabile y (variabile dipendente, in

Dettagli

TRACCIA DI STUDIO. Indici di dispersione assoluta per misure quantitative

TRACCIA DI STUDIO. Indici di dispersione assoluta per misure quantitative TRACCIA DI STUDIO Un indice di tendenza centrale non è sufficiente a descrivere completamente un fenomeno. Gli indici di dispersione assolvono il compito di rappresentare la capacità di un fenomeno a manifestarsi

Dettagli

Consideriamo due variabili quantitative Y e X, e supponiamo di essere interessati a comprendere come la Y

Consideriamo due variabili quantitative Y e X, e supponiamo di essere interessati a comprendere come la Y 1 Analisi della interdipendenza lineare Quando si analizzano due o più caratteri quantitativi si può cercare di individuare una funzione che descriva in modo dettagliato la relazione che emerge dai dati,

Dettagli

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17 C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative

Dettagli

Metodi statistici per la ricerca sociale Capitolo 11. Regressione Multipla e Correlazione

Metodi statistici per la ricerca sociale Capitolo 11. Regressione Multipla e Correlazione Metodi statistici per la ricerca sociale Capitolo 11. Regressione Multipla e Correlazione Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università degli Studi di Firenze

Dettagli

Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria

Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata Prof. Massimo Aria aria@unina.it Il concetto di interpolazione In matematica, e in particolare in

Dettagli

Cognome e nome Tempo disponibile: 75 minuti

Cognome e nome Tempo disponibile: 75 minuti Corso di Laurea in Biotecnologia Statistica medica. A.A. 2010-2011 21 giugno 2011 Cognome e nome Tempo disponibile: 75 minuti 1. Immaginate di condurre uno studio sperimentale in cui si confronta l effetto

Dettagli

Statistica 1 A.A. 2015/2016

Statistica 1 A.A. 2015/2016 Corso di Laurea in Economia e Finanza Statistica 1 A.A. 2015/2016 (8 CFU, corrispondenti a 48 ore di lezione frontale e 24 ore di esercitazione) Prof. Luigi Augugliaro 1 / 35 Il modello di regressione

Dettagli

Presentazione dell edizione italiana

Presentazione dell edizione italiana Presentazione dell edizione italiana Prefazione xiii xvii 1 Introduzione 1 1.1 Statistica e medicina.......................... 1 1.2 Statistica e matematica........................ 2 1.3 Statistica ed

Dettagli

Analisi descrittiva: calcolando medie campionarie, varianze campionarie e deviazioni standard campionarie otteniamo i dati:

Analisi descrittiva: calcolando medie campionarie, varianze campionarie e deviazioni standard campionarie otteniamo i dati: Obiettivi: Esplicitare la correlazione esistente tra l altezza di un individuo adulto e la lunghezza del suo piede e del suo avambraccio. Idea del progetto: Il progetto nasce dall idea di acquistare scarpe

Dettagli

Esercitazioni di Statistica Dott.ssa Cristina Mollica

Esercitazioni di Statistica Dott.ssa Cristina Mollica Esercitazioni di Statistica Dott.ssa Cristina Mollica cristina.mollica@uniroma.it Regressione Esercizio. Siano dati i seguenti valori per le due variabili X ed Y: 4 5 3 5 3 3 Con riferimento al modello

Dettagli

Statistica di base per l analisi socio-economica

Statistica di base per l analisi socio-economica Laurea Magistrale in Management e comunicazione d impresa Statistica di base per l analisi socio-economica Giovanni Di Bartolomeo gdibartolomeo@unite.it Definizioni di base Una popolazione è l insieme

Dettagli

Esame di Statistica A-Di Prof. M. Romanazzi

Esame di Statistica A-Di Prof. M. Romanazzi 1 Università di Venezia Esame di Statistica A-Di Prof. M. Romanazzi 12 Giugno 2015 Cognome e Nome..................................... N. Matricola.......... Valutazione Il punteggio massimo teorico di

Dettagli

CORSO DI LAUREA IN INFERMIERISTICA. LEZIONI DI STATISTICA Parte II Elaborazione dei dati Variabilità

CORSO DI LAUREA IN INFERMIERISTICA. LEZIONI DI STATISTICA Parte II Elaborazione dei dati Variabilità CORSO DI LAUREA IN INFERMIERISTICA LEZIONI DI STATISTICA Parte II Elaborazione dei dati Variabilità Lezioni di Statistica VARIABILITA Si definisce variabilità la proprietà di alcuni fenomeni di assumere

Dettagli

Esercizi su Regressione e Connessione

Esercizi su Regressione e Connessione Esercizi su Regressione e Connessione Stefano Cabras 31 marzo 2009 Sommario Questa serie di esercizi è principalmente incentrata sulla regressione e la connessione, tuttavia in alcuni esercizi le soluzioni

Dettagli

Analisi della Regressione Lineare

Analisi della Regressione Lineare Analisi della Regressione Lineare Master in Tecnologie Bioinformatiche 29/09/06 Adriano Decarli 1 29/09/06 Adriano Decarli 2 29/09/06 Adriano Decarli 3 29/09/06 Adriano Decarli 4 29/09/06 Adriano Decarli

Dettagli

STATISTICA MULTIVARIATA SSD MAT/06

STATISTICA MULTIVARIATA SSD MAT/06 Università degli studi di Ferrara Dipartimento di Matematica A.A. 2018/2019 I semestre STATISTICA MULTIVARIATA SSD MAT/06 LEZIONE 4 - Questioni di analisi e applicazione della regressione lineare Pratica

Dettagli

x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y )

x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y ) Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 0/03 lezioni di statistica del 5 e 8 aprile 03 - di Massimo Cristallo - A. Le relazioni tra i fenomeni

Dettagli

Dispensa di Statistica

Dispensa di Statistica Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza

Dettagli

Corso di STATISTICA EGA - Classe 1 aa Docenti: Luca Frigau, Claudio Conversano

Corso di STATISTICA EGA - Classe 1 aa Docenti: Luca Frigau, Claudio Conversano Corso di STATISTICA EGA - Classe 1 aa 2017-2018 Docenti: Luca Frigau, Claudio Conversano Il corso è organizzato in 36 incontri, per un totale di 72 ore di lezione. Sono previste 18 ore di esercitazione

Dettagli

Statistica descrittiva in due variabili

Statistica descrittiva in due variabili Statistica descrittiva in due variabili Dott Nicola Pintus AA 2018-2019 Indichiamo con U la popolazione statistica e con u i le unità statistiche Ad ogni unità statistica associamo i caratteri osservati

Dettagli

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25 Sommario Presentazione dell edizione italiana Prefazione xv xiii Capitolo 1 I dati e la statistica 1 Statistica in pratica: BusinessWeek 1 1.1 Le applicazioni in ambito aziendale ed economico 3 Contabilità

Dettagli

1. In uno studio viene misurata la pressione arteriosa sistolica a 36 soggetti, con i seguenti risultati. Media = 172,8 Deviazione standard= 24,25

1. In uno studio viene misurata la pressione arteriosa sistolica a 36 soggetti, con i seguenti risultati. Media = 172,8 Deviazione standard= 24,25 1. In uno studio viene misurata la pressione arteriosa sistolica a 36 soggetti, con i seguenti risultati. Media = 172,8 Deviazione standard= 24,25 Commento generale: in questo esercizio l unica stima della

Dettagli

tabelle grafici misure di

tabelle grafici misure di Statistica Descrittiva descrivere e riassumere un insieme di dati in maniera ordinata tabelle grafici misure di posizione dispersione associazione Misure di posizione Forniscono indicazioni sull ordine

Dettagli

7. STATISTICA DESCRITTIVA

7. STATISTICA DESCRITTIVA 7. STATISTICA DESCRITTIVA Quando si effettua un indagine statistica si ha a che fare con un numeroso insieme di oggetti, detto popolazione del quale si intende esaminare una o più caratteristiche (matricole

Dettagli

REGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori

REGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori REGRESSIONE lineare e CORRELAZIONE Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori Y X La NATURA e la FORZA della relazione tra variabili si studiano con la REGRESSIONE

Dettagli

Indice. L Editore ringrazia. Ringraziamenti. Autori. Prefazione. Obiettivi formativi XIII XVII

Indice. L Editore ringrazia. Ringraziamenti. Autori. Prefazione. Obiettivi formativi XIII XVII Indice XI XI XIII XV XVII L Editore ringrazia Ringraziamenti Autori Prefazione Obiettivi formativi XIX Istruzioni per gli studenti XIX Un po di storia XX Cosa è la Statistica XXI Come usare questo libro

Dettagli