TRACCIA DI STUDIO. Test di confronto per misure qualitative. Verifica di ipotesi
|
|
- Linda Fumagalli
- 6 anni fa
- Visualizzazioni
Transcript
1 TRACCIA DI STUDIO Verifica di ipotesi Nelle analisi statistiche di dati sperimentali riguardanti più gruppi di studio (talvolta più variabili) si pone come ipotesi da verificare la cosiddetta ipotesi zero: quanto riscontrato sperimentalmente quale probabilità ha di verificarsi casualmente, cioè con campioni provenienti da una stessa popolazione? Se la probabilità di un risultato giustificato dalla casualità è modesta, viene rifiutata l ipotesi zero e si pone l ipotesi alternativa: i gruppi non sono omogenei, esistono giustificazioni per una differenza non casuale (i diversi trattamenti sperimentali o la provenienza da popolazioni diverse). La probabilità tollerabile di errore nel rifiutare l ipotesi zero viene detta livello di significatività α e convenzionalmente i livelli di uso comune sono il 5% e l 1%. Rifiutare erroneamente l ipotesi zero comporta un errore di Tipo I; per contro, non rifiutarla quando è falsa porta a commettere un errore di Tipo II con probabilità β. Queste analisi inferenziali si basano sui parametri di distribuzioni teoriche di misure quantitative; in altre situazioni, sono previste tecniche non parametriche. Test di confronto per misure quantitative Differenza tra medie di campioni indipendenti Per il confronto tra due medie, si utilizza il test parametrico denominato t di Student, basato sulle stime campionarie delle medie e delle loro deviazioni standard. Differenza tra medie di campioni dipendenti Quando ogni osservazione di un campione è accoppiata con una sola osservazione di un altro campione (appaiamento dei dati), il test che si utilizza è il t di Student per dati appaiati. La situazione più frequente riguarda misurazioni effettuate sugli stessi soggetti prima e dopo un trattamento. Il test è organizzato in modo da eliminare la variabilità individuale. Test di confronto per misure qualitative Test del chi quadrato per campioni indipendenti Quando si vuole stabilire se due percentuali differiscono oltre la variabilità legata al caso, il test di riferimento per campioni indipendenti è il chi quadrato, basato sulle frequenze assolute del riscontro sperimentale e le frequenze teoriche attese nell ipotesi di una loro distribuzione casuale. Analisi della dipendenza La relazione fra due variabili in un campione può essere analizzata con due tecniche di significato diverso, ma complementari: la correlazione e la regressione. Correlazione lineare La correlazione lineare stabilisce il tipo e il grado di associazione tra due variabili. È negativa se all aumentare di una l altra diminuisce, positiva se si muovono congiuntamente. Il grado di associazione è espresso dal coefficiente di correlazione r, il cui valore è compreso, in termini assoluti, tra zero (nessuna correlazione) e uno (perfetta correlazione). Il coefficiente di determinazione (r 2 ) fornisce l indicazione della percentuale di variabilità di una variabile spiegata dall altra, cioè la forza associativa tra le due. Il riscontro di una associazione statistica non deve però essere identificato come un rapporto di causa ed effetto. Regressione lineare Nel caso di associazione statistica tra due variabili, la regressione lineare ha un significato predittivo in quanto stima i valori di una di esse (definita dipendente) in funzione dell altra (indipendente o predittiva). La retta di regressione rappresenta la migliore stima in base alla relazione tra due variabili, ma possiamo calcolare due rette di regressione a seconda della variabile considerata indipendente. Queste due rette tendono a coincidere quanto più elevato è il grado di associazione tra le variabili, fino a identificarsi quando la correlazione è perfetta.
2 ESERCIZI 1. Nella procedura di verifica di un ipotesi statistica viene assunta come vera l ipotesi zero o ipotesi nulla H 0. Vero o falso? 2. Da che cosa dipende il numero dei gradi di libertà nel contesto del test t di Student? 3. Che tipo di errore si commette se non si rifiuta l ipotesi zero, quando è falsa? 4. Il rapporto relativo alla sperimentazione di un nuovo farmaco evidenzia un efficacia superiore rispetto a quella di un farmaco tradizionale e termina definendo il risultato significativo con p < Il valore 0.05 a che cosa si riferisce? 5. Che cosa identifica la potenza di un test statistico? 6. In uno studio sul tempo di svuotamento gastrico condotto su due campioni di pazienti, uno di controllo e l altro costituito da soggetti edentuli, si sono rilevati i seguenti tempi (in minuti): Controllo Edentuli Verificare, con opportuno procedimento statistico, se i soggetti edentuli presentano un rallentato svuotamento gastrico rispetto ai controlli. 7. Per verificare l efficacia di un nuovo metodo di apprendimento, 15 pazienti con disturbi neurologici e tic in età evolutiva vengono sottoposti a un test valutativo, i cui punteggi si possono considerare quantitativi e seguono una distribuzione normale, prima e dopo un mese di applicazione del nuovo metodo. Il quadro dei punteggi di ciascuno è riportato nella seguente tabella: Prima Dopo Possiamo affermare che il nuovo metodo favorisce l apprendimento dei pazienti? 8. Stabilire se si possano considerare diversi i risultati ottenuti nel reparto (A) rispetto a quelli del reparto (B): Guariti Migliorati Stabili Peggiorati Totale Reparto (A) Reparto (B) Per verificare la preferenza nell uso di prodotti analgesici di largo consumo, si intervistano 120 pazienti chiedendo loro quale sia stato l ultimo prodotto acquistato: 12 rispondono il farmaco A, 30 il B, 18 il C, 8 il D, 48 l E, 4 l F. Verificare se la scelta rientra nella casualità.
3 . Date le seguenti misure: Codice Colesterolo Acido urico paziente (mg/dl) (mg/dl) a) Disegnare un grafico a punti del colesterolo in funzione dell acido urico. b) Che cosa suggerisce il grafico? c) Esiste una correlazione statistica tra le due variabili? d) Utilizzando il colesterolo come variabile dipendente, calcolare l equazione della retta di regressione e interpretarne i parametri. e) Calcolare e commentare il coefficiente di determinazione. 11. Su un campione di feti con differenti età gestazionali sono state valutate ecograficamente le misure della circonferenza cranica: Caso Età gestazionale Circonferenza (settimane) cranica (cm) A B C D E F G H I L a) A quale età gestazionale si prevede il raggiungimento di una circonferenza cranica di 25 cm? b) A quale età gestazionale possiamo ragionevolmente prevedere che la circonferenza cranica sia di 35 cm?
4 RISPOSTE 1. È corretto. In statistica viene valutata la probabilità che il risultato osservato (per esempio, la differenza tra le medie di due gruppi) si verifichi solo in virtù del caso (tenendo conto delle variabilità riscontrate), partendo dal presupposto che i gruppi di confronto provengano da una stessa popolazione. Se la probabilità è superiore al livello di significatività prescelto, il risultato si considera compatibile con la casualità della scelta campionaria; se è invece è inferiore, si rifiuta l ipotesi nulla e si pone l ipotesi alternativa che i campioni provengano da popolazioni diverse (per esempio, che le differenze riscontrate siano giustificate da situazioni o trattamenti diversi). 2. Bisogna considerare se il confronto è tra misure ripetute (dipendenti) oppure se i campioni sono indipendenti. Nel primo caso, i gradi di libertà sono dati dal numero di soggetti meno uno; per il secondo caso, avremo il numero totale di soggetti meno due, cioè n 1 per ciascun gruppo. 3. La conclusione falsa negativa è legata all incapacità di un test statistico di rilevare una differenza reale. Viene definita come errore di Tipo II, al quale è associata la probabilità β. 4. Segnala che la valutazione statistica dei risultati sperimentali ha permesso di rifiutare l ipotesi nulla al livello di significatività α 0.05, vale a dire che la probabilità di commettere un errore di Tipo I nell affermare che il farmaco nuovo è più efficace di quello tradizionale è inferiore al 5%. 5. La potenza di un test statistico è la capacità di rifiutare correttamente l ipotesi nulla, quando esiste una reale differenza tra i valori campionari. In genere, dipende dalla numerosità campionaria ed è complementare all errore di Tipo II, per cui corrisponde a una probabilità 1 β. 6. Dobbiamo effettuare un confronto tra i valori di una variabile quantitativa rilevata su due campioni indipendenti (le misure effettuate su di un campione non sono influenzate dall altro). Nell ipotesi che le distribuzioni siano di tipo normale con varianze omoscedastiche (non significativamente diverse), il test di riferimento è il t di Student per dati indipendenti. Occorre calcolare, per ciascun gruppo, media e devianza e poi applicare la formula per calcolo della statistica t. media Controllo (14) x Edentuli (12) x Devianza Edentuli x 2 ( x) 2 N Devianza Controlli x Ed x C ne t ne d n d n C C Devianza Ed Devianza C n n Ed C Con questo risultato, inferiore al livello critico t (per 24 gradi di libertà e al livello di significatività α 0.05), non è possibile respingere l ipotesi zero che i due campioni provengano da una stessa popolazione, pertanto la differenza riscontrata tra le velocità di svuotamento gastrico dei due campioni è giustificata dalla casualità del campionamento.
5 7. Dobbiamo utilizzare la statistica t di Student per dati dipendenti. Si devono preventivamente calcolare le differenze riscontrate in ciascun paziente, la media delle differenze e la deviazione standard della media. Prima Dopo Differenza d d 15 Differenza d d 2 67 d d 2n ( d) 00 s d n d 1 t n s d 1.93 Il valore critico del t di Student al livello α 0.05 con gradi di libertà è Il nostro valore è inferiore, anche se di poco. Non possiamo respingere l ipotesi zero: affermare che il nuovo metodo aumenta la capacità di apprendimento comporta una probabilità di errore di Tipo I superiore al 5%. Rimane tuttavia il dubbio che, a causa della numerosità modesta del campione, la potenza del test non fosse adeguata a evidenziare una differenza. Prima di abbandonare il nuovo metodo, potrebbe essere ripetuta l esperienza con un campione più numeroso. 8. La variabile in esame è qualitativa, o meglio semiquantitativa, con quattro modalità, per cui non è proponibile un confronto con il test t di Student. Occorre verificare l ipotesi zero di nessuna differenza tra i reparti impiegando il test del chi quadrato. Dopo aver completato la tabella con i totali generali, si calcolano le frequenze attese considerando che, nel caso dell ipotesi nulla, dovremmo riscontrare nei due reparti le stesse proporzioni di casi del risultato complessivo. Con la formula che utilizza i totali marginali, le frequenze attese risultano: guariti del reparto A: FA ,, peggiorati del reparto B: FA La tabella sottostante mostra il quadro generale (in corsivo le frequenze attese): Reparto (A) Reparto (B) Guariti Migliorati Stabili Peggiorati Totale Totale ( ) 2 ( ) 2 (7 6.52) 2 (9 9.13) 2 χ ( ) 2 ( ) 2 (8 8.48) 2 ( )
6 Con (4 1) (2 1) 3 gradi di libertà il valore critico al 5% è χ , superiore a quello ricavato. Non vi è motivo di rifiutare l ipotesi nulla e i risultati dei due reparti si possono considerare corrispondenti. Sono presenti alcune caselle con frequenza bassa, ma tutte le frequenze attese sono superiori a 5. L uso del test è quindi ammesso. 9. Inseriamo in una tabella i dati osservati: Farmaco A B C D E F Totale Preferenze L ipotesi nulla è che non vi sia stata una preferenza per un particolare prodotto. In questo caso, la probabilità di scelta casuale risulta uguale per tutti i farmaci H 0 : P(A) P(B) P(C) P(D) P(E) P(F) 1/6 e le frequenze attese per ciascun farmaco sono 1/ confezioni. Questo è un caso particolare di impiego del test del chi quadrato, riferito a un singolo campione con le frequenze attese calcolate in base a una distribuzione teorica di riferimento. Si può organizzare una tabella delle frequenze e procedere al calcolo del chi quadrato: A B C D E F Totale Frequenze osservate Frequenze attese χ 2 (12 20) 2 20 (30 20) (18 20) (8 20) 2 20 (48 20) 2 20 (4 20) Il valore ottenuto supera il valore critico anche all 1% (con 5 gradi di libertà χ ). È lecito respingere l ipotesi che la scelta sia stata casuale: i pazienti hanno maturato diverse preferenze verso quei farmaci.. a) Da come è posto il quesito, si comprende che deve essere considerata indipendente la variabile acido urico, da inserire quindi sull asse delle ascisse. 280 Colesterolo (mg/dl) Colesterolo = * acido urico Acido urico (mg/dl) b) Il grafico evidenzia una relazione positiva tra le variabili (all aumentare dell acido urico cresce anche il colesterolo), con i dati che tendono a distribuirsi in maniera lineare. Il legame (correlazione) tra le due variabili può essere studiato statisticamente per analizzarne il segno (che dovrà risultare positivo) e il grado. c) Per stimare il coefficiente di correlazione, occorre calcolare, oltre alle abituali sommatorie delle variabili e dei loro quadrati, la sommatoria dei prodotti (xy ).
7 Colesterolo y (mg/dl) Acido urico x (mg/dl) Media x o y x 2 o y xy Sostituendo i dati nella formula xy x y r n x 2 ( n ( n (x) x) 2 2 (y) y) y Per verificare l esistenza di una correlazione che vada oltre la casualità, ovvero rifiutare l ipotesi zero, si ricorre alla distribuzione del t di Student. Considerando che la distribuzione campionaria di r è legata a quella del t con 2 gradi di libertà mediante la relazione: t r ( n 2) 1 2 r Il valore è superiore quello critico al livello α 0.01 con 2 8 gradi di libertà (t 3.355). La correlazione riscontrata è pertanto diversa da zero con una probabilità di errore p < Stessa conclusione si sarebbe raggiunta consultando direttamente la tabella dei valori critici della distribuzione r, sempre con 8 g.l. d) Tra le infinite rette che è possibile tracciare, la retta di regressione è quella che rende minimi gli scarti tra i valori predittivi calcolati con la retta e i valori osservati: è il metodo dei minimi quadrati. I parametri della retta sono: xy x y n b x 2 ( x) n a y bx e l equazione risulta: y x. L intercetta a è il valore previsto della variabile dipendente, in questo frangente il colesterolo, corrispondente allo zero della variabile indipendente, l acido urico. Si tratta di valori puramente matematici, che non hanno alcun senso in quanto al di fuori dell intervallo di ogni logica fisiopatologica. Il coefficiente b (pendenza della retta) indica che per ogni mg/dl di acido urico il colesterolo aumenta in media di mg/dl.
8 e) Il coefficiente di determinazione è il quadrato del coefficiente di correlazione: r Poiché r può assumere qualsiasi valore nell intervallo 1 e 1, r 2 deve essere ovviamente compreso tra 0 e 1. Il coefficiente di determinazione indica che il 97.6% della variazione tra i valori osservati del colesterolo è spiegato dalla sua relazione lineare con l acido urico, mentre il restante % 2.4% è imputabile a fattori non spiegabili con i dati osservati. 11. Come nell esercizio precedente, si preparano le informazioni per stimare i parametri della retta di regressione: Età gestazionale y (settimane) Circonferenza cranica x (cm) Media x o y x 2 o y xy b a L equazione della retta è: y x. a) Inseriamo il valore di 25 cm come variabile indipendente e otteniamo il numero di settimane necessarie: y settimane. b) Per 35 cm saranno necessarie: y settimane. Bisogna però considerare che la retta di regressione è stata calcolata su dati in cui la circonferenza varia tra 20 e 27 settimane, per cui rimane il dubbio sulla relazione al di fuori di questo intervallo: potrebbe non esserci associazione o non essere lineare, oppure non essere adatta la precedente retta di regressione.
Esercizi di statistica
Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..
DettagliTRACCIA DI STUDIO. Indici di dispersione assoluta per misure quantitative
TRACCIA DI STUDIO Un indice di tendenza centrale non è sufficiente a descrivere completamente un fenomeno. Gli indici di dispersione assolvono il compito di rappresentare la capacità di un fenomeno a manifestarsi
DettagliSTATISTICA INFERENZIALE PER VARIABILI QUALITATIVE
STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE La presentazione dei dati per molte ricerche mediche fa comunemente riferimento a frequenze, assolute o percentuali. Osservazioni cliniche conducono sovente
DettagliRegressione Lineare Semplice e Correlazione
Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)
DettagliCasa dello Studente. Casa dello Studente
Esercitazione - 14 aprile 2016 ESERCIZIO 1 Di seguito si riporta il giudizio (punteggio da 0 a 5) espresso da un gruppo di studenti rispetto alle diverse residenze studentesche di un Ateneo: a) Si calcolino
DettagliPROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA
PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURA/TECNICA DI ANALISI DEI DATI SPECIFICAMENTE DESTINATA A STUDIARE LA RELAZIONE TRA UNA VARIABILE NOMINALE (ASSUNTA
DettagliStatistica multivariata Donata Rodi 17/10/2016
Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare
DettagliDispensa di Statistica
Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza
DettagliLezione 16. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 16. A. Iodice. Ipotesi statistiche
Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 23 Outline 1 2 3 4 5 6 () Statistica 2 / 23 La verifica delle ipotesi Definizione Un ipotesi statistica
DettagliGli errori nella verifica delle ipotesi
Gli errori nella verifica delle ipotesi Nella statistica inferenziale si cerca di dire qualcosa di valido in generale, per la popolazione o le popolazioni, attraverso l analisi di uno o più campioni E
DettagliUniversità del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare
Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione
DettagliCHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)
CHEMIOMETRIA Applicazione di metodi matematici e statistici per estrarre (massima) informazione chimica (affidabile) da dati chimici INCERTEZZA DI MISURA (intervallo di confidenza/fiducia) CONFRONTO CON
DettagliSTATISTICA INFERENZIALE PER VARIABILI QUALITATIVE
1 STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE La presentazione dei dati per molte ricerche mediche fa comunemente riferimento a frequenze, assolute o percentuali. Osservazioni cliniche conducono
DettagliCorso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII
Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Un breve richiamo sul test t-student Siano A exp (a 1, a 2.a n ) e B exp (b 1, b 2.b m ) due set di dati i cui
DettagliTest delle Ipotesi Parte I
Test delle Ipotesi Parte I Test delle Ipotesi sulla media Introduzione Definizioni basilari Teoria per il caso di varianza nota Rischi nel test delle ipotesi Teoria per il caso di varianza non nota Test
DettagliR - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre
R - Esercitazione 6 Andrea Fasulo fasulo.andrea@yahoo.it Università Roma Tre Venerdì 22 Dicembre 2017 Il modello di regressione lineare semplice (I) Esempi tratti da: Stock, Watson Introduzione all econometria
DettagliAnalisi della varianza
Università degli Studi di Padova Facoltà di Medicina e Chirurgia Facoltà di Medicina e Chirurgia - A.A. 2009-10 Scuole di specializzazione Lezioni comuni Disciplina: Statistica Docente: dott.ssa Egle PERISSINOTTO
DettagliSTATISTICA ESERCITAZIONE 13
STATISTICA ESERCITAZIONE 13 Dott. Giuseppe Pandolfo 9 Marzo 2015 Errore di I tipo: si commette se l'ipotesi nulla H 0 viene rifiutata quando essa è vera Errore di II tipo: si commette se l'ipotesi nulla
DettagliCognome e Nome:... Matricola e corso di laurea:...
Statistica - corso base Prof. B. Liseo Prova di esame dell 8 gennaio 2014 Cognome e Nome:................................................................... Matricola e corso di laurea:...................................................
DettagliSTATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo
STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)
DettagliCorso di Psicometria Progredito
Corso di Psicometria Progredito 5. La correlazione lineare Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014 Sommario 1 Tipi di relazione
DettagliStatistica Inferenziale
Statistica Inferenziale a) L Intervallo di Confidenza b) La distribuzione t di Student c) La differenza delle medie d) L intervallo di confidenza della differenza Prof Paolo Chiodini Dalla Popolazione
DettagliEsercitazione 8 del corso di Statistica 2
Esercitazione 8 del corso di Statistica Prof. Domenico Vistocco Dott.ssa Paola Costantini 6 Giugno 8 Decisione vera falsa è respinta Errore di I tipo Decisione corretta non è respinta Probabilità α Decisione
DettagliContenuti: Capitolo 14 del libro di testo
Test d Ipotesi / TIPICI PROBLEMI DI VERIFICA DI IPOTESI SONO Test per la media Test per una proporzione Test per la varianza Test per due campioni indipendenti Test di indipendenza Contenuti Capitolo 4
DettagliStatistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione.
Statistica inferenziale La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione. Verifica delle ipotesi sulla medie Quando si conduce una
DettagliBLAND-ALTMAN PLOT. + X 2i 2 la differenza ( d ) tra le due misure per ognuno degli n campioni; d i. X i. = X 1i. X 2i
BLAND-ALTMAN PLOT Il metodo di J. M. Bland e D. G. Altman è finalizzato alla verifica se due tecniche di misura sono comparabili. Resta da comprendere cosa si intenda con il termine metodi comparabili
DettagliCorso di Psicometria Progredito
Corso di Psicometria Progredito 4.1 I principali test statistici per la verifica di ipotesi: Il test t Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico
DettagliEsercitazione di Statistica Indici di associazione
Esercitazione di Statistica Indici di associazione 28/10/2015 La relazione tra caratteri Indipendenza logica Quando si suppone che tra due caratteri non ci sia alcuna relazione di causa-effetto. Indipendenza
DettagliEsame di Statistica del 19 settembre 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova).
Esame di Statistica del 19 settembre 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola Es. 1 Es. 2 Es. 3 Es. 4 Somma Voto finale Attenzione: si
DettagliEsercitazione del
Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36
DettagliStatistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill
Statistica - metodologie per le scienze economiche e sociali /e S. Borra, A. Di Ciaccio - McGraw Hill Es.. Soluzione degli esercizi del capitolo 4 4. Il sistema d ipotesi è: μ 7, H : μ 7, Essendo 0 : t,
DettagliREGRESSIONE E CORRELAZIONE
REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.
DettagliUniversità del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica
Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Regressione Lineare e Correlazione Argomenti della lezione Determinismo e variabilità Correlazione Regressione Lineare
DettagliSCOPO DELL ANALISI DI CORRELAZIONE
CORRELAZIONE 1 SCOPO DELL ANALISI DI CORRELAZIONE STUDIARE LA RELAZIONE TRA DUE VARIABILI X E Y 2 diagrammi di dispersione un diagramma di dispersione (o grafico di dispersione) èuna rappresentazione grafica
DettagliFondamenti di Psicometria. La statistica è facile!!! VERIFICA DELLE IPOTESI
Fondamenti di Psicometria La statistica è facile!!! VERIFICA DELLE IPOTESI INFERENZA STATISTICA Teoria della verifica dell ipotesi : si verifica, in termini probabilistici, se una certa affermazione relativa
DettagliTest d Ipotesi Introduzione
Test d Ipotesi Introduzione Uno degli scopi più importanti di un analisi statistica è quello di utilizzare i dati provenienti da un campione per fare inferenza sulla popolazione da cui è stato estratto
Dettaglii dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente
TEST DI AUTOVALUTAZIONE - SETTIMANA 6 I diritti d autore sono riservati. Ogni sfruttamento commerciale non autorizzato sarà perseguito. Metodi statistici per la biologia Parte A. La retta di regressione.2
DettagliIL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI
IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI Perchè confrontare le varianze stimate in due campioni? Torniamo all'esempio dei frinosomi Per poter applicare il test t avevamo detto che le varianze, e
DettagliLEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell
LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Strumenti statistici in Excell Pacchetto Analisi di dati Strumenti di analisi: Analisi varianza: ad un fattore Analisi
DettagliRegressione lineare semplice
Regressione lineare semplice Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Statistica con due variabili var. nominale, var. nominale: gruppo sanguigno - cancro
DettagliTest per la correlazione lineare
10 Test per la correlazione lineare Istituzioni di Matematica e Statistica 2015/16 E. Priola 1 Introduzione alla correlazione lineare Problema: In base ai dati che abbiamo possiamo dire che c è una qualche
DettagliSTATISTICA INFERENZIALE PER VARIABILI QUALITATIVE
1 STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE La presentazione dei dati per molte ricerche mediche fa comunemente riferimento a frequenze, assolute o percentuali. Osservazioni cliniche conducono
DettagliLezione VII: t-test. Prof. Enzo Ballone
Lezione VII: t-test Cattedra di Biostatistica Dipartimento di Scienze Biomediche, Università degli Studi G. d Annunzio di Chieti Pescara Prof. Enzo Ballone Un terzo problema: si considerino 2 campioni
DettagliConfronto tra due popolazioni Lezione 6
Last updated May 9, 06 Confronto tra due popolazioni Lezione 6 G. Bacaro Statistica CdL in Scienze e Tecnologie per l'ambiente e la Natura I anno, II semestre Concetti visti nell ultima lezione Le media
DettagliSTATISTICA A K (60 ore)
STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta
DettagliCognome e Nome:... Corso di laurea:...
Statistica - corso base Prof. B. Liseo Prova di esame dell 8 gennaio 201 Cognome e Nome:................................................................... Corso di laurea:.......................................................................
DettagliUlteriori applicazioni del test del Chi-quadrato (χ 2 )
Ulteriori applicazioni del test del Chi-quadrato (χ 2 ) Finora abbiamo confrontato con il χ 2 le numerosità osservate in diverse categorie in un campione con le numerosità previste da un certo modello
Dettaglix, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y )
Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 0/03 lezioni di statistica del 5 e 8 aprile 03 - di Massimo Cristallo - A. Le relazioni tra i fenomeni
DettagliLa regressione lineare. Rappresentazione analitica delle distribuzioni
La regressione lineare Rappresentazione analitica delle distribuzioni Richiamiamo il concetto di dipendenza tra le distribuzioni di due caratteri X e Y. Ricordiamo che abbiamo definito dipendenza perfetta
DettagliIntervallo di fiducia del coefficiente angolare e dell intercetta L intervallo di fiducia del coefficiente angolare (b 1 ) è dato da:
Analisi chimica strumentale Intervallo di fiducia del coefficiente angolare e dell intercetta L intervallo di fiducia del coefficiente angolare (b 1 ) è dato da: (31.4) dove s y è la varianza dei valori
DettagliStatistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi
Esercitazione 14 Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () 1 / 14 Ex.1: Verifica Ipotesi sulla media (varianza nota) Le funi prodotte da un certo macchinario hanno una
DettagliPSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI
PSICOMETRIA Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI CAMPIONI INDIPENDENTI Campioni estratti casualmente dalla popolazione con caratteristiche omogenee Assegnazione
DettagliCapitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson Apogeo
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 10 Test basati su due campioni e ANOVA a una via Insegnamento: Statistica Applicata Corsi di Laurea in "Scienze e tecnologie Alimentari"
DettagliCapitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson. Casa editrice: Pearson
Levine, Krehbiel, Berenson Statistica II ed. Casa editrice: Pearson Capitolo 10 Test basati su due campioni e ANOVA a una via Insegnamento: Statistica Corsi di Laurea Triennale in Economia Dipartimento
DettagliMetodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale
DIPARTIMENTO DI SCIENZE AGRARIE E AMBIENTALI PRODUZIONE, TERRITORIO, AGROENERGIA Marco Acutis marco.acutis@unimi.it www.acutis.it CdS Scienze della Produzione e Protezione delle Piante (g59) CdS Biotecnologie
DettagliIl modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)
Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Quesito: Posso stimare il numero di ore passate a studiare statistica sul voto conseguito all esame? Potrei calcolare il coefficiente di correlazione.
DettagliTest d ipotesi. Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona. Ipotesi alternativa (H 1 )
Test d ipotesi Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Nel 900 falsificazione di ipotesi (Karl Popper) TEST D IPOTESI Nell 800 dimostrazione di ipotesi
DettagliConcetti principale della lezione precedente
Corso di Statistica medica e applicata 9 a Lezione Dott.ssa Donatella Cocca Concetti principale della lezione precedente I concetti principali che sono stati presentati sono: Variabili su scala nominale
DettagliN.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.
N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle abelle riportate alla fine del documento. Esercizio 1 La concentrazione media di sostanze inquinanti osservata nelle acque di un fiume
DettagliMetodi statistici per la ricerca sociale Capitolo 7. Confronto tra Due Gruppi Esercitazione
Metodi statistici per la ricerca sociale Capitolo 7. Confronto tra Due Gruppi Esercitazione Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università degli Studi di Firenze
DettagliIl Test di Ipotesi Lezione 5
Last updated May 23, 2016 Il Test di Ipotesi Lezione 5 G. Bacaro Statistica CdL in Scienze e Tecnologie per l'ambiente e la Natura I anno, II semestre Il test di ipotesi Cuore della statistica inferenziale!
DettagliGestione ed Analisi Statistica dei dati
Master in Evidence Based Practice e Metodologia della Ricerca clinico-assistenziale assistenziale Gestione ed Analisi Statistica dei dati Daniela Fortuna 12 giugno 2014 TEST di ipotesi Finora abbiamo visto
DettagliSTATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE
STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 2 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1.1
Dettagli05. Errore campionario e numerosità campionaria
Statistica per le ricerche di mercato A.A. 01/13 05. Errore campionario e numerosità campionaria Gli schemi di campionamento condividono lo stesso principio di fondo: rappresentare il più fedelmente possibile,
DettagliCaratterizzazione dei consumi energetici (parte 3)
ESERCITAZIONE 4 Caratterizzazione dei consumi energetici (parte 3) 4.1 CuSum: elementi di analisi statistica Il diagramma delle somme cumulate dei residui in funzione del tempo (CuSum) può essere in generale
DettagliUn esempio. Ipotesi statistica: supposizione riguardante: un parametro della popolazione. la forma della distribuzione della popolazione
La verifica delle ipotesi In molte circostanze il ricercatore si trova a dover decidere quale, tra le diverse situazioni possibili riferibili alla popolazione, è quella meglio sostenuta dalle evidenze
DettagliStatistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2010/2011 Statistica Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza
DettagliVariabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.
Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:
DettagliCorso di Psicometria Progredito
Corso di Psicometria Progredito 43 I principali test statistici per la verifica di ipotesi: Il test del χ 2 per tavole di contingenza a 2 vie Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia
DettagliElementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 10-Significatività statistica per la correlazione vers. 1.0 (5 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università
DettagliLEZIONI DI STATISTICA MEDICA
LEZIONI DI STATISTICA MEDICA Lezione n.11 - Principi dell inferenza statistica - Campionamento - Distribuzione campionaria di una media e di una proporzione - Intervallo di confidenza di una media e di
DettagliSOLUZIONI ESERCITAZIONE NR. 8 Test statistici
SOLUZIONI ESERCITAZIONE NR. 8 Test statistici ESERCIZIO nr. 1 Un campione casuale di dieci pazienti di sesso maschile in cura per comportamenti aggressivi nell ambito del contesto familiare è stato classificato
DettagliCorso di Statistica Esercitazione 1.8
Corso di Statistica Esercitazione.8 Test su medie e proporzioni Prof.ssa T. Laureti a.a. 202-203 Esercizio Un produttore vuole monitorare i valori dei livelli di impurità contenute nella merce che gli
DettagliLezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria
Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata Prof. Massimo Aria aria@unina.it Il concetto di interpolazione In matematica, e in particolare in
DettagliLezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo
UIVERSITA DEGLI STUDI DI BASILICATA FACOLTA DI ECOOMIA Corso di laurea in Economia Aziendale anno accademico 2012/2013 Lezioni di Statistica del 15 e 18 aprile 2013 Docente: Massimo Cristallo LA RELAZIOE
DettagliCapitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica
Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università
DettagliFondamenti di statistica per il miglioramento genetico delle piante. Antonio Di Matteo Università Federico II
Fondamenti di statistica per il miglioramento genetico delle piante Antonio Di Matteo Università Federico II Modulo 2 Variabili continue e Metodi parametrici Distribuzione Un insieme di misure è detto
DettagliArgomenti della lezione:
Lezione 13 L analisi della Varianza (ANOVA): il modello lineare Argomenti della lezione: Modello lineare Disegni a una via L Analisi della Varianza (ANOVA): Esamina differenze tra le medie di due o più
DettagliTest d ipotesi: confronto fra medie
Test d ipotesi: confronto fra medie Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona CONFRONTO FRA MEDIE 1) confronto fra una media campionaria e una media di popolazione
DettagliEsercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale)
Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale) Esercizio 1: Un indagine su 10.000 famiglie ha dato luogo, fra le altre, alle osservazioni riportate nella
Dettagliˆp(1 ˆp) n 1 +n 2 totale di successi considerando i due gruppi come fossero uno solo e si costruisce z come segue ˆp 1 ˆp 2. n 1
. Verifica di ipotesi: parte seconda.. Verifica di ipotesi per due campioni. Quando abbiamo due insiemi di dati possiamo chiederci, a seconda della loro natura, se i campioni sono simili oppure no. Ci
DettagliTest per l omogeneità delle varianze
Test per l omogeneità delle varianze Le carte di controllo hanno lo scopo di verificare se i campioni estratti provengono da un processo produttivo caratterizzato da un unico valore dello s.q.m. σ. Una
Dettagli3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17
C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica
DettagliMatricola: Corso: 1. (4 Punti) Stimare la variazione del reddito quando il prezzo del prodotto finale raddoppia.
Facoltà di Economia Statistica Esame 3-12/04/2010: A Cognome, Nome: Matricola: Corso: Problema 1. Per 5 imprese imprese è stato rilevato il reddito quinquennale medio (in milioni di euro), y, e il corrispondente
DettagliQuanti soggetti devono essere selezionati?
Quanti soggetti devono essere selezionati? Determinare una appropriata numerosità campionaria già in fase di disegno dello studio molto importante è molto Studi basati su campioni troppo piccoli non hanno
Dettaglitabelle grafici misure di
Statistica Descrittiva descrivere e riassumere un insieme di dati in maniera ordinata tabelle grafici misure di posizione dispersione associazione Misure di posizione Forniscono indicazioni sull ordine
DettagliLa verifica delle ipotesi
La verifica delle ipotesi Se abbiamo un idea di quale possa essere il valore di un parametro incognito possiamo sottoporlo ad una verifica, che sulla base di un risultato campionario, ci permetta di decidere
DettagliTipi di variabili. Indici di tendenza centrale e di dispersione
Tipi di variabili. Indici di tendenza centrale e di dispersione L. Boni Variabile casuale In teoria della probabilità, una variabile casuale (o variabile aleatoria o variabile stocastica o random variable)
DettagliUlteriori Conoscenze di Informatica e Statistica
ndici di forma Ulteriori Conoscenze di nformatica e Statistica Descrivono le asimmetrie della distribuzione Carlo Meneghini Dip. di fisica via della Vasca Navale 84, st. 83 ( piano) tel.: 06 55 17 72 17
DettagliApprossimazione normale alla distribuzione binomiale
Approssimazione normale alla distribuzione binomiale P b (X r) costoso P b (X r) P(X r) per N grande Teorema: Se la variabile casuale X ha una distribuzione binomiale con parametri N e p, allora, per N
DettagliC.I. di Metodologia clinica
C.I. di Metodologia clinica Modulo 5. I metodi per la sintesi e la comunicazione delle informazioni sulla salute Quali errori influenzano le stime? L errore casuale I metodi per la produzione delle informazioni
DettagliFACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 21/09/2011
FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 1/9/11 ESERCIZIO 1 (+3++3) La seguente tabella riporta la distribuzione di frequenza dei valori di emoglobina nel sangue (espressi
DettagliLezione 17. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 17. A. Iodice
con Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 29 Outline con 1 2 3 con 4 5 campioni appaiati 6 Indipendenza tra variabili () Statistica 2 /
DettagliTest F per la significatività del modello
Test F per la significatività del modello Per verificare la significatività dell intero modello si utilizza il test F Si vuole verificare l ipotesi H 0 : β 1 = 0,, β k = 0 contro l alternativa che almeno
DettagliEsercitazioni di statistica
Esercitazioni di statistica Misure di associazione: Indipendenza assoluta e in media Stefania Spina Universitá di Napoli Federico II stefania.spina@unina.it 22 ottobre 2014 Stefania Spina Esercitazioni
DettagliSTATISTICA AZIENDALE Modulo Controllo di Qualità
STATISTICA AZIENDALE Modulo Controllo di Qualità A.A. 009/10 - Sottoperiodo PROA DEL 14 MAGGIO 010 Cognome:.. Nome: Matricola:.. AERTENZE: Negli esercizi in cui sono richiesti calcoli riportare tutte la
DettagliLA DISTRIBUZIONE NORMALE
LA DISTRIBUZIONE NORMALE Italo Nofroni Statistica medica - Facoltà di Medicina Sapienza - Roma La più nota ed importante distribuzione di probabilità è, senza alcun dubbio, la Distribuzione normale, anche
DettagliI appello di calcolo delle probabilità e statistica
I appello di calcolo delle probabilità e statistica A.Barchielli, L. Ladelli, G. Posta 8 Febbraio 13 Nome: Cognome: Matricola: Docente: I diritti d autore sono riservati. Ogni sfruttamento commerciale
DettagliUniversità degli Studi di Padova. Corso di Laurea in Medicina e Chirurgia - A.A
Università degli Studi di Padova Corso di Laurea in Medicina e Chirurgia - A.A. 015-16 Corso Integrato: Statistica e Metodologia Epidemiologica Disciplina: Statistica e Metodologia Epidemiologica Docenti:
DettagliStatistica Descrittiva Soluzioni 7. Interpolazione: minimi quadrati
ISTITUZIONI DI STATISTICA A. A. 2007/2008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona
Dettagli