Statistica Medica. Statistica descrittiva e introduzione al Calcolo delle probabilità

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Statistica Medica. Statistica descrittiva e introduzione al Calcolo delle probabilità"

Transcript

1 Statistica Medica Statistica descrittiva e introduzione al Calcolo delle probabilità Paolo Vidoni Dipartimento di Scienze Economiche e Statistiche Università di Udine via Treppo, 18 - Udine paolo.vidoni@uniud.it Per alcuni argomenti si è preso spunto da materiale didattico di R. Bellio, G. Masarotto, C. Romualdi, N. Sartori e L. Ventura. Statistica Medica, P. Vidoni 1/ 200

2 Introduzione alla Statistica Lo studio di un fenomeno di interesse richiede spesso l analisi di informazioni espresse in forma quantitativa (i dati). La Statistica fornisce concetti e strumenti per evidenziare gli aspetti rilevanti racchiusi nei dati e per quantificare la forza delle conclusioni che si possono dedurre da tale analisi. La Statistica è una Matematica applicata che, pur avendo come riferimento concreto i dati e il particolare fenomeno di interesse, interviene con principi e metodologie proprie. La Statistica è di supporto a varie discipline, quali l Economia, la Finanza, la Sociologia, la Medicina, l Ingegneria, la Biologia, ecc. Statistica Medica, P. Vidoni 2/ 200

3 I dati I dati si ottengono sia tramite osservazione sia tramite sperimentazione. I dati osservazionali esistono in natura e vengono rilevati direttamente per come si presentano. Sono spesso osservazioni di caratteristiche antropometriche, demografiche, socio-economiche, ma non solo. Un importante classe di dati osservazionali è rappresentata dai risultati di censimenti o di sondaggi d opinione. Esempi di osservazione: rilevazione dell età, statura, genere e gruppo sanguigno dei residenti nel Comune di Udine al 31 dicembre 2009; rilevazione dei dati relativi alle vendite di una certa azienda nel mese appena concluso; misurazione del livello di vari inquinanti nell aria; monitoraggio delle visite ad un certo sito web in un certo periodo di tempo. Statistica Medica, P. Vidoni 3/ 200

4 I dati sperimentali sono creati in circostanze controllate. L esperimento può essere replicato un numero di volte arbitrario, mantenendo fede ad un determinato protocollo sperimentale. Esempi di sperimentazione: pesatura di una modesta quantità di reagente con una bilancia di precisione; valutazione del grado di efficacia di un nuovo farmaco; analisi del grado di affidabilità di un componente elettronico; estrazione di un campione di individui da una popolazione nota. Sia nei dati ottenuti tramite sperimentazione che tramite osservazione si rileva usualmente la presenza di una certa variabilità. Statistica Medica, P. Vidoni 4/ 200

5 Unità statistiche e popolazione I dati rappresentano l informazione disponibile su certe caratteristiche di una popolazione, ovvero l intera collezione di unità statistiche sulle quali si cerca l informazione. È necessario individuare in modo non equivoco la popolazione di interesse. Si possono considerare: popolazioni reali, che sono costituite da unità che hanno un esistenza fisica simultanea al momento della rilevazione; sono popolazioni effettive e quindi finite. Possono essere esaminate in modo completo (censimento) o parziale (campionamento). popolazioni virtuali, che hanno un esistenza concettuale e sono evocate dalla potenziale replicabilità a piacere della sperimentazione; sono (potenzialmente) infinite e quindi esaminabili solo in modo parziale (campionamento), considerando il numero finito di volte con cui la sperimentazione viene ripetuta. Statistica Medica, P. Vidoni 5/ 200

6 Esempio. Un esempio di popolazione reale è l insieme dei residenti nel Comune di Udine al 31 dicembre Un esempio di popolazione virtuale è l insieme di tutte le possibili replicazioni (potenzialmente infinite) della pesata di una quantità di reagente con una bilancia di precisione. Censimento e campionamento Censimento: si esaminano tutte le unità di una popolazione reale, con riferimento a determinate caratteristiche di interesse. Anche per popolazioni reali i censimenti sono raramente effettuati. Molto più spesso si estrae un campione. Campionamento: si esamina un sottoinsieme finito di unità statistiche, appartenenti ad una popolazione reale o virtuale, selezionate mediante l esperimento di campionamento. Statistica Medica, P. Vidoni 6/ 200

7 L esperimento di campionamento è un particolare esperimento, assimilabile all estrazione casuale di alcuni elementi da un urna. È un esperimento casuale (aleatorio), dal momento che risultano possibili una pluralità di esiti (campioni osservati) e prima di effettuare il campionamento non è possibile individuare con certezza quale potenziale campione verrà selezionato (variabilità campionaria). Affinché il campione porti informazioni sull intera popolazione, la sua estrazione deve essere casuale. Il campione va scelto in modo che rifletta le caratteristiche della popolazione. Esistono vari piani di campionamento, il più semplice è il campionamento casuale semplice, assimilabile all estrazione casuale con reinserimento di elementi da un urna. Statistica Medica, P. Vidoni 7/ 200

8 Per l inerente replicabilità dell estrazione del campione, i dati campionari vanno interpretati come sperimentali anche se sono di tipo osservazionale. Il Calcolo delle probabilità fornisce gli strumenti matematici per lo studio di esperimenti casuali, e in particolare degli esperimenti di campionamento. Le popolazioni reali possono essere studiate per via campionaria o censuaria, mentre per le popolazioni virtuali la strategia campionaria è la sola possibile. Anche quando si conduce un indagine di tipo campionario l obiettivo non muta: si desidera acquisire informazione sull intera popolazione (reale o virtuale), con riferimento a particolari caratteristiche di interesse. Statistica Medica, P. Vidoni 8/ 200

9 Statistica: una definizione più precisa I metodi statistici si possono dividere in due grandi classi. Statistica descrittiva: metodi per la descrizione, la presentazione e la sintesi dei dati disponibili, al fine di individuarne la struttura essenziale. Le finalità sono principalmente di tipo descrittivo, poiché si sintetizzano le informazioni disponibili, che riguardano la totalità della popolazione. Anche quando i dati disponibili rappresentano un campione estratto da una popolazione, nella Statistica descrittiva non se ne tiene conto. Statistica Medica, P. Vidoni 9/ 200

10 Statistica inferenziale: metodi per ricavare dai dati campionari informazioni sulla popolazione di riferimento e per quantificare la fiducia da accordare a tali informazioni. Le informazioni estraibili da un campione possono essere riferite alla popolazione con, inevitabilmente, un certo grado di incertezza A tal fine, si utilizzano il linguaggio e i metodi del Calcolo delle probabilità, ovvero quel ramo della Matematica che permette di trattare l incertezza. Le tre discipline, Calcolo delle probabilità, Statistica descrittiva e Statistica inferenziale, hanno strette relazioni reciproche. Statistica Medica, P. Vidoni 10/ 200

11 Esempio: una gara di mountain bike Si considerano i tempi, in minuti, riportati da 24 ciclisti che hanno partecipato ad una gara di mountain bike. No. Tempo No. Tempo No. Tempo No. Tempo La popolazione reale di riferimento, costituita dai 24 ciclisti che hanno concluso la gara, viene esaminata in modo completo (censimento). La caratteristica di interesse è il tempo impiegato per concludere la prova. Statistica Medica, P. Vidoni 11/ 200

12 Esempio: con la verdura si previene la spina bifida L acido folico è una vitamina del gruppo B, abbondante nelle verdure. La spina bifida è un difetto di saldatura della colonna vertebrale che si manifesta durante la crescita embrionale e comporta gravi conseguenze. Per studiare l efficacia preventiva di una dieta ricca di acido folico nei primi mesi di gravidanza, a 2000 donne sono stati somministrati 800 microgrammi al giorno di tale vitamina ed a altre 2000 donne un placebo. Si sono ottenuti e seguenti risultati: Acido folico Placebo Malati 0 6 Sani Statistica Medica, P. Vidoni 12/ 200

13 La popolazione di riferimento è costituita dall insieme di tutte le donne in gravidanza, comparabili per abitudini e stili di vita. La popolazione viene esaminata in modo parziale (campionamento). Il campione è costituito dalle 4000 donne che sono entrate nella sperimentazione. Si è interessati a capire se la somministrazione preventiva dell acido folico in gravidanza risulta efficace per diminuire il numero di insorgenze della patologia in questione. Statistica Medica, P. Vidoni 13/ 200

14 Esempio: misurazioni con errore Si effettuano 20 misurazioni, ripetute nelle medesime condizioni sperimentali, di un determinato oggetto con uno strumento affetto da errore non sistematico La popolazione virtuale di riferimento è costituita dall insieme di tutte le infinite, potenziali replicazioni della misurazione dell oggetto in esame. La popolazione viene esaminata in modo parziale (campionamento). Il campione è costituito dalle 20 misurazioni che sono state effettuate. Si è interessati a determinare la vera dimensione dell oggetto. Statistica Medica, P. Vidoni 14/ 200

15 Le principali indagini statistiche italiane L ISTAT ( svolge circa 200 indagini ogni anno su tematiche di carattere socio-demografico, economico e ambientale. Le indagini censuarie svolte periodicamente dall ISTAT sono: il censimento generale della popolazione e delle abitazioni; il censimento generale dell industria, del commercio, dei servizi e dell artigianato; il censimento generale dell agricoltura. Tra le indagini campionarie a carattere periodico si ricordano: l indagine trimestrale sulle forze di lavoro; l indagine sui consumi delle famiglie; l indagine multiscopo. Statistica Medica, P. Vidoni 15/ 200

16 Software statistici Le analisi statistiche richiedono strumenti software opportuni, ovvero i così detti software statistici. I fogli di calcolo (Microsoft Excel c e altri) sono strumenti utili, ma solo per analisi semplici. I software statistici sono strumenti molto più potenti e flessibili. Esiste una varietà notevole di software statistici: l ambiente open-source ( è per molti aspetti il migliore strumento ad oggi disponibile. La libreria di, chiamata R Commander, fornisce un utile interfaccia per le applicazioni statistiche, grafiche e di analisi dei dati. Statistica Medica, P. Vidoni 16/ 200

17 Programma Statistica descrittiva Analisi univariate: matrice dei dati e variabili statistiche Analisi univariate: distribuzioni di frequenza Analisi univariate: rappresentazioni grafiche Analisi univariate: indici di posizione Analisi univariate: indici di variabilità Analisi univariate: simmetria e asimmetria Analisi multivariate: distribuzioni di frequenza e rappresentazioni grafiche Analisi multivariate: dipendenza Analisi multivariate: dipendenza in media Analisi multivariate: correlazione e regressione Introduzione al Calcolo delle probabilità Probabilità elementare: eventi e assiomi Probabilità elementare: probabilità condizionata Probabilità elementare: indipendenza stocastica Probabilità elementare: teorema di Bayes Probabilità elementare: test diagnostici Statistica Medica, P. Vidoni 17/ 200

18 Bibliografia e sussidi didattici Borra, S. e Di Ciaccio, A. (2008). Statistica. Metodologie per le scienze economiche e sociali. McGraw-Hill. Iacus, S.M. (2006). Statistica. McGraw-Hill. Stefanini, F.M. (2007). Introduzione alla Statistica Applicata con esempi in R. Pearson. Triola, M.M. e Triola, F.T. (2009). Statistica per le discipline biosanitarie. Pearson. Benedetto, D., Degli Esposti, M. e Maffei, C. (2008). Matematica per le Scienze della Vita. Casa Editrice Ambrosiana. Laboratorio virtuale di Probabilità e Statistica Statistica Medica, P. Vidoni 18/ 200

19 Statistica descrittiva Metodi grafici e numerici per descrivere e sintetizzare i dati osservati. Distinzione fra tecniche di analisi univariata, cioè relative ad una singola caratteristica (variabile) di interesse, e tecniche di analisi multivariata, ovvero per lo studio congiunto di due o più caratteristiche (variabili) di interesse. Alcune nozioni di base sono utili anche per la Statistica inferenziale. Come premessa ad una analisi inferenziale, è sempre opportuno effettuare uno studio descrittivo con riferimento al particolare campione osservato. Statistica Medica, P. Vidoni 19/ 200

20 Analisi univariate: matrice dei dati e variabili statistiche Si suppone che i dati siano già stati acquisiti e che siano disponibili nella forma di matrice dei dati. Questi sono i cosiddetti dati grezzi. (*) dato mancante. Unità Sesso Età Livistr Dist Andrea M Claudio M Lucia F Giuseppe M Mara F 16 2 (*) Luca M Aldo M Arianna F Statistica Medica, P. Vidoni 20/ 200

21 La matrice dei dati fornisce informazioni sulla popolazione in esame con riferimento a: Sesso: Maschio, Femmina. Età (in anni compiuti): 0, 1, 2,...; Livello di istruzione (con codificazione numerica): 1 Analfabeta, 2 Scuola dell obbligo, 3 Diploma, 4 Laurea; Distanza dal luogo di lavoro: numeri reali non negativi. Ogni riga corrisponde ad una unità statistica e contiene i valori su essa rilevati delle caratteristiche di interesse. Ogni colonna corrisponde ad una caratteristica di interesse e contiene i valori di tale caratteristica rilevati sulle varie unità statistiche. Statistica Medica, P. Vidoni 21/ 200

22 Una variabile è una caratteristica delle unità statistiche che, al variare dell unità, può assumere una pluralità di valori. Le modalità di una variabile sono i valori che essa può assumere (e si presumono noti preliminarmente). Sono, in genere, aggettivi, valori numerici, espressioni verbali. Le variabili si indicano con le lettere maiuscole, ad esempio Y, mentre una generica modalità si indica con y. L insieme Y è l insieme di tutte le possibili modalità di Y. Esempio. Con riferimento alla matrice dei dati presentata in precedenza, si hanno le variabili Y 1 = Sesso, con Y 1 = {M, F }; Y 2 = Età, in anni compiuti, con Y 2 = {0, 1, 2,...}; Y 3 = Livello di istruzione, con Y 3 = {1, 2, 3, 4}, avendo scelto la codifica della tabella precedente; Y 4 = Distanza, con Y 4 = R +, anche se si può pensare ad una classificazione su intervalli prefissati. R + indica l insieme dei numeri reali non negativi. Statistica Medica, P. Vidoni 22/ 200

23 Le variabili si possono classificare nel seguente modo. Variabili qualitative (categoriali), se le modalità sono espresse in forma verbale. In particolare, si individuano: variabili qualitative sconnesse (nominali), per le quali non è possibile individuare un ordinamento naturale delle modalità (ad esempio, Sesso, Colore degli occhi, Religione professata ); variabili qualitative ordinali, per le quali è invece possibile individuare un ordinamento naturale delle modalità (ad esempio, Livello di istruzione ). Variabili quantitative (numeriche), se le modalità sono espresse in forma numerica (da non confondere con le codifiche numeriche). In particolare, si individuano: variabili quantitative discrete, se Y è un insieme finito o al più numerabile (ad esempio, Età in a.c., Numero di figli ); variabili quantitative continue, se Y è un insieme continuo (ad esempio, Distanza, Altezza, Reddito ). Si noti che la continuità va intesa come potenziale continuità o come opportuno riferimento semplificativo. Statistica Medica, P. Vidoni 23/ 200

24 Se le modalità di una variabile qualitativa sono solo due, si parla di variabile dicotomica (binaria). Una variabile quantitativa può essere con scala di intervalli, se non esiste uno zero naturale e non arbitrario. Una variabile quantitativa è con scala di rapporti se invece esiste uno zero con tali caratteristiche. Ad esempio, la variabile Temperatura, in gradi centigradi, è su scala di intervalli poiché lo zero è convenzionale. Quindi, non ha senso affermare che la temperatura di 30 è due volte più calda della temperatura di 15. La variabile Reddito invece è su scala di rapporti. In questo caso ha senso affermare che un reddito di euro è il doppio di un reddito di euro. Statistica Medica, P. Vidoni 24/ 200

25 Esistono analisi statistiche adatte per lo studio dei diversi tipi di dati. Tra le varie tipologie di variabili esiste implicitamente una gerarchia. Le variabili quantitative continue possono essere discretizzate, le variabili quantitative discrete possono essere tradotte in variabili qualitative ordinali, quelle ordinali posso essere considerate nominali. Le analisi statistiche sono via via più ricche, man mano che si ascende la gerarchia. Le analisi univariate considerano una sola variabile rilevata sulle unità statistiche. Nello studio congiunto di due o più variabili si parla di analisi statistica bivariata o, in generale, multivariata. Statistica Medica, P. Vidoni 25/ 200

26 La variabile Y viene rilevata su una popolazione (campione) costituita da n unità e si ottiene una successione di modalità osservate (y 1,..., y i,..., y n ), dove y i, i = 1,..., n, è il valore assunto da Y con riferimento all unità i-esima. È utile distinguere tra variabile e risultato della sua rilevazione sulla popolazione (campione). Si definisce variabile statistica la rilevazione (y 1,..., y i,..., y n ) di una certa variabile Y su una determinata popolazione (campione). È una colonna della matrice dei dati. La stessa variabile rilevata su popolazioni (campioni) diverse dà luogo, in genere, a variabili statistiche differenti. Si usa il simbolo Y per indicare anche la variabile statistica. Statistica Medica, P. Vidoni 26/ 200

27 Esempio. Con riferimento alla matrice dei dati vista in precedenza, alla variabile Y = Età corrisponde la variabile statistica Y = (28, 17, 20, 32, 16, 34, 18, 25), con n = 8. Nel caso di dati (campioni) y 1,..., y i,..., y n di tipo numerico può essere utile considerare l insieme dei dati (campione) ordinato y (1),..., y (i),..., y (n), ottenuto disponendo le osservazioni in ordine non decrescente. Il valore che occupa la posizione i-esima, y (i), si dice avere rango i, i = 1,..., n. Si noti che il minimo e il massimo corrispondono rispettivamente a y (1) = min(y 1,..., y n ) e y (n) = max(y 1,..., y n ). Statistica Medica, P. Vidoni 27/ 200

28 Non tutte le modalità potenzialmente assumibili dalla variabile Y possono venire effettivamente rilevate in una popolazione (campione). Il supporto di una variabile statistica Y, indicato con S Y, è l insieme delle modalità di Y effettivamente osservate nella popolazione (campione); S Y = {y 1,..., y j,..., y J }. Si noti che J n. Le modalità osservate, che concorrono a costituire S Y, sono tra loro distinte, cioè vanno prese una volta sola anche se ripetute. Nel caso di variabili qualitative ordinali e quantitative si suppone che le modalità appartenenti al supporto vengano ordinate secondo un ordine crescente: y 1 < y 2 <... < y J. Esempio. Con riferimento alla variabile Y = Età, considerata in precedenza, il supporto è S Y = {16, 17, 18, 20, 25, 28, 32, 34}, mentre Y = {0, 1, 2,...}. Statistica Medica, P. Vidoni 28/ 200

29 Analisi univariate: distribuzioni di frequenza I dati grezzi (la variabile statistica), pur rappresentando pienamente il contenuto dell osservazione, usualmente non permettono di cogliere in modo chiaro le caratteristiche del fenomeno in esame. È utile passare dai dati in forma grezza ad una tabella di frequenza che fornisca una sintesi dei dati in un formato facile da capire. Esempio. Colesterolo. Si è misurato il livello di colesterolo sierico a n = 2294 soggetti maschi, discriminando i pazienti in due classi di età: anni e anni. Ci si chiede se il livello di colesterolo sia maggiore negli anziani piuttosto che nei giovani. Livello di colesterolo pazienti età anni: 80, 83, 86, 90, 93, 96, 109, 112, 116, 119, 120,..., 250, 251, 251, 251, 252, 252, 252, 253,... Livello di colesterolo pazienti età anni: 84, 85, 96, 97, 97, 101, 119, 122, 133, 138, 140,..., 266, 266, 268, 270, 272, 272, 284, 290,... Statistica Medica, P. Vidoni 29/ 200

30 I dati rilevati sono troppi per cercare di ricavare informazioni utili solamente guardandoli. È necessario operare una sintesi. Definire una tabella dove si considerano le frequenze con cui le diverse modalità, o classi di modalità, sono state osservate. Se y j S Y, j = 1,..., J, è una delle modalità osservate di Y, si dice frequenza assoluta di y j il numero di volte che y j risulta osservata. Si indica con f j. Evidentemente, f j > 0, j = 1,..., J, e J j=1 f j = n. La lista delle modalità osservate accompagnate dalle rispettive frequenze assolute è detta distribuzione di frequenza assoluta e si rappresenta con una tabella di frequenza del tipo Modalità y 1 y j y J Totale Frequenza f 1 f j f J J j=1 f j Statistica Medica, P. Vidoni 30/ 200

31 Esempio. Con riferimento alla matrice dei dati vista in precedenza, si ricavano le seguenti tabelle di frequenza (assoluta) associate alle variabili Sesso e Livello di istruzione : Sesso frequenza M 5 F 3 Totale 8 Liv. di istruz. frequenza Scuola obbligo 2 Diploma superiore 4 Laurea o superiore 2 Totale 8 Statistica Medica, P. Vidoni 31/ 200

32 Una tabella di frequenza riferita ad una variabile statistica qualitativa è detta serie statistica. Se la variabile statistica è quantitativa continua, si osservano, a meno di effetti di arrotondamento, tante modalità distinte quante sono le unità statistiche: S Y corrisponde all insieme dei dati grezzi e f j = 1, j = 1,..., J. Questo può accadere, in alcuni casi, anche con variabili statistiche quantitative discrete. È conveniente definire classi di modalità contigue e contare le unità che appartengono a ciascuna classe. Le classi vanno definite di modo che: non siano né troppe né troppo poche; siano disgiunte; comprendano tutte le modalità osservate. Statistica Medica, P. Vidoni 32/ 200

33 La regola di individuare un numero di classi (di uguale ampiezza) pari a n in molti casi va bene. Talvolta è necessario fare qualche aggiustamento o utilizzare regole più sofisticate. Le classi non hanno necessariamente un ampiezza costante. Si ottiene una tabella (distribuzione) di frequenza assoluta con modalità raggruppate in classi Classi y 0 y 1 y j 1 y j y J 1 y J Totale Freq. f 1 f j f J J j=1 f j dove f j è la frequenza assoluta associata alla classe y j 1 y j, che corrisponde all intervallo (y j 1, y j ]. Analogamente, y j 1 y j corrisponde all intervallo [y j 1, y j ) e y J indica (y J, + ). Statistica Medica, P. Vidoni 33/ 200

34 Una tabella di frequenza così ottenuta è detta seriazione statistica. Esempio. Con riferimento alla matrice dei dati vista in precedenza, si ricava la seguente seriazione statistica associata alla variabile Distanza : Dist frequenza Totale 7 Statistica Medica, P. Vidoni 34/ 200

35 La frequenza relativa di una modalità y j, o di una classe di modalità y j 1 y j, è la proporzione p j di unità statistiche portatrici di tale modalità o classe di modalità. Corrisponde a p j = f j J j=1 f j = f j, j = 1,..., J. n Evidentemente, p j > 0, j = 1,..., J, e J j=1 p j = 1. Si possono definire anche le frequenze relative percentuali, definite come p j 100, j = 1,..., J. Le frequenze relative sono utili per percepire il peso delle varie modalità e per operare confronti tra diverse popolazioni. Se S Y = {y 1 }, allora J = 1, f 1 = n, p 1 = 1 e la variabile statistica Y è detta degenere. Statistica Medica, P. Vidoni 35/ 200

36 Esempio. Si consideri la tabella che fornisce la distribuzione per sesso della popolazione residente in Italia (confini attuali) ricavata dai censimenti del 1861 e del 1981; i dati sono espressi in migliaia. Freq. ass. Freq. rel. Freq. rel. % M F Totale M F Totale Analizzando le frequenze relative si ha una rappresentazione immediata di come si è modificata la struttura della popolazione italiana. Statistica Medica, P. Vidoni 36/ 200

37 Esempio. Colesterolo (continua). Considerando i dati sul livello di colesterolo sierico, si ottiene la seguente tabella, dove le modalità sono state raggruppate in classi di ampiezza 40 Liv. colesterolo f j f j p j p j (mg/100 ml) (età 25-34) (età 55-64) (età 25-34) (età 55-64) Totale Statistica Medica, P. Vidoni 37/ 200

38 Commento: i soggetti più giovani hanno una porzione più elevata di osservazioni inferiori a 200 mg/100 ml, mentre i più anziani presentano una porzione più elevata al di sopra di questo valore. Esempio. Calcolosi. La litotripsia extracorporea è un trattamento per la calcolosi che può essere fatto in day hospital. Per valutarne l efficacia nel caso della calcolosi uretrale, la risposta di n = 80 pazienti è stata rilevata con la seguente scala di modalità, riferita al grado di frammentazione dei calcoli dopo il primo trattamento: buono: tutti i frammenti sono più piccoli di 3 mm; medio: nessun frammento maggiore di 5 mm e almeno uno maggiore di 3 mm; scarso: frammenti maggiori di 5 mm; assente: nessun segno di frammentazione. Statistica Medica, P. Vidoni 38/ 200

39 Ogni paziente poi viene classificato a seconda dell uretere (lombare, pre-sacrale, pelvico) dove si erano formati i calcoli. I dati grezzi prendono la forma di una lunga tabella che risulta di difficile analisi Paziente Uretere Grado framm. 1 pelvico buono 2 pre-sacrale assente 3 pelvico scarso 80 lombare buono I dati grezzi vengono sintetizzati determinando la distribuzione delle frequenze assolute e relative, suddividendo i pazienti in base alla posizione dei calcoli. Statistica Medica, P. Vidoni 39/ 200

40 Tabella delle frequenze assolute. Grado framm. Uretere Buono Medio Scarso Assente Totale Lombare Pre-sacr Pelvico Suddividendo ogni riga per il suo totale si ottiene la tabella delle frequenze relative. Grado framm. Uretere Buono Medio Scarso Assente Totale Lombare Pre-sacr Pelvico Statistica Medica, P. Vidoni 40/ 200

41 Commenti I gruppi di pazienti, classificati sulla base della posizione dei calcoli, hanno numerosità diversa. Il confronto tra i gruppi è più chiaro se si considerano le frequenze relative. Con riferimento alla calcolosi pre-sacrale, non si hanno risposte non soddisfacenti (scarso o assente). I casi considerati però sono pochi. Sembra che la migliore risposta al trattamento si abbia nel caso della calcolosi pelvica. Statistica Medica, P. Vidoni 41/ 200

42 Quando si hanno variabili con modalità ordinabili (qualitative ordinali o quantitative), può essere utile considerare la frequenza con cui si presentano modalità di ordine inferiore o uguale ad un certo valore. La frequenza assoluta cumulata F j o, analogamente, la frequenza relativa cumulata P j definiscono la frequenza assoluta o relativa di modalità o classi di modalità non superiori alla j-esima, j = 1,..., J. Si ottengono cumulando progressivamente le frequenze, più precisamente F j = j f i, P j = i=1 j p i, j = 1,..., J. i=1 Evidentemente, F 1 = f 1, F J = n, P 1 = p 1, P J = 1. Statistica Medica, P. Vidoni 42/ 200

43 Esempio. Colesterolo (continua). Considerando i dati sul livello di colesterolo sierico Liv. colesterolo F j F j P j P j (mg/100 ml) (età 25-34) (età 55-64) (età 25-34) (età 55-64) Commento: i soggetti più anziani tendono ad avere livelli di colesterolo più elevati rispetto ai giovani. Statistica Medica, P. Vidoni 43/ 200

44 Quando si misura un fenomeno nel tempo, si ottiene una distribuzione di frequenza che prende il nome di serie storica (temporale). Esempio. Si considera il numero di occupati in Italia dal 1997 al Anno No. occupati (in migliaia) Statistica Medica, P. Vidoni 44/ 200

45 Quando si misura un fenomeno nello spazio, si ottiene una distribuzione di frequenza che prende il nome di serie spaziale (territoriale). Esempio. Si considera il numero di occupati in Italia nel 2002, suddivisi per ripartizione territoriale. Ripartizione No. occupati territoriale (in migliaia) Nord Centro 4513 Sud e Isole 6286 Statistica Medica, P. Vidoni 45/ 200

46 Analisi univariate: rappresentazioni grafiche Oltre alle tabelle di frequenza, risulta utile introdurre alcune rappresentazioni grafiche, dette diagrammi statistici (grafici). L osservazione di un buon grafico fornisce informazioni interessanti su un insieme di dati con una semplice occhiata. Un grafico è di solito di più facile e immediata consultazione rispetto ad una tabella. La scelta del grafico dipende dalla natura dei dati. Si utilizzano rappresentazioni grafiche diverse per dati discreti, continui, serie storiche, ecc. Statistica Medica, P. Vidoni 46/ 200

47 Per dati categoriali si possono utilizzare, ad esempio, diagrammi circolari diagrammi a rettangoli diagrammi a rettangoli multipli Per dati numerici si possono utilizzare, ad esempio, diagrammi a bastoncini istogrammi poligoni di frequenza funzione di ripartizione empirica diagrammi di dispersione boxplot (che verranno presentati in seguito) Statistica Medica, P. Vidoni 47/ 200

48 I diagrammi circolari (a torta) sono utili per rappresentare serie statistiche sconnesse, riferite a dati qualitativi nominali o eventualmente ordinali. L area del settore circolare deve essere proporzionale alla frequenza della modalità corrispondente. Esempio. Calcolosi (continua). Considerando i dati riferiti al trattamento della calcolosi, le diverse modalità relative al grado di frammentazione sono rappresentate dagli spicchi della torta, la cui dimensione è proporzionale alla corrispondente frequenza. buono assente scarso medio Statistica Medica, P. Vidoni 48/ 200

49 I diagrammi a rettangoli (a barre) sono utili per rappresentare serie statistiche sconnesse, riferite a dati qualitativi nominali o eventualmente ordinali. Le altezze dei rettangoli sono proporzionali alle frequenze delle modalità. Le basi hanno la stesa dimensione e sono separate per non implicare alcuna continuità. Esempio. Calcolosi (continua). Considerando i dati riferiti al trattamento della calcolosi, si ottiene il seguente diagramma a rettangoli buono medio scarso assente Statistica Medica, P. Vidoni 49/ 200

50 I diagrammi a rettangoli (a barre) multipli sono utili per rappresentare serie statistiche sconnesse, riferite a dati qualitativi nominali o eventualmente ordinali, nel caso in cui la distribuzione di frequenza risulta suddivisa secondo un determinato criterio di classificazione. I rettangoli hanno la base uguale e sono separati per non implicare alcuna continuità. Le altezze sono proporzionali alla frequenze delle modalità; si considerano le frequenze relative affinché il confronto abbia senso. I rettangoli vengono raggruppati tenendo conto del criterio di classificazione. È opportuno evitare di disporre un numero elevato di rettangoli a confronto. Esempio. Calcolosi (continua). Considerando i dati riferiti al trattamento della calcolosi, si ottiene il seguente diagramma a rettangoli multipli. Statistica Medica, P. Vidoni 50/ 200

51 Le diverse modalità relative al grado di frammentazione vengono rappresentate considerando in modo distinto le varie zone dell uretere dove risultano posizionati i calcoli lombare pre sacr. pelvico buono medio scarso assente Statistica Medica, P. Vidoni 51/ 200

52 I diagrammi a bastoncini servono per rappresentare distribuzioni di frequenza assoluta o relativa, riferite a dati qualitativi discreti. L altezza dei bastoncini è proporzionale o pari alla frequenza, assoluta o relativa, della modalità. Esempio. Figli. Si considera il numero di figli con riferimento alle famiglie residenti in un determinato territorio. La distribuzione di frequenza relativa è rappresentata con il seguente diagramma. freq. rel. famiglie numero di figli Statistica Medica, P. Vidoni 52/ 200

53 Gli istogrammi si utilizzano per rappresentare distribuzioni di frequenza assoluta o relativa con modalità raggruppate in classi, riferite usualmente a dati quantitativi continui. L istogramma è un insieme di rettangoli adiacenti, ognuno rappresentativo di una classe, posti su un piano cartesiano. Il rettangolo corrispondente alla classe j-esima y j 1 y j, j = 1,..., J, ha come base l intervallo [y j 1, y j ] e altezza (e quindi area) proporzionale a, oppure pari a, f j /(y j y j 1 ): istogramma delle frequenze assolute; altezza (e quindi area) proporzionale a, oppure pari a, p j /(y j y j 1 ): istogramma delle frequenze relative. Se i rettangoli hanno la stessa base, allora l altezza è proporzionale a f j o a p j. Statistica Medica, P. Vidoni 53/ 200

54 Se le classi estreme sono aperte, ad esempio y 1 e y J 1, vanno chiuse scegliendo opportunamente gli estremi y 0 e y J. Se si considerano altezze pari a p j /(y j y j 1 ), la somma delle aree dei rettangoli è pari a 1. L istogramma può essere utilizzato anche per descrivere distribuzioni di frequenza associate a variabili statistiche quantitative discrete, quando si hanno molte modalità osservate distinte. Esempio. Reddito. Si consideri la seguente seriazione riferita alla variabile reddito (lordo mensile in migliaia di euro) Reddito Tot. freq. rel Statistica Medica, P. Vidoni 54/ 200

55 L associato istogramma della frequenze relative corrisponde a freq. rel Esempio. Colesterolo (continua). Considerando i dati sul livello di colesterolo sierico, si ottengono i seguenti istogrammi riferiti, rispettivamente, ai pazienti di età anni e di età anni. reddito Statistica Medica, P. Vidoni 55/ 200

56 I grafici suggeriscono le stesse conclusioni fatte sulla base delle tabelle di frequenza. La distribuzione di frequenza dei pazienti più anziani è spostata più a destra rispetto a quella dei pazienti giovani. Statistica Medica, P. Vidoni 56/ 200

57 Un poligono di frequenza è uno smussamento locale dell istogramma. Per costruirlo si introducono due classi adiacenti alle classi esterne y 0 y 1 e y J 1 y J, ognuna con ampiezza uguale alla classe vicina e frequenza assoluta pari a zero. Il poligono si ottiene unendo i punti di mezzo dei lati superiori dei rettangoli dell istogramma con una linea spezzata. Solo se i rettangoli hanno la stessa base, l area sottesa dalla linea spezzata coincide con la somma dell area dei rettangoli Statistica Medica, P. Vidoni 57/ 200

58 Esempio. Reddito (continua). Si consideri la seriazione riferita alla variabile reddito. Partendo dall associato istogramma si ottiene il corrispondente poligono di frequenza. freq. rel reddito Statistica Medica, P. Vidoni 58/ 200

59 Un ulteriore rappresentazione grafica per dati quantitativi, e che risulta in molti casi particolarmente efficace, è fornita dalla funzione di ripartizione empirica. La funzione di ripartizione empirica è una funzione il cui valore nel punto y R corrisponde al rapporto tra il numero di osservazioni minori o uguali a y e il numero totale di osservazioni F n (y) = dove R è l insieme dei numeri reali. no. oss. y no. totale oss., y R, Al variare di y, fornisce la proporzione cumulata di unità statistiche che presentano modalità minori o uguali a y. La nozione di funzione di ripartizione empirica è simile, ma non uguale, a quella di frequenza relativa cumulata. Statistica Medica, P. Vidoni 59/ 200

60 Esempio. Geyser Old Faithful. Si dispone di dati riferiti alle durate delle pause (in minuti) e alla tipologia delle eruzioni che precedono le pause (lunga o corta), con riferimento al geyser Old Faithful che si trova nel parco nazionale di Yellowstone, Wyoming, USA. Si hanno le seguenti n = 60 osservazioni Pausa Eruzione 76 Lunga 80 Lunga 84 Lunga.. 56 Corta 83 Lunga Statistica Medica, P. Vidoni 60/ 200

61 Considerando tutti i dati disponibili si può calcolare il seguente istogramma. Si individuano classi di ampiezza costante pari a 5 minuti. densita La forma dell istogramma è dovuta al fatto che si sono considerati congiuntamente i dati sulla durata delle pause, senza distinguere tra durata corta o lunga dell eruzione precedente. Pausa Statistica Medica, P. Vidoni 61/ 200

62 Se si considerano le durate delle pause, raggruppando i dati in base alla tipologia dell eruzione precedente, si ottengono i seguenti istogrammi Eruzione Corta Eruzione Lunga densita densita Pausa Pausa Le pause successive ad un eruzione corta tendono ad essere più corte di quelle che seguono un eruzione lunga. Statistica Medica, P. Vidoni 62/ 200

63 Considerando i due insiemi di dati distinti, si possono determinare le associate funzioni di ripartizione empiriche (rosso=eruzione corta, nero=eruzione lunga), che confermano questa affermazione. Funzione di ripartizione empirica Fn(x) Pausa Statistica Medica, P. Vidoni 63/ 200

64 In molti casi, per ogni unità statistica vengono raccolti dati di più variabili. Nel caso di due variabili quantitative, per una prima analisi della relazione tra le variabili si possono usare i diagrammi di dispersione (scatterplot). Se (x i, y i ), i = 1,..., n, sono i valori delle due variabili, il diagramma di dispersione si ottiene rappresentando i punti in un piano cartesiano. Per più di due variabili, si possono ottenere i diagrammi di dispersione per ogni coppia di variabili. Statistica Medica, P. Vidoni 64/ 200

65 Esempio. Velocità. Si dispone di dati riferiti alla velocità, in Km/h, e allo spazio di frenata, in metri, per n = 50 automobili degli anni 20. Si costruisce il seguente diagramma di dispersione. spazio di frenata velocità Lo spazio di frenata aumenta al crescere della velocità, con una relazione che che si discosta leggermente da quella lineare. Statistica Medica, P. Vidoni 65/ 200

66 Se i dati bivariati presentano una componente temporale, si ha una serie storica. In questo caso, si possono rappresentare i dati in funzione del tempo utilizzando un particolare diagramma di dispersione con i punti uniti da una linea spezzata. Esempio. Patologie polmonari. Si considerano i dati riferiti al numero di decessi mensili per patologie polmonari (bronchiti, asma, enfisema) rilevati nel Regno Unito dal 1974 al no. decessi tempo Statistica Medica, P. Vidoni 66/ 200

67 Analisi univariate: indici di posizione Fino ad ora si sono utilizzate tabelle di frequenza e diagrammi statistici per descrivere e presentare dati ottenuti da rilevazioni statistiche. Questi strumenti possono non essere adeguati per descrivere in modo efficace alcuni aspetti rilevanti dell insieme dei dati e della associata distribuzione di frequenza. È interessante indagare i seguenti aspetti dei dati: la posizione, cioè il centro dei dati; la variabilità, cioè la dispersione dei dati; la forma della distribuzione di frequenza, considerando la simmetria e la curtosi (pesantezza delle code). Statistica Medica, P. Vidoni 67/ 200

68 Si presenteranno alcuni indici sintetici che descrivono la posizione, la variabilità e la simmetria di una variabile statistica. Nel caso in cui i dati derivino da un indagine campionaria, gli indici vengono detti indici campionari. Un aspetto rilevante dei dati è rappresentato dal suo centro, cioè dal punto attorno al quale le modalità osservate si dispongono. Un indice di posizione è espresso nell ordine di grandezza di Y e individua tale centro, che costituisce, in alcuni casi, il baricentro della associata distribuzione di frequenza. Si presentano i seguenti indici di posizione: media aritmetica; mediana; moda. Statistica Medica, P. Vidoni 68/ 200

69 La media aritmetica, che è l indice di posizione più noto, si può calcolare per una variabile quantitativa Y e si indica con E(Y ), con µ Y o semplicemente con µ. Esempio. Sia Y = (27, 30, 30) la variabile statistica che descrive i voti riportati in tre esami da uno studente. La media aritmetica dei voti è 29 = ( )/3. Si noti che 29 non corrisponde a nessuno dei voti ottenuti. Se Y = (28, 30, 30), la media aritmetica dei voti è 29.3 = ( )/3, che non corrisponde a nessuna potenziale modalità per Y. In entrambi i casi la media sintetizza i valori osservati indicandone un centro. La media può essere vista anche come il valore di equiripartizione sulle unità statistiche del totale delle osservazioni. Statistica Medica, P. Vidoni 69/ 200

70 Se si dispone dei dati grezzi y 1,..., y n, allora E(Y ) = 1 n y i. n Se, con riferimento ad una variabile quantitativa discreta Y, si dispone della tabella di frequenza assoluta o relativa, allora E(Y ) = 1 J J y j f j = y j p j. n j=1 Se, con riferimento ad una variabile quantitativa continua Y, si dispone della tabella di frequenza assoluta o relativa con modalità raggruppate in classi (ad esempio y j 1 y j, j = 1,..., J), si calcola il punto centrale yj c = (y j 1 + y j )/2, j = 1,..., J, delle singole classi e E(Y ) = 1 J J y c n jf j = yjp c j. j=1 i=1 j=1 j=1 Statistica Medica, P. Vidoni 70/ 200

71 Se ci sono classi aperte, il punto centrale viene individuato dopo aver convenientemente chiuso la classe. Questa procedura approssimata per il calcolo di E(Y ) è equivalente a quella che si definisce quando si dispone dei dati grezzi se viene soddisfatta una delle seguenti ipotesi: le osservazioni che cadono in una classe coincidono con il punto centrale della classe; le osservazioni sono distribuite in modo uniforme nella classe di appartenenza. Non è detto che E(Y ) coincida con una delle modalità osservate o osservabili. La media aritmetica risente della presenza di osservazioni anomale o estreme (non è un indice robusto). Esistono altre tipologie di medie, che non vengono considerate in questa sede. Statistica Medica, P. Vidoni 71/ 200

72 Esempio. Si consideri la seguente tabella di frequenza y j Totale f j È immediato concludere che E(Y ) = 122/200 = Esempio. Si consideri la seguente tabella di frequenza con modalità raggruppate in classi Classe Totale freq. rel I valori centrali delle classi sono, rispettivamente, y1 c = 5, y2 c = 12.5 e yc 3 = 17.5, da cui si conclude che E(Y ) = = Statistica Medica, P. Vidoni 72/ 200

73 Esempio. Un lavoratore può raggiungere il luogo di lavoro in bicicletta o in automobile. Vorrebbe scegliere il mezzo di trasporto che gli consente il maggiore risparmio di tempo. Con questo obiettivo, va a lavorare per 12 giorni in automobile e per 12 giorni in bicicletta e registra il tempo impiegato (in minuti): Automobile X = (23, 32, 44, 21, 36, 30, 28, 33, 45, 34, 29, 31) Bicicletta Y = (22, 24, 22, 33, 26, 31, 24, 28, 32, 31, 37, 24) Il tempo minore in assoluto si ha in auto (21 minuti), ma sempre in auto si ha anche il tempo maggiore in assoluto (45 minuti). Calcolando le medie aritmetiche si ha E(X) = e E(Y ) = 27.83, quindi per raggiungere il posto di lavoro, in media, si impiega meno tempo in bicicletta. Statistica Medica, P. Vidoni 73/ 200

74 Esempio. Asma. Si vuole studiare la risposta all ozono e all anidride carbonica in n = 13 adolescenti asmatici. Si misura il volume respiratorio forzato in litri al secondo. I dati grezzi vengono riportati nella seguente tabella, dove si riporta anche il sesso dei soggetti coinvolti nello studio Soggetto Sesso M F F M M M F M Vol. resp Soggetto Sesso M F F M M Vol. resp La media aritmetica risulta essere E(Y ) = 38.35/13 = 2.95 litri al secondo. Statistica Medica, P. Vidoni 74/ 200

75 Se al posto dell osservazione y 11 = 4.02 si avesse y 11 = 40.2, ad esempio per effetto di un errore nella rilevazione, la media risulterebbe pari a E(Y ) = 74.53/13 = 5.73 litri al secondo, che è quasi il doppio del valore precedente. Commento: la media aritmetica è sensibile alla presenza di valori anomali, che possono essere legati a errori oppure essere valori estremi non dovuti ad errori. La media aritmetica non si calcola per dati categoriali. Un eccezione si ha con variabili dicotomiche, le cui modalità si possono codificare come 0 e 1. In questo caso la media fornisce la proporzione di esiti 1 sul totale delle osservazioni. Esempio. Asma (continua). Nel caso dello studio sugli adolescenti asmatici, se si considera la variabile dicotomica X, con modalità 1 = M e 0 = F, si ha che E(X) = 8/13 = Quindi, il 61.5% dei soggetti studiati sono maschi. Statistica Medica, P. Vidoni 75/ 200

76 La media aritmetica soddisfa le seguenti proprietà. 1) Proprietà di Cauchy. Sia S Y = {y 1,..., y J }, con y 1 < < y J, allora y 1 E(Y ) y J. La media è compresa tra il più piccolo e il più grande valore osservato. 2) Proprietà di baricentro. Sia Y E(Y ) la variabile scarto di Y dalla sua media E(Y ), con modalità y i E(Y ), j = 1,..., J, allora cioè la sua media è nulla. E(Y E(Y )) = 0, Statistica Medica, P. Vidoni 76/ 200

77 3) Proprietà di linearità. Sia ay + b, a, b R, una trasformata lineare della variabile Y, allora E(aY + b) = ae(y ) + b. Quindi, la media della variabile ay + b, con modalità ay i + b, j = 1,..., J, corrisponde alla corrispondente trasformata lineare di E(Y ). Statistica Medica, P. Vidoni 77/ 200

78 La mediana si può calcolare per una variabile qualitativa ordinale o quantitativa Y e si indica con y 0.5. È quel valore che, rispetto allo ordinamento non decrescente delle osservazioni, le divide in due parti uguali. È il valore centrale La mediana corrisponde a ogni valore y 0.5 tale che: almeno il 50% delle unità statistiche presenta modalità inferiori o pari a y 0.5 ; almeno il 50% delle unità statistiche presenta modalità superiori o pari a y 0.5. Se si dispone dei dati grezzi y 1,..., y n, ordinati secondo un ordinamento non decrescente, allora la mediana di y 0.5 corrisponde alla modalità che si trova nella posizione (n + 1)/2, se n è dispari, cioè y 0.5 = y (n+1)/2 ; alle modalità che si trovano nelle posizioni n/2 e (n/2) + 1, se n è pari, cioè y 0.5 = y n/2 e y 0.5 = y (n/2)+1. Statistica Medica, P. Vidoni 78/ 200

79 Se y n/2 e y (n/2)+1 non coincidono, la mediana può non essere unica. Nel caso di variabili quantitative con n pari, si può avere anche un intervallo di valori [y n/2, y (n/2)+1 ] che soddisfano alla definizione di mediana. In questo caso si può prendere il punto di mezzo come mediana convenzionale. Esempio. Si consideri la variabile statistica qualitativa ordinale Y che descrive il voto di n = 5 studenti, Y = (suff., suff., buono, buono, ottimo). Poiché n è dispari, y 0.5 = y (n+1)/2 = y 3 = buono. Statistica Medica, P. Vidoni 79/ 200

80 Se invece Y = (suff., suff., suff., buono, buono, ottimo), n è pari, quindi y 0.5 = y n/2 = y 3 = suff. e y 0.5 = y (n/2)+1 = y 4 = buono. Infine, se Y = (suff., suff., buono, buono, ottimo, ottimo), n è pari, ma y 0.5 = y n/2 = y 3 = buono e y 0.5 = y (n/2)+1 = y 4 = buono; quindi, buono è l unica mediana. Statistica Medica, P. Vidoni 80/ 200

81 Esempio. Si consideri la variabile statistica quantitativa discreta Y che descrive il numero di puntate, di una serie televisiva, viste da n = 8 famiglie Y = (0, 1, 3, 3, 4, 6, 6, 6). Poiché n è pari, y 0.5 = y n/2 = y 4 = 3 e y 0.5 = y (n/2)+1 = y 5 = 4. In questo caso, sia 3 che 4 sono valori mediani e, in generale, ogni punto dell intervallo [3, 4] è un valore mediano; la mediana convenzionale è 3.5. Se invece Y = (0, 1, 3, 3, 4, 6, 6), n è dispari e c è un unica mediana y 0.5 = y (n+1)/2 = y 4 = 3. Statistica Medica, P. Vidoni 81/ 200

82 Se si dispone soltanto della distribuzione di frequenza relativa o assoluta, si può operare nel seguente modo. Si suppone che le modalità del supporto S Y = {y 1,..., y J } siano ordinate in senso crescente. Se sono note le frequenze assolute f j, j = 1,..., J, e quindi la dimensione n della popolazione, la mediana corrisponde, se n è dispari, alla modalità y j che presenta la frequenza assoluta cumulata F j più piccola tale che F j (n + 1)/2; se n è pari, alla modalità y j che presenta la frequenza assoluta cumulata F j più piccola tale che F j n/2 e alla modalità y j che presenta la frequenza assoluta cumulata F j più piccola tale che F j (n/2) + 1. Nel caso con n pari si possono avere due valori mediani distinti o più di due, se si considerano variabili quantitative. Statistica Medica, P. Vidoni 82/ 200

83 Se sono note solo le frequenze relative p j, j = 1,..., J, e quindi la dimensione n della popolazione non risulta nota, allora la mediana corrisponde alla modalità y j che presenta frequenza relativa cumulata più piccola tale che P j 0.5. Se esite una modalità y j tale che P j = 0.5, allora sia y j che y j+1 soddisfano la definizione di mediana. La mediana è un indice di posizione robusto rispetto a valori anomali dei dati. Se si dispone soltanto della distribuzione di frequenza relativa o assoluta con modalità raggruppate in classi, si può operare allo stesso modo. Quindi, si individuerà una classe mediana. Statistica Medica, P. Vidoni 83/ 200

Corso di. Dott.ssa Donatella Cocca

Corso di. Dott.ssa Donatella Cocca Corso di Statistica medica e applicata Dott.ssa Donatella Cocca 1 a Lezione Cos'è la statistica? Come in tutta la ricerca scientifica sperimentale, anche nelle scienze mediche e biologiche è indispensabile

Dettagli

Un po di statistica. Christian Ferrari. Laboratorio di Matematica

Un po di statistica. Christian Ferrari. Laboratorio di Matematica Un po di statistica Christian Ferrari Laboratorio di Matematica 1 Introduzione La statistica è una parte della matematica applicata che si occupa della raccolta, dell analisi e dell interpretazione di

Dettagli

Il concetto di valore medio in generale

Il concetto di valore medio in generale Il concetto di valore medio in generale Nella statistica descrittiva si distinguono solitamente due tipi di medie: - le medie analitiche, che soddisfano ad una condizione di invarianza e si calcolano tenendo

Dettagli

VARIABILI E DISTRIBUZIONI DI FREQUENZA A.A. 2010/2011

VARIABILI E DISTRIBUZIONI DI FREQUENZA A.A. 2010/2011 VARIABILI E DISTRIBUZIONI DI FREQUENZA A.A. 2010/2011 1 RAPPRESENTARE I DATI: TABELLE E GRAFICI Un insieme di misure è detto serie statistica o serie dei dati 1) Una sua prima elementare elaborazione può

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 1

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 1 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 1 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Un breve riepilogo: caratteri, unità statistiche e collettivo UNITA STATISTICA: oggetto dell osservazione

Dettagli

1. L analisi statistica

1. L analisi statistica 1. L analisi statistica Di cosa parleremo La statistica è una scienza, strumentale ad altre, concernente la determinazione dei metodi scientifici da seguire per raccogliere, elaborare e valutare i dati

Dettagli

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva Università del Piemonte Orientale Corsi di Laurea Triennale Corso di Statistica e Biometria Introduzione e Statistica descrittiva Corsi di Laurea Triennale Corso di Statistica e Biometria: Introduzione

Dettagli

OCCUPATI SETTORE DI ATTIVITA' ECONOMICA

OCCUPATI SETTORE DI ATTIVITA' ECONOMICA ESERCIZIO 1 La tabella seguente contiene i dati relativi alla composizione degli occupati in Italia relativamente ai tre macrosettori di attività (agricoltura, industria e altre attività) negli anni 1971

Dettagli

Facciamo qualche precisazione

Facciamo qualche precisazione Abbiamo introdotto alcuni indici statistici (di posizione, di variabilità e di forma) ottenibili da Excel con la funzione Riepilogo Statistiche Facciamo qualche precisazione Al fine della partecipazione

Dettagli

Grafici delle distribuzioni di frequenza

Grafici delle distribuzioni di frequenza Grafici delle distribuzioni di frequenza L osservazione del grafico può far notare irregolarità o comportamenti anomali non direttamente osservabili sui dati; ad esempio errori di misurazione 1) Diagramma

Dettagli

Università del Piemonte Orientale. Corsi di Laurea Triennale di Area Tecnica. Corso di Statistica e Biometria. Statistica descrittiva

Università del Piemonte Orientale. Corsi di Laurea Triennale di Area Tecnica. Corso di Statistica e Biometria. Statistica descrittiva Università del Piemonte Orientale Corsi di Laurea Triennale di Area Tecnica Corso di Statistica e Biometria Statistica descrittiva 1 Statistica Funzioni Descrittiva Induttiva (inferenziale) Statistica

Dettagli

LABORATORIO EXCEL XLSTAT 2008 SCHEDE 2 e 3 VARIABILI QUANTITATIVE

LABORATORIO EXCEL XLSTAT 2008 SCHEDE 2 e 3 VARIABILI QUANTITATIVE Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) LABORATORIO EXCEL

Dettagli

Relazioni statistiche: regressione e correlazione

Relazioni statistiche: regressione e correlazione Relazioni statistiche: regressione e correlazione È detto studio della connessione lo studio si occupa della ricerca di relazioni fra due variabili statistiche o fra una mutabile e una variabile statistica

Dettagli

STATISTICA IX lezione

STATISTICA IX lezione Anno Accademico 013-014 STATISTICA IX lezione 1 Il problema della verifica di un ipotesi statistica In termini generali, si studia la distribuzione T(X) di un opportuna grandezza X legata ai parametri

Dettagli

Capitolo 2 Distribuzioni di frequenza

Capitolo 2 Distribuzioni di frequenza Edizioni Simone - Vol. 43/1 Compendio di statistica Capitolo 2 Distribuzioni di frequenza Sommario 1. Distribuzioni semplici. - 2. Distribuzioni doppie. - 3. Distribuzioni parziali: condizionate e marginali.

Dettagli

Come descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva. Brugnaro Luca

Come descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva. Brugnaro Luca Come descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva Brugnaro Luca Progetto formativo complessivo Obiettivo: incrementare le competenze degli operatori sanitari nelle metodiche

Dettagli

Statistica descrittiva

Statistica descrittiva Corso di Laurea in Ingegneria per l Ambiente ed il Territorio Corso di Costruzioni Idrauliche A.A. 2004-05 www.dica.unict.it/users/costruzioni Statistica descrittiva Ing. Antonino Cancelliere Dipartimento

Dettagli

ESAME DI STATISTICA Nome: Cognome: Matricola:

ESAME DI STATISTICA Nome: Cognome: Matricola: ESAME DI STATISTICA Nome: Cognome: Matricola: ISTRUZIONI: Per la prova è consentito esclusivamente l uso di una calcolatrice tascabile, delle tavole della normale e della t di Student. I risultati degli

Dettagli

Statistica. Le rappresentazioni grafiche

Statistica. Le rappresentazioni grafiche Statistica Le rappresentazioni grafiche Introduzione Le rappresentazioni grafiche costituiscono uno dei mezzi più efficaci, sia per descrivere in forma visiva i risultati di numerose osservazioni riguardanti

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2014-2015 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

Prova di autovalutazione Prof. Roberta Siciliano

Prova di autovalutazione Prof. Roberta Siciliano Prova di autovalutazione Prof. Roberta Siciliano Esercizio 1 Nella seguente tabella è riportata la distribuzione di frequenza dei prezzi per camera di alcuni agriturismi, situati nella regione Basilicata.

Dettagli

La distribuzione Normale. La distribuzione Normale

La distribuzione Normale. La distribuzione Normale La Distribuzione Normale o Gaussiana è la distribuzione più importante ed utilizzata in tutta la statistica La curva delle frequenze della distribuzione Normale ha una forma caratteristica, simile ad una

Dettagli

Statistica descrittiva: prime informazioni dai dati sperimentali

Statistica descrittiva: prime informazioni dai dati sperimentali SECONDO APPUNTAMENTO CON LA SPERIMENTAZIONE IN AGRICOLTURA Statistica descrittiva: prime informazioni dai dati sperimentali La statistica descrittiva rappresenta la base di partenza per le applicazioni

Dettagli

Indice Statistiche Univariate Statistiche Bivariate

Indice Statistiche Univariate Statistiche Bivariate Indice 1 Statistiche Univariate 1 1.1 Importazione di un file.data.............................. 1 1.2 Medie e variabilità................................... 6 1.3 Distribuzioni di frequenze...............................

Dettagli

Slide Cerbara parte1 5. Le distribuzioni teoriche

Slide Cerbara parte1 5. Le distribuzioni teoriche Slide Cerbara parte1 5 Le distribuzioni teoriche I fenomeni biologici, demografici, sociali ed economici, che sono il principale oggetto della statistica, non sono retti da leggi matematiche. Però dalle

Dettagli

METODOLOGIA STATISTICA E CLASSIFICAZIONE DEI DATI

METODOLOGIA STATISTICA E CLASSIFICAZIONE DEI DATI METODOLOGIA STATISTICA E CLASSIFICAZIONE DEI DATI 1.1 La Statistica La Statistica è la scienza che raccoglie, elabora ed interpreta i dati (informazioni) relativi ad un dato fenomeno oggetto di osservazione.

Dettagli

RAPPRESENTAZIONE DEI DATI

RAPPRESENTAZIONE DEI DATI Rappresentazione dei Dati RAPPRESENTAZIONE DEI DATI Quando si dispone di un alto numero di misure della stessa grandezza fisica è opportuno organizzarle in modo da rendere evidente Quandoil si loro dispone

Dettagli

LA STATISTICA E IL CALCOLO DELLE PROBABILITÀ

LA STATISTICA E IL CALCOLO DELLE PROBABILITÀ LA STATISTICA E IL CALCOLO DELLE PROBABILITÀ Prof. Francesco Tottoli Versione 3 del 20 febbraio 2012 DEFINIZIONE È una scienza giovane e rappresenta uno strumento essenziale per la scoperta di leggi e

Dettagli

ESERCIZI SVOLTI PER LA PROVA DI STATISTICA

ESERCIZI SVOLTI PER LA PROVA DI STATISTICA ESERCIZI SVOLTI PER LA PROVA DI STATISTICA Stefania Naddeo (anno accademico 4/5) INDICE PARTE PRIMA: STATISTICA DESCRITTIVA. DISTRIBUZIONI DI FREQUENZA E FUNZIONE DI RIPARTIZIONE. VALORI CARATTERISTICI

Dettagli

Conoscenza. Metodo scientifico

Conoscenza. Metodo scientifico Conoscenza La conoscenza è la consapevolezza e la comprensione di fatti, verità o informazioni ottenuti attraverso l'esperienza o l'apprendimento (a posteriori), ovvero tramite l'introspezione (a priori).

Dettagli

Lezione 1. Concetti Fondamentali

Lezione 1. Concetti Fondamentali Lezione 1 Concetti Fondamentali 1 Sonetto di Trilussa Sai ched è la statistica? E E na cosa che serve pe fa un conto in generale de la gente che nasce, che sta male, che more, che va in carcere e che sposa.

Dettagli

1. Distribuzioni campionarie

1. Distribuzioni campionarie Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 2012/2013 lezioni di statistica del 3 e 6 giugno 2013 - di Massimo Cristallo - 1. Distribuzioni campionarie

Dettagli

Dr. Marco Vicentini marco.vicentini@unipd.it Anno Accademico 2010 2011 Rev 30/03/2011

Dr. Marco Vicentini marco.vicentini@unipd.it Anno Accademico 2010 2011 Rev 30/03/2011 Università degli Studi di Padova Facoltà di Psicologia, L4, Psicometria, Modulo B Dr. Marco Vicentini marco.vicentini@unipd.it Anno Accademico 2010 2011 Rev 30/03/2011 Statistica descrittiva e inferenziale

Dettagli

CLASSIFICAZIONE DEI CARATTERI

CLASSIFICAZIONE DEI CARATTERI CLASSIFICAZIONE DEI CARATTERI Come abbiamo visto, su ogni unità statistica si rilevano una o più informazioni di interesse (caratteri). Il modo in cui un carattere si manifesta in un unità statistica è

Dettagli

Analisi della performance temporale della rete

Analisi della performance temporale della rete Analisi della performance temporale della rete In questo documento viene analizzato l andamento nel tempo della performance della rete di promotori. Alcune indicazioni per la lettura di questo documento:

Dettagli

matematica probabilmente

matematica probabilmente IS science centre immaginario scientifico Laboratorio dell'immaginario Scientifico - Trieste tel. 040224424 - fax 040224439 - e-mail: lis@lis.trieste.it - www.immaginarioscientifico.it indice Altezze e

Dettagli

LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE

LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE DESCRIZIONE DEI DATI DA ESAMINARE Sono stati raccolti i dati sul peso del polmone di topi normali e affetti da una patologia simile

Dettagli

Indici (Statistiche) che esprimono le caratteristiche di simmetria e

Indici (Statistiche) che esprimono le caratteristiche di simmetria e Indici di sintesi Indici (Statistiche) Gran parte della analisi statistica consiste nel condensare complessi pattern di osservazioni in un indicatore che sia capace di riassumere una specifica caratteristica

Dettagli

PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE

PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) PROBABILITÀ -

Dettagli

Modelli descrittivi, statistica e simulazione

Modelli descrittivi, statistica e simulazione Modelli descrittivi, statistica e simulazione Master per Smart Logistics specialist Roberto Cordone (roberto.cordone@unimi.it) Statistica descrittiva Cernusco S.N., giovedì 21 gennaio 2016 (9.00/13.00)

Dettagli

Elementi di statistica descrittiva I 31 Marzo 2009

Elementi di statistica descrittiva I 31 Marzo 2009 Il Concetti generali di Statistica) Corso Esperto in Logistica e Trasporti Elementi di Statistica applicata Elementi di statistica descrittiva I Marzo 009 Concetti Generali di Statistica F. Caliò franca.calio@polimi.it

Dettagli

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: Esempi di domande risposta multipla (Modulo II) 1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: 1) ha un numero di elementi pari a 5; 2) ha un numero di elementi

Dettagli

STATISTICA DESCRITTIVA UNIVARIATA

STATISTICA DESCRITTIVA UNIVARIATA Capitolo zero: STATISTICA DESCRITTIVA UNIVARIATA La STATISTICA è la scienza che si occupa di fenomeni collettivi che richiedono lo studio di un grande numero di dati. Il termine STATISTICA deriva dalla

Dettagli

Indici di dispersione

Indici di dispersione Indici di dispersione 1 Supponiamo di disporre di un insieme di misure e di cercare un solo valore che, meglio di ciascun altro, sia in grado di catturare le caratteristiche della distribuzione nel suo

Dettagli

LA STATISTICA NEI TEST INVALSI

LA STATISTICA NEI TEST INVALSI LA STATISTICA NEI TEST INVALSI 1 Prova Nazionale 2011 Osserva il grafico seguente che rappresenta la distribuzione percentuale di famiglie per numero di componenti, in base al censimento 2001. Qual è la

Dettagli

ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE

ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE e-mail: tommei@dm.unipi.it web: www.dm.unipi.it/ tommei Ricevimento: su appuntamento Dipartimento di Matematica, piano terra, studio 114

Dettagli

PROGRAMMA SVOLTO NELLA SESSIONE N.

PROGRAMMA SVOLTO NELLA SESSIONE N. Università C. Cattaneo Liuc, Corso di Statistica, Sessione n. 1, 2014 Laboratorio Excel Sessione n. 1 Venerdì 031014 Gruppo PZ Lunedì 061014 Gruppo AD Martedì 071014 Gruppo EO PROGRAMMA SVOLTO NELLA SESSIONE

Dettagli

ESERCIZI DI STATISTICA DESCRITTIVA

ESERCIZI DI STATISTICA DESCRITTIVA ESERCIZI DI STATISTICA DESCRITTIVA ES1 Data la seguente serie di dati su Sesso e Altezza di 8 pazienti, riempire opportunamente due tabelle per rappresentare le distribuzioni di frequenze dei due caratteri,

Dettagli

Elementi di Statistica descrittiva Parte I

Elementi di Statistica descrittiva Parte I Elementi di Statistica descrittiva Parte I Che cos è la statistica Metodo di studio di caratteri variabili, rilevabili su collettività. La statistica si occupa di caratteri (ossia aspetti osservabili)

Dettagli

Analisi e diagramma di Pareto

Analisi e diagramma di Pareto Analisi e diagramma di Pareto L'analisi di Pareto è una metodologia statistica utilizzata per individuare i problemi più rilevanti nella situazione in esame e quindi le priorità di intervento. L'obiettivo

Dettagli

LA CORRELAZIONE LINEARE

LA CORRELAZIONE LINEARE LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad esempio, si può supporre che vi sia una relazione tra l insoddisfazione

Dettagli

PROGETTO INDAGINE DI OPINIONE SUL PROCESSO DI FUSIONE DEI COMUNI NEL PRIMIERO

PROGETTO INDAGINE DI OPINIONE SUL PROCESSO DI FUSIONE DEI COMUNI NEL PRIMIERO PROGETTO INDAGINE DI OPINIONE SUL PROCESSO DI FUSIONE DEI COMUNI NEL PRIMIERO L indagine si è svolta nel periodo dal 26 agosto al 16 settembre 2014 con l obiettivo di conoscere l opinione dei residenti

Dettagli

Statistica. Lezione 6

Statistica. Lezione 6 Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 6 a.a 011-01 Dott.ssa Daniela Ferrante

Dettagli

Dott.ssa Caterina Gurrieri

Dott.ssa Caterina Gurrieri Dott.ssa Caterina Gurrieri Le relazioni tra caratteri Data una tabella a doppia entrata, grande importanza riveste il misurare se e in che misura le variabili in essa riportata sono in qualche modo

Dettagli

LE SUCCESSIONI 1. COS E UNA SUCCESSIONE

LE SUCCESSIONI 1. COS E UNA SUCCESSIONE LE SUCCESSIONI 1. COS E UNA SUCCESSIONE La sequenza costituisce un esempio di SUCCESSIONE. Ecco un altro esempio di successione: Una successione è dunque una sequenza infinita di numeri reali (ma potrebbe

Dettagli

Brugnaro Luca Boscaro Gianni (2009) 1

Brugnaro Luca Boscaro Gianni (2009) 1 STATISTICA PER LE PROFESSIONI SANITARIE - LIVELLO BASE Brugnaro Luca Boscaro Gianni (2009) 1 Perché la statistica Prendere decisioni Bibliografia non soddisfacente Richieste nuove conoscenze Raccolta delle

Dettagli

INDICI DI TENDENZA CENTRALE

INDICI DI TENDENZA CENTRALE INDICI DI TENDENZA CENTRALE NA Al fine di semplificare la lettura e l interpretazione di un fenomeno oggetto di un indagine statistica, i dati possono essere: organizzati in una insieme di dati statistici

Dettagli

STATISTICA 1 ESERCITAZIONE 1 CLASSIFICAZIONE DELLE VARIABILI CASUALI

STATISTICA 1 ESERCITAZIONE 1 CLASSIFICAZIONE DELLE VARIABILI CASUALI STATISTICA 1 ESERCITAZIONE 1 Dott. Giuseppe Pandolfo 30 Settembre 2013 Popolazione statistica: insieme degli elementi oggetto dell indagine statistica. Unità statistica: ogni elemento della popolazione

Dettagli

Calcolo delle probabilità

Calcolo delle probabilità Calcolo delle probabilità Laboratorio di Bioinformatica Corso A aa 2005-2006 Statistica Dai risultati di un esperimento si determinano alcune caratteristiche della popolazione Calcolo delle probabilità

Dettagli

Metodi Matematici ed Informatici per la Biologia Esame Finale, I appello 1 Giugno 2007

Metodi Matematici ed Informatici per la Biologia Esame Finale, I appello 1 Giugno 2007 Metodi Matematici ed Informatici per la Biologia Esame Finale, I appello 1 Giugno 2007 Nome: Alberto Cognome: De Sole Matricola: 01234567890 Codice 9784507811 Esercizio Risposta Voto 1 a b c d e 1 2 V

Dettagli

Il significato della MEDIA e della MEDIANA in una raccolta di dati numerici

Il significato della MEDIA e della MEDIANA in una raccolta di dati numerici Il significato della MEDIA e della MEDIANA in una raccolta di dati numerici Ogni qual volta si effettua una raccolta di dati di tipo numerico è inevitabile fornirne il valore medio. Ma che cos è il valore

Dettagli

PROGETTO EM.MA PRESIDIO

PROGETTO EM.MA PRESIDIO PROGETTO EM.MA PRESIDIO di PIACENZA Bentornati Il quadro di riferimento di matematica : INVALSI e TIMSS A CONFRONTO LE PROVE INVALSI Quadro di riferimento per la valutazione Quadro di riferimento per i

Dettagli

Analisi di dati di frequenza

Analisi di dati di frequenza Analisi di dati di frequenza Fase di raccolta dei dati Fase di memorizzazione dei dati in un foglio elettronico 0 1 1 1 Frequenze attese uguali Si assuma che dalle risposte al questionario sullo stato

Dettagli

Una sperimentazione. Probabilità. Una previsione. Calcolo delle probabilità. Nonostante ciò, è possibile dire qualcosa.

Una sperimentazione. Probabilità. Una previsione. Calcolo delle probabilità. Nonostante ciò, è possibile dire qualcosa. Una sperimentazione Probabilità Si sta sperimentando l efficacia di un nuovo farmaco per il morbo di Parkinson. Duemila pazienti partecipano alla sperimentazione: metà di essi vengono trattati con il nuovo

Dettagli

CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI

CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI VERO FALSO CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI 1. V F Un ipotesi statistica è un assunzione sulle caratteristiche di una o più variabili in una o più popolazioni 2. V F L ipotesi nulla unita

Dettagli

ANALISI DELLE FREQUENZE: IL TEST CHI 2

ANALISI DELLE FREQUENZE: IL TEST CHI 2 ANALISI DELLE FREQUENZE: IL TEST CHI 2 Quando si hanno scale nominali o ordinali, non è possibile calcolare il t, poiché non abbiamo medie, ma solo frequenze. In questi casi, per verificare se un evento

Dettagli

Corso di Psicometria Progredito

Corso di Psicometria Progredito Corso di Psicometria Progredito 1. La quantificazione in psicologia Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014 Sommario 1 Introduzione

Dettagli

2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale

2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale BIOSTATISTICA 2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 12-Il t-test per campioni appaiati vers. 1.2 (7 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione)

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione) Esercitazione #5 di Statistica Test ed Intervalli di Confidenza (per una popolazione) Dicembre 00 1 Esercizi 1.1 Test su media (con varianza nota) Esercizio n. 1 Il calore (in calorie per grammo) emesso

Dettagli

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010 LEZIONE 3 "Educare significa aiutare l'animo dell'uomo ad entrare nella totalità della realtà. Non si può però educare se non rivolgendosi alla libertà, la quale definisce il singolo, l'io. Quando uno

Dettagli

Lezione 1. Concetti Fondamentali

Lezione 1. Concetti Fondamentali Lezione 1 Concetti Fondamentali Sonetto di Trilussa Sai ched è la statistica? E na cosa che serve pe fa un conto in generale de la gente che nasce, che sta male, che more, che va in carcere e che sposa.

Dettagli

11. Analisi statistica degli eventi idrologici estremi

11. Analisi statistica degli eventi idrologici estremi . Analisi statistica degli eventi idrologici estremi I processi idrologici evolvono, nello spazio e nel tempo, secondo modalità che sono in parte predicibili (deterministiche) ed in parte casuali (stocastiche

Dettagli

Premesse alla statistica

Premesse alla statistica Premesse alla statistica Versione 22.10.08 Premesse alla statistica 1 Insiemi e successioni I dati di origine sperimentale si presentano spesso non come singoli valori, ma come insiemi di valori. Richiamiamo

Dettagli

Statistica e biometria. D. Bertacchi. Variabili aleatorie. V.a. discrete e continue. La densità di una v.a. discreta. Esempi.

Statistica e biometria. D. Bertacchi. Variabili aleatorie. V.a. discrete e continue. La densità di una v.a. discreta. Esempi. Iniziamo con definizione (capiremo fra poco la sua utilità): DEFINIZIONE DI VARIABILE ALEATORIA Una variabile aleatoria (in breve v.a.) X è funzione che ha come dominio Ω e come codominio R. In formule:

Dettagli

Chi non risolve esercizi non impara la matematica.

Chi non risolve esercizi non impara la matematica. 120 statistica 6.5 esercizi hi non risolve esercizi non impara la matematica. 1 a un indagine sulla distribuzione delle altezze in un gruppo di studenti sono stati rilevati i seguenti valori grezzi (espressi

Dettagli

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008 Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica 18 dicembre 008 Esame sull intero programma: esercizi da A a D Esame sulla seconda parte del programma: esercizi

Dettagli

CORSO DI STATISTICA La Misurazione, Scale di Misura, Errori di Misura

CORSO DI STATISTICA La Misurazione, Scale di Misura, Errori di Misura CORSO DI STATISTICA La Misurazione, Scale di Misura, Errori di Misura Bruno Mario Cesana Bruno M. Cesana 1 MISURAZIONE La figura 1.1 è tratta da: Bossi A. et al.: Introduzione alla Statistica Medica A

Dettagli

IL SOFTWARE EXCEL 4 I GRAFICI

IL SOFTWARE EXCEL 4 I GRAFICI IL SOFTWARE EXCEL 4 I GRAFICI I GRAFICI E se questi dati volessimo trasformarli in grafico? I GRAFICI: I GRAFICI: Ogni tipo di grafico ha una sua peculiarità. Dal punto di vista statistico i grafici NON

Dettagli

SPC e distribuzione normale con Access

SPC e distribuzione normale con Access SPC e distribuzione normale con Access In questo articolo esamineremo una applicazione Access per il calcolo e la rappresentazione grafica della distribuzione normale, collegata con tabelle di Clienti,

Dettagli

1. PRIME PROPRIETÀ 2

1. PRIME PROPRIETÀ 2 RELAZIONI 1. Prime proprietà Il significato comune del concetto di relazione è facilmente intuibile: due elementi sono in relazione se c è un legame tra loro descritto da una certa proprietà; ad esempio,

Dettagli

ALLEGATO 1 Analisi delle serie storiche pluviometriche delle stazioni di Torre del Lago e di Viareggio.

ALLEGATO 1 Analisi delle serie storiche pluviometriche delle stazioni di Torre del Lago e di Viareggio. ALLEGATO 1 Analisi delle serie storiche pluviometriche delle stazioni di Torre del Lago e di Viareggio. Per una migliore caratterizzazione del bacino idrologico dell area di studio, sono state acquisite

Dettagli

Corso di laurea in Economia e Gestione delle Arti e delle Attività Culturali a.a. 2003-2004 INTRODUZIONE ALLA STATISTICA DESCRITTIVA

Corso di laurea in Economia e Gestione delle Arti e delle Attività Culturali a.a. 2003-2004 INTRODUZIONE ALLA STATISTICA DESCRITTIVA Corso di laurea in Economia e Gestione delle Arti e delle Attività Culturali a.a. 2003-2004 INTRODUZIONE ALLA STATISTICA DESCRITTIVA Prof. Stefania Funari Parte I TERMINOLOGIA STATISTICA e CONCETTI INTRODUTTIVI

Dettagli

(concetto classico di probabilità)

(concetto classico di probabilità) Probabilità matematica (concetto classico di probabilità) Teoria ed esempi Introduzione Il calcolo delle probabilità è la parte della matematica che si occupa di prevedere, sulla base di regole e leggi

Dettagli

Probabilità discreta

Probabilità discreta Probabilità discreta Daniele A. Gewurz 1 Che probabilità c è che succeda...? Una delle applicazioni della combinatoria è nel calcolo di probabilità discrete. Quando abbiamo a che fare con un fenomeno che

Dettagli

Psicometria (8 CFU) Corso di Laurea triennale STANDARDIZZAZIONE

Psicometria (8 CFU) Corso di Laurea triennale STANDARDIZZAZIONE Psicometria (8 CFU) Corso di Laurea triennale Un punteggio all interno di una distribuzione è in realtà privo di significato se preso da solo. Sapere che un soggetto ha ottenuto un punteggio x=52 in una

Dettagli

LA STATISTICA si interessa del rilevamento, dell elaborazione e dello studio dei dati; studia ciò che accade o come è fatto un gruppo numeroso di

LA STATISTICA si interessa del rilevamento, dell elaborazione e dello studio dei dati; studia ciò che accade o come è fatto un gruppo numeroso di STATISTICA LA STATISTICA si interessa del rilevamento, dell elaborazione e dello studio dei dati; studia ciò che accade o come è fatto un gruppo numeroso di oggetti; cerca, attraverso l uso della matematica

Dettagli

Metodi Matematici e Informatici per la Biologia----31 Maggio 2010

Metodi Matematici e Informatici per la Biologia----31 Maggio 2010 Metodi Matematici e Informatici per la Biologia----31 Maggio 2010 COMPITO 4 (3 CREDITI) Nome: Cognome: Matricola: ISTRUZIONI Gli esercizi che seguono sono di tre tipi: Domande Vero/Falso: cerchiate V o

Dettagli

Titolo della lezione. Analisi dell associazione tra due caratteri: indipendenza e dipendenza

Titolo della lezione. Analisi dell associazione tra due caratteri: indipendenza e dipendenza Titolo della lezione Analisi dell associazione tra due caratteri: indipendenza e dipendenza Introduzione Analisi univariata, bivariata, multivariata Analizzare le relazioni tra i caratteri, per cercare

Dettagli

[ Analisi della. concentrazione] di Luca Vanzulli. Pag. 1 di 1

[ Analisi della. concentrazione] di Luca Vanzulli. Pag. 1 di 1 [ Analisi della concentrazione] di Luca Vanzulli Pag. 1 di 1 LA CONCENTRAZIONE NELL ANALISI DELLE VENDITE L analisi periodica delle vendite rappresenta un preziosissimo indicatore per il monitoraggio del

Dettagli

Statistiche campionarie

Statistiche campionarie Statistiche campionarie Sul campione si possono calcolare le statistiche campionarie (come media campionaria, mediana campionaria, varianza campionaria,.) Le statistiche campionarie sono stimatori delle

Dettagli

Lezione 18 1. Introduzione

Lezione 18 1. Introduzione Lezione 18 1 Introduzione In questa lezione vediamo come si misura il PIL, l indicatore principale del livello di attività economica. La definizione ed i metodi di misura servono a comprendere a quali

Dettagli

LE FUNZIONI A DUE VARIABILI

LE FUNZIONI A DUE VARIABILI Capitolo I LE FUNZIONI A DUE VARIABILI In questo primo capitolo introduciamo alcune definizioni di base delle funzioni reali a due variabili reali. Nel seguito R denoterà l insieme dei numeri reali mentre

Dettagli

Regressione Mario Guarracino Data Mining a.a. 2010/2011

Regressione Mario Guarracino Data Mining a.a. 2010/2011 Regressione Esempio Un azienda manifatturiera vuole analizzare il legame che intercorre tra il volume produttivo X per uno dei propri stabilimenti e il corrispondente costo mensile Y di produzione. Volume

Dettagli

VERIFICA DELLE IPOTESI

VERIFICA DELLE IPOTESI VERIFICA DELLE IPOTESI Nella verifica delle ipotesi è necessario fissare alcune fasi prima di iniziare ad analizzare i dati. a) Si deve stabilire quale deve essere l'ipotesi nulla (H0) e quale l'ipotesi

Dettagli

Corso integrato di informatica, statistica e analisi dei dati sperimentali Altri esercizi_esercitazione V

Corso integrato di informatica, statistica e analisi dei dati sperimentali Altri esercizi_esercitazione V Corso integrato di informatica, statistica e analisi dei dati sperimentali Altri esercizi_esercitazione V Sui PC a disposizione sono istallati diversi sistemi operativi. All accensione scegliere Windows.

Dettagli

Corso di Analisi Statistica per le Imprese (9 CFU) Prof. L. Neri a.a. 2011-2012

Corso di Analisi Statistica per le Imprese (9 CFU) Prof. L. Neri a.a. 2011-2012 Corso di Analisi Statistica per le Imprese (9 CFU) Prof. L. Neri a.a. 2011-2012 1 Riepilogo di alcuni concetti base Concetti di base: unità e collettivo statistico; popolazione e campione; caratteri e

Dettagli

STATISTICA DESCRITTIVA - SCHEDA N. 1 VARIABILI QUALITATIVE

STATISTICA DESCRITTIVA - SCHEDA N. 1 VARIABILI QUALITATIVE Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) STATISTICA DESCRITTIVA

Dettagli

7.2 Indagine di Customer Satisfaction

7.2 Indagine di Customer Satisfaction 7.2 Indagine di Customer Satisfaction Il campione L indagine è stata condotta su un campione a più stadi di 795 clienti TIEMME SpA (errore di campionamento +/ 2%) rappresentativo della popolazione obiettivo,

Dettagli

Note per la lettura dei report

Note per la lettura dei report Note per la lettura dei report Report strutturali 0. IMPRESE REGISTRATE PER STATO DI ATTIVITÀ. ANNO 2012 E TASSO DI CRESCITA 2012 Contiene la distribuzione dell insieme delle imprese registrate, ovvero

Dettagli