STATA. e la BIOSTATISTICA di Norman - Streiner. Prof. Pierpaolo Vittorini

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "STATA. e la BIOSTATISTICA di Norman - Streiner. Prof. Pierpaolo Vittorini pierpaolo.vittorini@univaq.it"

Transcript

1 e la BIOSTATISTICA di Norman - Streiner Università degli Studi dell Aquila Facoltà di Medicina e Chirurgia 14 febbraio 2013

2 Contenuti e obiettivi Breve riassunto applicativo dei test statistici Gestione dei dati in Sintassi generale Comandi principali Creazione di un dataset in Grafici Statistica descrittiva Regressione Cenni di statistica non parametrica Cenni sull analisi della sopravvivenza

3 Concetti preliminari Introduzione Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi Tipi di variabili Numerica Una variabile numerica è generalmente una misura che può assumere un valore nel dominio dei numeri reali (e.g., l età, il peso, il livello di colesterolo, etc.) Ordinale Una variabile ordinale è una variabile che presenta differenti livelli di codifica con un preciso ordine fra i livelli (e.g., il livello di scolarità) Nominale Una variabile nominale è una variabile che presenta differenti livelli di codifica senza un preciso ordine fra i livelli (e.g., il sesso)

4 Concetti preliminari (2) Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi Domande dell analisi statistica Statistica descrittiva Tendenza centrale: qual è il valore che descrive la tendenza della mia variabile? Dispersione: quanto sono concentrati intorno al valore di tendenza centrale le mie osservazioni? Differenza: c è differenza fra le osservazioni? Associazione: c è associazione fra variabili?

5 Tendenza centrale Introduzione Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi Per variabili numeriche media Per variabili ordinali mediana Per variabili nominali moda

6 Dispersione Introduzione Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi Per variabili numeriche varianza o s.q.m. Per variabili ordinali range (max-min) Per variabili nominali numero di categorie

7 Differenza Introduzione Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi Per testare l ipotesi che esistano differenze fra le mie osservazioni, il primo discriminante è sul tipo di variabile Se le osservazioni provengono da variabili ordinali o numeriche, Oppure se provengono da variabili nominali

8 Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi Differenza - Variabili ordinali o numeriche La prima domanda che devo pormi è sul numero di gruppi che ho all interno delle mie osservazioni Se ho dei pazienti e voglio confrontarne il livello di colesterolo con la media nazionale, allora ho un solo gruppo Se ho dei pazienti e voglio confrontare il livello di colesterolo dei maschi rispetto a quello delle femmine, allora ho due gruppi

9 Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi Differenza - Variabili ordinali o numeriche - 1 gruppo Se il numero di osservazioni è superiore a 30, allora eseguo un t-test Se il numero di osservazioni è minore di 30, allora Eseguo un test di normalità (e.g., Shapiro-Wilk) Se la distribuzione è normale, allora eseguo un t-test Altrimenti, eseguo un sign-test

10 Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi Differenza - Variabili ordinali o numeriche - 2 gruppi La domanda che devo pormi è sulla dipendenza/indipendenza dei due gruppi Due gruppi sono indipendenti se le osservazioni sono prese da soggetti tra di loro indipendenti Il peso di un soggetto preso prima e dopo una cura dimagrante forma due gruppi dipendenti (lo stesso soggetto) Il livello di colesterolo fra maschi e femmine forma due gruppi indipendenti (sono soggetti differenti)

11 Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi Differenza - Variabili ordinali o numeriche - 2 gruppi indipendenti Se il numero di osservazioni è superiore a 30, allora eseguo un t-test Se il numero di osservazioni è minore di 30, allora Eseguo un test di normalità (e.g., Shapiro-Wilk) Se la distribuzione è normale, allora Eseguo un test sull uguaglianza delle varianze (e.g. variance-ratio test) Se le varianze sono uguali e i due gruppi hanno la medesima numerosità, allora eseguo un t-test Altrimenti, eseguo un rank-sum test di Wilcoxon Altrimenti, eseguo un rank-sum test di Wilcoxon

12 Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi Differenza - Variabili ordinali o numeriche - 2 gruppi dipendenti Se il numero di osservazioni è superiore a 30, allora eseguo un t-test per dati appaiati Se il numero di osservazioni è minore di 30, allora Eseguo un test di normalità (e.g., Shapiro-Wilk) Se la distribuzione è normale, allora eseguo un t-test per dati appaiati Altrimenti, eseguo un signed-ranks test di Wilcoxon

13 Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi Differenza - Variabili ordinali o numeriche - 3 o più gruppi La domanda che devo pormi è ancora sulla dipendenza/indipendenza dei tre o più gruppi

14 Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi Differenza - Variabili ordinali o numeriche - 3 o più gruppi indipendenti Eseguo un test di normalità (e.g., Shapiro-Wilk) Se la distribuzione è normale, allora Se il numero di fattori 1 è unitario, allora eseguo una ANOVA a 1-dimensione Altrimenti, eseguo una ANOVA generalizzata 1 Data la variabile sulla quale investighiamo la differenza chiamata di risposta, per numero di fattori si intende quante variabili sono da considersi fattori di influenza nella variabile di risposta.

15 Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi Differenza - Variabili ordinali o numeriche - 3 o più gruppi dipendenti Eseguo un test di normalità (e.g., Shapiro-Wilk) Se la distribuzione è normale, allora eseguo una ANOVA per misure ripetute Altrimenti, eseguo un test di Friedman

16 Differenza - Variabili nominali Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi La domanda che ancora una volta devo pormi è sul numero di gruppi

17 Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi Differenza - Variabili nominali - 1 gruppo Eseguo il test binomiale

18 Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi Differenza - Variabili nominali - 2 gruppi Se i gruppi sono indipendenti Se le frequenze sono tutte superiori a 5, allora eseguo il test esatto di Fisher Altrimenti, eseguo il test del χ 2 Altrimenti, eseguo il χ 2 di McNemar oppure il Kappa

19 Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi Differenza - Variabili nominali - 3 o più gruppi Se i gruppi sono indipendenti Se le frequenze sono tutte superiori a 5, allora eseguo il test esatto di Fisher Altrimenti, eseguo il test del χ 2 Altrimenti, eseguo il test Q di Cochran

20 Associazione Introduzione Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi Per investigare circa l esistenza di associazione fra due o più variabili, il primo discriminante è proprio il numero di variabili nelle quali cerco la presenza di associazione

21 Associazione - 2 variabili Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi Se variabili nominali rischio relativo Se variabili ordinali ρ di Spearman Se variabili numeriche Se esiste una variabile dipendente e una indipendente, allora eseguo una regressione lineare Altrimenti, eseguo una correlazione di Pearson

22 Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi Associazione - 2 o più variabili indipendenti Se le variabili indipendenti sono due o più, allora il primo discriminante è sul tipo delle variabili indipendenti, cioè se tutte nominali, oppure se ne troviamo alcune numeriche

23 Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi Associazione - 2 o più variabili indipendenti nominali Se la variabile dipendente è nominale, allora Se abbiamo dei censored 2, allora eseguo il metodo di Kaplan-Meier Altrimenti Se abbiamo una variabile di confondimento 3, allora eseguo il test di Mantel-Haenszel Altrimenti, eseguo l analisi log-lineare Altrimenti Se abbiamo dei censored, allora eseguo il metodo di Cox Altrimenti eseguo l ANOVA 2 In questa situazione, ci troviamo di fronte ad una analisi della sopravvivenza, in cui i censored sono i soggetti che perdiamo durante lo studio 3 Una variabile di confondimento è una variabile che può influenzare l esistenza di una dipendenza: e.g. il peso di un bambino e il reddito familiare sembrano essere in relazione. Una variabile di confondimento potrebbe essere l età del bambino.

24 Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi Associazione - 2 o più variabili indipendenti nominali e numeriche Se la variabile dipendente è nominale, allora Se il suo numero di valori è dicotomico, allora eseguo una regressione logistica Altrimenti eseguo l analisi dei discriminanti Altrimenti Se abbiamo dei censored, allora eseguo il metodo di Cox Altrimenti Se abbiamo una variabile di confondimento, allora eseguo l ANCOVA Altrimenti, eseguo una regressione multipla

25 Introduzione a Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi è un pacchetto statistico per la manipolazione, l analisi e la resa in formato grafico di dati è disponibile per molte piattaforme, ed è usabile alla stregua di una applicazione sia point-and-click che a linea di comando

26 Terminologia Introduzione Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi Dataset: l insieme di dati a mia disposizione Soggetto: è ciò che mi propongo di studiare (e.g., un paziente) Variabile: è la rappresentazione di un fenomeno reale appartente ai soggetti in esame (e.g., posso scegliere di indicare con la variabile altezza il fenomeno corrispondente all altezza dei miei soggetti in cm) Osservazione: è la misura di una o più variabili di un determinato soggetto (e.g., una osservazione può valere 175cm per la variabile altezza riferita ad un certo soggetto)

27 La prima esecuzione di Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi

28 Interagire con Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi L interazione con avviene lanciando comandi È possibile digitare i comandi, costruirli tramite l interfaccia grafica, oppure scriverli all interno di un do-file La prima opzione è da preferire per comandi semplici La seconda opzione è da preferire per comandi complessi La terza opzione è da preferire quando si deve elaborare più di una volta un dataset

29 Interagire con (2) Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi L output di una elaborazione può essere memorizzato all interno di un file di log Un file di log si apre, si può sospendere/continuare, quindi si chiude, poi lo si può visualizzare (anche per farne un copia/incolla verso un programma di wordprocessing), o eventualmente convertire in altri formati.

30 Caricare/salvare i dati in Stata Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi In Stata è possibile caricare/salvare dati dal suo formato nativo (.dta) da una sorgente esterna (e.g., Excel) Formato nativo GUI Comando Caricare File Open use file.dta Salvare File Save save file.dta

31 Caricare/salvare i dati in Stata (2) Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi Per caricare/salvare dati da una sorgente esterna in Stata è possibile usare Stat/Transfer usare un formato di interscambio (e.g., CSV) Formato di interscambio per importare: File Import [Formato] per esportare: File Export [Formato]

32 Creazione di un dataset Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi Quando il trattamento che deve essere fatto ai dati è esclusivamente statistico (i.e., non ci sono query da fare, etc.) è vantaggioso creare il dataset direttamente dentro La creazione di un nuovo dataset procede secondo i seguenti passi Impostazione del numero di osservazioni Creazione delle variabili Aggiunta di eventuali etichette Inserimento dei dati

33 Passo 1 Introduzione Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi Impostare il numero di osservazioni set obs [numero] dove numero è il numero di osservazioni Tale numero può essere modificato anche in seguito

34 Passo 2 Introduzione Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi Creare le variabili gen [tipo] [nome] = [ini] dove tipo è il tipo della variabile (int, float, double, str1,..., str80) nome è il nome della variabile ini è il valore iniziale, oppure una espressione, a cui si vuole porre tale variabile

35 Passo 3 Introduzione Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi Aggiungere etichette Le etichette vengono usate, negli output, al posto del nome della variabile Etichettare il dataset Etichettare le variabili Creare eventuali associazioni simboliche sulle variabili (e.g., 0= Maschio 1= Femmina )

36 Passo 3.1 Introduzione Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi Etichettare il dataset label data [etichetta] dove etichetta è una stringa di caratteri (max 80)

37 Passo 3.2 Introduzione Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi Etichettare una variabile label var [variabile] [etichetta] dove variabile è un nome di variabile etichetta è una stringa di caratteri (max 80)

38 Passo 3.3 Introduzione Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi Una associazione simbolica permette di mappare un valore numerico in una descrizione più esplicita 0=Maschio, 1=Femmina 0=Nord, 1=Centro, 2=Sud, 3=Isole... Il tipo della variabile non cambia Creare associazioni simboliche su variabili Creare l associazione Attaccare tale associazione alla variabile

39 Passo Introduzione Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi Creare l associazione label define [nome] [lista] dove nome è un nome simbolico per l associazione lista è una lista di coppie valore/associazione

40 Passo Introduzione Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi Attaccare tale associazione alla variabile label values [variabile] [nome] dove variabile è un nome di variabile nome è un nome simbolico per l associazione

41 Passo 4 Introduzione Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi Inserire fisicamente i dati edit

42 Sintassi dei comandi Stata Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi La sintassi generale di un comando è la seguente [by varlist:] comando [varlist] [=espr] [if espr] [in range] [, opzioni] Nella sua forma più semplice è il solo comando Nella maggior parte dei casi si usa con la sola varlist Nella forma più generale si arricchisce di opzioni, etc.

43 La lista di varibili (varlist) Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi [by varlist:] comando [varlist] [=espr] [if espr] [in range] [, opzioni] Una varlist è semplicemente una lista di variabili separate dallo spazio Ad esempio: nome sesso altezza Una varlist serve per indicare le variabili sulle quali deve essere eseguita una determinata operazione

44 Le opzioni Introduzione Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi [by varlist:] comando [varlist] [=espr] [if espr] [in range] [, opzioni] Le opzioni sono un elenco separato da spazi di istruzioni che permettono di modificare l esecuzione del comando Variano da comando a comando

45 La clausola if Introduzione Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi [by varlist:] comando [varlist] [=espr] [if espr] [in range] [, opzioni] La clausola condizionale if [espr] permette di restringere il campo di applicazione alle sole osservazioni per cui l espressione booleana espr è vera

46 La clausola in Introduzione Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi [by varlist:] comando [varlist] [=espr] [if espr] [in range] [, opzioni] La clausola condizionale in [min/max] permette di restringere il campo di applicazione alle sole osservazioni comprese fra i valori min e max Gli estremi sono compresi

47 La clausola by Introduzione Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi [by varlist:] comando [varlist] [=espr] [if espr] [in range] [, opzioni] La clausola by [var] permette di stratificare le analisi statistiche secondo la variabile var I dati devono essere prima ordinati prima di stratificare un qualsiasi tipo di analisi

48 Il primo comando Introduzione Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi Eseguiamo il comando verinst Il comando va digitato in basso L output appare in alto I comandi vengono memorizzati in una lista

49 Il comando describe Introduzione Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi Il comando describe fornisce delle informazioni aggiuntive sulle variabili passate nella sua varlist Carichiamo il dataset census12.dta e lanciamo il comando describe sulla varlist state marriage rate

50 Il comando list Introduzione Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi Il comando list elenca le osservazioni

51 Il comando summarize Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi Il comando summarize serve per eseguire una statistica descrittiva Lanciamo il comando summarize marriage rate divorce rate

52 Le opzioni Introduzione Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi Ciascun comando può prendere delle opzioni che permettono di modificare l esecuzione di un comando Ad esempio: Aggiungendo l opzione detail al comando summarize, si amplia l analisi descrittiva Vengono infatti forniti I percentili Gli indicatori di asimmetria e di curtosi

53 Le opzioni (2) Introduzione Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi Vogliamo vedere i dettagli dell analisi sul tasso di matrimoni Lanciamo il comando summarize marriage rate, detail

54 La clausola by Introduzione Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi Analizziamo i tassi di matrimoni e divorzi, regione per regione: bisogna anzitutto ordinare i dati: sort region quindi si lancia il comando by region: summarize marriage rate divorce rate oppure in maniera compatta bysort region: summarize marriage rate divorce rate

55 La clausola by (2) Introduzione Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi

56 La clausola if Introduzione Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi Analizziamo i tassi di matrimoni e divorzi per la sola regione West summarize marriage rate divorce rate if region== West

57 La clausola in Introduzione Sintesi dei test statistici Introduzione a Stata Caricamento dati e creazione di un dataset Sintassi generale e primi comandi Analizziamo i tassi di matrimoni e divorzi per le osservazioni dalla 5a alla 25ma summarize marriage rate divorce rate in 5/25

58 Esaminare i dati Introduzione Grafici Statistica descrittiva Diagrammi a barre Istogrammi Grafici two-way (X/Y)

59 Diagrammi a barre Introduzione Grafici Statistica descrittiva Creazione del dataset (tab2-1.dta) s e t obs 5 gen i n t c o r s o=0 gen i n t numero=0 l a b e l v a r i a b l e c o r s o Corso l a b e l v a r i a b l e numero Numero d i s t u d e n t i l a b e l d e f i n e a s s o c 1 S o c i o l o g i a 2 Economia 3 S t o r i a 4 P s i c o l o g i a 5 Aritmetica l a b e l v a l u e s c o r s o a s s o c e d i t

60 Diagrammi a barre (2) Grafici Statistica descrittiva Generazione del grafico graph bar numero, over ( c o r s o ) y t i t l e ( Numero d i s t u d e n t i ) Numero di studenti Sociologia Economia Storia Psicologia Aritmetica

61 Altre tipologie di grafico Grafici Statistica descrittiva Stata supporta molte tipologie di grafici: Diagrammi a barre Verticali - bar Orizzontali - hbar A punti - dot Box - box A torta - pie Ciascun tipo di grafico puó essere creato invocando il comando graph [ t i p o ] v a r i a b i l e, over ( v a r i a b i l e )...

62 Vari tipi di grafico Introduzione Grafici Statistica descrittiva Grafico a barre orizzontali graph hbar numero, over ( c o r s o ) y t i t l e ( Numero d i s t u d e n t i ) Sociologia Economia Storia Psicologia Aritmetica Numero di studenti

63 Vari tipi di grafico (2) Grafici Statistica descrittiva Grafico a punti graph dot numero, over ( c o r s o ) y t i t l e ( Numero d i s t u d e n t i ) Sociologia Economia Storia Psicologia Aritmetica Numero di studenti

64 Vari tipi di grafico (3) Grafici Statistica descrittiva Grafico a torta graph p i e numero, over ( c o r s o ) Sociologia Storia Aritmetica Economia Psicologia

65 Istogrammi Introduzione Grafici Statistica descrittiva Un istogramma é un particolare diagramma a barre Sulle ascisse va posizionata la variabile in esame, mentre sulle ordinate viene posizionata la relativa frequenza La variabile in esame viene raggruppata in classi

66 Esempio Introduzione Grafici Statistica descrittiva s e t obs 100 gen i n t numero=60 uniform ( ) l a b e l v a r i a b l e numero Numero histogram numero, width ( 5 ) s t a r t ( 0 ) y t i t l e ( Frequenza ) f r e q u e n c y Frequenza Numero

67 Esempio Introduzione Grafici Statistica descrittiva Per creare un istogramma delle frequenze relative con classi di ampiezza pari a 4, sui dati creati precedentemente histogram numero, width ( 4 ) s t a r t ( 0 ) y t i t l e ( Frequenza r e l a t i v a ) d e n s i t y Frequenza relativa Numero

68 Grafici Two-Way Introduzione Grafici Statistica descrittiva I grafici two-way sono la piú ampia famiglia di grafici Un grafico twoway si crea invocando il comando twoway ( t i p o v a r l i s t, o p z i o n i ), o p z i o n i dove tipo é il tipo di grafico (scatter, line, connected, lfitci,...) Usare help twoway per la lista di grafici varlist é una lista di variabili (Y e X) opzioni sono le eventuali opzioni

69 Esempi di grafici two-way Grafici Statistica descrittiva Carichiamo il dataset tab12-1.dta e lanciamo il comando twoway ( s c a t t e r CLASS s o g g e t t o ) Cucina+Limousine+Abiti+Salute+Stipendio Soggetto

70 Composizione di grafici two-way Grafici Statistica descrittiva é possibile comporre piú grafici twoway usando la sintassi twoway ( g r a f i c o 1 ) ( g r a f i c o 2 )... ( g r a f i c o N ), o p z i o n i dove grafico1,..., graficon sono i vari grafici I grafici vengono disegnati nell ordine

71 Esempi di grafici complessi Grafici Statistica descrittiva Carichiamo il dataset tab12-1.dta e lanciamo il comando twoway ( scatter CLASS s o g g e t t o ) ( l i n e ADE s o g g e t t o ) Cucina+Limousine+Abiti+Salute+Stipendio/Angolo Di Escursione Soggetto Cucina+Limousine+Abiti+Salute+Stipendio Angolo Di Escursione

72 Esempi di grafici complessi (2) Grafici Statistica descrittiva Carichiamo il dataset tab12-1.dta e lanciamo il comando twoway ( l f i t c i CLASS ADE) ( s c a t t e r CLASS ADE) 95% CI/Fitted values/cucina+limousine+abiti+salute+stipendio Angolo Di Escursione 95% CI Fitted values Cucina+Limousine+Abiti+Salute+Stipendio

73 Statistica descrittiva Introduzione Grafici Statistica descrittiva Medie (aritmetica, geometrica, armonica) Mediana e percentili Indici di dispersione (deviazione standard, varianza, scarti)

74 Medie Introduzione Grafici Statistica descrittiva Le medie aritmetica, geometrica, armonica possono essere calcolate tramite il comando means

75 Percentili e mediana Introduzione Grafici Statistica descrittiva Il calcolo dei percentili viene fatta tramite il comando c e n t i l e var, c e n t i l e ( v a l o r i ) dove var é la variabile valori é una lista, separata da spazio, dei percentili che interessano La mediana si calcola come il valore al 50mo percentile

76 Percentili e mediana (2) Grafici Statistica descrittiva Ad esempio, invocando il comando c e n t i l e numeri, c e n t i l e ( ) La mediana vale 48

77 Indici di dispersione Introduzione Grafici Statistica descrittiva Il piú noto indice di dispersione é la deviazione standard Il calcolo di tale indice avviene invocando il comando summarize v a r l i s t Usando poi l opzione detail, si aggiungono i valori di varianza, di asimmetria (skewness), di curtosi (kurtosis), nonché alcuni percentili

78 Indici di dispersione (2) Grafici Statistica descrittiva Ad esempio, invocando il comando summarize numeri, d e t a i l

79 Regressione La statistica inferenziale viene usata per quantificare la probabilitá che una deduzione, basata sull analisi dei dati raccolti per un certo campione, sia vera I test piú importanti sono t-test ANOVA a una dimensione ANOVA fattoriale

80 T-test Introduzione Regressione Il t-test verifica l uguaglianza dei valori medi fra due gruppi In dobbiamo avere due variabili numeriche, una che identifica la variabile, e l altra che identifica il gruppo Ad esempio (tab7-1a.dta) Parole Gruppo

81 Esempio di t-test Introduzione Regressione Prendiamo l esempio di tab7-1a.dta e facciamo fare a il test di Student t t e s t p a r o l e, by ( gruppo )

82 T-test per dati appaiati Regressione Il t-test per dati appaiati verifica l uguaglianza dei valori medi di due gruppi di eguale cardinalitá In dobbiamo creare due variabili per i due gruppi e usare il comando t t e s t gruppo1==gruppo2

83 Esempio di t-test Introduzione Regressione Prendiamo l esempio di tab7-1.dta e facciamo fare a il test per dati appaiati t t e s t p a r t e c i p a n t i == c o n t r o l l i

84 ANOVA a una dimensione Regressione Il t-test é limitato al confronto di soli due gruppi di uguale cardinalitá L ANOVA (ANalisys Of VAriance) é in grado di estendere gli stessi concetti del t-test a piú gruppi di cardinalitá anche diversa

85 Esempio Introduzione Regressione Consideriamo l esempio in cui vogliamo capire se esiste una differenza fra quattro marche di profilattici (tab8-1.dta) Tali dati devono essere inseriti in sotto forma di 40 osservazioni, usando una tabella del tipo Tipo profilattico Voto 1=Relax 4 1=Relax =Senza nome 4 4=Senza nome 3

86 Creazione del dataset Regressione Vediamo i passi necessari alla creazione del dataset s e t obs 40 gen i n t t i p o =0 gen i n t voto=0 l a b e l data P u n t e g g i d i s o d d i s f a z i o n e l a b e l define assoc 1 Relax 2 Sanuel 3 Toutou 4 Senza nome l a b e l v a l u e s t i p o a s s o c l a b e l v a r i a b l e t i p o T i p o l o g i a d i p r o d o t t o l a b e l v a r i a b l e voto Voto n e l l a s c a l a 0 10 e d i t

87 Come eseguire il test Regressione Per l esecuzione del test abbiamo a disposizione i due comandi oneway - specifico per ANOVA a una dimensione anova - analisi della varianza in generale

88 oneway Introduzione Regressione Eseguiamo il test usando il comando oneway oneway voto t i p o L output di tale comando é Come noto, l ANOVA presuppone che le variabili provengano da distribuzioni di ugual varianza: il test di Bartlett (ultima riga) serve allo scopo

89 Confronti post-hoc Introduzione Regressione Il comando oneway prende alcune opzioni che ci permettono di confrontare due medie alla volta L opzione bonferroni usa la correzione di Bonferroni sidak usa il metodo di Sidak scheffe usa il metodo di Scheffé (il piú conservativo)

90 Confronti post-hoc (2) Regressione Ad esempio, con il metodo di Scheffé

91 ANOVA fattoriale Introduzione Regressione L ANOVA fattoriale ci permette di prendere in considerazione anche l eventualitá di interazioni fra fattori Dal caso precedente, prendiamo in considerazione il fattore: esperto

92 Punteggi di soddisfazione Regressione Prendiamo in esame i punteggi (tab9-1.dta) Relax Sanuel Toutou Senza nome Esperto Non esperto

93 ANOVA fattoriale Introduzione Regressione Il comando anova ci permette di eseguire un ANOVA fattoriale, chiedendoci se il tipo di prodotto (tipo) interagisca (*) con l esperienza (fattore)

94 Regressione semplice Regressione Scopo della regressione semplice é quello di verificare se esista una relazione lineare fra due variabili (y = a x + b) Prendiamo in esame l esempio delle due variabili CLASS e ADE (tab12-1.dta) Soggetto CLASS ADE

95 Regressione semplice Regressione Cerchiamo di capire se esista una relazione lineare che leghi la variabile CLASS alla variabile ADE Scopro così che tale relazione esiste e che ADE = 0.84 CLASS

96 Regressione semplice Regressione Per farlo disegnare da, ricorro ai grafici two-way twoway ( l f i t c i CLASS ADE) ( s c a t t e r CLASS ADE) % CI/Fitted values/angolo Di Escursione Cucina+Limousine+Abiti+Salute+Stipendio 95% CI Fitted values Angolo Di Escursione

97 Regressione multipla Introduzione Regressione La regressione multipla cerca di scoprire l esistenza di una relazione lineare tra una variabile ed n altre variabili (y = i a i x i + b) Ad esempio, scomponiamo la variabile CLASS nelle variabili C, L, A, S1, S2 e facciamo fare a una regressione multipla (tab13-0.dta)

98 Regressione multipla Introduzione Regressione Risultato dell esecuzione Le uniche variabili non significative nel modello sono la L e la S2

99 Regressione multipla stepwise Regressione La regressione stepwise analizza una variabile alla volta e la inserisce o la esclude dal modello a seconda di certe probabilitá scelte dall utente L esecuzione di una regressione multipla stepwise si fa fare a con il precomando sw indicando le probabilitá richieste pe - per entrare nel modello e pr - per uscirne

100 Regressione multipla stepwise Regressione Regressione stepwise su tutte le variabili, con soglia di ingresso = 0.05 e di uscita = 0.1

101 Statistica non parametrica Statistica non parametrica Analisi della sopravvivenza Test di significativitá per frequenze di dati categorici (χ 2 ) V di Cramer e Kappa di Cohen Test di significativitá per dati trasformati in ranghi

102 Test di significativitá Statistica non parametrica Analisi della sopravvivenza Prendiamo in esame l esempio realmente accaduto relativo al triptofano e alla sindrome eosinofilico-mialgica Molti decessi, causa EMS, dopo l assunzione di un integratore a base di triptofano, causati da un inquinante proveniente dal ciclo di lavorazione dalla ditta Showa Denko K.K. Partiamo dai dati aggregati (tab16-1.dta) EMS Normale Triptofano No

103 Creazione del dataset Statistica non parametrica Analisi della sopravvivenza Costruiamo il dataset in Abbiamo 280 osservazioni La variabile triptofano ha 76 valori pari a 0, e 204 pari a 1 La variabile ems ha 80 valori pari a 0, e 200 pari a 1

104 Tabella di contingenza Statistica non parametrica Analisi della sopravvivenza Per arrivare alla tabella di contingenza invochiamo il comando tabulate

105 Test del χ 2 Introduzione Statistica non parametrica Analisi della sopravvivenza Il test del χ 2 ci permetterá di capire se c é differenza fra chi ha usato il triptofano e chi no Per invocare il test possiamo seguire due strade usare l opzione chi2 al comando tabulate considerare lo studio come del tipo caso/controllo

106 Test del χ 2 Introduzione Statistica non parametrica Analisi della sopravvivenza Usando l opzione chi2 al comando tabulate si ottiene Il test é significativo In alcuni casi é possibile usare il test estatto di Fisher con l opzione exact

107 Test del χ 2 Introduzione Statistica non parametrica Analisi della sopravvivenza Considerando lo studio come del tipo caso/controllo

108 Ancora sul χ 2 Introduzione Statistica non parametrica Analisi della sopravvivenza Suddividendo i casi a seconda della ditta (tabella 16-3)... e la ditta Showa Denko K.K. fu incriminata

109 Test di significativitá Statistica non parametrica Analisi della sopravvivenza Ampliamo il caso precedente, e supponiamo che esita una stratificazione, cioé la somministrazione di Gin-tonic, solo tonica, o niente (tab16-10.dta) Facciamo un test del chi-quadro complessivo sembrerebbe non esserci associazione...

110 Test di significativitá (2) Statistica non parametrica Analisi della sopravvivenza Investighiamo il primo strato c é associazione...

111 Test di significativitá (3) Statistica non parametrica Analisi della sopravvivenza Investighiamo il secondo strato anche qui...

112 Test di significativitá (4) Statistica non parametrica Analisi della sopravvivenza Investighiamo il terzo strato e anche qui.

113 χ 2 di Mantel-Haenszel Statistica non parametrica Analisi della sopravvivenza La presenza o meno di associazione in una situazione (caso/controllo) stratificata si investiga con il chi-quadro di Mantel-Haenszel L associazione é quindi confermata

114 V di Cramer Introduzione Statistica non parametrica Analisi della sopravvivenza La V di Cramer é una versione corretta del χ 2 Per il calcolo della V di Cramer, si puó usare il comando tabulate con l opzione all

115 Kappa di Cohen Introduzione Statistica non parametrica Analisi della sopravvivenza Il Kappa di Cohen K permette di verificare il grado di accordo fra due osservatori Nell esempio di tab17-2.dta, usiamo l opzione tab per farci stampare la tabella di contingenza

116 Kappa di Cohen generalizzato Statistica non parametrica Analisi della sopravvivenza Il Kappa di Cohen puó essere esteso ai casi in cui il giudizio non é dicotomico Nell esempio di tab17-4.dta K non pesato

117 Kappa di Cohen generalizzato (2) Statistica non parametrica Analisi della sopravvivenza K con pesi di Cicchetti

118 Kappa di Cohen generalizzato (3) Statistica non parametrica Analisi della sopravvivenza K con pesi quadratici

119 Kappa di Cohen generalizzato (4) Statistica non parametrica Analisi della sopravvivenza K con pesi generici

120 Test per ranghi Introduzione Statistica non parametrica Analisi della sopravvivenza I dati per i quali possono essere espressi dei valori di rango vanno trattati diversamente dai dati categorici Prendiamo in esame tab18-1.dta Rango Trattamento 1 BC 2 BC SM e vediamo come eseguire il test U di Mann-Whitney (alias somma dei ranghi di Wilcoxon), cioé l equivalente non parametrico del t-test

121 Test U di Mann-Whitney Statistica non parametrica Analisi della sopravvivenza Il test U di Mann-Whitney si esegue in con il comando

122 Test di Kruskal-Wallis Statistica non parametrica Analisi della sopravvivenza Nel caso in cui dovessero aumentare i gruppi (e.g., le tipologie di trattamento) si ricorre al test di Kruskal-Wallis

123 Test di Wilcoxon con segno Statistica non parametrica Analisi della sopravvivenza Per misure ripetute

124 Analisi della sopravvivenza Statistica non parametrica Analisi della sopravvivenza Prendiamo in esame i dati in tab20-1.dta Soggetto A B C D E F G H I J Censurato Perso Censurato Perso Deceduto Censurato Deceduto Deceduto Perso Deceduto Permanenza nello studio (anni) Calcoliamo le tavole di sopravvivenza tecniche secondo l approccio attuariale l approccio di Kaplan-Meier

125 Approccio attuariale Introduzione Statistica non parametrica Analisi della sopravvivenza La tavola di sopravvivenza tecnica secondo l approccio attuariale

126 Kaplan-Meier Introduzione Statistica non parametrica Analisi della sopravvivenza La tavola di sopravvivenza tecnica secondo Kaplan-Meier

127 Curve di sopravvivenza Statistica non parametrica Analisi della sopravvivenza La curva di sopravvivenza si ottiene con il comando s t s graph Probabilità di sopravvivere Curva di sopravvivenza Numero di anni

128 Confronto di due (o più) gruppi Statistica non parametrica Analisi della sopravvivenza In una analisi di sopravvivenza avviene molto di frequente di confrontare due (o più gruppi) Prendiamo in considerazione l esempio di tab20-6.dta

129 Curve di sopravvivenza per gruppi Statistica non parametrica Analisi della sopravvivenza Analogamente al caso precedente, è necessario prima generare la tabella di sopravvivenza con il comando stset poi graficare i dati con il comando sts graph, by(gruppo) Curve di sopravvivenza analysis time gruppo = Esposti gruppo = Controlli

130 Test di Mantel-Cox Introduzione Statistica non parametrica Analisi della sopravvivenza Dall analisi grafica precedente, sembrano emergere delle differenze fra il gruppo sperimentale e i controlli Il χ 2 di Mantel-Cox ci da una risposta

Relazioni tra variabili

Relazioni tra variabili Università degli Studi di Padova Facoltà di Medicina e Chirurgia Corso di Laurea in Medicina e Chirurgia - A.A. 009-10 Scuole di specializzazione in: Medicina Legale, Medicina del Lavoro, Igiene e Medicina

Dettagli

Natura dei dati e della statistica

Natura dei dati e della statistica INDICE SEZIONE PRIMA Natura dei dati e della statistica 1 Le basi 2 Statistica: ma a che serve? 2 Statistica descrittiva e statistica inferenziale 2 Variabili 3 Tipi di dati 3 Dati discreti e dati continui

Dettagli

DEFINIZIONE La statistica è una scienza che si propone di definire con dei numeri cose che non si possono numerare ne misurare.

DEFINIZIONE La statistica è una scienza che si propone di definire con dei numeri cose che non si possono numerare ne misurare. Appunti di Statistica DEFINIZIONE La statistica è una scienza che si propone di definire con dei numeri cose che non si possono numerare ne misurare. PROCESSO STATISTICO L indagine statistica comprende

Dettagli

1 La Matrice dei dati

1 La Matrice dei dati Dispense sull uso di Excel Daniela Marella 1 La Matrice dei dati Un questionario è costituito da un insieme di domande raccolte su un determinato supporto (cartaceo o elettronico) e somministrate alla

Dettagli

Esercitazione di riepilogo 23 Aprile 2013

Esercitazione di riepilogo 23 Aprile 2013 Esercitazione di riepilogo 23 Aprile 2013 Grafici Grafico a barre Servono principalmente per rappresentare variabili (caratteri) qualitative, quantitative e discrete. Grafico a settori circolari (torta)

Dettagli

Il corso si colloca nell ambito del corso integrato di scienze quantitative, al secondo anno, primo semestre.

Il corso si colloca nell ambito del corso integrato di scienze quantitative, al secondo anno, primo semestre. Corso di Statistica Medica 2004-2005 Il corso si colloca nell ambito del corso integrato di scienze quantitative, al secondo anno, primo semestre. Sono previste 30 ore di lezione di statistica e 12 di

Dettagli

Il corso si colloca nell ambito del corso integrato di scienze quantitative, al primo anno.

Il corso si colloca nell ambito del corso integrato di scienze quantitative, al primo anno. Corso di Statistica Medica Il corso si colloca nell ambito del corso integrato di scienze quantitative, al primo anno. Sono previste 40 ore complessive, di cui almeno 16 di lezione frontale e le restanti

Dettagli

Disegni di Ricerca e Analisi dei Dati in Psicologia Clinica. Rcmdr

Disegni di Ricerca e Analisi dei Dati in Psicologia Clinica. Rcmdr Disegni di Ricerca e Analisi dei Dati in Psicologia Clinica Rcmdr http://www.r-project.org http://qplab.psy.unipd.it Che cos è Rcmdr? Rcmdr è un pacchetto che possiamo scaricare dal CRAN e installare su

Dettagli

Excel Terza parte. Excel 2003

Excel Terza parte. Excel 2003 Excel Terza parte Excel 2003 TABELLA PIVOT Selezioniamo tutti i dati (con le relative etichette) Dati Rapporto tabella pivot e grafico pivot Fine 2 La tabella pivot viene messa di default in una pagina

Dettagli

Analizza/Confronta medie. ELEMENTI DI PSICOMETRIA Esercitazione n. 7-8-9-107. Test t. Test t. t-test test e confronto tra medie chi quadrato

Analizza/Confronta medie. ELEMENTI DI PSICOMETRIA Esercitazione n. 7-8-9-107. Test t. Test t. t-test test e confronto tra medie chi quadrato Analizza/Confronta medie ELEMENTI DI PSICOMETRIA Esercitazione n. 7-8-9-107 t-test test e confronto tra medie chi quadrato C.d.L. Comunicazione e Psicologia a.a. 2008/09 Medie Calcola medie e altre statistiche

Dettagli

Esplorazione dei dati

Esplorazione dei dati Esplorazione dei dati Introduzione L analisi esplorativa dei dati evidenzia, tramite grafici ed indicatori sintetici, le caratteristiche di ciascun attributo presente in un dataset. Il processo di esplorazione

Dettagli

Test statistici non-parametrici

Test statistici non-parametrici Test statistici non-parametrici Il test t di Student e l ANOVA sono basati su alcune assunzioni. Variabili continue o almeno misurate in un intervallo (es. non conosco il valore assoluto, ma posso quantificare

Dettagli

Test non parametrici. Test non parametrici. Test non parametrici. Test non parametrici

Test non parametrici. Test non parametrici. Test non parametrici. Test non parametrici Test non parametrici Test non parametrici Il test T di Student per uno o per due campioni, il test F di Fisher per l'analisi della varianza, la correlazione, la regressione, insieme ad altri test di statistica

Dettagli

Elementi di Psicometria

Elementi di Psicometria Elementi di Psicometria E2-Riepilogo finale vers. 1.2 Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2010-2011 G. Rossi (Dip. Psicologia) ElemPsico 2010-2011

Dettagli

Misure della dispersione o della variabilità

Misure della dispersione o della variabilità QUARTA UNITA Misure della dispersione o della variabilità Abbiamo visto che un punteggio di per sé non ha alcun significato e lo acquista solo quando è posto a confronto con altri punteggi o con una statistica.

Dettagli

I TEST NON-PARAMETRICI PIU CITATI NELLE DISCIPLINE SCIENTIFICHE

I TEST NON-PARAMETRICI PIU CITATI NELLE DISCIPLINE SCIENTIFICHE I TEST NON-PARAMETRICI PIU CITATI NELLE DISCIPLINE SCIENTIFICHE (Edizione 2008) Email: lamberto.soliani@unipr.it Tel.0521/905662 Fax 0521/905402 Lamberto Soliani DIPARTIMENTO DI SCIENZE AMBIENTALI UNIVERSITA

Dettagli

In una tabella 2 x 2 il valore del chiquadrato, che quantifica la differenza fra i numero osservati e quelli attesi, è la somma delle quattro celle

In una tabella 2 x 2 il valore del chiquadrato, che quantifica la differenza fra i numero osservati e quelli attesi, è la somma delle quattro celle Test statistici il chi quadrato Valutare la differenza tra due percentuali o proporzioni L'ipotesi zero (o ipotesi nulla) afferma che la differenza osservata - di qualsiasi entità essa sia - è dovuta al

Dettagli

Maria Chiara D Errico Università degli Studi di Perugia. Laboratorio di Econometria Introduzione a Stata

Maria Chiara D Errico Università degli Studi di Perugia. Laboratorio di Econometria Introduzione a Stata Maria Chiara D Errico Università degli Studi di Perugia Laboratorio di Econometria Introduzione a Stata Perugia, 11 Marzo 2013 STATA STATA è un software per l elaborazione dati e l analisi Statistica.

Dettagli

Elementi di Statistica

Elementi di Statistica Elementi di Statistica Contenuti Contenuti di Statistica nel corso di Data Base Elementi di statistica descrittiva: media, moda, mediana, indici di dispersione Introduzione alle variabili casuali e alle

Dettagli

Dipartimento di Scienze dell Educazione Università degli studi Roma Tre

Dipartimento di Scienze dell Educazione Università degli studi Roma Tre Dipartimento di Scienze dell Educazione Università degli studi Roma Tre Materiale del Laboratorio sulle Procedure Statistiche di base con SPSS CASD Centro Analisi Statistica Dati 1 1. Il Questionario Nella

Dettagli

EPG Metodologia della ricerca e Tecniche Multivariate dei dati. Dott.ssa Antonella Macchia E-mail: a.macchia@unich.it. www.psicometria.unich.

EPG Metodologia della ricerca e Tecniche Multivariate dei dati. Dott.ssa Antonella Macchia E-mail: a.macchia@unich.it. www.psicometria.unich. EPG Metodologia della ricerca e Tecniche Multivariate dei dati Dott.ssa Antonella Macchia E-mail: a.macchia@unich.it www.psicometria.unich.it GIORNI E ORARI LEZIONI Sabato 01-03-2014 h 08:00-12:00 Sabato

Dettagli

FACOLTA DI PSICOLOGIA Scienze della Mente TESINA DI INFORMATICA. Fossataro Carlotta Di Rienzo Ariana Basso Alessandra Marchetto Helena

FACOLTA DI PSICOLOGIA Scienze della Mente TESINA DI INFORMATICA. Fossataro Carlotta Di Rienzo Ariana Basso Alessandra Marchetto Helena FACOLTA DI PSICOLOGIA Scienze della Mente TESINA DI INFORMATICA Fossataro Carlotta Di Rienzo Ariana Basso Alessandra Marchetto Helena SPSS INDICE INTRODUZIONE...3 FINESTRE...4 EDITOR DEI DATI...4 OUTPUT...11

Dettagli

Grafici delle distribuzioni di frequenza

Grafici delle distribuzioni di frequenza Grafici delle distribuzioni di frequenza L osservazione del grafico può far notare irregolarità o comportamenti anomali non direttamente osservabili sui dati; ad esempio errori di misurazione 1) Diagramma

Dettagli

Statistica Medica. Verranno presi in esame:

Statistica Medica. Verranno presi in esame: Statistica Medica Premessa: il seguente testo cerca di riassumere e rendere in forma comprensibile ai non esperti in matematica e statistica le nozioni e le procedure necessarie a svolgere gli esercizi

Dettagli

Statistica multivariata. Statistica multivariata. Analisi multivariata. Dati multivariati. x 11 x 21. x 12 x 22. x 1m x 2m. x nm. x n2.

Statistica multivariata. Statistica multivariata. Analisi multivariata. Dati multivariati. x 11 x 21. x 12 x 22. x 1m x 2m. x nm. x n2. Analisi multivariata Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Cercare di capire le relazioni

Dettagli

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva Università del Piemonte Orientale Corsi di Laurea Triennale Corso di Statistica e Biometria Introduzione e Statistica descrittiva Corsi di Laurea Triennale Corso di Statistica e Biometria: Introduzione

Dettagli

Riassunto 24 Parole chiave 24 Commenti e curiosità 25 Esercizi 27 Appendice

Riassunto 24 Parole chiave 24 Commenti e curiosità 25 Esercizi 27 Appendice cap 0 Romane - def_layout 1 12/06/12 07.51 Pagina V Prefazione xiii Capitolo 1 Nozioni introduttive 1 1.1 Introduzione 1 1.2 Cenni storici sullo sviluppo della Statistica 2 1.3 La Statistica nelle scienze

Dettagli

Metodi Matematici e Informatici per la Biologia----31 Maggio 2010

Metodi Matematici e Informatici per la Biologia----31 Maggio 2010 Metodi Matematici e Informatici per la Biologia----31 Maggio 2010 COMPITO 4 (3 CREDITI) Nome: Cognome: Matricola: ISTRUZIONI Gli esercizi che seguono sono di tre tipi: Domande Vero/Falso: cerchiate V o

Dettagli

ANOVA a un fattore between in R

ANOVA a un fattore between in R ANOVA a un fattore between in R Il file Excel Il file sinburn.xlsx contiene i dati dello studio sulla sindrome da burnout in quindici infermieri ospedalieri di tre diversi reparti. Importare dati in R

Dettagli

Il software Epi Info

Il software Epi Info Il software Epi Info Descrizione e analisi dei dati dello studio sulla compliance: Modulo Analizza i dati I tipi di variabili (aleatorie) (1) Variabile: fenomeno misurato Aleatorio: il risultato di questa

Dettagli

METODOLOGIA CLINICA Necessita di: Quantificazione Formalizzazione matematica

METODOLOGIA CLINICA Necessita di: Quantificazione Formalizzazione matematica METODOLOGIA CLINICA Necessita di: Quantificazione Formalizzazione matematica EPIDEMIOLOGIA Ha come oggetto lo studio della distribuzione delle malattie in un popolazione e dei fattori che la influenzano

Dettagli

Università del Piemonte Orientale. Corso di dottorato in medicina molecolare. a.a. 2002 2003. Corso di Statistica Medica. Inferenza sulle medie

Università del Piemonte Orientale. Corso di dottorato in medicina molecolare. a.a. 2002 2003. Corso di Statistica Medica. Inferenza sulle medie Università del Piemonte Orientale Corso di dottorato in medicina molecolare aa 2002 2003 Corso di Statistica Medica Inferenza sulle medie Statistica U Test z Test t campioni indipendenti con uguale varianza

Dettagli

Come descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva. Brugnaro Luca

Come descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva. Brugnaro Luca Come descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva Brugnaro Luca Progetto formativo complessivo Obiettivo: incrementare le competenze degli operatori sanitari nelle metodiche

Dettagli

Il concetto di correlazione

Il concetto di correlazione SESTA UNITA Il concetto di correlazione Fino a questo momento ci siamo interessati alle varie statistiche che ci consentono di descrivere la distribuzione dei punteggi di una data variabile e di collegare

Dettagli

Indice. 1 La statistica, i dati e altri concetti fondamentali ---------------------------------------------------- 3

Indice. 1 La statistica, i dati e altri concetti fondamentali ---------------------------------------------------- 3 LEZIONE ELEMENTI DI STATISTICA DESCRITTIVA PROF. CRISTIAN SIMONI Indice 1 La statistica, i dati e altri concetti fondamentali ---------------------------------------------------- 3 1.1. Popolazione --------------------------------------------------------------------------------------------

Dettagli

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a) Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B Eventi indipendenti: un evento non influenza l altro Eventi disgiunti: il verificarsi di un evento esclude l altro Evento prodotto:

Dettagli

Prof.ssa Paola Vicard

Prof.ssa Paola Vicard Questa nota consiste perlopiù nella traduzione da Descriptive statistics di J. Shalliker e C. Ricketts, 2000, University of Plymouth Consideriamo come esempio il data set contenuto nel foglio excel esercizio2_dati.xls.

Dettagli

ESEMPIO SPERIMENTAZIONE DEL MODELLO CS ON LINE. Indagine di soddisfazione per il Comune di XY

ESEMPIO SPERIMENTAZIONE DEL MODELLO CS ON LINE. Indagine di soddisfazione per il Comune di XY ESEMPIO SPERIMENTAZIONE DEL MODELLO CS ON LINE Indagine di soddisfazione per il Comune di XY Indice Introduzione: le fasi per la realizzazione dell indagine di customer satisfaction...2 L indagine del

Dettagli

ESERCITAZIONE 4 SOCIALE. Corso di Laurea Comunicazione e A.A. 2012/2013

ESERCITAZIONE 4 SOCIALE. Corso di Laurea Comunicazione e A.A. 2012/2013 ESERCITAZIONE 4 STATISTICA PER LA RICERCA SOCIALE Corso di Laurea Comunicazione e Psicologia A.A. 2012/2013 \\lib\psico\corsi\esercitazioni_cp1 Il programma SPSS 1) Aprire spss 2) Immettere dati / aprire

Dettagli

Laboratorio di Chimica Fisica 04/03/2015. Introduzione all uso di Microcal Origin 6.0 (TM)

Laboratorio di Chimica Fisica 04/03/2015. Introduzione all uso di Microcal Origin 6.0 (TM) Introduzione all uso di Microcal Origin 6.0 (TM) Origin lavora solo in ambiente Windows, ma ci sono degli omologhi per linux e apple. Sui computer del laboratorio è installato windows XP e troverete la

Dettagli

Elementi di statistica

Elementi di statistica Elementi di statistica Summer School: Data journalism e visualizzazione grafica dei dati! Flavon - 30 Agosto 2011! La statistica! Chi vi sta parlando? 2 La statistica! Chi vi sta parlando?! Cos è la Statistica?

Dettagli

Statistica. L. Freddi. L. Freddi Statistica

Statistica. L. Freddi. L. Freddi Statistica Statistica L. Freddi Statistica La statistica è un insieme di metodi e tecniche per: raccogliere informazioni su un fenomeno sintetizzare l informazione (elaborare i dati) generalizzare i risultati ottenuti

Dettagli

Analisi statistica di dati biomedici Analysis of biologicalsignals

Analisi statistica di dati biomedici Analysis of biologicalsignals Analisi statistica di dati biomedici Analysis of biologicalsignals II Parte Verifica delle ipotesi (a) Agostino Accardo (accardo@units.it) Master in Ingegneria Clinica LM in Neuroscienze 2013-2014 e segg.

Dettagli

Facoltà di Psicologia - Corso FSE gennaio febbraio 2010. Marco Vicentini info@marcovicentini.it

Facoltà di Psicologia - Corso FSE gennaio febbraio 2010. Marco Vicentini info@marcovicentini.it Facoltà di Psicologia - Corso FSE gennaio febbraio 2010 Marco Vicentini info@marcovicentini.it Statistica e Psicologia Quali statistiche per la psicologia? Quali programmi per la statistica? Codifica e

Dettagli

Elaborazione dati in Analisi Sensoriale

Elaborazione dati in Analisi Sensoriale Elaborazione dati in Analisi Sensoriale Si è parlato di interpretazione corretta dei risultati ottenuti; a questo concorrono due fattori: affidabilità e validità. Se i test fossero stati ripetuti con lo

Dettagli

Statistica descrittiva

Statistica descrittiva Statistica descrittiva La statistica descrittiva mette a disposizione il calcolo di indicatori sintetici che individuano, con un singolo valore, proprieta` statistiche di un campione/popolazione rispetto

Dettagli

Insegnamento di STATISTICA MEDICA

Insegnamento di STATISTICA MEDICA Università degli Studi di Padova Facoltà di Medicina e Chirurgia Corso di Laurea triennale Tecniche della Prevenzione PERCORSO STRAORDINARIO 2007/08 Docente:Dott.ssa Egle Perissinotto 1) Il processo di

Dettagli

Dr. Marco Vicentini marco.vicentini@unipd.it Anno Accademico 2010 2011 Rev 30/03/2011

Dr. Marco Vicentini marco.vicentini@unipd.it Anno Accademico 2010 2011 Rev 30/03/2011 Università degli Studi di Padova Facoltà di Psicologia, L4, Psicometria, Modulo B Dr. Marco Vicentini marco.vicentini@unipd.it Anno Accademico 2010 2011 Rev 30/03/2011 Statistica descrittiva e inferenziale

Dettagli

Laboratorio di Statistica con R

Laboratorio di Statistica con R Laboratorio di Statistica con R R è un vero e proprio linguaggio di programmazione. Il suo nome, è dovuto probabilmente al nome dei suoi sviluppatori:robert Gentleman e Ross Ihaka Le principali funzioni

Dettagli

LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE

LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE DESCRIZIONE DEI DATI DA ESAMINARE Sono stati raccolti i dati sul peso del polmone di topi normali e affetti da una patologia simile

Dettagli

Traccia delle lezioni svolte in laboratorio Excel 2003. Excel 2003 Excel 2010

Traccia delle lezioni svolte in laboratorio Excel 2003. Excel 2003 Excel 2010 Traccia delle lezioni svolte in laboratorio Excel 2003 Excel 2003 Excel 2010 INTRODUZIONE A EXCEL EXCEL è un programma di Microsoft Office che permette di analizzare grandi quantità di dati (database)

Dettagli

IBM SPSS Statistics Base 19

IBM SPSS Statistics Base 19 IBM SPSS Statistics Base 19 Note: Before using this information and the product it supports, read the general information under Notices a pag. 312. This document contains proprietary information of SPSS

Dettagli

LAB LEZ. 1 STATISTICA DESCRITTIVA CON R

LAB LEZ. 1 STATISTICA DESCRITTIVA CON R LAB LEZ. 1 STATISTICA DESCRITTIVA CON R 1 2 L AMBIENTE DI SVILUPPO DI RStudio 1 3 4 2 1 FINESTRA PER GLI SCRIPT E PER VISUALIZZARE I DATI 2 CONSOLE DEI COMANDI 3 VARIABILI PRESENTI NELLA MEMORIA DEL PROGRAMMA

Dettagli

Cenni di statistica descrittiva

Cenni di statistica descrittiva Cenni di statistica descrittiva La statistica descrittiva è la disciplina nella quale si studiano le metodologie di cui si serve uno sperimentatore per raccogliere, rappresentare ed elaborare dei dati

Dettagli

Indici (Statistiche) che esprimono le caratteristiche di simmetria e

Indici (Statistiche) che esprimono le caratteristiche di simmetria e Indici di sintesi Indici (Statistiche) Gran parte della analisi statistica consiste nel condensare complessi pattern di osservazioni in un indicatore che sia capace di riassumere una specifica caratteristica

Dettagli

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi donatella.siepi@unipg.it tel: 075 5853525

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi donatella.siepi@unipg.it tel: 075 5853525 UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA Prof.ssa Donatella Siepi donatella.siepi@unipg.it tel: 075 5853525 2 LEZIONE Statistica descrittiva STATISTICA DESCRITTIVA Rilevazione dei dati Rappresentazione

Dettagli

Le formule possono essere scritte utilizzando un insieme di funzioni predefinite che Excel mette a disposizione, raggruppate per argomento.

Le formule possono essere scritte utilizzando un insieme di funzioni predefinite che Excel mette a disposizione, raggruppate per argomento. Excel: le funzioni Le formule possono essere scritte utilizzando un insieme di funzioni predefinite che Excel mette a disposizione, raggruppate per argomento. DEFINIZIONE: Le funzioni sono dei procedimenti

Dettagli

Il controllo statistico di processo

Il controllo statistico di processo Il controllo statistico di processo Torino, 02 ottobre 2012 Relatrice: Monica Lanzoni QUALITÀ DI DI UN UN PRODOTTO: l'adeguatezza del del medesimo all'uso per per il il quale quale è stato stato realizzato

Dettagli

Facoltà di Psicologia - Corso FSE Ottobre 2009. Marco Vicentini info@marcovicentini.it

Facoltà di Psicologia - Corso FSE Ottobre 2009. Marco Vicentini info@marcovicentini.it Facoltà di Psicologia - Corso FSE Ottobre 2009 Marco Vicentini info@marcovicentini.it Statistica vs. SPSS Importare, costruire e manipolare un file Statistiche descrittive e grafici Analisi correlazionale

Dettagli

Introduzione al software SAS

Introduzione al software SAS Introduzione al software SAS Metodi Quantitativi per Economia, Finanza e Management Esercitazione n 1 Orario di ricevimento Alberto Saccardi alberto.saccardi@nunatac.it asaccardi@liuc.it Lunedì 17-18 Aula

Dettagli

Brugnaro Luca Boscaro Gianni (2009) 1

Brugnaro Luca Boscaro Gianni (2009) 1 STATISTICA PER LE PROFESSIONI SANITARIE - LIVELLO BASE Brugnaro Luca Boscaro Gianni (2009) 1 Perché la statistica Prendere decisioni Bibliografia non soddisfacente Richieste nuove conoscenze Raccolta delle

Dettagli

La Statistica come strumento di analisi nelle scienze umanistiche e comportamentali

La Statistica come strumento di analisi nelle scienze umanistiche e comportamentali La Statistica come strumento di analisi nelle scienze umanistiche e comportamentali Elementi di Analisi Multivariata V SCUOLA ESTIVA AISV 5 -- 9 ottobre 009 - Soriano nel Cimino (VT) Sabrina Giordano Dipartimento

Dettagli

Lo scopo di questo capitolo è quello di introdurre le principali tecniche di descrizione dei dati.

Lo scopo di questo capitolo è quello di introdurre le principali tecniche di descrizione dei dati. Indice 1 Descriviamo i Dati 1 1.1 L Informazione in Statistica................... 1 1.2 Variabili Qualitative....................... 5 1.2.1 Distribuzioni di Frequenza................ 5 1.2.2 Rappresentazioni

Dettagli

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Introduzione : analisi delle relazioni tra due caratteristiche osservate sulle stesse unità statistiche studio del comportamento di due caratteri

Dettagli

Pivot è bello. Principali. misure di variabilità. Il contesto è di tipo matematico, in particolare riguarda l uso di dati numerici e delle loro

Pivot è bello. Principali. misure di variabilità. Il contesto è di tipo matematico, in particolare riguarda l uso di dati numerici e delle loro Pivot è bello Livello scolare: 1 biennio Abilità Conoscenze interessate Predisporre la struttura della Distribuzioni delle matrice dei dati grezzi con frequenze a seconda del riguardo a una rilevazione

Dettagli

Dott.ssa Caterina Gurrieri

Dott.ssa Caterina Gurrieri Dott.ssa Caterina Gurrieri Le relazioni tra caratteri Data una tabella a doppia entrata, grande importanza riveste il misurare se e in che misura le variabili in essa riportata sono in qualche modo

Dettagli

2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale

2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale BIOSTATISTICA 2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk

Dettagli

RELAZIONE TRA DUE VARIABILI QUANTITATIVE

RELAZIONE TRA DUE VARIABILI QUANTITATIVE RELAZIONE TRA DUE VARIABILI QUANTITATIVE Quando si considerano due o più caratteri (variabili) si possono esaminare anche il tipo e l'intensità delle relazioni che sussistono tra loro. Nel caso in cui

Dettagli

Prof.ssa Paola Vicard

Prof.ssa Paola Vicard DISTRIBUZIONE DI FREQUENZE PER CARATTERI QUALITATIVI Questa nota consiste per la maggior parte nella traduzione (con alcune integrazioni) da Descriptive statistics di J. Shalliker e C. Ricketts, 2000,

Dettagli

Fonti e strumenti statistici per la comunicazione (prof.ssa I.Mingo) Esercizi (soluzioni e suggerimenti )

Fonti e strumenti statistici per la comunicazione (prof.ssa I.Mingo) Esercizi (soluzioni e suggerimenti ) Esercizio 1 Fonti e strumenti statistici per la comunicazione (prof.ssa I.Mingo) Esercizi (soluzioni e suggerimenti ) Qualitativo Sconnesso: Marca di Jeans preferita, Partito votato nelle ultime elezioni,

Dettagli

Indice generale. Prefazione...xi. Introduzione...1. Capitolo 1 Tabelle e prospetti...25

Indice generale. Prefazione...xi. Introduzione...1. Capitolo 1 Tabelle e prospetti...25 Prefazione...xi Introduzione...1 Terminologia essenziale... 1 Differenze di aspetto tra Excel 2003 (XP) ed Excel 2010: la barra multifunzione... 3 Novità relative al menu File e alle barre Standard e Formattazione...

Dettagli

Fogli Elettronici: MS Excel utilizzo avanzato

Fogli Elettronici: MS Excel utilizzo avanzato Fogli Elettronici: MS Excel utilizzo avanzato 1 Ripasso 2 1 Selezionare celle e gruppi di celle Una cella in un foglio è individuata dall incrocio tra la riga e la colonna (coordinate della cella) Es:

Dettagli

I ESERCITAZIONE. Gruppo I 100 individui. Trattamento I Nuovo Farmaco. Osservazione degli effetti sul raffreddore. Assegnazione casuale

I ESERCITAZIONE. Gruppo I 100 individui. Trattamento I Nuovo Farmaco. Osservazione degli effetti sul raffreddore. Assegnazione casuale I ESERCITAZIONE ESERCIZIO 1 Si vuole testare un nuovo farmaco contro il raffreddore. Allo studio partecipano 200 soggetti sani della stessa età e dello stesso sesso e con caratteristiche simili. i) Che

Dettagli

VARIABILI E DISTRIBUZIONI DI FREQUENZA A.A. 2010/2011

VARIABILI E DISTRIBUZIONI DI FREQUENZA A.A. 2010/2011 VARIABILI E DISTRIBUZIONI DI FREQUENZA A.A. 2010/2011 1 RAPPRESENTARE I DATI: TABELLE E GRAFICI Un insieme di misure è detto serie statistica o serie dei dati 1) Una sua prima elementare elaborazione può

Dettagli

RELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della

RELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della RELAZIONE TRA VARIABILI QUANTITATIVE Lezione 7 a Accade spesso nella ricerca in campo biomedico, così come in altri campi della scienza, di voler studiare come il variare di una o più variabili (variabili

Dettagli

Strumenti informatici 2.3 - Le statistiche descrittive con Excel e SPSS

Strumenti informatici 2.3 - Le statistiche descrittive con Excel e SPSS Strumenti informatici 2.3 - Le statistiche descrittive con Excel e SPSS Per ottenere le statistiche descrittive di una o più variabili in Excel occorre utilizzare le funzioni, che sono operatori matematici,

Dettagli

Esercizi di Statistica

Esercizi di Statistica Esercizi di Statistica Selezione di esercizi proposti durante le esercitazioni dei corsi di Statistica tenute presso la Facoltà di Economia dell Università di Salerno Versione del 17 ottobre 2006 2 Per

Dettagli

Statistica corso base Canale N Z prof. Francesco Maria Sanna. Prove scritte di esame a.a. 2012-13

Statistica corso base Canale N Z prof. Francesco Maria Sanna. Prove scritte di esame a.a. 2012-13 Statistica corso base Canale N Z prof. Francesco Maria Sanna Prova scritta del 8/1/2013 Prove scritte di esame a.a. 2012-13 Esercizio 1 (5 punti). Nella seguente tabella è riportata la distribuzione delle

Dettagli

Strumenti statistici per l analisi di dati genetici

Strumenti statistici per l analisi di dati genetici Strumenti statistici per l analisi di dati genetici Luca Tardella + Maria Brigida Ferraro 1 email: luca.tardella@uniroma1.it Lezione #1 Introduzione al software R al suo utilizzo per l implementazione

Dettagli

Anno Accademico 2014-2015. Corso di Laurea in Economia Aziendale Università di Bologna STATISTICA

Anno Accademico 2014-2015. Corso di Laurea in Economia Aziendale Università di Bologna STATISTICA Statistica, CLEA p. 1/68 Anno Accademico 2014-2015 Corso di Laurea in Economia Aziendale Università di Bologna STATISTICA Monia Lupparelli monia.lupparelli@unibo.it http://www2.stat.unibo.it/lupparelli

Dettagli

Regressione Lineare con un Singolo Regressore

Regressione Lineare con un Singolo Regressore Regressione Lineare con un Singolo Regressore Quali sono gli effetti dell introduzione di pene severe per gli automobilisti ubriachi? Quali sono gli effetti della riduzione della dimensione delle classi

Dettagli

Analisi statistica degli errori

Analisi statistica degli errori Analisi statistica degli errori I valori numerici di misure ripetute risultano ogni volta diversi l operazione di misura può essere considerata un evento casuale a cui è associata una variabile casuale

Dettagli

CORSO DI LAUREA IN OTTICA E OPTOMETRIA CORSO DI INFORMATICA E STATISTICA DANIELE.MONTANINO@UNISALENTO.IT

CORSO DI LAUREA IN OTTICA E OPTOMETRIA CORSO DI INFORMATICA E STATISTICA DANIELE.MONTANINO@UNISALENTO.IT CORSO DI LAUREA IN OTTICA E OPTOMETRIA CORSO DI INFORMATICA E STATISTICA DANIELE.MONTANINO@UNISALENTO.IT CONVENZIONE SULLE CIFRE SIGNIFICATIVE La convenzione usata sul troncamento delle cifre è troncare

Dettagli

Matlab per applicazioni statistiche

Matlab per applicazioni statistiche Matlab per applicazioni statistiche Marco J. Lombardi 19 aprile 2005 1 Introduzione Il sistema Matlab è ormai uno standard per quanto riguarda le applicazioni ingegneristiche e scientifiche, ma non ha

Dettagli

STATISTICA DESCRITTIVA - SCHEDA N. 1 VARIABILI QUALITATIVE

STATISTICA DESCRITTIVA - SCHEDA N. 1 VARIABILI QUALITATIVE Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) STATISTICA DESCRITTIVA

Dettagli

STATISTICA A.A. 2009/2010. Dott. Alessandro Cucchi. alessandro.cucchi@unife.it DEFINIZIONE DI STATISTICA

STATISTICA A.A. 2009/2010. Dott. Alessandro Cucchi. alessandro.cucchi@unife.it DEFINIZIONE DI STATISTICA STATISTICA A.A. 2009/2010 Dott. Alessandro Cucchi alessandro.cucchi@unife.it DEFINIZIONE DI STATISTICA Analisi quantitativa dei fenomeni collettivi allo scopo di descriverli e di individuare leggi e modelli

Dettagli

Corso integrato di informatica, statistica e analisi dei dati sperimentali Altri esercizi_esercitazione V

Corso integrato di informatica, statistica e analisi dei dati sperimentali Altri esercizi_esercitazione V Corso integrato di informatica, statistica e analisi dei dati sperimentali Altri esercizi_esercitazione V Sui PC a disposizione sono istallati diversi sistemi operativi. All accensione scegliere Windows.

Dettagli

Facciamo qualche precisazione

Facciamo qualche precisazione Abbiamo introdotto alcuni indici statistici (di posizione, di variabilità e di forma) ottenibili da Excel con la funzione Riepilogo Statistiche Facciamo qualche precisazione Al fine della partecipazione

Dettagli

Laboratorio di Informatica

Laboratorio di Informatica Laboratorio di Informatica Pacchetti Applicativi Excel e i Grafici CdL Economia A.A. 2012/2013 Domenica Sileo Università degli Studi della Basilicata Pacchetti Applicativi: Excel >> Sommario Sommario 2

Dettagli

Indice Prefazione xiii 1 Probabilità

Indice Prefazione xiii 1 Probabilità Prefazione xiii 1 Probabilità 1 1.1 Origini del Calcolo delle Probabilità e della Statistica 1 1.2 Eventi, stato di conoscenza, probabilità 4 1.3 Calcolo Combinatorio 11 1.3.1 Disposizioni di n elementi

Dettagli

R - Esercitazione 1. Lorenzo Di Biagio dibiagio@mat.uniroma3.it. 30 Settembre 2013. Università Roma Tre

R - Esercitazione 1. Lorenzo Di Biagio dibiagio@mat.uniroma3.it. 30 Settembre 2013. Università Roma Tre R - Esercitazione 1 Lorenzo Di Biagio dibiagio@mat.uniroma3.it Università Roma Tre 30 Settembre 2013 Introduzione a R R è un software open-source, per Linux, Mac OS X, Windows, distribuito secondo la licenza

Dettagli

STATISTICA DESCRITTIVA SCHEDA N. 5: REGRESSIONE LINEARE

STATISTICA DESCRITTIVA SCHEDA N. 5: REGRESSIONE LINEARE STATISTICA DESCRITTIVA SCHEDA N. : REGRESSIONE LINEARE Nella Scheda precedente abbiamo visto che il coefficiente di correlazione fra due variabili quantitative X e Y fornisce informazioni sull esistenza

Dettagli

STATISTICA (A-K) a.a. 2007-08 Prof.ssa Mary Fraire Test di STATISTICA DESCRITTIVA Esonero del 2007

STATISTICA (A-K) a.a. 2007-08 Prof.ssa Mary Fraire Test di STATISTICA DESCRITTIVA Esonero del 2007 A STATISTICA (A-K) a.a. 007-08 Prof.ssa Mary Fraire Test di STATISTICA DESCRITTIVA Esonero del 007 STESS N.O. RD 00 GORU N.O. RD 006 ) La distribuzione del numero degli occupati (valori x 000) in una provincia

Dettagli

Prof.ssa Paola Vicard

Prof.ssa Paola Vicard Questa nota consiste perlopiù nella traduzione (con alcune integrazioni) da Descriptive statistics di J. Shalliker e C. Ricketts, 2000, University of Plymouth Consideriamo i dati nel file esercizio10_dati.xls.

Dettagli

3 Confronto fra due popolazioni attraverso il test t e test analoghi

3 Confronto fra due popolazioni attraverso il test t e test analoghi 3 Confronto fra due popolazioni attraverso il test t e test analoghi Consideriamo in questo capitolo gli esperimenti comprendenti un solo fattore fisso, e nel loro ambito quelli in cui questo criterio

Dettagli

STATISTICA ECONOMICA ED ANALISI DI MERCATO Previsioni Economiche ed Analisi di Serie Storiche A.A. 2003 / 04 ESERCITAZIONE 2

STATISTICA ECONOMICA ED ANALISI DI MERCATO Previsioni Economiche ed Analisi di Serie Storiche A.A. 2003 / 04 ESERCITAZIONE 2 STATISTICA ECONOMICA ED ANALISI DI MERCATO Previsioni Economiche ed Analisi di Serie Storiche A.A. 2003 / 04 ESERCITAZIONE 2 Introduzione all uso di EViews di Daniele Toninelli 1. INTRODUZIONE ad EViews

Dettagli

DATABASE SU EXCEL: I FILTRI

DATABASE SU EXCEL: I FILTRI DATABASE SU EXCEL: I FILTRI È possibile mettere in relazione i dati in base a determinati criteri di ricerca e creare un archivio di dati E necessario creare delle categorie di ordinamento in base alle

Dettagli

Corso di Psicometria Progredito

Corso di Psicometria Progredito Corso di Psicometria Progredito 2.1 Statistica descrittiva (Richiami) Prima Parte Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014 Sommario

Dettagli

Contenuto del libro...2 Convenzioni utilizzate nel libro...2

Contenuto del libro...2 Convenzioni utilizzate nel libro...2 Indice Introduzione... 1 Contenuto del libro...2 Convenzioni utilizzate nel libro...2 I INTERVALLI E FORMULE DI EXCEL 1 Ricavare il massimo dagli intervalli.... 7 Tecniche avanzate di selezione degli intervalli...7

Dettagli

Lezione V. Il foglio elettronico

Lezione V. Il foglio elettronico Informatica di Base Lezione V 1 Lezione V In laboratorio userete prevalentemente Microsoft Excel Ma ce ne sono altri, es. Open Office In aula avete sia office 2003 che Calc. (open office) Contabilità e

Dettagli