2 Confronto fra due o più distribuzioni di frequenza

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "2 Confronto fra due o più distribuzioni di frequenza"

Transcript

1 2 Confronto fra due o più distribuzioni di frequenza I problemi statistici considerati in questo capitolo possono riguardare l'analisi di variabili di risposta sia qualitative, sia quantitative discrete oppure continue ma con dati riuniti in classi di frequenza. Essi possono essere elencati nel modo seguente in funzione della loro ipotesi nulla da verificare: 1) omogeneità di due o più distribuzioni di frequenza 2) uguaglianza di due o più proporzioni 3) indipendenza stocastica di due criteri di classificazione 4) bontà dell'adattamento di una distribuzione di frequenza osservata ad una determinata distribuzione teorica. In questa Nota, il termine "distribuzione di frequenza" si riferisce in particolare al caso in cui la variabile di risposta abbia un numero di varianti o livelli almeno pari a 3, mentre il termine "proporzione" è utilizzato nel caso che tali varianti siano solo 2 (il che equivale ad una distribuzione di frequenza per ciascun campione composta da 2 sole classi). Perciò, il secondo problema statistico costituisce in effetti un importante caso particolare del primo problema. In entrambi i problemi, si mettono a confronto per un determinato carattere due o più campioni rappresentativi di altrettante popolazioni; nel terzo e nel quarto problema le osservazioni sono invece relative ad un campione estratto da una sola popolazione. In ogni caso, i test statistici considerati richiedono come condizione di applicazione che i campioni considerati siano casuali e indipendenti (cioè non dipendenti dal/dai campioni precedenti). Il χ 2 di Pearson è il test statistico di validità generale per questi problemi. Attraverso di esso si confronta la osservata distribuzione di frequenze a due dimensioni (nei primi tre dei problemi anzidetti) o ad una dimensione (nel quarto problema) con una distribuzione teorica od attesa in base all'ipotesi nulla considerata. Tale test, approssimato, è affidabile a condizione che nessuna frequenza attesa per ciascuna classe sia inferiore al valore 5; si può ammettere però una frequenza attesa compresa tra 1 e 5 se le classi della distribuzione sono almeno 6, e 2 di tali frequenze se le classi sono almeno 11. Il SAS comunica come avviso nel file.lst la presenza e la percentuale sul totale delle frequenze attese con valore inferiore a 5. Limitatamente alla risoluzione dei primi tre problemi statistici sopra elencati, l'esecuzione di questo test viene richiesta nell'ambito della procedura FREQ attraverso l'opzione CHISQ come esemplificato nei paragrafi 2.1 e 2.3. Le modalità di esecuzione del test nella risoluzione del quarto problema sono invece illustrate in 2.5. Confronto fra due distribuzioni di frequenza 7

2 Il test "esatto" di Fisher calcola invece esattamente la distribuzione definita dall'ipotesi nulla entro la quale vengono distinte le regioni di accettazione e di rifiuto, consentendo così una soluzione non approssimata dei primi tre problemi su elencati. Essendo però dispendioso per il Sistema dato l'elevato numero di calcoli richiesto, se ne consiglia l'adozione solo nei casi in cui il test χ 2 fosse inaffidabile per quanto detto e nei problemi implicanti tavole di frequenza a doppia entrata con un numero limitato di classi. Il test di Fisher si richiede, sempre nell'ambito della PROC FREQ, con l'opzione EXACT. Nel solo caso di tavole di frequenza 2 x 2 il SAS esegue d'ufficio il test di Fisher anche nell'ambito dell'opzione CHISQ. L'adozione del test di Fisher è esemplificata in 2.2 e 2.4. Considerando i primi due problemi statistici sopra elencati, può succedere che più campioni vengano prelevati per ciascuna popolazione statistica (o trattamento). Se la variabile di risposta è di tipo binario, il dato per campione può essere espresso sotto forma di percentuale ed i trattamenti essere messi a confronto tramite analisi della varianza, nella quale i diversi campioni per trattamento rappresentano altrettante unità sperimentali (o repliche) completamente randomizzate od eventualmente organizzate in blocchi a seconda delle modalità del campionamento stesso. Un esempio di tale caso è considerato in 5.1. Se invece la variabile di risposta ha più di due varianti, si confrontano le distribuzioni di frequenza dei trattamenti che si ottengono cumulando i dati dei campioni a disposizione per trattamento; tuttavia, è buona regola far precedere tale operazione da un controllo dell'errore sperimentale verificando l'omogeneità delle distribuzioni di frequenza dei campioni relativi ad uno stesso trattamento. Può anche succedere che il campionamento (ovvero l'esperimento) venga ripetuto nel tempo o nello spazio e ci si chieda se i campioni disponibili per ciascun trattamento siano omogenei, ovvero se non si verifichi interazione fra trattamento ed ambiente, e le risposte dei trattamenti siano quindi confrontabili attraverso un solo test eseguito sull'insieme dei dati disponibili. Ciò è ammissibile se non può essere respinta l'ipotesi nulla di omogeneità delle distribuzioni di frequenza o di uguaglianza delle proporzioni dei diversi campioni appartenenti ad uno stesso trattamento. L'esempio in 2.3 si riferisce a tale problematica. Il quarto problema statistico, che comprende in effetti anche il caso del test di conformità di una proporzione osservata ad una teorica, non è purtroppo risolvibile attraverso alcuna specifica procedura dei moduli del SAS qui considerati. E' necessaria la redazione di un programma le cui istruzioni sono illustrate nell' esempio in 2.5; le frequenze assolute attese per la distribuzione teorica considerata dovranno essere state calcolate dall'utente a priori, dopo avere stimato i parametri di tale distribuzione se essa non è completamente definita. Nel solo caso della distribuzione normale il SAS consente però di eseguire, nell'ambito della procedura UNIVARIATE, il test di Shapiro-Wilks per i campioni non superiori ai 2000 individui, ed il test di Kolmogorov per i campioni di effettivi superiori. Un esempio del primo test sarà dato in 3.1. L applicazione di modelli lineari a dati categorici di tipo numerico, eseguibile con la PROC CATMOD, non viene esemplificato nella Nota. Confronto fra due distribuzioni di frequenza 8

3 2.1 Omogeneità di due o più distribuzioni di frequenza I dati si riferiscono ad un esperimento su erba medica. Nell'ambito della varietà Lodi sono stati selezionati due gruppi di individui presentanti rispettivamente in misura positiva (gruppo "plus") e negativa (gruppo "minus") le desiderate caratteristiche di elevato sviluppo radicale, elevato numero di tubercoli ed elevato vigore. Tali due gruppi sono stati poi messi a confronto per evidenziare eventuali differenze nella forma dei tubercoli radicali, carattere considerato nelle sue tre varianti di tonda, cilindrica e ramificata. La distribuzione di frequenza per questo carattere è legata alla complessità dell'organizzazione dei tubercoli, che è minima nel caso della forma tonda e massima nella forma ramificata. PROGRAMMA SAS I dati sono inseriti direttamente nello step di DATA del programma, preceduti dall'istruzione CARDS. L'istruzione INPUT presenta le successive variabili in un ordine scelto a piacere, che nel nostro caso è: gruppo di appartenenza, forma dei tubercoli ed infine la variabile "nindiv" indicante il numero di individui appartenenti al gruppo e presentanti la forma dei tubercoli indicati dalle variabili precedenti. Il segno di dollaro che segue le prime due variabili indica la loro natura alphanumerica. L'analisi viene eseguita nell'ambito della procedura FREQ. Nell'istruzione TABLES si riportano insieme la variabile categorica "gruppo" e la variabile "forma" che è oggetto di analisi. Nell'ambito di questa istruzione, l'opzione CHISQ richiede l'esecuzione del test χ 2 di Pearson. L'opzione EXPECTED richiede invece la stampa delle frequenze attese per classe, mentre l'opzione NOCOL elimina dalla tabella di output i valori delle percentuali degli individui compresi in ciascuna classe rispetto al totale per colonna, di scarsa importanza in casi del genere. La variabile indicata nell'istruzione WEIGHT, "nindiv", indica poi il peso da assegnare a ciascuna osservazione appartenente ad un certo gruppo ed alla variante del carattere la cui analisi è richiesta in TABLES. Tale istruzione e la relativa variabile sarebbero assenti nel caso che ciascuna riga di dati si riferisse ad un solo individuo. Infine, l'istruzione facoltativa TITLE richiede che la stringa di caratteri racchiusa tra gli apici compaia come titolo in ciascuna pagina dell'output. Con TITLE2, un'altra stringa si estende sulla seconda riga. L'ordine delle istruzioni nelle procedure di analisi è facoltativo. L'istruzione RUN chiude il programma SAS. 2.1 OMOGENEITA' DI DUE O PIU' DISTRIBUZIONI DI FREQUENZA C. SCOTTI e M. MOLINARI (NON PUBBL.) ; DATA esempio; INPUT gruppo $ forma $ nindiv; CARDS; minus tonda 6 minus cilind 74 minus ramif 22 plus tonda 16 plus cilind 245 plus ramif 226 ; PROC FREQ; Confronto fra due distribuzioni di frequenza 9

4 TITLE '2.1 omogeneità di due o più distribuzioni'; TITLE2 'di frequenza'; TABLES gruppoforma / CHISQ EXPECTED NOCOL; WEIGHT nindiv; RUN; OUTPUT SAS L'output riporta nella tabella a doppia entrata per ciascuna classe le frequenze assolute osservate (Frequency) ed attese (Expected), le frequenze relative (Percent) ed i valori espressi in percento delle due distribuzioni di frequenza messe a confronto (Row Pct), insieme ai totali marginali espressi anch'essi sia in valori assoluti che relativi. I valori delle frequenze attese ci permettono di verificare che sotto questo aspetto le condizioni per l'analisi richiesta risultano soddisfatte. Il valore del χ 2 ➊ è talmente elevato da poter respingere l'ipotesi nulla di omogeneità delle due distribuzioni osservate con un livello di probabilità di commettere un errore P ❷ La tendenza che si osserva per i tubercoli radicali del gruppo "plus" ad avere una forma, quella ramificata, indice di una organizzazione più complessa, risulta quindi altamente significativa. 2.1 omogeneità di due o più distribuzioni di frequenza TABLE OF GRUPPO BY FORMA GRUPPO FORMA Frequency Expected Percent Row Pct cilind ramif tonda Total minus plus Total STATISTICS FOR TABLE OF GRUPPO BY FORMA Statistic DF Value Prob Chi-Square ➊ ➋ Likelihood Ratio Chi-Square Mantel-Haenszel Chi-Square Phi Coefficient Contingency Coefficient Cramer's V Sample Size = 589 Confronto fra due distribuzioni di frequenza 10

5 2.2 Uguaglianza di due o più proporzioni Nota sull Analisi...(2 a ed.) Sei popolazioni di trifoglio violetto appartenenti tutte all'ecotipo "Bolognino" sono state confrontate per evidenziare, fra i vari caratteri morfologici distintivi, eventuali differenze nella percentuale di piante presentanti marche fogliari. Tale carattere è stato rilevato su un campione di piante per popolazione compreso fra i dieci e i dodici individui completamente randomizzati. PROGRAMMA SAS Dopo l'istruzione INPUT, quella facoltativa LABEL associa la stringa di caratteri racchiusa tra gli apici al nome della variabile alla quale si riferisce; la stampa di tale stringa nell'output, richiesta come opzione, ha lo scopo di rendere più comprensibile la variabile stessa. Nell'ambito della PROC FREQ, l'opzione EXACT richiede l'esecuzione del test esatto di Fisher, poichè il numero di frequenze attese per classe con un valore inferiore a 5 è troppo elevato per permettere l'applicazione del test di Pearson. Le istruzioni TABLES e WEIGHT sono utilizzate secondo modalità analoghe a quelle dell'esempio precedente; l'istruzione LABEL richiede la stampa delle stringhe di caratteri anzidette. 2.2 UGUAGLIANZA DI DUE O PIU' PROPORZIONI P. ANNICCHIARICO (NON PUBBL.) ; DATA esempio; INPUT popol marche $ nindiv; LABEL popol='popolazioni' marche='marche fogliari'; CARDS; 1 no 10 1 si 1 2 no 7 2 si 5 3 no 8 3 si 3 4 no 10 4 si 1 5 no 9 5 si 2 6 no 5 6 si 5 ; PROC FREQ; TITLE '2.2 uguaglianza di due o più proporzioni'; TABLES popolmarche / EXACT NOCOL; WEIGHT nindiv; LABEL; RUN; OUTPUT SAS Il test di Fisher ➊ indica l'assenza di differenze significative tra le popolazioni per il carattere considerato. Confronto fra due distribuzioni di frequenza 11

6 L'avviso in fondo all'output ci conferma che ci troviamo al di fuori delle condizioni di applicazione per il test di Pearson. 2.2 Uguaglianza di due o più proporzioni TABLE OF POPOL BY MARCHE POPOL(popolazioni) MARCHE(marche fogliari) Frequency Percent Row Pct no si Total Total STATISTICS FOR TABLE OF POPOL BY MARCHE Statistic DF Value Prob Chi-Square Likelihood Ratio Chi-Square Mantel-Haenszel Chi-Square Fisher's Exact Test (2-Tail) ➊ Phi Coefficient Contingency Coefficient Cramer's V Sample Size = 66 WARNING: 50% of the cells have expected counts less than 5. Chi-Square may not be a valid test. Confronto fra due distribuzioni di frequenza 12

7 2.3 Omogeneità di due o più distribuzioni di frequenza - esperimento ripetuto nel tempo o nello spazio I dati si ispirano ad un riferimento bibliografico (Dagnelie, 1973, pag. 84). Dei rametti fruttiferi di una cultivar di melo sono stati sottoposti a 4 diversi trattamenti applicati a caso sui rametti stessi. La variabile di risposta, data dal numero di frutti per rametto, è continua ma discreta essendo caratterizzata da tre livelli (0, 1, più di 1 frutto per rametto). Ci si chiede se i trattamenti determinano quote di allegagione diverse. Rispetto all'esempio bibliografico, si immagina che i dati a disposizione per trattamento non derivino da un unico campione bensì da due, relativi ad altrettante località nelle quali è stato ripetuto l'esperimento. E' necessario quindi verificare l'omogeneità della distribuzione di frequenza dei due campioni a disposizione nell'ambito di ciascun trattamento. Se i dati dei due campioni risultano omogenei, cioè risultano appartenere alla stessa popolazione statistica, essi possono essere cumulati per l'esecuzione di un unico test; se non lo risultano, il confronto fra i trattamenti va limitato alle singole località. PROGRAMMA SAS Rispetto all'esempio precedente è qui presente e considerata nell'istruzione INPUT una variabile categorica indicativa della località (1 o 2) di provenienza dei campioni. L'uso di un particolare segno di codice nell'ambito della stessa istruzione, la doppia "chiocciola", consente di riportare i valori relativi a più di un'osservazione su ciascuna riga di programma riservata ai dati. Come si vede, nell'input dei dati il numero di spazi bianchi che dividono due osservazioni sulla stessa riga non è rilevante. La verifica dell'omogeneità dei dati dei due campioni viene eseguita attraverso il test di Fisher richiedendo quattro separate PROC FREQ, ciascuna relativa ad una variante della variabile "tratt". Questo si ottiene attraverso l'uso dell'istruzione BY, secondo una modalità che in SAS ha la funzione di restringere l'esecuzione della procedura richiesta ai sottogruppi identificati dalla variabile categorica indicata da tale istruzione. L'istruzione stessa è però eseguibile solo se le osservazioni sono state preordinate, numericamente e/o alfabeticamente, secondo la variabile categorica indicata; ciò è ottenuto tramite la procedura SORT che precede. L'istruzione NOPRINT sopprime la stampa della tabella a doppia entrata in ciascuna di queste procedure. Verificata l'omogeneità dei dati dei campioni, i dati stessi vengono cumulati attraverso la PROC MEANS che segue. Si indica con l'opzione SUM la richiesta dell'esecuzione della somma dei valori contenuti nella variabile "nindiv", indicata dall'istruzione VAR, separatamente per ciascuno dei sottogruppi identificati dalla combinazione delle varianti delle variabili categoriche indicate in BY (l'uso di quest'ultima istruzione va ancora fatto precedere dalla PROC SORT). Attraverso l'istruzione OUTPUT si richiede la creazione di un nuovo file di dati contenente le somme dei valori nella variabile il cui nome è specificato in SUM= ; tale file, il cui nome è indicato in OUT=, conterrà anche le due variabili che identificano i sedici sottogruppi. L'opzione NOPRINT richiede che i risultati della PROC MEANS non siano riportati nell'output. La successiva PROC FREQ viene eseguita sul nuovo file di dati grazie all'opzione DATA=, che ne specifica il nome. Ogni volta che tale opzione non viene utilizzata, la procedura richiesta viene eseguita sul file di dati impiegato nello STEP precedente, che viene detto perciò "file attivo". Confronto fra due distribuzioni di frequenza 13

8 2.3 OMOGENEITA' DI DUE O PIU' DISTRIBUZIONI DI FREQUENZA - ESPERIMENTO RIPETUTO NEL TEMPO O NELLO SPAZIO ; DATA file1; INPUT tratt $ luogo nfrutti $ LABEL tratt='trattamento' luogo='località' nfrutti='numero di frutti'; CARDS; A A A 1 >1 3 A A A 2 >1 3 B B B 1 >1 1 B B B 2 >1 0 C C C 1 >1 2 C C C 2 >1 0 D D D 1 >1 9 D D D 2 >1 8 ; verifica della omogeneità delle distribuzioni di frequenza dei campioni di ciascun trattamento ; PROC SORT; BY tratt; PROC FREQ; TITLE '2.3 omogeneità di due o più distribuzioni di frequenza -'; TITLE2 'esperimento ripetuto nel tempo o nello spazio'; TITLE4 'test di omogeneità delle distribuzioni di frequenza'; TITLE5 'dei campioni di ciascun trattamento'; BY tratt; TABLES luogonfrutti / EXACT NOPRINT; WEIGHT nindiv; LABEL; esecuzione del test di omogeneità delle distribuzioni di frequenza dei trattamenti sui dati cumulati dei campioni ; PROC SORT; BY tratt nfrutti; PROC MEANS SUM NOPRINT; BY tratt nfrutti; VAR nindiv; OUTPUT OUT=file2 SUM=nindtot; PROC FREQ DATA=file2; TITLE4 'test di omogeneità delle distribuzioni di frequenza'; TITLE5 'dei trattamenti'; TABLES trattnfrutti / CHISQ EXPECTED NOCOL; WEIGHT nindtot; LABEL; RUN; Confronto fra due distribuzioni di frequenza 14

9 OUTPUT SAS I valori del test di Fisher, l'unico affidabile in ognuno dei casi in esame, non consentono di respingere l'ipotesi di omogeneità dei dati dei due campioni ➊. Il test di Pearson indica, con una probabilità di errore molto esigua ➋, che i trattamenti determinano quote di allegagione diverse nella cultivar e nelle località considerate. 2.3 omogeneità di due o più distribuzioni di frequenza - esperimento ripetuto nel tempo o nello spazio test di omogeneità delle distribuzioni di frequenza dei campioni di ciascun trattamento trattamento=a STATISTICS FOR TABLE OF LUOGO BY NFRUTTI Statistic DF Value Prob Chi-Square Likelihood Ratio Chi-Square Mantel-Haenszel Chi-Square Fisher's Exact Test (2-Tail) ➊ Phi Coefficient Contingency Coefficient Cramer's V Sample Size = 359 WARNING: 33% of the cells have expected counts less than 5. Chi-Square may not be a valid test trattamento=b STATISTICS FOR TABLE OF LUOGO BY NFRUTTI Statistic DF Value Prob Chi-Square Likelihood Ratio Chi-Square Mantel-Haenszel Chi-Square Fisher's Exact Test (2-Tail) ➊ Phi Coefficient Contingency Coefficient Cramer's V Sample Size = 379 WARNING: 33% of the cells have expected counts less than 5. Chi-Square may not be a valid test trattamento=c STATISTICS FOR TABLE OF LUOGO BY NFRUTTI Statistic DF Value Prob Chi-Square Likelihood Ratio Chi-Square Mantel-Haenszel Chi-Square Fisher's Exact Test (2-Tail) ➊ Confronto fra due distribuzioni di frequenza 15

10 Phi Coefficient Contingency Coefficient Cramer's V Sample Size = 386 WARNING: 33% of the cells have expected counts less than 5. Chi-Square may not be a valid test trattamento=d STATISTICS FOR TABLE OF LUOGO BY NFRUTTI Statistic DF Value Prob Chi-Square Likelihood Ratio Chi-Square Mantel-Haenszel Chi-Square Fisher's Exact Test (2-Tail) ➊ Phi Coefficient Contingency Coefficient Cramer's V Sample Size = 381 test di omogeneità delle distribuzioni di frequenza dei trattamenti TABLE OF TRATT BY NFRUTTI TRATT(trattamento) NFRUTTI(numero di frutti) Frequency Expected Percent Row Pct 0 1 >1 Total A B C D Total Confronto fra due distribuzioni di frequenza 16

11 STATISTICS FOR TABLE OF TRATT BY NFRUTTI Statistic DF Value Prob Chi-Square ➋ Likelihood Ratio Chi-Square Mantel-Haenszel Chi-Square Phi Coefficient Contingency Coefficient Cramer's V Sample Size = 1505 Confronto fra due distribuzioni di frequenza 17

12 2.4 Indipendenza stocastica di due criteri di classificazione I dati si riferiscono alla caratterizzazione di 1000 genotipi di Cichorium intybus. Si vuole verificare l'indipendenza dei due criteri di classificazione "pubescenza fogliare" e "crespatura fogliare", essendo ciascun criterio costituito semplicemente dalle due varianti presenza - assenza del carattere considerato. Si vuole anche fornire una rappresentazione grafica della distribuzione di frequenze a due dimensioni osservata. PROGRAMMA SAS La struttura del programma è analoga a quella degli esempi precedenti. L'istruzione TABLES indica stavolta le variabili che costituiscono i due criteri di classificazione. L'opzione EXACT richiede l'esecuzione del test esatto di Fisher; come detto, in un caso del genere (tavola di contingenza 2 x 2) anche l'opzione CHISQ avrebbe permesso l'esecuzione di questo test. Attraverso la PROC CHART vengono eseguiti istogrammi di vario tipo ed altre rappresentazioni grafiche del genere. L'istruzione BLOCK specifica la rappresentazione desiderata, l'istogramma a colonne, mentre la variabile che la segue indica il primo criterio di classificazione. L'opzione GROUP e la variabile associata indicano la presenza ed il nome della seconda variabile categorica; l'opzione SUMVAR riporta la variabile indicante il numero di individui appartenenti a ciascuna classe identificata dai criteri di classificazione; infine DISCRETE informa che nessuna delle variabili categoriche è del tipo continuo con dati da riunire in classi di frequenza. 2.4 INDIPENDENZA STOCASTICA DI 2 O PIU' CRITERI DI CLASSIFICAZIONE DAGNELIE (1973) - PAG. 91, DAGNELIE (1975) - PAG. 89 ; DATA esempio; INPUT pubesc $ crespat $ nindiv; LABEL pubesc='pubescenza fogliare' crespat='crespatura fogliare'; CARDS; no no 506 no si 326 si no 83 si si 85 ; PROC FREQ; TITLE '2.4 indipendenza stocastica di due o più criteri'; TITLE2 'di classificazione'; WEIGHT nindiv; TABLES pubesccrespat / EXACT; PROC CHART; TITLE3 'distribuzione di frequenze a due dimensioni osservata'; BLOCK pubesc / SUMVAR=nindiv GROUP=crespat DISCRETE; LABEL; RUN; OUTPUT SAS L'ipotesi nulla di indipendenza dei due criteri di classificazione può essere respinta con un livello di P 0.01 in funzione tanto del test di Pearson ➊ che del test di Fisher (2-Tail) ➋, Confronto fra due distribuzioni di frequenza 18

13 indicando quest'ultimo una probabilità di errore nel respingere tale ipotesi pari a 7.58 x (10) -3 = Deduciamo però dai coefficienti di correlazione non parametrica riportati ➌ che l'associazione fra i due caratteri, sebbene significativa, è piuttosto debole. 2.4 Indipendenza stocastica di due o più criteri di classificazione TABLE OF PUBESC BY CRESPAT PUBESC(pubescenza fogliare) CRESPAT(crespatura fogliare) Frequency Percent Row Pct Col Pct no si Total no si Total STATISTICS FOR TABLE OF PUBESC BY CRESPAT Statistic DF Value Prob Chi-Square ➊ Likelihood Ratio Chi-Square Continuity Adj. Chi-Square Mantel-Haenszel Chi-Square Fisher's Exact Test (Left) (Right) 4.12E-03 (2-Tail) 7.58E-03 ➋ Phi Coefficient ➌ Contingency Coefficient Cramer's V Sample Size = 1000 Confronto fra due distribuzioni di frequenza 19

14 distibuzione di frequenze a due dimensioni osservata SUM OF NINDIV BY PUBESC GROUPED BY CRESPAT /_ / crespatura fogliare /_ / / / / /_ / / si / / / / / / / / 326 / 85 / / / / / / / / / /_ / / no / / / / / / / / / / / / 506 / 83 / / / / no si pubescenza fogliare Confronto fra due distribuzioni di frequenza 20

15 2.5 Bontà dell'adattamento di una distribuzione di frequenze osservata ad una determinata distribuzione teorica Si vuole determinare se la distribuzione spaziale di piante di asfodelo sia in accordo con la distribuzione teorica di Poisson (indice di una distribuzione del tutto casuale degli individui). A questo scopo si è determinato il numero di piante presenti in ciascuna di 512 parcelle quadrate di un metro di lato ciascuna scelte a caso nella località di rilevamento. Tali parcelle sono state poi riunite in classi di frequenza in funzione del numero di piante contenute. Le frequenze assolute della distribuzione teorica sono state previamente calcolate attraverso la relativa formula di ricorrenza della distribuzione, dopo aver utilizzato il valore della media osservato come stima del parametro non conosciuto di questa distribuzione teorica non completamente definita. Le classi con un numero di individui superiore ad 8 sono state poi riunite in un'unica classe, per rientrare nelle condizioni di applicazione del test di Pearson che prevedono per il numero di classi indicato non più di una delle frequenze teoriche inferiore a 5. PROGRAMMA SAS Il test richiesto è eseguibile solo attraverso una serie di istruzioni che prevedono il calcolo del χ 2 osservato e la successiva verifica del suo livello di significatività tramite la funzione PROBCHI del SAS. Il programma non viene commentato in dettaglio, ma ci si sofferma solo sui punti di esso che possono variare in coincidenza con dati, numero di classi e distribuzioni teoriche differenti. Nell'istruzione INPUT le variabili classe, nosserv e nteoric si riferiscono rispettivamente alle classi di frequenza ed al numero di individui contenuti in esse secondo la distribuzione osservata e secondo quella teorica. Mantenendo inalterati tali nomi, la sola parte del programma da variare nella risoluzione di un problema analogo è, a parte la porzione riservata all'input dei dati, il numero indicato tra parentesi nella funzione PROBCHI verso la fine del programma. Tale numero indica i gradi di libertà da considerare nell'esecuzione del test di Pearson. Esso è pari al numero di classi di frequenza meno uno nel caso di distribuzioni completamente definite. Se, come in questo e nella gran parte dei casi, la distribuzione non è completamente definita occorrerà sottrarre un grado di libertà aggiuntivo per ogni parametro della distribuzione che si è dovuto stimare (in questo caso è uno). 2.5 BONTA' DELL'ADATTAMENTO DI UNA DISTRIBUZIONE DI FREQUENZE OSSERVATA AD UNA DETERMINATA DISTRIBUZIONE TEORICA DAGNELIE (1975) - PAG. 67 ; DATA file1; INPUT CLASSE $ NOSSERV NTEORIC; SCARTO = (NOSSERV - NTEORIC) 2 / NTEORIC; CARDS; Confronto fra due distribuzioni di frequenza 21

16 > ; calcolo del valore del X 2 ; PROC MEANS SUM NOPRINT; VAR SCARTO; OUTPUT OUT=file2 SUM=CHIQU; determinazione della significatività del X 2 tramite la funzione PROBCHI ; DATA file3; SET file2; PROBCHI = PROBCHI (CHIQU,8); ALPHA = 1 - PROBCHI; FILE PRINT; TITLE '2.5 bontà dell'adattamento di una distribuzione di frequenze'; TITLE2 'osservata ad una determinata distribuzione teorica'; PUT ' '; PUT ' chi quadrato = ' CHIQU ' alpha = ' ALPHA; RUN; OUTPUT SAS L'ipotesi di distribuzione casuale delle piante di asfodelo può essere respinta con una probabilità di errore talmente ridotta da essere riportata come 0 in alpha. In effetti, la distribuzione di tali piante è di tipo aggregativo. 2.5 Bontà dell'adattamento di una distribuzione di frequenze osservata ad una determinata distribuzione teorica chi quadrato = alpha = 0 Confronto fra due distribuzioni di frequenza 22

3 Confronto fra due popolazioni attraverso il test t e test analoghi

3 Confronto fra due popolazioni attraverso il test t e test analoghi 3 Confronto fra due popolazioni attraverso il test t e test analoghi Consideriamo in questo capitolo gli esperimenti comprendenti un solo fattore fisso, e nel loro ambito quelli in cui questo criterio

Dettagli

STATISTICA IX lezione

STATISTICA IX lezione Anno Accademico 013-014 STATISTICA IX lezione 1 Il problema della verifica di un ipotesi statistica In termini generali, si studia la distribuzione T(X) di un opportuna grandezza X legata ai parametri

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 12-Il t-test per campioni appaiati vers. 1.2 (7 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

VERIFICA DELLE IPOTESI

VERIFICA DELLE IPOTESI VERIFICA DELLE IPOTESI Nella verifica delle ipotesi è necessario fissare alcune fasi prima di iniziare ad analizzare i dati. a) Si deve stabilire quale deve essere l'ipotesi nulla (H0) e quale l'ipotesi

Dettagli

ANALISI DELLE FREQUENZE: IL TEST CHI 2

ANALISI DELLE FREQUENZE: IL TEST CHI 2 ANALISI DELLE FREQUENZE: IL TEST CHI 2 Quando si hanno scale nominali o ordinali, non è possibile calcolare il t, poiché non abbiamo medie, ma solo frequenze. In questi casi, per verificare se un evento

Dettagli

Corso di. Dott.ssa Donatella Cocca

Corso di. Dott.ssa Donatella Cocca Corso di Statistica medica e applicata Dott.ssa Donatella Cocca 1 a Lezione Cos'è la statistica? Come in tutta la ricerca scientifica sperimentale, anche nelle scienze mediche e biologiche è indispensabile

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 10-Il test t per un campione e la stima intervallare (vers. 1.1, 25 ottobre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia,

Dettagli

Esercitazione 1 del corso di Statistica 2 Prof. Domenico Vistocco

Esercitazione 1 del corso di Statistica 2 Prof. Domenico Vistocco Esercitazione 1 del corso di Statistica 2 Prof. Domenico Vistocco Alfonso Iodice D Enza April 26, 2007 1...prima di cominciare Contare, operazione solitamente semplice, può diventare complicata se lo scopo

Dettagli

Strumenti informatici 13.1

Strumenti informatici 13.1 1 Strumenti informatici 1.1 I test post-hoc nel caso del confronto fra tre o più proporzioni dipendenti e la realizzazione del test Q di Cochran in SPSS Nel caso dei test post-hoc per il test Q di Cochran,

Dettagli

Il concetto di valore medio in generale

Il concetto di valore medio in generale Il concetto di valore medio in generale Nella statistica descrittiva si distinguono solitamente due tipi di medie: - le medie analitiche, che soddisfano ad una condizione di invarianza e si calcolano tenendo

Dettagli

LEZIONE n. 5 (a cura di Antonio Di Marco)

LEZIONE n. 5 (a cura di Antonio Di Marco) LEZIONE n. 5 (a cura di Antonio Di Marco) IL P-VALUE (α) Data un ipotesi nulla (H 0 ), questa la si può accettare o rifiutare in base al valore del p- value. In genere il suo valore è un numero molto piccolo,

Dettagli

Un gioco con tre dadi

Un gioco con tre dadi Un gioco con tre dadi Livello scolare: biennio Abilità interessate Costruire lo spazio degli eventi in casi semplici e determinarne la cardinalità. Valutare la probabilità in diversi contesti problematici.

Dettagli

Capitolo 2 Distribuzioni di frequenza

Capitolo 2 Distribuzioni di frequenza Edizioni Simone - Vol. 43/1 Compendio di statistica Capitolo 2 Distribuzioni di frequenza Sommario 1. Distribuzioni semplici. - 2. Distribuzioni doppie. - 3. Distribuzioni parziali: condizionate e marginali.

Dettagli

SISTEMI DI NUMERAZIONE E CODICI

SISTEMI DI NUMERAZIONE E CODICI SISTEMI DI NUMERAZIONE E CODICI Il Sistema di Numerazione Decimale Il sistema decimale o sistema di numerazione a base dieci usa dieci cifre, dette cifre decimali, da O a 9. Il sistema decimale è un sistema

Dettagli

Capitolo 12 La regressione lineare semplice

Capitolo 12 La regressione lineare semplice Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara

Dettagli

Analisi sensitività. Strumenti per il supporto alle decisioni nel processo di Valutazione d azienda

Analisi sensitività. Strumenti per il supporto alle decisioni nel processo di Valutazione d azienda Analisi sensitività. Strumenti per il supporto alle decisioni nel processo di Valutazione d azienda Premessa Con l analisi di sensitività il perito valutatore elabora un range di valori invece di un dato

Dettagli

Prova di autovalutazione Prof. Roberta Siciliano

Prova di autovalutazione Prof. Roberta Siciliano Prova di autovalutazione Prof. Roberta Siciliano Esercizio 1 Nella seguente tabella è riportata la distribuzione di frequenza dei prezzi per camera di alcuni agriturismi, situati nella regione Basilicata.

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 29-Analisi della potenza statistica vers. 1.0 (12 dicembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

Analisi della varianza (anova) a due vie

Analisi della varianza (anova) a due vie Analisi della varianza (anova) a due vie Andrea Onofri 27 marzo 2014 Indice 1 Il concetto di interazione 1 2 Tipi di interazione 2 3 Descrizione del caso studio 3 4 Analisi dei dati 4 Sommario Scopo di

Dettagli

Analisi di dati di frequenza

Analisi di dati di frequenza Analisi di dati di frequenza Fase di raccolta dei dati Fase di memorizzazione dei dati in un foglio elettronico 0 1 1 1 Frequenze attese uguali Si assuma che dalle risposte al questionario sullo stato

Dettagli

CAPITOLO III CONFRONTI TRA DISTRIBUZIONI

CAPITOLO III CONFRONTI TRA DISTRIBUZIONI CAPITOLO III CONFRONTI TRA DISTRIBUZIONI 3.1 CONFRONTI TRA DISTRIBUZIONI OSSERVATE E DISTRIBUZIONI TEORICHE OD ATTESE. Nella teoria statistica e nella pratica sperimentale, è frequente la necessità di

Dettagli

Stima per intervalli Nei metodi di stima puntuale è sempre presente un ^ errore θ θ dovuto al fatto che la stima di θ in genere non coincide con il parametro θ. Sorge quindi l esigenza di determinare una

Dettagli

CHIUSURE di MAGAZZINO di FINE ANNO

CHIUSURE di MAGAZZINO di FINE ANNO CHIUSURE di MAGAZZINO di FINE ANNO Operazioni da svolgere per il riporto delle giacenze di fine esercizio Il documento che segue ha lo scopo di illustrare le operazioni che devono essere eseguite per:

Dettagli

PROGRAMMA SVOLTO NELLA SESSIONE N.

PROGRAMMA SVOLTO NELLA SESSIONE N. Università C. Cattaneo Liuc, Corso di Statistica, Sessione n. 1, 2014 Laboratorio Excel Sessione n. 1 Venerdì 031014 Gruppo PZ Lunedì 061014 Gruppo AD Martedì 071014 Gruppo EO PROGRAMMA SVOLTO NELLA SESSIONE

Dettagli

Disegni di Ricerca e Analisi dei Dati in Psicologia Clinica. Indici di Affidabilità

Disegni di Ricerca e Analisi dei Dati in Psicologia Clinica. Indici di Affidabilità Disegni di Ricerca e Analisi dei Dati in Psicologia Clinica Indici di Affidabilità L Attendibilità È il livello in cui una misura è libera da errore di misura È la proporzione di variabilità della misurazione

Dettagli

Statistica. Lezione 6

Statistica. Lezione 6 Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 6 a.a 011-01 Dott.ssa Daniela Ferrante

Dettagli

Strumenti e metodi per la redazione della carta del pericolo da fenomeni torrentizi

Strumenti e metodi per la redazione della carta del pericolo da fenomeni torrentizi Versione 2.0 Strumenti e metodi per la redazione della carta del pericolo da fenomeni torrentizi Corso anno 2011 E. MANUALE UTILIZZO HAZARD MAPPER Il programma Hazard Mapper è stato realizzato per redarre,

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2014-2015 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

Luigi Piroddi piroddi@elet.polimi.it

Luigi Piroddi piroddi@elet.polimi.it Automazione industriale dispense del corso 10. Reti di Petri: analisi strutturale Luigi Piroddi piroddi@elet.polimi.it Analisi strutturale Un alternativa all analisi esaustiva basata sul grafo di raggiungibilità,

Dettagli

Facciamo qualche precisazione

Facciamo qualche precisazione Abbiamo introdotto alcuni indici statistici (di posizione, di variabilità e di forma) ottenibili da Excel con la funzione Riepilogo Statistiche Facciamo qualche precisazione Al fine della partecipazione

Dettagli

Il confronto fra proporzioni

Il confronto fra proporzioni L. Boni Il rapporto Un rapporto (ratio), attribuendo un ampio significato al termine, è il risultato della divisione di una certa quantità a per un altra quantità b Il rapporto Spesso, in maniera più specifica,

Dettagli

Indice Statistiche Univariate Statistiche Bivariate

Indice Statistiche Univariate Statistiche Bivariate Indice 1 Statistiche Univariate 1 1.1 Importazione di un file.data.............................. 1 1.2 Medie e variabilità................................... 6 1.3 Distribuzioni di frequenze...............................

Dettagli

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a) Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B Eventi indipendenti: un evento non influenza l altro Eventi disgiunti: il verificarsi di un evento esclude l altro Evento prodotto:

Dettagli

SPC e distribuzione normale con Access

SPC e distribuzione normale con Access SPC e distribuzione normale con Access In questo articolo esamineremo una applicazione Access per il calcolo e la rappresentazione grafica della distribuzione normale, collegata con tabelle di Clienti,

Dettagli

Un po di statistica. Christian Ferrari. Laboratorio di Matematica

Un po di statistica. Christian Ferrari. Laboratorio di Matematica Un po di statistica Christian Ferrari Laboratorio di Matematica 1 Introduzione La statistica è una parte della matematica applicata che si occupa della raccolta, dell analisi e dell interpretazione di

Dettagli

UNIVERSITÀ DEGLI STUDI DI TERAMO

UNIVERSITÀ DEGLI STUDI DI TERAMO UNIVERSITÀ DEGLI STUDI DI TERAMO CORSO DI LAUREA IN ECONOMIA BANCARIA FINANZIARIA ED ASSICURATIVA (Classe 7) Corso di Matematica per l Economia (Prof. F. Eugeni) TEST DI INGRESSO Teramo, ottobre 00 SEZIONE

Dettagli

L Analisi della Varianza ANOVA (ANalysis Of VAriance)

L Analisi della Varianza ANOVA (ANalysis Of VAriance) L Analisi della Varianza ANOVA (ANalysis Of VAriance) 1 CONCETTI GENERALI Finora abbiamo descritto test di ipotesi finalizzati alla verifica di ipotesi sulla differenza tra parametri di due popolazioni

Dettagli

1. Distribuzioni campionarie

1. Distribuzioni campionarie Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 2012/2013 lezioni di statistica del 3 e 6 giugno 2013 - di Massimo Cristallo - 1. Distribuzioni campionarie

Dettagli

RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL

RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL 1 RAPPRESENTAZIONE GRAFICA Per l analisi dati con Excel si fa riferimento alla versione 2007 di Office, le versioni successive non differiscono

Dettagli

11. Analisi statistica degli eventi idrologici estremi

11. Analisi statistica degli eventi idrologici estremi . Analisi statistica degli eventi idrologici estremi I processi idrologici evolvono, nello spazio e nel tempo, secondo modalità che sono in parte predicibili (deterministiche) ed in parte casuali (stocastiche

Dettagli

Statistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice

Statistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice Esercitazione 15 Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () 1 / 18 L importanza del gruppo di controllo In tutti i casi in cui si voglia studiare l effetto di un certo

Dettagli

Analisi dei residui. Test Esatto di Fisher. Differenza fra proporzioni

Analisi dei residui. Test Esatto di Fisher. Differenza fra proporzioni Statistica Economica Materiale didattico a cura del docente Analisi dei residui Test Esatto di Fisher Differenza fra proporzioni 1 Analisi dei residui Il test statistico ed il suo p-valore riassumono la

Dettagli

( x) ( x) 0. Equazioni irrazionali

( x) ( x) 0. Equazioni irrazionali Equazioni irrazionali Definizione: si definisce equazione irrazionale un equazione in cui compaiono uno o più radicali contenenti l incognita. Esempio 7 Ricordiamo quanto visto sulle condizioni di esistenza

Dettagli

Capitolo 13: L offerta dell impresa e il surplus del produttore

Capitolo 13: L offerta dell impresa e il surplus del produttore Capitolo 13: L offerta dell impresa e il surplus del produttore 13.1: Introduzione L analisi dei due capitoli precedenti ha fornito tutti i concetti necessari per affrontare l argomento di questo capitolo:

Dettagli

Excel Terza parte. Excel 2003

Excel Terza parte. Excel 2003 Excel Terza parte Excel 2003 TABELLA PIVOT Selezioniamo tutti i dati (con le relative etichette) Dati Rapporto tabella pivot e grafico pivot Fine 2 La tabella pivot viene messa di default in una pagina

Dettagli

Interesse, sconto, ratei e risconti

Interesse, sconto, ratei e risconti TXT HTM PDF pdf P1 P2 P3 P4 293 Interesse, sconto, ratei e risconti Capitolo 129 129.1 Interesse semplice....................................................... 293 129.1.1 Esercizio per il calcolo dell

Dettagli

IL TEST CHI QUADRATO χ 2

IL TEST CHI QUADRATO χ 2 IL TEST CHI QUADRATO χ 2 Test parametrici I test studiati nelle lezioni precedenti (test-t, testz) consentono la verifica di ipotesi relative al valore di specifici parametri di popolazione Esempio: differenza

Dettagli

Siamo così arrivati all aritmetica modulare, ma anche a individuare alcuni aspetti di come funziona l aritmetica del calcolatore come vedremo.

Siamo così arrivati all aritmetica modulare, ma anche a individuare alcuni aspetti di come funziona l aritmetica del calcolatore come vedremo. DALLE PESATE ALL ARITMETICA FINITA IN BASE 2 Si è trovato, partendo da un problema concreto, che con la base 2, utilizzando alcune potenze della base, operando con solo addizioni, posso ottenere tutti

Dettagli

Dimensione di uno Spazio vettoriale

Dimensione di uno Spazio vettoriale Capitolo 4 Dimensione di uno Spazio vettoriale 4.1 Introduzione Dedichiamo questo capitolo ad un concetto fondamentale in algebra lineare: la dimensione di uno spazio vettoriale. Daremo una definizione

Dettagli

matematica probabilmente

matematica probabilmente IS science centre immaginario scientifico Laboratorio dell'immaginario Scientifico - Trieste tel. 040224424 - fax 040224439 - e-mail: lis@lis.trieste.it - www.immaginarioscientifico.it indice Altezze e

Dettagli

Pro e contro delle RNA

Pro e contro delle RNA Pro e contro delle RNA Pro: - flessibilità: le RNA sono approssimatori universali; - aggiornabilità sequenziale: la stima dei pesi della rete può essere aggiornata man mano che arriva nuova informazione;

Dettagli

Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI

Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI 1. L azienda Wood produce legno compensato per costruzioni

Dettagli

Strumenti informatici 2.1 - Realizzare grafici e tabelle con Excel e SPSS

Strumenti informatici 2.1 - Realizzare grafici e tabelle con Excel e SPSS Strumenti informatici 2.1 - Realizzare grafici e tabelle con Excel e SPSS Realizzare un grafico con Excel è molto semplice, e permette tutta una serie di varianti. Il primo passo consiste nell organizzare

Dettagli

Statistica descrittiva: prime informazioni dai dati sperimentali

Statistica descrittiva: prime informazioni dai dati sperimentali SECONDO APPUNTAMENTO CON LA SPERIMENTAZIONE IN AGRICOLTURA Statistica descrittiva: prime informazioni dai dati sperimentali La statistica descrittiva rappresenta la base di partenza per le applicazioni

Dettagli

Metodologia per l analisi dei dati sperimentali L analisi di studi con variabili di risposta multiple: Regressione multipla

Metodologia per l analisi dei dati sperimentali L analisi di studi con variabili di risposta multiple: Regressione multipla Il metodo della regressione può essere esteso dal caso in cui si considera la variabilità della risposta della y in relazione ad una sola variabile indipendente X ad una situazione più generale in cui

Dettagli

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione)

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione) Esercitazione #5 di Statistica Test ed Intervalli di Confidenza (per una popolazione) Dicembre 00 1 Esercizi 1.1 Test su media (con varianza nota) Esercizio n. 1 Il calore (in calorie per grammo) emesso

Dettagli

Test statistici di verifica di ipotesi

Test statistici di verifica di ipotesi Test e verifica di ipotesi Test e verifica di ipotesi Il test delle ipotesi consente di verificare se, e quanto, una determinata ipotesi (di carattere biologico, medico, economico,...) è supportata dall

Dettagli

Servizi di consulenza specialistica per IGRUE 2009 2012

Servizi di consulenza specialistica per IGRUE 2009 2012 Allegato 9A Metodo della stima delle differenze Descrizione della procedura Il metodo della stima delle differenze è indicato qualora il controllore ritenga che la popolazione sia affetta da un tasso di

Dettagli

Relazioni statistiche: regressione e correlazione

Relazioni statistiche: regressione e correlazione Relazioni statistiche: regressione e correlazione È detto studio della connessione lo studio si occupa della ricerca di relazioni fra due variabili statistiche o fra una mutabile e una variabile statistica

Dettagli

Leasing secondo lo IAS 17

Leasing secondo lo IAS 17 Leasing secondo lo IAS 17 Leasing: Ias 17 Lo Ias 17 prevede modalità diverse di rappresentazione contabile a seconda si tratti di leasing finanziario o di leasing operativo. Il leasing è un contratto per

Dettagli

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: Esempi di domande risposta multipla (Modulo II) 1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: 1) ha un numero di elementi pari a 5; 2) ha un numero di elementi

Dettagli

RELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della

RELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della RELAZIONE TRA VARIABILI QUANTITATIVE Lezione 7 a Accade spesso nella ricerca in campo biomedico, così come in altri campi della scienza, di voler studiare come il variare di una o più variabili (variabili

Dettagli

Onestà di un dado. Relazione sperimentale

Onestà di un dado. Relazione sperimentale Onestà di un dado Relazione sperimentale La valutazione dell onesta di un qualunque dado a n facce è svolta mediante l analisi statistica di un set di tiri del medesimo ed il confronto con i valori teorici.

Dettagli

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE La presentazione dei dati per molte ricerche mediche fa comunemente riferimento a frequenze, assolute o percentuali. Osservazioni cliniche conducono sovente

Dettagli

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010 LEZIONE 3 "Educare significa aiutare l'animo dell'uomo ad entrare nella totalità della realtà. Non si può però educare se non rivolgendosi alla libertà, la quale definisce il singolo, l'io. Quando uno

Dettagli

LE FUNZIONI A DUE VARIABILI

LE FUNZIONI A DUE VARIABILI Capitolo I LE FUNZIONI A DUE VARIABILI In questo primo capitolo introduciamo alcune definizioni di base delle funzioni reali a due variabili reali. Nel seguito R denoterà l insieme dei numeri reali mentre

Dettagli

PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE

PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) PROBABILITÀ -

Dettagli

Modulo: Fogli elettronici

Modulo: Fogli elettronici Corso: Abilità Informatiche Modulo: Fogli elettronici Pagina 1 di 18 Autori del Modulo: Bruno fadini; Pino Cepparulo Presentazione del Modulo: Versione Italiano Il modulo, corrispondente al modulo 4 dell'ecdl

Dettagli

GUIDA RAPIDA PER LA COMPILAZIONE DELLA SCHEDA CCNL GUIDA RAPIDA PER LA COMPILAZIONE DELLA SCHEDA CCNL

GUIDA RAPIDA PER LA COMPILAZIONE DELLA SCHEDA CCNL GUIDA RAPIDA PER LA COMPILAZIONE DELLA SCHEDA CCNL GUIDA RAPIDA BOZZA 23/07/2008 INDICE 1. PERCHÉ UNA NUOVA VERSIONE DEI MODULI DI RACCOLTA DATI... 3 2. INDICAZIONI GENERALI... 4 2.1. Non modificare la struttura dei fogli di lavoro... 4 2.2. Cosa significano

Dettagli

Corso di Psicometria Progredito

Corso di Psicometria Progredito Corso di Psicometria Progredito 3.1 Introduzione all inferenza statistica Prima Parte Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014

Dettagli

iovanella@disp.uniroma2.it http://www.disp.uniroma2.it/users/iovanella Verifica di ipotesi

iovanella@disp.uniroma2.it http://www.disp.uniroma2.it/users/iovanella Verifica di ipotesi iovanella@disp.uniroma2.it http://www.disp.uniroma2.it/users/iovanella Verifica di ipotesi Idea di base Supponiamo di avere un idea del valore (incognito) di una media di un campione, magari attraverso

Dettagli

Statistica inferenziale

Statistica inferenziale Statistica inferenziale Popolazione e campione Molto spesso siamo interessati a trarre delle conclusioni su persone che hanno determinate caratteristiche (pazienti, atleti, bambini, gestanti, ) Osserveremo

Dettagli

MATLAB. Caratteristiche. Dati. Esempio di programma MATLAB. a = [1 2 3; 4 5 6; 7 8 9]; b = [1 2 3] ; c = a*b; c

MATLAB. Caratteristiche. Dati. Esempio di programma MATLAB. a = [1 2 3; 4 5 6; 7 8 9]; b = [1 2 3] ; c = a*b; c Caratteristiche MATLAB Linguaggio di programmazione orientato all elaborazione di matrici (MATLAB=MATrix LABoratory) Le variabili sono matrici (una variabile scalare equivale ad una matrice di dimensione

Dettagli

E naturale chiedersi alcune cose sulla media campionaria x n

E naturale chiedersi alcune cose sulla media campionaria x n Supponiamo che un fabbricante stia introducendo un nuovo tipo di batteria per un automobile elettrica. La durata osservata x i delle i-esima batteria è la realizzazione (valore assunto) di una variabile

Dettagli

Laboratorio di Pedagogia Sperimentale. Indice

Laboratorio di Pedagogia Sperimentale. Indice INSEGNAMENTO DI LABORATORIO DI PEDAGOGIA SPERIMENTALE LEZIONE III INTRODUZIONE ALLA RICERCA SPERIMENTALE (PARTE III) PROF. VINCENZO BONAZZA Indice 1 L ipotesi -----------------------------------------------------------

Dettagli

Relazioni tra variabili

Relazioni tra variabili Università degli Studi di Padova Facoltà di Medicina e Chirurgia Corso di Laurea in Medicina e Chirurgia - A.A. 009-10 Scuole di specializzazione in: Medicina Legale, Medicina del Lavoro, Igiene e Medicina

Dettagli

OCCUPATI SETTORE DI ATTIVITA' ECONOMICA

OCCUPATI SETTORE DI ATTIVITA' ECONOMICA ESERCIZIO 1 La tabella seguente contiene i dati relativi alla composizione degli occupati in Italia relativamente ai tre macrosettori di attività (agricoltura, industria e altre attività) negli anni 1971

Dettagli

L analisi dei rischi: l aspetto statistico Ing. Pier Giorgio DELLA ROLE Six Sigma Master Black Belt

L analisi dei rischi: l aspetto statistico Ing. Pier Giorgio DELLA ROLE Six Sigma Master Black Belt L analisi dei rischi: l aspetto statistico Ing. Pier Giorgio DELL ROLE Six Sigma Master lack elt Dicembre, 009 Introduzione Nell esecuzione dei progetti Six Sigma è di fondamentale importanza sapere se

Dettagli

Il coefficiente di correlazione di Spearman per ranghi

Il coefficiente di correlazione di Spearman per ranghi Il coefficiente di correlazione di Spearman per ranghi Questo indice di correlazione non parametrico viene indicato con r s o Spearman rho e permette di valutare la forza del rapporto tra due variabili

Dettagli

Statistiche campionarie

Statistiche campionarie Statistiche campionarie Sul campione si possono calcolare le statistiche campionarie (come media campionaria, mediana campionaria, varianza campionaria,.) Le statistiche campionarie sono stimatori delle

Dettagli

VALORE DELLE MERCI SEQUESTRATE

VALORE DELLE MERCI SEQUESTRATE La contraffazione in cifre: NUOVA METODOLOGIA PER LA STIMA DEL VALORE DELLE MERCI SEQUESTRATE Roma, Giugno 2013 Giugno 2013-1 Il valore economico dei sequestri In questo Focus si approfondiscono alcune

Dettagli

Test non parametrici. Test non parametrici. Test non parametrici. Test non parametrici

Test non parametrici. Test non parametrici. Test non parametrici. Test non parametrici Test non parametrici Test non parametrici Il test T di Student per uno o per due campioni, il test F di Fisher per l'analisi della varianza, la correlazione, la regressione, insieme ad altri test di statistica

Dettagli

APPUNTI SU PROBLEMI CON CALCOLO PERCENTUALE

APPUNTI SU PROBLEMI CON CALCOLO PERCENTUALE APPUNTI SU PROBLEMI CON CALCOLO PERCENTUALE 1. Proporzionalità diretta e proporzionalità inversa Analizziamo le seguenti formule Peso Lordo = Peso Netto + Tara Ricavo = Utile + Costo Rata = Importo + Interesse

Dettagli

1. PRIME PROPRIETÀ 2

1. PRIME PROPRIETÀ 2 RELAZIONI 1. Prime proprietà Il significato comune del concetto di relazione è facilmente intuibile: due elementi sono in relazione se c è un legame tra loro descritto da una certa proprietà; ad esempio,

Dettagli

Definire all'interno del codice un vettore di interi di dimensione DIM, es. int array[] = {1, 5, 2, 4, 8, 1, 1, 9, 11, 4, 12};

Definire all'interno del codice un vettore di interi di dimensione DIM, es. int array[] = {1, 5, 2, 4, 8, 1, 1, 9, 11, 4, 12}; ESERCIZI 2 LABORATORIO Problema 1 Definire all'interno del codice un vettore di interi di dimensione DIM, es. int array[] = {1, 5, 2, 4, 8, 1, 1, 9, 11, 4, 12}; Chiede all'utente un numero e, tramite ricerca

Dettagli

Appendice I. Principali procedure ed istruzioni per la gestione di files, l'analisi statistica di tipo descrittivo e la correlazione semplice

Appendice I. Principali procedure ed istruzioni per la gestione di files, l'analisi statistica di tipo descrittivo e la correlazione semplice . Principali procedure ed istruzioni per la gestione di files, l'analisi statistica di tipo descrittivo e la correlazione semplice Ordinamento di osservazioni: PROC SORT PROC SORT DATA=fa il sort è numerico

Dettagli

Probabilità discreta

Probabilità discreta Probabilità discreta Daniele A. Gewurz 1 Che probabilità c è che succeda...? Una delle applicazioni della combinatoria è nel calcolo di probabilità discrete. Quando abbiamo a che fare con un fenomeno che

Dettagli

Sostituto abilitato Entratel con più sedi: ricezione diretta e incarico ad intermediario abilitato

Sostituto abilitato Entratel con più sedi: ricezione diretta e incarico ad intermediario abilitato FAQ Flusso telematico dei modelli 730-4 D.M. 31 maggio 1999, n. 164 Comunicazione dei sostituti d imposta per la ricezione telematica, tramite l Agenzia delle entrate, dei dati dei 730-4 relativi ai mod.

Dettagli

ANALISI DI CORRELAZIONE

ANALISI DI CORRELAZIONE ANALISI DI CORRELAZIONE Esempio: Dati raccolti da n = 129 studenti di Pavia (A.A. 21/2) Altezza (cm) Peso (Kg) Voto Algebra e Geometria Voto Fisica I Valutare la correlazione delle seguenti coppie: Peso

Dettagli

Verifica di ipotesi e intervalli di confidenza nella regressione multipla

Verifica di ipotesi e intervalli di confidenza nella regressione multipla Verifica di ipotesi e intervalli di confidenza nella regressione multipla Eduardo Rossi 2 2 Università di Pavia (Italy) Maggio 2014 Rossi MRLM Econometria - 2014 1 / 23 Sommario Variabili di controllo

Dettagli

Excel. A cura di Luigi Labonia. e-mail: luigi.lab@libero.it

Excel. A cura di Luigi Labonia. e-mail: luigi.lab@libero.it Excel A cura di Luigi Labonia e-mail: luigi.lab@libero.it Introduzione Un foglio elettronico è un applicazione comunemente usata per bilanci, previsioni ed altri compiti tipici del campo amministrativo

Dettagli

Appunti sulla Macchina di Turing. Macchina di Turing

Appunti sulla Macchina di Turing. Macchina di Turing Macchina di Turing Una macchina di Turing è costituita dai seguenti elementi (vedi fig. 1): a) una unità di memoria, detta memoria esterna, consistente in un nastro illimitato in entrambi i sensi e suddiviso

Dettagli

Esercizio 1. Verifica di ipotesi sulla media (varianza nota), p-value del test

Esercizio 1. Verifica di ipotesi sulla media (varianza nota), p-value del test STATISTICA (2) ESERCITAZIONE 6 05.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Verifica di ipotesi sulla media (varianza nota), p-value del test Il preside della scuola elementare XYZ sospetta che

Dettagli

Clustering. Utilizziamo per la realizzazione dell'esempio due tipologie di software:

Clustering. Utilizziamo per la realizzazione dell'esempio due tipologie di software: Esercizio Clustering Utilizziamo per la realizzazione dell'esempio due tipologie di software: - XLSTAT.xls - Cluster.exe XLSTAT.xls XLSTAT.xls è una macro di Excel che offre la possibilità di effettuare

Dettagli

Fogli Elettronici: MS Excel

Fogli Elettronici: MS Excel Fogli Elettronici: MS Excel Informatica - A.A. 2010/2011 - Excel 7.0 Foglio Elettronico Un foglio elettronico (o spreadsheet) è un software applicativo nato dall esigenza di: organizzare insiemi di dati

Dettagli

ESERCIZI SVOLTI PER LA PROVA DI STATISTICA

ESERCIZI SVOLTI PER LA PROVA DI STATISTICA ESERCIZI SVOLTI PER LA PROVA DI STATISTICA Stefania Naddeo (anno accademico 4/5) INDICE PARTE PRIMA: STATISTICA DESCRITTIVA. DISTRIBUZIONI DI FREQUENZA E FUNZIONE DI RIPARTIZIONE. VALORI CARATTERISTICI

Dettagli

Esempi di algoritmi. Lezione III

Esempi di algoritmi. Lezione III Esempi di algoritmi Lezione III Scopo della lezione Implementare da zero algoritmi di media complessità. Verificare la correttezza di un algoritmo eseguendolo a mano. Imparare a valutare le prestazioni

Dettagli

Uso di base delle funzioni in Microsoft Excel

Uso di base delle funzioni in Microsoft Excel Uso di base delle funzioni in Microsoft Excel Le funzioni Una funzione è un operatore che applicato a uno o più argomenti (valori, siano essi numeri con virgola, numeri interi, stringhe di caratteri) restituisce

Dettagli

LA DISTRIBUZIONE DI PROBABILITÀ DEI RITORNI AZIONARI FUTURI SARÀ LA MEDESIMA DEL PASSATO?

LA DISTRIBUZIONE DI PROBABILITÀ DEI RITORNI AZIONARI FUTURI SARÀ LA MEDESIMA DEL PASSATO? LA DISTRIBUZIONE DI PROBABILITÀ DEI RITORNI AZIONARI FUTURI SARÀ LA MEDESIMA DEL PASSATO? Versione preliminare: 25 Settembre 2008 Nicola Zanella E-Mail: n.zanella@yahoo.it ABSTRACT In questa ricerca ho

Dettagli