Laboratorio di Analisi ed Esplorazione Dati A.A. 2008/09 Secondo foglio di esercizi per l esame.
|
|
- Pio Sacchi
- 8 anni fa
- Visualizzazioni
Transcript
1 Laboratorio di Analisi ed Esplorazione Dati A.A. 2008/09 Secondo foglio di esercizi per l esame. Ognuno deve svolgere ambedue gli esercizi (a) e (b) del numero (da 1 a 9) assegnato. Bisogna scrivere un programma in R che risponda alle domande, con eventuali commenti, e mandarmelo via a pugliese@science.unitn.it (alle parti teoriche, presenti in un paio di esercizi, potete rispondere su un foglio) 2. (a) Il file spesasanitaria.rdata (ovvero quello spesasanitaria.dat ) nella directory dati contiene dati sulla spesa sanitaria delle regioni italiane (e delle provincie di TN e BZ) fra il 1995 e Per ogni regione e anno le variabili riportate comprendono la percentuale di popolazione nelle varie classi di età (0-14, 15-64, 65-79, 80-+), i posti letto (ospedalieri) pro capite, il prodotto interno lordo pro capite, la spesa sanitaria totale pro capite, la macroarea a cui appartiene la regione. Studiare tutti i possibili modelli lineari di regressione della spesa pro-capite sulla macroarea ( macroarea3 ) a cui appartiene la regione e sull anno, considerando le variabili (anno e macroarea) sia come qualitative sia come quantitative. Trovate il modello più adeguato e descrivetelo a parole e in formula. Una volta trovato il modello più adeguato, mostrate graficamente i dati insieme al modello trovato, individuando eventuali osservazioni outlier. Mostrate qualche grafico da cui si possa verificare in che misura siano soddisfatte alcune ipotesi del modello lineare. (b) Costruite 50 osservazioni della variabile X comprese fra 0 e 10. Per ogni osservazione di X, costruite 10 osservazioni di una variabile Y che sarà uguale a 1 con probabilità p data dalla formula logistica con predittore 3X X 2 /2 2. ed uguale a 0 con probabilità 1 p. Calcolate la regressione logistica di Y su X, sia con un termine di secondo grado in X sia senza. Ripetete il procedimento 50 volte. Trovare la distribuzione empirica dei coefficienti della regressione. 3. (a) Si consideri il modello y i = ŷ i + ε i, dove ŷ i = x i. Si calcolino valori ŷ i in corrispondenza dei seguenti valori di x: x 1 = 1
2 21, x 2 = 22,...x 10 = 30, generando un campione di 10 residui ε i estratto da una distribuzione uniforme continua fra 2 e 2 ed ottenendo i corrispondenti valori y i. Sul campione così ottenuto si stimi il coefficiente di regressione lineare (semplice). Dopo aver ripetuto il procedimento 1000 volte, si trovi la media e la varianza dei coefficienti di regressione e si disegni infine la distribuzione di campionamento empirica. Fate lo stesso per la varianza degli errori. Confrontate con le attese teoriche. (b) Il file pinecones.txt (scaricabile dal sito Web del corso) contiene dati sulla produzione di pigne da parte di alberi di diametro diverso e sotto diverse concentrazioni di CO 2. La colonna contrassegnata da diam contiene la misura del diametro; nella colonna tmt il simbolo AMB indica che la pianta è stata tenuta alla concentrazione ambientale di CO 2 ; il simbolo CO2 indica che la pianta è stata tenuta a una concentrazione maggiore di CO 2 ; le colonne c98, c99 e c00 contengono il numero di coni prodotti nel 1998, 1999 e Noi intendiamo studiare soltanto come la probabilità di produrre coni nel 2000 (c00 > 0) è stata influenzata dal diametro e dalla concentrazione di CO 2. Trovate il modello migliore (fra quelli studiati nel corso) per questo studio. Scrivete (su un foglio) la formula trovata che mette in relazione diametro e concentrazione (normale o aumentata) di CO 2 con la probabilità di produrre coni. Mostrate in forma grafica la formula trovata insieme ai dati. Si può concludere che la concentrazione di CO 2 influenzi la probabilità di produrre coni? 4. (a) Il file bostonh.dat, in rete sulla pagina Web del corso, contiene 506 osservazioni (una per ogni distretto di censo nell area metropolitana di Boston) di 14 variabili (dati raccolti da Harrison e Rubinfeld, 1978). Il significato delle variabili è spiegato nella seguente tabella: 2
3 1. crimerate per capita crime rate 2. residentialzone proportion of residential land zoned for large lots 3. nonretail proportion of nonretail business acres 4. river Charles river (yes or no) 5. NO concentration nitric oxides concentration 6. noofrooms average number of rooms per dwelling 7. age proportion of owner-occupied units built prior to distance weighted distances to five Boston employment centers 9. accesstohigway index of accessibility to radial highways 10. taxrate full-value property tax-rate per $ 10, pupilteacher pupil teacher ratio 12. blackpeople 1000(B 0.63) 2 I B 0.63 where B is the proportion of blacks 13. lowerstatus % lower status of the population 14. valueofhome median value of owner-occupied homes in $1000 Tramite un metodo step-wise, sia forward che backward, eliminate le variabili inutili per la regressione; secondo il modello finale, quali sono le variabili che hanno un influenza significativa su V 14 ai livelli di significatività standard? Effettuate una trasformazione logaritmica delle variabili 1, 9 e 10; trasformate la seconda secondo la regola X 2 = log( V 2 + 1) e la dodicesima con X 12 = log(400 V 12 ). Ripetete il metodo step-wise sulle variabili trasformate. (b) La variabile X ha tutti i valori fra 0 e 20 (compresi) con passo 0.5. Se X < 10, la variabile Y è uguale a 0; altrimenti Y è uguale a 1. Calcolate la regressione logistica di Y su X. Qual è il risultato? Sapete spiegare eventuali anomalie? Mostrate su un grafico i punti (X, Y ) insieme alla curva (disegnata con una certa precisione) che descrive il modello trovato di dipendenza della probabilità di successo da X. 5. (a) Si consideri il modello y i = ŷ i +ε i, dove ŷ i = z i, mentre ε i sono variabili casuali normali indipendenti di media 0 e varianza 3. z i non è osservabile, ma si osserva invece x i = z i + η i dove η i sono variabili casuali normali indipendenti di media 0 e varianza 3/50. 3
4 Scegliete 50 valori per z i traendoli da una distribuzione uniforme fra 0 e 30. Successivamente ottenete x i e y i secondo il modello descritto sopra. Sul campione {(x i, y i ), i = } così ottenuto si stimi il coefficiente di regressione lineare (semplice). Dopo aver ripetuto il procedimento 100 volte, si trovi la media e la varianza dei coefficienti di regressione e si disegni infine la distribuzione di campionamento empirica. Confrontate con il valore teorico di Ripetete il procedimento quando η i hanno varianza 3/10 e 3/5. Commentate i risultati. (b) Il dataset Titanic (nelle libreria di R) riporta età, sesso e classe (prima, seconda, terza o equipaggio) delle persone presenti sul Titanic, insieme al fatto se sono sopravvissute o meno. Analizzare la probabilità di sopravvivenza in rapporto alle tre variabili considerate. 6. (a) Il file gala.txt nella directory dati/ascdata contiene dati sulle isole Galapagos; le righe corrispondono alle varie isole, le colonne descrivono il numero di specie presenti sull isola, oltre ad alcune informazioni geografiche (area, elevazione, distanza dall isola più vicina...). Effettuate la regressione della variabile Species su Area, Elevation, Scruz, Nearest e Adjacent. Selezionate il modello che appare più adeguato. Effettuate l analisi dei residui e discutete se vi sembrano soddisfatte le ipotesi del modello lineare. Ripetete l analisi utilizzando la radice quadrata di Species ed eventualmente anche altre trasfomazioni delle variabili. L analisi appare più soddisfacente? I risultati sono simili ai precedenti? Mostrate graficamente i dati insieme al modello trovato, individuando eventuali osservazioni outlier. (b) Si consideri il modello y i = ŷ i + ε i, dove ŷ i = x i 0.05x 2 i, mentre ε i sono variabili casuali normali indipendenti di media 0 e varianza x i (i varia fra 1 e 50). Ponete x i = 0.05i + η i dove η i sono tratti da una distribuzione uniforme fra e Successivamente ottenete y i secondo il modello descritto sopra. Sul campione {(x i, y i ), i = } così ottenuto si applichi il metodo di regressione lineare con e senza il termine quadratico. Si valuti se i coefficienti del termine lineare e quadratico sono significativamente diversi da 0. 4
5 Ripetete l analisi applicando l opzione weights (presente in lm che devono essere uguali all inverso della varianza) per utilizzare l ipotesi che la varianza dell errore dipende da x. Mostrare il grafico dei residui nei vari casi. Mostrare un grafico dei dati, unitamente ai vari modelli di regressione ottenuti, e commentare i risultati. 7. (a) Sia X una variabile normale bivariata di media µ e matrice di varianza-covarianza Σ. Sia A una matrice 2 2, b un vettore di R 2 e Y = Ax + b. Qual è la distribuzione di Y? Utilizzando il calcolo precedente, mostrate che se X è un vettore composto da due normali indipendenti standard (media 0 e varianza 1), ponendo A = ( (1+ 5) 4 ) b = ( ) 1 0 Y = Ax + b ( 1 Y è un vettore di due variabili casuali normali con media e 0) ( ) 1 1/2 varianza-covarianza. 1/2 4 Usate questo metodo per costruire 20 vettori casuali Y con quella distribuzione. Calcolate il coefficiente di correlazione empirico fra Y 1 e Y 2 in questo campione; corrisponde all aspettativa teorica? Effettuate la regressione lineare di Y 2 su Y 1 ; qual è il risultato? è un metodo appropriato per un campione costruito in questo modo? (b) Il file toxoplasmosis.rda, attualmente recuperabile dalla mia pagina Web a (esiste nell attuale directory../dati il file toxoplasmosis.dat che ha gli stessi dati, ma con qualche problema; il file toxoplasmosis.rda, è un file nel formato interno di R che va recuperato col comando load ) contiene i risultati di uno studio sulla toxoplasmosi in Guatemala. In varie città del Guatemala è stata registrata la piovosità media (in mm) e sono stati effettuati alcuni campioni (il numero è nella variabile Sampled) di cui un certo numero (variabile Positive) è risultato positivo alla toxoplasmosi [la variabile Proportion è uguale, con una certa approssimazione, a 5
6 Positive/Sampled]. Tramite la regressione logistica analizzare se la probabilità di essersi infettati con la toxoplasmosi dipenda dalla piovosità. 8. (a) Il file tab75 4.dat, attualmente recuperabile dalla mia pagina Web a (vedrò di mettere un link al più presto) contiene i risultati di tiri a canestro effettuati dall autore del libro e i suoi figli: nella prima colonna la distanza (in piedi) dal canestro, nelle successive colonne il numero di canestri (su 6 tentativi da ogni distanza) per ognuno dei partecipanti. Tramite la regressione logistica analizzare in che modo la probabilità di successo dipendeva dalla distanza (provare sia con la distanza stessa sia con la sua radice quadrata) e dal tiratore. Vedere se eventualmente è utile dividere i tiratori in gruppi a seconda dell abilità. Nota: con un trattino viene indicato che l autore non ha compiuto tentativi da distanze superiori ai 10 piedi. Io consiglierei di considerare tale risultato non come un missing value ma come 0 (non ha provato perché riteneva impossibile il successo). (b) La variabile X ha tutti i valori fra 0 e 20 (compresi) con passo 0.5. Se X < 10, la probabilità di successo è uguale a 1/4; altrimenti la probabilità di successo è uguale a 1/2. Per ogni valore di X generate una variabile Y binomiale con 2 tentativi e probabilità di successo descritta sopra. Calcolate la regressione logistica di Y su X. Si trova un effetto significativo di X sulla probabilità di successo? Mostrate su un grafico i punti (X, Y/2) insieme alla curva (disegnata con una certa precisione) che descrive il modello trovato di dipendenza della probabilità di successo da X. Ripetete ponendo, per ogni valore di X, Y binomiale con 10 tentativi. Come cambiano i risultati? 9. (a) Il file strongx.txt nella directory dati/ascdata contiene dati su un esperimento di collisione di protoni. Una teoria prevedeva che la cross-section (variabile crossx ) cresca linearmente proporzionale all inverso dell energia (variabile energy già uguale a 1/energia). Ad ogni valore del momento ed energia sono state compiute abbastanza misure da stimare la deviazione standard della misura (variabile sd ). 6
7 i. Effettuare la regressione lineare di crossx su energy, sia senza tener conto dei valori di sd, sia tenendone conto (in quest ultimo caso bisogna usare l opzione weights, ponendoli uguali all inverso della varianza). ii. Trovate il modello che vi sembra il migliore (anche se forse insensato dal punto di vista delle leggi fisiche) ammettendo far le variabili esplicative anche il quadrato di energy e momentum. (b) Siano (X 1, X 2 ) 32 osservazioni con X 1 compreso fra 0 e 2 e X 2 fra 1 e 10. Per ogni valore di (X 1, X 2 ) si compiono 10 prove in ognuna delle quali la probabilità di successo è p data dalla formula seguente: p(x 1.X 2 ) = arctan(2x 1 X 2 1 X 2/2)/π + 1/2. S è il numero di successi ottenuti. Generate S secondo questa procedura [in R π si ottiene scrivendo pi e l arcotangente è atan ]. Studiate tramite il metodo della regressione logistica la dipendenza di S da X 1 e X 2, eventualmente usando funzioni polinomiali. Ripetete il procedimento 50 volte. Trovare la distribuzione empirica dei coefficienti della regressione. Empiricamente, quanto spesso si vede un effetto significativo di X 1 su Y? 7
I ESERCITAZIONE. Gruppo I 100 individui. Trattamento I Nuovo Farmaco. Osservazione degli effetti sul raffreddore. Assegnazione casuale
I ESERCITAZIONE ESERCIZIO 1 Si vuole testare un nuovo farmaco contro il raffreddore. Allo studio partecipano 200 soggetti sani della stessa età e dello stesso sesso e con caratteristiche simili. i) Che
DettagliProbabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)
Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B Eventi indipendenti: un evento non influenza l altro Eventi disgiunti: il verificarsi di un evento esclude l altro Evento prodotto:
DettagliCriteri di Valutazione della scheda - Solo a carattere indicativo -
Criteri di Valutazione della scheda - Solo a carattere indicativo - Previsioni Sono state fatte le previsioni e discussi i valori attesi con il ragionamento con cui sono stati calcolati E stata usata la
Dettagli1. Distribuzioni campionarie
Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 2012/2013 lezioni di statistica del 3 e 6 giugno 2013 - di Massimo Cristallo - 1. Distribuzioni campionarie
Dettaglimatematica probabilmente
IS science centre immaginario scientifico Laboratorio dell'immaginario Scientifico - Trieste tel. 040224424 - fax 040224439 - e-mail: lis@lis.trieste.it - www.immaginarioscientifico.it indice Altezze e
DettagliElementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 12-Il t-test per campioni appaiati vers. 1.2 (7 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca
DettagliLa distribuzione Gaussiana
Università del Piemonte Orientale Corso di Laurea in Biotecnologie Corso di Statistica Medica La distribuzione Normale (o di Gauss) Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione
DettagliCorso integrato di informatica, statistica e analisi dei dati sperimentali Altri esercizi_esercitazione V
Corso integrato di informatica, statistica e analisi dei dati sperimentali Altri esercizi_esercitazione V Sui PC a disposizione sono istallati diversi sistemi operativi. All accensione scegliere Windows.
DettagliCAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI
VERO FALSO CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI 1. V F Un ipotesi statistica è un assunzione sulle caratteristiche di una o più variabili in una o più popolazioni 2. V F L ipotesi nulla unita
DettagliCapitolo 12 La regressione lineare semplice
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara
DettagliE naturale chiedersi alcune cose sulla media campionaria x n
Supponiamo che un fabbricante stia introducendo un nuovo tipo di batteria per un automobile elettrica. La durata osservata x i delle i-esima batteria è la realizzazione (valore assunto) di una variabile
DettagliElementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 10-Il test t per un campione e la stima intervallare (vers. 1.1, 25 ottobre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia,
DettagliElementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 5-Indici di variabilità (vers. 1.0c, 20 ottobre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca
DettagliDimensione di uno Spazio vettoriale
Capitolo 4 Dimensione di uno Spazio vettoriale 4.1 Introduzione Dedichiamo questo capitolo ad un concetto fondamentale in algebra lineare: la dimensione di uno spazio vettoriale. Daremo una definizione
DettagliCORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Test delle ipotesi sulla varianza In un azienda che produce componenti meccaniche, è stato
DettagliPROGRAMMA SVOLTO NELLA SESSIONE N.
Università C. Cattaneo Liuc, Corso di Statistica, Sessione n. 1, 2014 Laboratorio Excel Sessione n. 1 Venerdì 031014 Gruppo PZ Lunedì 061014 Gruppo AD Martedì 071014 Gruppo EO PROGRAMMA SVOLTO NELLA SESSIONE
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2014-2015 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliCorso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 14: Analisi della varianza (ANOVA)
Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 4: Analisi della varianza (ANOVA) Analisi della varianza Analisi della varianza (ANOVA) ANOVA ad
Dettagli1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:
Esempi di domande risposta multipla (Modulo II) 1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: 1) ha un numero di elementi pari a 5; 2) ha un numero di elementi
DettagliStatistica. Lezione 6
Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 6 a.a 011-01 Dott.ssa Daniela Ferrante
DettagliLE FUNZIONI A DUE VARIABILI
Capitolo I LE FUNZIONI A DUE VARIABILI In questo primo capitolo introduciamo alcune definizioni di base delle funzioni reali a due variabili reali. Nel seguito R denoterà l insieme dei numeri reali mentre
DettagliCorso di Laurea in Scienze e Tecnologie Biomolecolari. NOME COGNOME N. Matr.
Corso di Laurea in Scienze e Tecnologie Biomolecolari Matematica e Statistica II Prova di esame del 18/7/2013 NOME COGNOME N. Matr. Rispondere ai punti degli esercizi nel modo più completo possibile, cercando
DettagliMetodi Matematici e Informatici per la Biologia----31 Maggio 2010
Metodi Matematici e Informatici per la Biologia----31 Maggio 2010 COMPITO 4 (3 CREDITI) Nome: Cognome: Matricola: ISTRUZIONI Gli esercizi che seguono sono di tre tipi: Domande Vero/Falso: cerchiate V o
DettagliStatistiche campionarie
Statistiche campionarie Sul campione si possono calcolare le statistiche campionarie (come media campionaria, mediana campionaria, varianza campionaria,.) Le statistiche campionarie sono stimatori delle
DettagliANALISI DI CORRELAZIONE
ANALISI DI CORRELAZIONE Esempio: Dati raccolti da n = 129 studenti di Pavia (A.A. 21/2) Altezza (cm) Peso (Kg) Voto Algebra e Geometria Voto Fisica I Valutare la correlazione delle seguenti coppie: Peso
DettagliStima per intervalli Nei metodi di stima puntuale è sempre presente un ^ errore θ θ dovuto al fatto che la stima di θ in genere non coincide con il parametro θ. Sorge quindi l esigenza di determinare una
DettagliRegressione Mario Guarracino Data Mining a.a. 2010/2011
Regressione Esempio Un azienda manifatturiera vuole analizzare il legame che intercorre tra il volume produttivo X per uno dei propri stabilimenti e il corrispondente costo mensile Y di produzione. Volume
Dettaglietà sesso luogo-abitazione scuola superiore esperienza insegnamento 1 2 2 2 1 2 2 2 2 2 1 2 3 2 2 2 1 2 4 2 2 2 1 2 5 3 2 2 1 2 6 2 2 2 1 2 7 3 2 1 1
età sesso luogo-abitazione scuola superiore esperienza insegnamento 1 1 1 3 1 4 1 5 3 1 6 1 7 3 1 1 8 3 1 9 3 1 10 3 1 11 3 1 1 1 13 4 1 1 14 3 1 15 1 16 1 17 1 18 1 19 1 0 1 1 1 1 3 3 1 4 1 Come analizzare
DettagliLa distribuzione Normale. La distribuzione Normale
La Distribuzione Normale o Gaussiana è la distribuzione più importante ed utilizzata in tutta la statistica La curva delle frequenze della distribuzione Normale ha una forma caratteristica, simile ad una
DettagliLa variabile casuale Binomiale
La variabile casuale Binomiale Si costruisce a partire dalla nozione di esperimento casuale Bernoulliano che consiste in un insieme di prove ripetute con le seguenti caratteristiche: i) ad ogni singola
DettagliMisure della dispersione o della variabilità
QUARTA UNITA Misure della dispersione o della variabilità Abbiamo visto che un punteggio di per sé non ha alcun significato e lo acquista solo quando è posto a confronto con altri punteggi o con una statistica.
DettagliUniversità di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008
Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica 18 dicembre 008 Esame sull intero programma: esercizi da A a D Esame sulla seconda parte del programma: esercizi
DettagliRAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL
RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL 1 RAPPRESENTAZIONE GRAFICA Per l analisi dati con Excel si fa riferimento alla versione 2007 di Office, le versioni successive non differiscono
DettagliAPPUNTI SU PROBLEMI CON CALCOLO PERCENTUALE
APPUNTI SU PROBLEMI CON CALCOLO PERCENTUALE 1. Proporzionalità diretta e proporzionalità inversa Analizziamo le seguenti formule Peso Lordo = Peso Netto + Tara Ricavo = Utile + Costo Rata = Importo + Interesse
DettagliPsicometria (8 CFU) Corso di Laurea triennale STANDARDIZZAZIONE
Psicometria (8 CFU) Corso di Laurea triennale Un punteggio all interno di una distribuzione è in realtà privo di significato se preso da solo. Sapere che un soggetto ha ottenuto un punteggio x=52 in una
DettagliI punteggi zeta e la distribuzione normale
QUINTA UNITA I punteggi zeta e la distribuzione normale I punteggi ottenuti attraverso una misurazione risultano di difficile interpretazione se presi in stessi. Affinché acquistino significato è necessario
DettagliUn gioco con tre dadi
Un gioco con tre dadi Livello scolare: biennio Abilità interessate Costruire lo spazio degli eventi in casi semplici e determinarne la cardinalità. Valutare la probabilità in diversi contesti problematici.
DettagliSTATISTICA IX lezione
Anno Accademico 013-014 STATISTICA IX lezione 1 Il problema della verifica di un ipotesi statistica In termini generali, si studia la distribuzione T(X) di un opportuna grandezza X legata ai parametri
Dettaglirisulta (x) = 1 se x < 0.
Questo file si pone come obiettivo quello di mostrarvi come lo studio di una funzione reale di una variabile reale, nella cui espressione compare un qualche valore assoluto, possa essere svolto senza necessariamente
DettagliProva di autovalutazione Prof. Roberta Siciliano
Prova di autovalutazione Prof. Roberta Siciliano Esercizio 1 Nella seguente tabella è riportata la distribuzione di frequenza dei prezzi per camera di alcuni agriturismi, situati nella regione Basilicata.
DettagliEsercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione)
Esercitazione #5 di Statistica Test ed Intervalli di Confidenza (per una popolazione) Dicembre 00 1 Esercizi 1.1 Test su media (con varianza nota) Esercizio n. 1 Il calore (in calorie per grammo) emesso
DettagliRegressione Logistica: un Modello per Variabili Risposta Categoriali
: un Modello per Variabili Risposta Categoriali Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 1 / 54 Introduzione Premessa I modelli di regressione
DettagliUniversità degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI
Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI 1. L azienda Wood produce legno compensato per costruzioni
DettagliRELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della
RELAZIONE TRA VARIABILI QUANTITATIVE Lezione 7 a Accade spesso nella ricerca in campo biomedico, così come in altri campi della scienza, di voler studiare come il variare di una o più variabili (variabili
DettagliBasi di matematica per il corso di micro
Basi di matematica per il corso di micro Microeconomia (anno accademico 2006-2007) Lezione del 21 Marzo 2007 Marianna Belloc 1 Le funzioni 1.1 Definizione Una funzione è una regola che descrive una relazione
DettagliSlide Cerbara parte1 5. Le distribuzioni teoriche
Slide Cerbara parte1 5 Le distribuzioni teoriche I fenomeni biologici, demografici, sociali ed economici, che sono il principale oggetto della statistica, non sono retti da leggi matematiche. Però dalle
DettagliCorso di Laurea in Scienze e Tecnologie Biomolecolari. NOME COGNOME N. Matr.
Corso di Laurea in Scienze e Tecnologie Biomolecolari Matematica e Statistica II Prova di esame dell 11/1/2012 NOME COGNOME N. Matr. Rispondere alle domande nel modo più completo possibile, cercando di
DettagliLezione 9: Cambio di base
Lezione 9: Cambio di base In questa lezione vogliamo affrontare uno degli argomenti piu ostici per lo studente e cioè il cambio di base all interno di uno spazio vettoriale, inoltre cercheremo di capire
DettagliPolitecnico di Torino. Esercitazioni di Protezione idraulica del territorio
Politecnico di Torino Esercitazioni di Protezione idraulica del territorio a.a. 2012-2013 ESERCITAZIONE 1 VALUTAZIONE DELLA RARITÀ DI UN EVENTO PLUVIOMETRICO ECCEZIONALE 1. Determinazione del periodo di
Dettaglilezione 18 AA 2015-2016 Paolo Brunori
AA 2015-2016 Paolo Brunori Previsioni - spesso come economisti siamo interessati a prevedere quale sarà il valore di una certa variabile nel futuro - quando osserviamo una variabile nel tempo possiamo
DettagliLABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE
LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE DESCRIZIONE DEI DATI DA ESAMINARE Sono stati raccolti i dati sul peso del polmone di topi normali e affetti da una patologia simile
DettagliProf.ssa Paola Vicard
Questa nota consiste perlopiù nella traduzione (con alcune integrazioni) da Descriptive statistics di J. Shalliker e C. Ricketts, 2000, University of Plymouth Consideriamo i dati nel file esercizio10_dati.xls.
DettagliStudente: SANTORO MC. Matricola : 528
CORSO di LAUREA in INFORMATICA Corso di CALCOLO NUMERICO a.a. 2004-05 Studente: SANTORO MC. Matricola : 528 PROGETTO PER L ESAME 1. Sviluppare una versione dell algoritmo di Gauss per sistemi con matrice
DettagliStatistica. Esercitazione 3 5 maggio 2010 Serie storiche. Connessione e indipendenza statistica
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2008/2009 Statistica Esercitazione 3 5 maggio 2010 Serie storiche. Connessione e indipendenza
DettagliCALCOLO COMBINATORIO
CALCOLO COMBINATORIO 1 Modi di formare gruppi di k oggetti presi da n dati 11 disposizioni semplici, permutazioni Dati n oggetti distinti a 1,, a n si chiamano disposizioni semplici di questi oggetti,
DettagliVERIFICA DELLE IPOTESI
VERIFICA DELLE IPOTESI Nella verifica delle ipotesi è necessario fissare alcune fasi prima di iniziare ad analizzare i dati. a) Si deve stabilire quale deve essere l'ipotesi nulla (H0) e quale l'ipotesi
DettagliFacoltà di Psicologia Università di Padova Anno Accademico 2010-2011
Facoltà di Psicologia Università di Padova Anno Accademico 010-011 Corso di Psicometria - Modulo B Dott. Marco Vicentini marco.vicentini@unipd.it Rev. 10/01/011 La distribuzione F di Fisher - Snedecor
Dettaglipostulato della valutazione tramite indicatori: La valutazione di un sistema sanitario tramite indicatori ipotizza
postulato della valutazione tramite indicatori: La valutazione di un sistema sanitario tramite indicatori ipotizza la praticabilità di una scomposizione della complessità in informazioni elementari ed
Dettaglif(x) = 1 x. Il dominio di questa funzione è il sottoinsieme proprio di R dato da
Data una funzione reale f di variabile reale x, definita su un sottoinsieme proprio D f di R (con questo voglio dire che il dominio di f è un sottoinsieme di R che non coincide con tutto R), ci si chiede
DettagliElementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 29-Analisi della potenza statistica vers. 1.0 (12 dicembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca
Dettagli3) ANALISI DEI RESIDUI
3) ANALISI DEI RESIDUI Dopo l analisi di regressione si eseguono alcuni test sui residui per avere una ulteriore conferma della validità del modello e delle assunzioni (distribuzione normale degli errori,
DettagliLezione 10: Il problema del consumatore: Preferenze e scelta ottimale
Corso di Scienza Economica (Economia Politica) prof. G. Di Bartolomeo Lezione 10: Il problema del consumatore: Preferenze e scelta ottimale Facoltà di Scienze della Comunicazione Università di Teramo Scelta
DettagliIl confronto fra proporzioni
L. Boni Il rapporto Un rapporto (ratio), attribuendo un ampio significato al termine, è il risultato della divisione di una certa quantità a per un altra quantità b Il rapporto Spesso, in maniera più specifica,
DettagliLEZIONE 23. Esempio 23.1.3. Si consideri la matrice (si veda l Esempio 22.2.5) A = 1 2 2 3 3 0
LEZIONE 23 231 Diagonalizzazione di matrici Abbiamo visto nella precedente lezione che, in generale, non è immediato che, data una matrice A k n,n con k = R, C, esista sempre una base costituita da suoi
DettagliAntonella Martinucci, Rossana Nencini, 2013 IL PESO. classe quarta
Antonella Martinucci, Rossana Nencini, 2013 IL PESO classe quarta I bambini utilizzano spontaneamente il concetto di pesante? Collochiamo su un banco alcuni oggetti: penne matite gomme fogli scottex quaderni
DettagliEsercizi sulle variabili aleatorie Corso di Probabilità e Inferenza Statistica, anno 2007-2008, Prof. Mortera
Esercizi sulle variabili aleatorie Corso di Probabilità e Inferenza Statistica, anno 2007-2008, Prof. Mortera 1. Avete risparmiato 10 dollari che volete investire per un anno in azioni e/o buoni del tesoro
DettagliRelazioni statistiche: regressione e correlazione
Relazioni statistiche: regressione e correlazione È detto studio della connessione lo studio si occupa della ricerca di relazioni fra due variabili statistiche o fra una mutabile e una variabile statistica
DettagliSPC e distribuzione normale con Access
SPC e distribuzione normale con Access In questo articolo esamineremo una applicazione Access per il calcolo e la rappresentazione grafica della distribuzione normale, collegata con tabelle di Clienti,
DettagliISTITUTO COMPRENSIVO BARBERINO MUGELLO
IL PESO percorso didattico scuola primaria Sperimentazione didattica ISTITUTO COMPRENSIVO BARBERINO MUGELLO I bambini utilizzano spontaneamente il concetto di pesante? Collochiamo su un banco alcuni oggetti:
DettagliANALISI DELLE FREQUENZE: IL TEST CHI 2
ANALISI DELLE FREQUENZE: IL TEST CHI 2 Quando si hanno scale nominali o ordinali, non è possibile calcolare il t, poiché non abbiamo medie, ma solo frequenze. In questi casi, per verificare se un evento
DettagliViene lanciata una moneta. Se esce testa vinco 100 euro, se esce croce non vinco niente. Quale è il valore della mia vincita?
Viene lanciata una moneta. Se esce testa vinco 00 euro, se esce croce non vinco niente. Quale è il valore della mia vincita? Osserviamo che il valore della vincita dipende dal risultato dell esperimento
DettagliStatistica inferenziale
Statistica inferenziale Popolazione e campione Molto spesso siamo interessati a trarre delle conclusioni su persone che hanno determinate caratteristiche (pazienti, atleti, bambini, gestanti, ) Osserveremo
DettagliLineamenti di econometria 2
Lineamenti di econometria 2 Camilla Mastromarco Università di Lecce Master II Livello "Analisi dei Mercati e Sviluppo Locale" (PIT 9.4) Aspetti Statistici della Regressione Aspetti Statistici della Regressione
Dettagli3. Confronto tra medie di due campioni indipendenti o appaiati
BIOSTATISTICA 3. Confronto tra medie di due campioni indipendenti o appaiati Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk MARTA BLANGIARDO
DettagliESERCIZI DI ALGEBRA LINEARE E GEOMETRIA
ESERCIZI DI ALGEBRA LINEARE E GEOMETRIA Francesco Bottacin Padova, 24 febbraio 2012 Capitolo 1 Algebra Lineare 1.1 Spazi e sottospazi vettoriali Esercizio 1.1. Sia U il sottospazio di R 4 generato dai
Dettagli4. Operazioni elementari per righe e colonne
4. Operazioni elementari per righe e colonne Sia K un campo, e sia A una matrice m n a elementi in K. Una operazione elementare per righe sulla matrice A è una operazione di uno dei seguenti tre tipi:
DettagliLA MOLTIPLICAZIONE IN CLASSE SECONDA
LA MOLTIPLICAZIONE IN CLASSE SECONDA Rossana Nencini, 2013 Le fasi del lavoro: 1. Proponiamo ai bambini una situazione reale di moltiplicazione: portiamo a scuola una scatola di biscotti (. ) e diamo la
DettagliMetodi Matematici ed Informatici per la Biologia Esame Finale, I appello 1 Giugno 2007
Metodi Matematici ed Informatici per la Biologia Esame Finale, I appello 1 Giugno 2007 Nome: Alberto Cognome: De Sole Matricola: 01234567890 Codice 9784507811 Esercizio Risposta Voto 1 a b c d e 1 2 V
DettagliFacciamo qualche precisazione
Abbiamo introdotto alcuni indici statistici (di posizione, di variabilità e di forma) ottenibili da Excel con la funzione Riepilogo Statistiche Facciamo qualche precisazione Al fine della partecipazione
DettagliAnalizza/Confronta medie. ELEMENTI DI PSICOMETRIA Esercitazione n. 7-8-9-107. Test t. Test t. t-test test e confronto tra medie chi quadrato
Analizza/Confronta medie ELEMENTI DI PSICOMETRIA Esercitazione n. 7-8-9-107 t-test test e confronto tra medie chi quadrato C.d.L. Comunicazione e Psicologia a.a. 2008/09 Medie Calcola medie e altre statistiche
DettagliRelazioni tra variabili
Università degli Studi di Padova Facoltà di Medicina e Chirurgia Corso di Laurea in Medicina e Chirurgia - A.A. 009-10 Scuole di specializzazione in: Medicina Legale, Medicina del Lavoro, Igiene e Medicina
DettagliEsempio. Approssimazione con il criterio dei minimi quadrati. Esempio. Esempio. Risultati sperimentali. Interpolazione con spline cubica.
Esempio Risultati sperimentali Approssimazione con il criterio dei minimi quadrati Esempio Interpolazione con spline cubica. Esempio 1 Come procedere? La natura del fenomeno suggerisce che una buona approssimazione
DettagliESAME DI STATO DI LICEO SCIENTIFICO CORSO SPERIMENTALE P.N.I. 2004
ESAME DI STAT DI LICE SCIENTIFIC CRS SPERIMENTALE P.N.I. 004 Il candidato risolva uno dei due problemi e 5 dei 0 quesiti in cui si articola il questionario. PRBLEMA Sia la curva d equazione: ke ove k e
Dettagli1 Applicazioni Lineari tra Spazi Vettoriali
1 Applicazioni Lineari tra Spazi Vettoriali Definizione 1 (Applicazioni lineari) Si chiama applicazione lineare una applicazione tra uno spazio vettoriale ed uno spazio vettoriale sul campo tale che "!$%!
DettagliGeneral Linear Model. Esercizio
Esercizio General Linear Model Una delle molteplici applicazioni del General Linear Model è la Trend Surface Analysis. Questa tecnica cerca di individuare, in un modello di superficie, quale tendenza segue
DettagliConvertitori numerici in Excel
ISTITUTO DI ISTRUZIONE SUPERIORE G. M. ANGIOY CARBONIA Convertitori numerici in Excel Prof. G. Ciaschetti Come attività di laboratorio, vogliamo realizzare dei convertitori numerici con Microsoft Excel
Dettagli(a cura di Francesca Godioli)
lezione n. 12 (a cura di Francesca Godioli) Ad ogni categoria della variabile qualitativa si può assegnare un valore numerico che viene chiamato SCORE. Passare dalla variabile qualitativa X2 a dei valori
DettagliInteresse, sconto, ratei e risconti
TXT HTM PDF pdf P1 P2 P3 P4 293 Interesse, sconto, ratei e risconti Capitolo 129 129.1 Interesse semplice....................................................... 293 129.1.1 Esercizio per il calcolo dell
DettagliLEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010
LEZIONE 3 "Educare significa aiutare l'animo dell'uomo ad entrare nella totalità della realtà. Non si può però educare se non rivolgendosi alla libertà, la quale definisce il singolo, l'io. Quando uno
DettagliInferenza statistica. Statistica medica 1
Inferenza statistica L inferenza statistica è un insieme di metodi con cui si cerca di trarre una conclusione sulla popolazione sulla base di alcune informazioni ricavate da un campione estratto da quella
Dettagli( x) ( x) 0. Equazioni irrazionali
Equazioni irrazionali Definizione: si definisce equazione irrazionale un equazione in cui compaiono uno o più radicali contenenti l incognita. Esempio 7 Ricordiamo quanto visto sulle condizioni di esistenza
DettagliEsercizio 1 Dato il gioco ({1, 2, 3}, v) con v funzione caratteristica tale che:
Teoria dei Giochi, Trento, 2004/05 c Fioravante Patrone 1 Teoria dei Giochi Corso di laurea specialistica: Decisioni economiche, impresa e responsabilità sociale, A.A. 2004/05 Soluzioni degli esercizi
DettagliIl coefficiente di correlazione di Spearman per ranghi
Il coefficiente di correlazione di Spearman per ranghi Questo indice di correlazione non parametrico viene indicato con r s o Spearman rho e permette di valutare la forza del rapporto tra due variabili
DettagliOSSERVAZIONI TEORICHE Lezione n. 4
OSSERVAZIONI TEORICHE Lezione n. 4 Finalità: Sistematizzare concetti e definizioni. Verificare l apprendimento. Metodo: Lettura delle OSSERVAZIONI e risoluzione della scheda di verifica delle conoscenze
DettagliPROVE D'ESAME DI CPS A.A. 2009/2010. 0 altrimenti.
PROVE D'ESAME DI CPS A.A. 009/00 0/06/00 () (4pt) Olimpiadi, nale dei 00m maschili, 8 nalisti. Si sa che i 4 atleti nelle corsie centrali hanno probabilità di correre in meno di 0 secondi. I 4 atleti delle
DettagliL analisi dei dati. Capitolo 4. 4.1 Il foglio elettronico
Capitolo 4 4.1 Il foglio elettronico Le più importanti operazioni richieste dall analisi matematica dei dati sperimentali possono essere agevolmente portate a termine da un comune foglio elettronico. Prenderemo
Dettagli(liberamente interpretato da http://www2.unipr.it/~bottarel/epi/homepage.html) SCHEDA ALUNNI. Descrizione dell attività:
Pagina 1 di 11 (liberamente interpretato da http://www2.unipr.it/~bottarel/epi/homepage.html) SCHEDA ALUNNI Descrizione dell attività: Problema 1. Siamo nel 2060 ed ormai gli umani hanno colonizzato Marte.
DettagliDeterminazione del pka per un acido moderatamente debole per via potenziometrica C.Tavagnacco - versione 02.02.05
Determinazione del pka per un acido moderatamente debole per via potenziometrica C.Tavagnacco - versione 02.02.05 Dall equazione di Henderson-Hasselbalch (H-H), ph = pka + log ([A - ]/[HA]) si ricava che
DettagliMetodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo
Metodi statistici per l economia (Prof. Capitanio) Slide n. 9 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 TEST D IPOTESI Partiamo da un esempio presente sul libro di testo.
DettagliLEZIONE n. 5 (a cura di Antonio Di Marco)
LEZIONE n. 5 (a cura di Antonio Di Marco) IL P-VALUE (α) Data un ipotesi nulla (H 0 ), questa la si può accettare o rifiutare in base al valore del p- value. In genere il suo valore è un numero molto piccolo,
Dettagli