Laboratorio di Analisi ed Esplorazione Dati A.A. 2008/09 Terzo foglio di esercizi per l esame.

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Laboratorio di Analisi ed Esplorazione Dati A.A. 2008/09 Terzo foglio di esercizi per l esame."

Transcript

1 Laboratorio di Analisi ed Esplorazione Dati A.A. 2008/09 Terzo foglio di esercizi per l esame. Ognuno deve svolgere (scrivendo la soluzione su un foglio) l esercizio A e l esercizio del punto B (scrivendo un programma in R che risponda alle domande, con eventuali commenti, e mandandomelo via a pugliese@science.unitn.it ) del numero (da 1 a 9) assegnato, come da elenco presente anch esso in rete. A. Per riconoscere potenziali portatrici del gene dell emofilia A, venne analizzato il sangue di due gruppi di donne, misurando X 1, il logaritmo dell attività AHF (fattore anti-emofiliaco) e X 2, il logaritmo dell antigene tipo AHF. Il primo gruppo era costituito da n 1 = 30 donne non portatrici del gene; il secondo da n 2 = 22 donne portatrici del gene. Gli scienziati hanno stimato le medie di X nei due gruppi µ 1 = ( ) µ 2 = ( e l inversa della matrice comune di covarianza ( ) S 1 = Supponendo uguali costi per gli errori di misclassificazione e uguali probabilità a priori, assegnare a uno dei gruppi una donna le cui misure sono x 1 = 0.210, x 2 = Calcolate anche le probabilità a posteriori. 2. Ripetete i calcoli, supponendo che la donna sia prima cugina di un emofiliaco, quindi p 1 = 3/4, p 2 = 1/4 e che sia stato deciso che c 2 = 2c Supponendo che la distribuzione di X sia normale bivariata con medie e covarianza date dalla matrice di cui sopra, calcolate la probabilità teorica di errore di classificazione, assumendo p 1 = p 2. B. 2. Il file tab53 2.dat nella directory dati contiene 4 misure morfologiche (le chiamerò Y 1, Y 2, Y 3, Y 4) su 2 specie (identificate con 1 o 2 nella prima colonna) di pulci: Haltica oleracea e Haltica carduorum. (a) Eseguite l analisi discriminante lineare per predire (con probabilità a priori 1/2 e 1/2) la specie sulla base delle 4 variabili morfologiche. Calcolate la frequenza di errore sia sui dati utilizzati nell analisi, sia applicando il metodo della cross-validation escludendo i dati uno alla volta. 1 )

2 (b) Mostrare le proiezioni dei dati (distinguendo la specie) sulla/e variabile discriminante canonica. (c) Ripetere l analisi utilizzando tutte le variabili meno Y 1, tutte meno Y 3 e solo Y 1 e Y 2. Quale metodo raccomandereste di usare per il futuro? (d) Eseguite la regressione lineare di Y 2 su Y 1, usando come covariata la specie di appartenenza. E significativa la differenza della regressione fra le due specie? Fate il grafico di Y 1 e Y 2 con le varie rette di regressione. 3. Attuare l analisi discriminante lineare sui dati delle ditte che hanno subito o meno bancarotta nel file bankrupcy.dat nella directory dati. Valutate la frequenza di errore sia sui dati utilizzati nell analisi, sia con il metodo della cross-validation. (a) Secondo un ricercatore, l osservazione 16 delle ditte che hanno fatto bancarotta (indice 0 nella colonna 1) e l osservazione 13 per le ditte a posto (indice 1) sono influenti nel senso che influenzano i calcoli in modo significativo. Rifate le analisi escludendo queste osservazioni e confrontate i grafici dei dati nelle variabili discriminanti canoniche con o senza l esclusione di queste osservazioni. (b) Ripetere l analisi usando la regressione logistica. 4. Il file plankton.txt (scaricabile dal sito Web del corso) contiene dati sulla quantità di certi tipi di organismi raccolta in 25 campionamenti. [Notare che le prime righe del file contengono informazioni sul contenuto del file, informazioni utili per altri programmi statistici. In R conviene saltare queste righe tramite l opzione skip nel comando read.table()] Sulle righe ci sono i 25 campionamenti; le prime 5 colonne mostrano i dati delle 5 specie A, B, C, D ed E alla profondità di 29 m; le successive 5 colonne si riferiscono alle stesse specie alla profondità di 31 m. Compiete un analisi delle componenti principali su questi dati. Mostrate anche graficamente il risultato di questa procedura. Individuate dal grafico i campionamenti più diversi dagli altri. Ripetete la procedura utilizzando, per ogni campionamento, soltanto la media fra la profondità di 29 m e quella di 31 m per le cinque specie. Ripetete la procedura separatamente per i dati alla profondità di 29 e per quelli alla profondità di 31 metri. Si vede qualche differenza fra le 2

3 due profondità? 5. Il file remote.txt nella directory nella directory dati contiene nella prima colonna un indice sul tipo di coltivazione (1 = corn, 2 = soybeans, 3 = cotton, 4 = sugarbeets, 5 = clover), nelle altre quattro delle misure ottenute tramite remote sensing sulle coltivazioni. [Notare che le prime righe del file contengono informazioni sul contenuto del file, informazioni utili per altri programmi statistici. In R conviene saltare queste righe tramite l opzione skip nel comando read.table()] Utilizzare l analisi discriminante su questi dati per stabilire (usando probabilità a priori uguali) il tipo di coltivazione in base alle altre misure. Fate un grafico dei dati sulle variabili discriminanti canoniche. Trovare il tasso di errore sul campione, e con il metodo della crossvalidation. Provare ad eliminare variabili per eventualmente migliorare i risultati. Ripetere l analisi solo sulle coltivazioni di tipo 1 e 2 (ossia solo le prime 14 righe). Come funziona il metodo? Si potevano usare tecniche diverse per questo caso? 6. Il file forestry.txt nella directory dati contiene dati sulla presenza di 8 specie di alberi in 10 siti nel Wisconsin. Attuare un analisi delle corrispondenze su questi dati. Mostrare i risultati anche in forma grafica. Quante dimensioni scegliereste per la rappresentazione grafica dei dati? Motivare la risposta. E possibile suddividere le specie di alberi in gruppi di specie associate? e associarle ad alcuni di questi siti? scrittori di romanzi sono stati valutati da un campione di lettori i quali hanno espresso opinioni sul tipo di contenuto e sul modo in cui sono state scritte delle opere dei scrittori indicati in base ai parametri riportati (vedi tabella più sotto; i dati (senza nomi di righe e colonne) sono nel file romanzi.txt nella cartella dati ): X1: giudizio, X2: leggibilità, X3: politica, X4: fantasia, X5: rilettura, X6: thriller, X7: attualità. 3

4 Compiere un analisi delle componenti principali su questi dati; presentate i dati in forma grafica, giustificando il numero di componenti scelti; mostrateli anche sotto forma di biplot insieme alle variabili. [E preferibile mostrare i grafici con i nomi corretti di righe e colonne] 8. Analizzate i dati del file savings.txt (nella directory /dati/ascdata ) tramite l analisi delle componenti principali, usando la matrice di covarianza o di correlazione a seconda di cosa vi sembra più appropriato. Interpretate i risultati. Individuate (con il comando identify ) i punti estremi sul grafico delle prime componenti principali. Secondo voi è più appropriato questo tipo di analisi o la regressione multipla svolta in un altro esercizio? 9. Il file uscrime.txt riporta il numero di crimini di vari tipi commessi nel 1985 nei 50 stati degli USA. Le righe indicano (in sigla) gli stati. Le 4

5 colonne indicano (nell ordine) area (in miglia quadrate?), popolazione (in migliaia), omicidi, stupri, rapine, aggressioni, furti con scasso, borseggiamenti, furti di auto, regione, divisione. Credo che anche il numero dei crimini sia in migliaia. Le regioni sono 1 (Nord-Est), 2 (Midwest), 3 (Sud), 4 (Ovest). Le divisioni vanno da 1 a 9 e corrispondono ad una divisione piu fine degli USA. Attuate l analisi delle corrispondenze sui dati dei crimini. Qual è il contributo degli assi? Fate un grafico dei valori sui primi 2 assi (è ragionevole tale scelta?). Si può vedere un effetto della regione (o della divisione) sul tipo di crimini riscontrati? 5

STATISTICA. Esercitazione 5

STATISTICA. Esercitazione 5 STATISTICA Esercitazione 5 Esercizio 1 Ad un esame universitario sono stati assegnati in modo casuale due compiti diversi con i seguenti risultati: Compito A Compito B Numero studenti 102 105 Media dei

Dettagli

Esercizi di statistica

Esercizi di statistica Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..

Dettagli

Analisi della varianza

Analisi della varianza Università degli Studi di Padova Facoltà di Medicina e Chirurgia Facoltà di Medicina e Chirurgia - A.A. 2009-10 Scuole di specializzazione Lezioni comuni Disciplina: Statistica Docente: dott.ssa Egle PERISSINOTTO

Dettagli

L A B C di R. Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010

L A B C di R. Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010 L A B C di R 0 20 40 60 80 100 2 3 4 5 6 7 8 Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010 La scelta del test statistico giusto La scelta della analisi

Dettagli

Capitolo 1. Analisi Discriminante. 1.1 Introduzione. 1.2 Un analisi discriminante Descrizione del dataset

Capitolo 1. Analisi Discriminante. 1.1 Introduzione. 1.2 Un analisi discriminante Descrizione del dataset Capitolo 1 Analisi Discriminante 1.1 Introduzione L analisi discriminante viene condotta per definire una modalità di assegnazione dei casi a differenti gruppi, in funzione di una serie di variabili fra

Dettagli

ESERCIZIO 1. Vengono riportati di seguito i risultati di un analisi discriminante.

ESERCIZIO 1. Vengono riportati di seguito i risultati di un analisi discriminante. ESERCIZIO 1. Vengono riportati di seguito i risultati di un analisi discriminante. Test di uguaglianza delle medie di gruppo SELF_EFF COLL_EFF COIN_LAV IMPEGNO SODDISF CAP_IST COLLEGHI Lambda di Wilks

Dettagli

Ulteriori applicazioni del test del Chi-quadrato (χ 2 )

Ulteriori applicazioni del test del Chi-quadrato (χ 2 ) Ulteriori applicazioni del test del Chi-quadrato (χ 2 ) Finora abbiamo confrontato con il χ 2 le numerosità osservate in diverse categorie in un campione con le numerosità previste da un certo modello

Dettagli

Corso di Laurea in Informatica Calcolo delle Probabilità e Statistica (269AA) A.A. 2016/17 - Prova del

Corso di Laurea in Informatica Calcolo delle Probabilità e Statistica (269AA) A.A. 2016/17 - Prova del Corso di Laurea in Informatica Calcolo delle Probabilità e Statistica (269AA) A.A. 206/7 - Prova del 207-09-08 La durata della prova è di tre ore. Le risposte devono essere adeguatamente giustificate.

Dettagli

Biostatistica Laurea Magistrale in Biologia

Biostatistica Laurea Magistrale in Biologia Biostatistica Laurea Magistrale in Biologia Risultati dell esame del 1 Giugno 2016 Matricola 704922 715340 718052 7263 735674 741637 751823 751833 752143 752451 7537 7534 766091 766657 767606 781510 797434

Dettagli

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Un breve richiamo sul test t-student Siano A exp (a 1, a 2.a n ) e B exp (b 1, b 2.b m ) due set di dati i cui

Dettagli

Corso Integrato di Statistica Informatica e Analisi dei Dati Sperimentali. Esercitazione E

Corso Integrato di Statistica Informatica e Analisi dei Dati Sperimentali. Esercitazione E Corso Integrato di Statistica Informatica e Analisi dei Dati Sperimentali A.A 2009-2010 Esercitazione E Scopo dell esercitazione Applicazioni del teorema del limite centrale. Rappresentazione delle incertezze

Dettagli

Studio di osservazione, perché non viene imposto nessun trattamento alle unità campionarie

Studio di osservazione, perché non viene imposto nessun trattamento alle unità campionarie ALCUNI ESERCIZI ASSEGNATI (3 e 6 crediti) NELLA SESSIONE DI LUGLIO CON RELATIVE SOLUZIONI ATTENZIONE I VALORI OTTENUTI NEI CALCOLI (OTTENUTI CON UN SOFTWARE STATISTICO) POSSONO DIFFERIRE DI POCO DA QUELLI

Dettagli

Statistica multivariata 27/09/2016. D.Rodi, 2016

Statistica multivariata 27/09/2016. D.Rodi, 2016 Statistica multivariata 27/09/2016 Metodi Statistici Statistica Descrittiva Studio di uno o più fenomeni osservati sull INTERA popolazione di interesse (rilevazione esaustiva) Descrizione delle caratteristiche

Dettagli

Statistica Applicata Corso di Laurea in Scienze Naturali a. a. 2016/2017

Statistica Applicata Corso di Laurea in Scienze Naturali a. a. 2016/2017 Statistica Applicata Corso di Laurea in Scienze Naturali a. a. 2016/2017 prof. Federico Plazzi 13 Febbraio 2017 Nome: Cognome: Matricola: Alcune indicazioni: La prova è constituita da quattro esercizi;

Dettagli

Esercizi vari sulle schede di statistica

Esercizi vari sulle schede di statistica Esercizi vari sulle schede di statistica December 4, 2008 1 Introduzione Nelle prove scritte ci sarà un esercizio relativo alla parte di statistica e la sua implementazione con R. Tale parte dello scritto

Dettagli

VIII Indice 2.6 Esperimenti Dicotomici Ripetuti: Binomiale ed Ipergeometrica Processi Stocastici: Bernoul

VIII Indice 2.6 Esperimenti Dicotomici Ripetuti: Binomiale ed Ipergeometrica Processi Stocastici: Bernoul 1 Introduzione alla Teoria della Probabilità... 1 1.1 Introduzione........................................ 1 1.2 Spazio dei Campioni ed Eventi Aleatori................ 2 1.3 Misura di Probabilità... 5

Dettagli

Corso di Laurea in MQEGA

Corso di Laurea in MQEGA Corso di Laurea in MQEGA Insegnamento di Statistica (Prof. P.F. Perri) Esercizi di riepilogo sulle distribuzioni bivariate Esercizio 1 La rilevazione congiunta dei caratteri e Y su 100 unità statistiche

Dettagli

x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y )

x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y ) Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 0/03 lezioni di statistica del 5 e 8 aprile 03 - di Massimo Cristallo - A. Le relazioni tra i fenomeni

Dettagli

Ulteriori conoscenze di informatica Elementi di statistica Esercitazione I

Ulteriori conoscenze di informatica Elementi di statistica Esercitazione I Ulteriori conoscenze di informatica Elementi di statistica Esercitazione I Sui PC a disposizione sono istallati diversi sistemi operativi. All accensione scegliere Windows. Immettere Nome utente b## (##

Dettagli

Ulteriori conoscenze di informatica Elementi di statistica Esercitazione3

Ulteriori conoscenze di informatica Elementi di statistica Esercitazione3 Ulteriori conoscenze di informatica Elementi di statistica Esercitazione3 Sui PC a disposizione sono istallati diversi sistemi operativi. All accensione scegliere Windows. Immettere Nome utente b## (##

Dettagli

ECONOMETRIA: Laboratorio I

ECONOMETRIA: Laboratorio I ECONOMETRIA: Laboratorio I Luca De Angelis CLASS - Università di Bologna Programma Laboratorio I Valori attesi e varianze Test di ipotesi Stima di un modello lineare attraverso OLS Valore atteso Data una

Dettagli

R - Esercitazione 5. Andrea Fasulo Venerdì 16 Dicembre Università Roma Tre

R - Esercitazione 5. Andrea Fasulo Venerdì 16 Dicembre Università Roma Tre R - Esercitazione 5 Andrea Fasulo fasulo.andrea@yahoo.it Università Roma Tre Venerdì 16 Dicembre 2016 Intervalli di confidenza (1) Sia X 1,..., X n un campione casuale estratto da un densità f (x, θ) nota

Dettagli

Dr. Marco Vicentini Anno Accademico Rev 02/04/2011

Dr. Marco Vicentini Anno Accademico Rev 02/04/2011 Università degli Studi di Padova Facoltà di Psicologia, L4, Psicometria, Modulo B Dr. Marco Vicentini marco.vicentini@unipd.it Anno Accademico 2010 2011 Rev 02/04/2011 Tabelle di contingenza Percentuali

Dettagli

per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione

per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione Rapporti statistici di composizione la parte rispetto al tutto percentuali di derivazione per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione di frequenza (tassi) rapporti

Dettagli

Esame di Statistica A-Di Prof. M. Romanazzi

Esame di Statistica A-Di Prof. M. Romanazzi 1 Università di Venezia Esame di Statistica A-Di Prof. M. Romanazzi 1 Settembre 2015 Cognome e Nome..................................... N. Matricola.......... Valutazione Il punteggio massimo teorico

Dettagli

Analisi Multivariata Prova intermedia del 20 aprile 2011

Analisi Multivariata Prova intermedia del 20 aprile 2011 Analisi Multivariata Prova intermedia del 20 aprile 20 Esercizio A Sia X N 3 (µ, Σ) con µ = [ 3,, 4] e 2 0 Σ = 2 5 0 0 0 2 Quali delle seguenti variabili casuali è indipendente? Motivare la risposta. A.

Dettagli

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17 C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica

Dettagli

L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale

L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile Corso di Metodologia della ricerca sociale L analisi della varianza (ANOVA) La tecnica con cui si esplorano le relazioni

Dettagli

Statistica descrittiva: analisi di regressione

Statistica descrittiva: analisi di regressione Statistica descrittiva: analisi di regressione L analisi di regressione permette di esplorare le relazioni tra due insiemi di valori (p.e. i valori di due attributi di un campione) alla ricerca di associazioni.

Dettagli

1.1 Obiettivi della statistica Struttura del testo 2

1.1 Obiettivi della statistica Struttura del testo 2 Prefazione XV 1 Introduzione 1.1 Obiettivi della statistica 1 1.2 Struttura del testo 2 2 Distribuzioni di frequenza 2.1 Informazione statistica e rilevazione dei dati 5 2.2 Distribuzioni di frequenza

Dettagli

MISURA DELLA VARIAZIONE CONCOMITANTE (COVARIAZIONE/ CONTROVARIAZIONE) DI VARIABILI CARDINALI O QUASI- CARDINALI

MISURA DELLA VARIAZIONE CONCOMITANTE (COVARIAZIONE/ CONTROVARIAZIONE) DI VARIABILI CARDINALI O QUASI- CARDINALI ANALISI DELLA CORRELAZIONE MISURA DELLA VARIAZIONE CONCOMITANTE (COVARIAZIONE/ CONTROVARIAZIONE) DI VARIABILI CARDINALI O QUASI- CARDINALI VINCOLI CHE SI IMPONGONO ALLA SUA UTILIZZAZIONE: LA RELAZIONE

Dettagli

Metodi di analisi statistica multivariata

Metodi di analisi statistica multivariata Metodi di analisi statistica multivariata lzo V

Dettagli

IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI

IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI Perchè confrontare le varianze stimate in due campioni? Torniamo all'esempio dei frinosomi Per poter applicare il test t avevamo detto che le varianze, e

Dettagli

EUROPEAN COMPUTER DRIVING LICENCE SYLLABUS VERSIONE 5.0

EUROPEAN COMPUTER DRIVING LICENCE SYLLABUS VERSIONE 5.0 Pagina I EUROPEAN COMPUTER DRIVING LICENCE SYLLABUS VERSIONE 5.0 Modulo 4 Foglio elettronico Il seguente Syllabus è relativo al Modulo 4, Foglio elettronico, e fornisce i fondamenti per il test di tipo

Dettagli

Soluzioni prova scritta di Complementi di Probabilità e Statistica (29/06)

Soluzioni prova scritta di Complementi di Probabilità e Statistica (29/06) Soluzioni prova scritta di Complementi di Probabilità e Statistica (29/6). (a) Per costruire il box plot, vengono determinati minimo=,, massimo=,97, mediana=,455, I quartile=,3375 e III quartile=,745 dei

Dettagli

1. Sono state eseguite 250 misure di temperatura che hanno rivelato i seguenti valori stimati di media e di deviazione standard per il campione

1. Sono state eseguite 250 misure di temperatura che hanno rivelato i seguenti valori stimati di media e di deviazione standard per il campione Inferenza di Intervallo 1. Sono state eseguite 250 misure di temperatura che hanno rivelato i seguenti valori stimati di media e di deviazione standard per il campione T = 300 K σ T = 50 a. Calcolare un

Dettagli

ISTITUTO D ARTE A.VENTURI (Modena) PROGRAMMA di MATEMATICA SVOLTO dalle classi 2^P a.s. 2013/2014

ISTITUTO D ARTE A.VENTURI (Modena) PROGRAMMA di MATEMATICA SVOLTO dalle classi 2^P a.s. 2013/2014 ISTITUTO D ARTE A.VENTURI (Modena) PROGRAMMA di MATEMATICA SVOLTO dalle classi ^P a.s. / Aritmetica e algebra ripasso monomi e polinomi; regole dei prodotti notevoli (somma per differenza, quadrato di

Dettagli

Corso in Statistica Medica

Corso in Statistica Medica Corso in Statistica Medica Introduzione alle tecniche statistiche di elaborazione dati Regressione e correlazione Dott. Angelo Menna Università degli Studi di Chieti G. d Annunziod Annunzio Anno Accademico

Dettagli

COGNOME.NOME...MATR..

COGNOME.NOME...MATR.. STATISTICA 29.01.15 - PROVA GENERALE (CHALLENGE) Modalità A (A) ai fini della valutazione verranno considerate solo le risposte riportate dallo studente negli appositi riquadri bianchi: in caso di necessità

Dettagli

Prova Pratica di Statistica I+II - Prof. M. Romanazzi

Prova Pratica di Statistica I+II - Prof. M. Romanazzi 1 Università di Venezia - Corso di Statistica I + II (Cb-Ga) Prova Pratica di Statistica I+II - Prof. M. Romanazzi 3 Giugno 2008 Cognome e Nome............................................ N. Matricola............

Dettagli

Cognome e Nome:... Matricola e corso di laurea:...

Cognome e Nome:... Matricola e corso di laurea:... Statistica - corso base Prof. B. Liseo Prova di esame dell 8 gennaio 2014 Cognome e Nome:................................................................... Matricola e corso di laurea:...................................................

Dettagli

Esperimentazioni di Fisica 1. Prova in itinere del 12 giugno 2018

Esperimentazioni di Fisica 1. Prova in itinere del 12 giugno 2018 Esperimentazioni di Fisica 1 Prova in itinere del 1 giugno 018 Esp-1 Prova in Itinere n. - - Page of 6 1/06/018 1. (1 Punti) Quesito L incertezza da associare alle misurazioni eseguite con un certo strumento

Dettagli

Esercitazione del

Esercitazione del Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36

Dettagli

Regressione logistica. Strumenti quantitativi per la gestione

Regressione logistica. Strumenti quantitativi per la gestione Regressione logistica Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/classes/4a_rlg.html#(22) 1/28 Metodi di classificazione I

Dettagli

Esercitazione Marzo 2019

Esercitazione Marzo 2019 Esercitazione 13 Marzo 019 Esercizio 1 Su un collettivo di 100 appartamenti ubicati nella stessa zona della città vengono rilevati i seguenti caratteri: X 1 affitto mensile pagato dal locatario (in Euro)

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2016-2017 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

0 altimenti 1 soggetto trova lavoroentro 6 mesi}

0 altimenti 1 soggetto trova lavoroentro 6 mesi} Lezione n. 16 (a cura di Peluso Filomena Francesca) Oltre alle normali variabili risposta che presentano una continuità almeno all'interno di un certo intervallo di valori, esistono variabili risposta

Dettagli

Metodi Matematici e Informatici per la biologia. Esercizi

Metodi Matematici e Informatici per la biologia. Esercizi Metodi Matematici e Informatici per la biologia Esercizi Esercizio 1 Il modo migliore per isolare gli effetti delle variabili nascoste sulla variabile di risposta è di effettuare uno studio di osservazione

Dettagli

ESEMPI DI DOMANDE PER LA PROVA SCRITTA DI STATISTICA SOCIALE

ESEMPI DI DOMANDE PER LA PROVA SCRITTA DI STATISTICA SOCIALE ESERCITAZIONE DI FINE CORSO ESEMPI DI DOMANDE PER LA PROVA SCRITTA DI STATISTICA SOCIALE 1. Si prenda in esame la seguente tabella che riporta la suddivisione di una popolazione femminile per titolo di

Dettagli

R - Esercitazione 2. Andrea Fasulo 20 Ottobre Università Roma Tre

R - Esercitazione 2. Andrea Fasulo 20 Ottobre Università Roma Tre R - Esercitazione 2 Andrea Fasulo fasulo.andrea@yahoo.it Università Roma Tre 20 Ottobre 2017 det(), solve() : calcolano determinante e inverso di una matrice quadrata. t() genera la matrice trasposta.

Dettagli

Università di Pavia Econometria Esercizi 4 Soluzioni

Università di Pavia Econometria Esercizi 4 Soluzioni Università di Pavia Econometria 2008-2009 Esercizi 4 Soluzioni Maggio, 2009 Istruzioni: I commenti devono essere concisi! 1. Dato il modello di regressione lineare, con K regressori con E(ɛ) = 0 e E(ɛɛ

Dettagli

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Strumenti statistici in Excell Pacchetto Analisi di dati Strumenti di analisi: Analisi varianza: ad un fattore Analisi

Dettagli

CORSO DI INFORMATICA. CL3 - Biotecnologie

CORSO DI INFORMATICA. CL3 - Biotecnologie CORSO DI INFORMATICA CL3 - Biotecnologie Formattazione dei numeri Convertire in numeri i numeri memorizzati come testo Può capitare che occasionalmente i numeri vengano formattati e memorizzati nelle celle

Dettagli

Legge di Hardy-Weinberg

Legge di Hardy-Weinberg Legge di Hardy-Weinberg Popolazione in equilibrio Popolazione infinitamente grande No mutazioni No migrazione (geni non sono introdotti o persi) No selezione Incroci casuali Unione fra genotipi è casuale

Dettagli

Analisi Discriminante Canonica con R

Analisi Discriminante Canonica con R Università di Bologna - Facoltà di Scienze Statistiche Laurea Triennale in Statistica e Ricerca Sociale Corso di Analisi di Serie Storiche e Multidimensionali Prof.ssa Marilena Pillati Analisi Discriminante

Dettagli

Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di:

Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di: Teoria dei Fenomeni Aleatori AA 01/13 Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di: N-pla o Sequenza

Dettagli

Esame di Statistica del 1 settembre 2004 (Corso di Laurea in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola

Esame di Statistica del 1 settembre 2004 (Corso di Laurea in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola Esame di Statistica del 1 settembre 004 (Corso di Laurea in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola Es. 1 Es. Es. Es. 4 Somma Voto finale Attenzione: si consegnano SOLO

Dettagli

Quiz di verifica Classificazione

Quiz di verifica Classificazione Quiz di verifica Classificazione Strumenti Quantitativi per la gestione Le domande 1 4 si riferiscono al seguente problema: Supponiamo di raccogliere dati per un gruppo di studenti della classe di SQG

Dettagli

La media e la mediana sono indicatori di centralità, che indicano un centro dei dati.

La media e la mediana sono indicatori di centralità, che indicano un centro dei dati. La media e la mediana sono indicatori di centralità, che indicano un centro dei dati. Un indicatore che sintetizza in un unico numero tutti i dati, nascondendo quindi la molteplicità dei dati. Per esempio,

Dettagli

JMP 10 Student Edition: Guida rapida

JMP 10 Student Edition: Guida rapida JMP 10 Student Edition: Guida rapida Queste istruzioni presuppongono una tabella di dati aperta, le impostazioni delle preferenze predefinite, e le variabili di interesse con l appropriato tipo di modellazione.

Dettagli

La matrice delle correlazioni è la seguente:

La matrice delle correlazioni è la seguente: Calcolo delle componenti principali tramite un esempio numerico Questo esempio numerico puó essere utile per chiarire il calcolo delle componenti principali e per introdurre il programma SPAD. IL PROBLEMA

Dettagli

Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di:

Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di: Teoria dei Fenomeni Aleatori AA 01/13 Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di: N-pla o Sequenza

Dettagli

Statistica Applicata Corso di Laurea in Scienze Naturali a. a. 2016/2017

Statistica Applicata Corso di Laurea in Scienze Naturali a. a. 2016/2017 Statistica Applicata Corso di Laurea in Scienze Naturali a. a. 2016/2017 prof. Federico Plazzi 19 Luglio 2017 Nome: Cognome: Matricola: Alcune indicazioni: La prova è constituita da quattro esercizi; dopo

Dettagli

Statistica inferenziale

Statistica inferenziale Dipartimento di Fisica a.a. 2004/2005 Fisica Medica 2 Statistica inferenziale 6/5/2005 Relazione tra dati Possono esistere in uno studio connessioni tra dati differenti che possono legare caratteristiche:

Dettagli

STATISTICA MULTIVARIATA SSD MAT/06

STATISTICA MULTIVARIATA SSD MAT/06 Università degli studi di Ferrara Dipartimento di Matematica A.A. 2018/2019 I semestre STATISTICA MULTIVARIATA SSD MAT/06 LEZIONE 4 - Questioni di analisi e applicazione della regressione lineare Pratica

Dettagli

L'analisi bivariata (associazione e cograduazione)

L'analisi bivariata (associazione e cograduazione) L'analisi bivariata (associazione e cograduazione) Prof. Stefano Nobile Corso di Metodologia della ricerca sociale L analisi bivariata L analisi bivariata è un analisi delle relazioni tra due caratteristiche

Dettagli

Tecniche statistiche di analisi del cambiamento

Tecniche statistiche di analisi del cambiamento Tecniche statistiche di analisi del cambiamento 07a-Ripasso: Anova ad un fattore (v. 1.9a, 29 dicembre 2018) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

nome di un menu per visualizzarlo e poi selezionate facendo clic sul comando che vi interessa.

nome di un menu per visualizzarlo e poi selezionate facendo clic sul comando che vi interessa. 1 (conoscere le basi di Excel) < I controlli della. Finestra > La finestra di apertura di Excel presenta una cartella di lavoro vuota; la finestra del programma occupa tutto lo spazio dello schermo, mentre

Dettagli

STATISTICA CORSO BASE. Prova scritta del Tempo: 2 ore Cognome e Nome:... Matricola:...

STATISTICA CORSO BASE. Prova scritta del Tempo: 2 ore Cognome e Nome:... Matricola:... STATISTICA CORSO BASE. Prova scritta del 7-2-2013. Tempo: 2 ore Cognome e Nome:.............................. Matricola:.............................. Attenzione: Prima di affrontare la prova si consiglia

Dettagli

1 L analisi discriminante lineare

1 L analisi discriminante lineare 1 L analisi discriminante lineare L analisi discriminante lineare presuppone che p variabili (quantitative) Y 1,... Y p siano state misurate su osservazioni appartenenti a 2 o più gruppi: G 1,...,G k,

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2017-2018 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

A m n B n p = P m p. 0 1 a b c d. a b. 0 a 0 c Il risultato e lo stesso solo nel caso in cui c = 0 e a = d.

A m n B n p = P m p. 0 1 a b c d. a b. 0 a 0 c Il risultato e lo stesso solo nel caso in cui c = 0 e a = d. Matematica II, 220404 Il prodotto di matrici e un operazione parziale che prende in entrata una matrice A ed una matrice B, tali che il numero delle colonne di A sia uguale al numero delle righe di B,

Dettagli

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli Dipartimento di Sociologia e Ricerca Sociale Corso di Laurea in Sociologia Insegnamento di Statistica (a.a. 2018-2019) dott.ssa Gaia Bertarelli Esercitazione n. 6 1. Si consideri un campione di 69 persone

Dettagli

materiale didattico II incontro

materiale didattico II incontro Piano Nazionale Lauree Scientifiche (PLS 016-017) Statistica Laboratorio di Statistica Le relazioni tra variabili. L indipendenza prof.ssa Angela Maria D'Uggento angelamaria.duggento@uniba.it materiale

Dettagli

I TEST STATISTICI. dott.ssa Gabriella Agrusti

I TEST STATISTICI. dott.ssa Gabriella Agrusti I TEST STATISTICI dott.ssa Gabriella Agrusti Dulcis in fundo.. come scegliere un test statistico in base all ipotesi come stabilire se due variabili sono associate (correlazione di Pearson) come stabilire

Dettagli

Prova scritta di Complementi di Probabilità e Statistica. 7 Dicembre 2012

Prova scritta di Complementi di Probabilità e Statistica. 7 Dicembre 2012 Prova scritta di Complementi di Probabilità e Statistica 7 Dicembre. Un ingegnere vuole investigare se le caratteristiche di una superficie metallica sono influenzate dal tipo di pittura usata e dal tempo

Dettagli

Progetti Algoritmi e Strutture Dati A.A Si intende realizzare una coda di priorità mediante un max-heap.

Progetti Algoritmi e Strutture Dati A.A Si intende realizzare una coda di priorità mediante un max-heap. Progetti Algoritmi e Strutture Dati A.A. 2017-2018 Esercizio 1 Si intende realizzare una coda di priorità mediante un max-heap. Ogni singolo elemento della struttura è rappresentato da una coppia < categoria,

Dettagli

Fondamenti di statistica per il miglioramento genetico delle piante. Antonio Di Matteo Università Federico II

Fondamenti di statistica per il miglioramento genetico delle piante. Antonio Di Matteo Università Federico II Fondamenti di statistica per il miglioramento genetico delle piante Antonio Di Matteo Università Federico II Modulo 2 Variabili continue e Metodi parametrici Distribuzione Un insieme di misure è detto

Dettagli

CAPITOLO 11 ANALISI DI REGRESSIONE

CAPITOLO 11 ANALISI DI REGRESSIONE VERO FALSO CAPITOLO 11 ANALISI DI REGRESSIONE 1. V F Se c è una relazione deterministica tra due variabili,x e y, ogni valore dato di x,determinerà un unico valore di y. 2. V F Quando si cerca di scoprire

Dettagli

PROBABILITÀ ELEMENTARE

PROBABILITÀ ELEMENTARE Prefazione alla seconda edizione XI Capitolo 1 PROBABILITÀ ELEMENTARE 1 Esperimenti casuali 1 Spazi dei campioni 1 Eventi 2 Il concetto di probabilità 3 Gli assiomi della probabilità 3 Alcuni importanti

Dettagli

Appendice 1: Verifiche scritte

Appendice 1: Verifiche scritte ANNO SCOLASTICO 2015-2016 CLASSE 1 LB DISCIPLINA: FISICA DOCENTE: Romio Silvana A. PROGRAMMA Le misure delle grandezze. Introduzione alla fisica: la Fisica come scienza, limiti e validità di una teoria

Dettagli

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello Metodi Quantitativi per Economia, Finanza e Management Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello 1. Introduzione ai modelli di regressione 2. Obiettivi 3. Le

Dettagli

3 giugno 2019, es.1) Programmazione lineare

3 giugno 2019, es.1) Programmazione lineare giugno 09, es.) Programmazione lineare Discutere il seguente problema di Programmazione lineare: trovare, se esiste, il massimo di p(x, x, x, x 4 ) = 5 x + x + x + 6 x 4 con i vincoli x k 0 ( k 4) e x

Dettagli

Teoria e tecniche dei test. Concetti di base

Teoria e tecniche dei test. Concetti di base Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi

Dettagli

Excel. È data la distribuzione di 1863 famiglie italiane secondo il numero di componenti:

Excel. È data la distribuzione di 1863 famiglie italiane secondo il numero di componenti: Excel È data la distribuzione di 1863 famiglie italiane secondo il numero di componenti: Calcolare per ogni classe della distribuzione: (a) le frequenze relative; Sia data la distribuzione degli studenti

Dettagli

Stima dei parametri. I parametri di una pdf sono costanti che caratterizzano la sua forma. r.v. parameter. Assumiamo di avere un campione di valori

Stima dei parametri. I parametri di una pdf sono costanti che caratterizzano la sua forma. r.v. parameter. Assumiamo di avere un campione di valori Stima dei parametri I parametri di una pdf sono costanti che caratterizzano la sua forma r.v. parameter Assumiamo di avere un campione di valori Vogliamo una funzione dei dati che permette di stimare i

Dettagli

Statistica di base per l analisi socio-economica

Statistica di base per l analisi socio-economica Laurea Magistrale in Management e comunicazione d impresa Statistica di base per l analisi socio-economica Giovanni Di Bartolomeo gdibartolomeo@unite.it Definizioni di base Una popolazione è l insieme

Dettagli

STATISTICA CORSO BASE. Prova scritta del Tempo: 2 ore Cognome e Nome:... Matricola:...

STATISTICA CORSO BASE. Prova scritta del Tempo: 2 ore Cognome e Nome:... Matricola:... STATISTICA CORSO BASE. Prova scritta del 7-2-2013. Tempo: 2 ore Cognome e Nome:.............................. Matricola:.............................. Attenzione: Prima di affrontare la prova si consiglia

Dettagli

LM 88 SOCIOLOGIA E RICERCA SOCIALE. Metodi Statistici per la Ricerca Sociale. Regressione lineare e correlazione

LM 88 SOCIOLOGIA E RICERCA SOCIALE. Metodi Statistici per la Ricerca Sociale. Regressione lineare e correlazione LM 88 SOCIOLOGIA E RICERCA SOCIALE Metodi Statistici per la Ricerca Sociale Regressione lineare e correlazione 1. Su un campione di individui sono rilevati i caratteri X (peso in Kg) e Y (altezza in cm),

Dettagli

Data Import pulizia dati e Probabilità. Renato Mainetti

Data Import pulizia dati e Probabilità. Renato Mainetti Data Import pulizia dati e Probabilità Renato Mainetti Importare dati in Matlab: Abbiamo visto come sia possibile generare array e matrici di dati. Per ora abbiamo sempre inserito i dati manualmente o

Dettagli

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Introduzione : analisi delle relazioni tra due caratteristiche osservate sulle stesse unità statistiche studio del comportamento di due caratteri

Dettagli

REGRESSIONE E CORRELAZIONE

REGRESSIONE E CORRELAZIONE REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.

Dettagli

Modelli e procedure per l educazione degli adulti

Modelli e procedure per l educazione degli adulti CdL SEAFC a.a. 2016-2017 II semestre Pedagogia sperimentale. Modelli e procedure per l educazione degli adulti francesco.agrusti@uniroma3.it T6. Modelli e procedure di valutazione Ultimo appuntamento con

Dettagli

i) Si tratta di uno studio di osservazione V F ii) Quale delle seguenti affermazioni è corretta? a b c

i) Si tratta di uno studio di osservazione V F ii) Quale delle seguenti affermazioni è corretta? a b c I COMPITO (3 crediti) ESERCIZIO 1 E stata effettuata una ricerca per studiare se il raccolto di una particolare specie di cereale Y (t/ha) è correlato linearmente con la quantità di fertilizzante applicato

Dettagli

Criteri di Valutazione della scheda (solo a carattere indicativo)

Criteri di Valutazione della scheda (solo a carattere indicativo) Criteri di Valutazione della scheda (solo a carattere indicativo) Previsioni - A Sono state fatte le previsioni e discussi i valori attesi insieme al ragionamento con cui sono stati calcolati? E stata

Dettagli

Esercizi riepilogativi (dai compiti dell A.A. 2001/02 IV canale)

Esercizi riepilogativi (dai compiti dell A.A. 2001/02 IV canale) Esercizi riepilogativi (dai compiti dell A.A. 2001/02 IV canale) Grafici e distribuzioni univariate 1. Da un campione di 100 aziende agricole della provincia di Bologna è stata rilevata la classe di superficie

Dettagli

Psicometria con Laboratorio di SPSS 1

Psicometria con Laboratorio di SPSS 1 Psicometria con Laboratorio di SPSS 1 1-Panoramica delle tecniche: Spiegazione intuitiva vers. 1.1 (vers. 1.1, 14 marzo 2018) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università

Dettagli

Lab. 2 - Excel. Prof. De Michele e Farina

Lab. 2 - Excel. Prof. De Michele e Farina Lab. 2 - Excel Prof. De Michele e Farina 1 Utilizzo avanzato di un foglio elettronico: - Utilizzo di funzioni Regressioni lineari Istogrammi 2 La funzione somma restituisce la somma dei valori dei propri

Dettagli

questa variabile corrisponde alla somma ponderata delle variabili originarie in cui i pesi sono costituiti dai coefficienti a ij

questa variabile corrisponde alla somma ponderata delle variabili originarie in cui i pesi sono costituiti dai coefficienti a ij 5. COMPONENTI PRINCIPALI 5.1 Introduzione L analisi in componenti principali (CP) si pone l obiettivo di determinare quelle trasformazioni lineari delle h variabili originarie X i (i = 1, 2,, h), linearmente

Dettagli

INDICE PARTE METODOLOGICA

INDICE PARTE METODOLOGICA INDICE PARTE METODOLOGICA 1. Il processo di ricerca 1.1.Individuazione di un problema e formulazione delle ipotesi 1.2.Individuazione e definizione operativa delle variabili 1.2.1. Le variabili definite

Dettagli