Laboratorio di Analisi ed Esplorazione Dati A.A. 2008/09 Terzo foglio di esercizi per l esame.
|
|
- Cinzia Marcellina Rota
- 5 anni fa
- Visualizzazioni
Transcript
1 Laboratorio di Analisi ed Esplorazione Dati A.A. 2008/09 Terzo foglio di esercizi per l esame. Ognuno deve svolgere (scrivendo la soluzione su un foglio) l esercizio A e l esercizio del punto B (scrivendo un programma in R che risponda alle domande, con eventuali commenti, e mandandomelo via a pugliese@science.unitn.it ) del numero (da 1 a 9) assegnato, come da elenco presente anch esso in rete. A. Per riconoscere potenziali portatrici del gene dell emofilia A, venne analizzato il sangue di due gruppi di donne, misurando X 1, il logaritmo dell attività AHF (fattore anti-emofiliaco) e X 2, il logaritmo dell antigene tipo AHF. Il primo gruppo era costituito da n 1 = 30 donne non portatrici del gene; il secondo da n 2 = 22 donne portatrici del gene. Gli scienziati hanno stimato le medie di X nei due gruppi µ 1 = ( ) µ 2 = ( e l inversa della matrice comune di covarianza ( ) S 1 = Supponendo uguali costi per gli errori di misclassificazione e uguali probabilità a priori, assegnare a uno dei gruppi una donna le cui misure sono x 1 = 0.210, x 2 = Calcolate anche le probabilità a posteriori. 2. Ripetete i calcoli, supponendo che la donna sia prima cugina di un emofiliaco, quindi p 1 = 3/4, p 2 = 1/4 e che sia stato deciso che c 2 = 2c Supponendo che la distribuzione di X sia normale bivariata con medie e covarianza date dalla matrice di cui sopra, calcolate la probabilità teorica di errore di classificazione, assumendo p 1 = p 2. B. 2. Il file tab53 2.dat nella directory dati contiene 4 misure morfologiche (le chiamerò Y 1, Y 2, Y 3, Y 4) su 2 specie (identificate con 1 o 2 nella prima colonna) di pulci: Haltica oleracea e Haltica carduorum. (a) Eseguite l analisi discriminante lineare per predire (con probabilità a priori 1/2 e 1/2) la specie sulla base delle 4 variabili morfologiche. Calcolate la frequenza di errore sia sui dati utilizzati nell analisi, sia applicando il metodo della cross-validation escludendo i dati uno alla volta. 1 )
2 (b) Mostrare le proiezioni dei dati (distinguendo la specie) sulla/e variabile discriminante canonica. (c) Ripetere l analisi utilizzando tutte le variabili meno Y 1, tutte meno Y 3 e solo Y 1 e Y 2. Quale metodo raccomandereste di usare per il futuro? (d) Eseguite la regressione lineare di Y 2 su Y 1, usando come covariata la specie di appartenenza. E significativa la differenza della regressione fra le due specie? Fate il grafico di Y 1 e Y 2 con le varie rette di regressione. 3. Attuare l analisi discriminante lineare sui dati delle ditte che hanno subito o meno bancarotta nel file bankrupcy.dat nella directory dati. Valutate la frequenza di errore sia sui dati utilizzati nell analisi, sia con il metodo della cross-validation. (a) Secondo un ricercatore, l osservazione 16 delle ditte che hanno fatto bancarotta (indice 0 nella colonna 1) e l osservazione 13 per le ditte a posto (indice 1) sono influenti nel senso che influenzano i calcoli in modo significativo. Rifate le analisi escludendo queste osservazioni e confrontate i grafici dei dati nelle variabili discriminanti canoniche con o senza l esclusione di queste osservazioni. (b) Ripetere l analisi usando la regressione logistica. 4. Il file plankton.txt (scaricabile dal sito Web del corso) contiene dati sulla quantità di certi tipi di organismi raccolta in 25 campionamenti. [Notare che le prime righe del file contengono informazioni sul contenuto del file, informazioni utili per altri programmi statistici. In R conviene saltare queste righe tramite l opzione skip nel comando read.table()] Sulle righe ci sono i 25 campionamenti; le prime 5 colonne mostrano i dati delle 5 specie A, B, C, D ed E alla profondità di 29 m; le successive 5 colonne si riferiscono alle stesse specie alla profondità di 31 m. Compiete un analisi delle componenti principali su questi dati. Mostrate anche graficamente il risultato di questa procedura. Individuate dal grafico i campionamenti più diversi dagli altri. Ripetete la procedura utilizzando, per ogni campionamento, soltanto la media fra la profondità di 29 m e quella di 31 m per le cinque specie. Ripetete la procedura separatamente per i dati alla profondità di 29 e per quelli alla profondità di 31 metri. Si vede qualche differenza fra le 2
3 due profondità? 5. Il file remote.txt nella directory nella directory dati contiene nella prima colonna un indice sul tipo di coltivazione (1 = corn, 2 = soybeans, 3 = cotton, 4 = sugarbeets, 5 = clover), nelle altre quattro delle misure ottenute tramite remote sensing sulle coltivazioni. [Notare che le prime righe del file contengono informazioni sul contenuto del file, informazioni utili per altri programmi statistici. In R conviene saltare queste righe tramite l opzione skip nel comando read.table()] Utilizzare l analisi discriminante su questi dati per stabilire (usando probabilità a priori uguali) il tipo di coltivazione in base alle altre misure. Fate un grafico dei dati sulle variabili discriminanti canoniche. Trovare il tasso di errore sul campione, e con il metodo della crossvalidation. Provare ad eliminare variabili per eventualmente migliorare i risultati. Ripetere l analisi solo sulle coltivazioni di tipo 1 e 2 (ossia solo le prime 14 righe). Come funziona il metodo? Si potevano usare tecniche diverse per questo caso? 6. Il file forestry.txt nella directory dati contiene dati sulla presenza di 8 specie di alberi in 10 siti nel Wisconsin. Attuare un analisi delle corrispondenze su questi dati. Mostrare i risultati anche in forma grafica. Quante dimensioni scegliereste per la rappresentazione grafica dei dati? Motivare la risposta. E possibile suddividere le specie di alberi in gruppi di specie associate? e associarle ad alcuni di questi siti? scrittori di romanzi sono stati valutati da un campione di lettori i quali hanno espresso opinioni sul tipo di contenuto e sul modo in cui sono state scritte delle opere dei scrittori indicati in base ai parametri riportati (vedi tabella più sotto; i dati (senza nomi di righe e colonne) sono nel file romanzi.txt nella cartella dati ): X1: giudizio, X2: leggibilità, X3: politica, X4: fantasia, X5: rilettura, X6: thriller, X7: attualità. 3
4 Compiere un analisi delle componenti principali su questi dati; presentate i dati in forma grafica, giustificando il numero di componenti scelti; mostrateli anche sotto forma di biplot insieme alle variabili. [E preferibile mostrare i grafici con i nomi corretti di righe e colonne] 8. Analizzate i dati del file savings.txt (nella directory /dati/ascdata ) tramite l analisi delle componenti principali, usando la matrice di covarianza o di correlazione a seconda di cosa vi sembra più appropriato. Interpretate i risultati. Individuate (con il comando identify ) i punti estremi sul grafico delle prime componenti principali. Secondo voi è più appropriato questo tipo di analisi o la regressione multipla svolta in un altro esercizio? 9. Il file uscrime.txt riporta il numero di crimini di vari tipi commessi nel 1985 nei 50 stati degli USA. Le righe indicano (in sigla) gli stati. Le 4
5 colonne indicano (nell ordine) area (in miglia quadrate?), popolazione (in migliaia), omicidi, stupri, rapine, aggressioni, furti con scasso, borseggiamenti, furti di auto, regione, divisione. Credo che anche il numero dei crimini sia in migliaia. Le regioni sono 1 (Nord-Est), 2 (Midwest), 3 (Sud), 4 (Ovest). Le divisioni vanno da 1 a 9 e corrispondono ad una divisione piu fine degli USA. Attuate l analisi delle corrispondenze sui dati dei crimini. Qual è il contributo degli assi? Fate un grafico dei valori sui primi 2 assi (è ragionevole tale scelta?). Si può vedere un effetto della regione (o della divisione) sul tipo di crimini riscontrati? 5
STATISTICA. Esercitazione 5
STATISTICA Esercitazione 5 Esercizio 1 Ad un esame universitario sono stati assegnati in modo casuale due compiti diversi con i seguenti risultati: Compito A Compito B Numero studenti 102 105 Media dei
DettagliEsercizi di statistica
Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..
DettagliAnalisi della varianza
Università degli Studi di Padova Facoltà di Medicina e Chirurgia Facoltà di Medicina e Chirurgia - A.A. 2009-10 Scuole di specializzazione Lezioni comuni Disciplina: Statistica Docente: dott.ssa Egle PERISSINOTTO
DettagliL A B C di R. Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010
L A B C di R 0 20 40 60 80 100 2 3 4 5 6 7 8 Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010 La scelta del test statistico giusto La scelta della analisi
DettagliCapitolo 1. Analisi Discriminante. 1.1 Introduzione. 1.2 Un analisi discriminante Descrizione del dataset
Capitolo 1 Analisi Discriminante 1.1 Introduzione L analisi discriminante viene condotta per definire una modalità di assegnazione dei casi a differenti gruppi, in funzione di una serie di variabili fra
DettagliESERCIZIO 1. Vengono riportati di seguito i risultati di un analisi discriminante.
ESERCIZIO 1. Vengono riportati di seguito i risultati di un analisi discriminante. Test di uguaglianza delle medie di gruppo SELF_EFF COLL_EFF COIN_LAV IMPEGNO SODDISF CAP_IST COLLEGHI Lambda di Wilks
DettagliUlteriori applicazioni del test del Chi-quadrato (χ 2 )
Ulteriori applicazioni del test del Chi-quadrato (χ 2 ) Finora abbiamo confrontato con il χ 2 le numerosità osservate in diverse categorie in un campione con le numerosità previste da un certo modello
DettagliCorso di Laurea in Informatica Calcolo delle Probabilità e Statistica (269AA) A.A. 2016/17 - Prova del
Corso di Laurea in Informatica Calcolo delle Probabilità e Statistica (269AA) A.A. 206/7 - Prova del 207-09-08 La durata della prova è di tre ore. Le risposte devono essere adeguatamente giustificate.
DettagliBiostatistica Laurea Magistrale in Biologia
Biostatistica Laurea Magistrale in Biologia Risultati dell esame del 1 Giugno 2016 Matricola 704922 715340 718052 7263 735674 741637 751823 751833 752143 752451 7537 7534 766091 766657 767606 781510 797434
DettagliCorso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII
Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Un breve richiamo sul test t-student Siano A exp (a 1, a 2.a n ) e B exp (b 1, b 2.b m ) due set di dati i cui
DettagliCorso Integrato di Statistica Informatica e Analisi dei Dati Sperimentali. Esercitazione E
Corso Integrato di Statistica Informatica e Analisi dei Dati Sperimentali A.A 2009-2010 Esercitazione E Scopo dell esercitazione Applicazioni del teorema del limite centrale. Rappresentazione delle incertezze
DettagliStudio di osservazione, perché non viene imposto nessun trattamento alle unità campionarie
ALCUNI ESERCIZI ASSEGNATI (3 e 6 crediti) NELLA SESSIONE DI LUGLIO CON RELATIVE SOLUZIONI ATTENZIONE I VALORI OTTENUTI NEI CALCOLI (OTTENUTI CON UN SOFTWARE STATISTICO) POSSONO DIFFERIRE DI POCO DA QUELLI
DettagliStatistica multivariata 27/09/2016. D.Rodi, 2016
Statistica multivariata 27/09/2016 Metodi Statistici Statistica Descrittiva Studio di uno o più fenomeni osservati sull INTERA popolazione di interesse (rilevazione esaustiva) Descrizione delle caratteristiche
DettagliStatistica Applicata Corso di Laurea in Scienze Naturali a. a. 2016/2017
Statistica Applicata Corso di Laurea in Scienze Naturali a. a. 2016/2017 prof. Federico Plazzi 13 Febbraio 2017 Nome: Cognome: Matricola: Alcune indicazioni: La prova è constituita da quattro esercizi;
DettagliEsercizi vari sulle schede di statistica
Esercizi vari sulle schede di statistica December 4, 2008 1 Introduzione Nelle prove scritte ci sarà un esercizio relativo alla parte di statistica e la sua implementazione con R. Tale parte dello scritto
DettagliVIII Indice 2.6 Esperimenti Dicotomici Ripetuti: Binomiale ed Ipergeometrica Processi Stocastici: Bernoul
1 Introduzione alla Teoria della Probabilità... 1 1.1 Introduzione........................................ 1 1.2 Spazio dei Campioni ed Eventi Aleatori................ 2 1.3 Misura di Probabilità... 5
DettagliCorso di Laurea in MQEGA
Corso di Laurea in MQEGA Insegnamento di Statistica (Prof. P.F. Perri) Esercizi di riepilogo sulle distribuzioni bivariate Esercizio 1 La rilevazione congiunta dei caratteri e Y su 100 unità statistiche
Dettaglix, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y )
Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 0/03 lezioni di statistica del 5 e 8 aprile 03 - di Massimo Cristallo - A. Le relazioni tra i fenomeni
DettagliUlteriori conoscenze di informatica Elementi di statistica Esercitazione I
Ulteriori conoscenze di informatica Elementi di statistica Esercitazione I Sui PC a disposizione sono istallati diversi sistemi operativi. All accensione scegliere Windows. Immettere Nome utente b## (##
DettagliUlteriori conoscenze di informatica Elementi di statistica Esercitazione3
Ulteriori conoscenze di informatica Elementi di statistica Esercitazione3 Sui PC a disposizione sono istallati diversi sistemi operativi. All accensione scegliere Windows. Immettere Nome utente b## (##
DettagliECONOMETRIA: Laboratorio I
ECONOMETRIA: Laboratorio I Luca De Angelis CLASS - Università di Bologna Programma Laboratorio I Valori attesi e varianze Test di ipotesi Stima di un modello lineare attraverso OLS Valore atteso Data una
DettagliR - Esercitazione 5. Andrea Fasulo Venerdì 16 Dicembre Università Roma Tre
R - Esercitazione 5 Andrea Fasulo fasulo.andrea@yahoo.it Università Roma Tre Venerdì 16 Dicembre 2016 Intervalli di confidenza (1) Sia X 1,..., X n un campione casuale estratto da un densità f (x, θ) nota
DettagliDr. Marco Vicentini Anno Accademico Rev 02/04/2011
Università degli Studi di Padova Facoltà di Psicologia, L4, Psicometria, Modulo B Dr. Marco Vicentini marco.vicentini@unipd.it Anno Accademico 2010 2011 Rev 02/04/2011 Tabelle di contingenza Percentuali
Dettagliper togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione
Rapporti statistici di composizione la parte rispetto al tutto percentuali di derivazione per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione di frequenza (tassi) rapporti
DettagliEsame di Statistica A-Di Prof. M. Romanazzi
1 Università di Venezia Esame di Statistica A-Di Prof. M. Romanazzi 1 Settembre 2015 Cognome e Nome..................................... N. Matricola.......... Valutazione Il punteggio massimo teorico
DettagliAnalisi Multivariata Prova intermedia del 20 aprile 2011
Analisi Multivariata Prova intermedia del 20 aprile 20 Esercizio A Sia X N 3 (µ, Σ) con µ = [ 3,, 4] e 2 0 Σ = 2 5 0 0 0 2 Quali delle seguenti variabili casuali è indipendente? Motivare la risposta. A.
Dettagli3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17
C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica
DettagliL'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale
L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile Corso di Metodologia della ricerca sociale L analisi della varianza (ANOVA) La tecnica con cui si esplorano le relazioni
DettagliStatistica descrittiva: analisi di regressione
Statistica descrittiva: analisi di regressione L analisi di regressione permette di esplorare le relazioni tra due insiemi di valori (p.e. i valori di due attributi di un campione) alla ricerca di associazioni.
Dettagli1.1 Obiettivi della statistica Struttura del testo 2
Prefazione XV 1 Introduzione 1.1 Obiettivi della statistica 1 1.2 Struttura del testo 2 2 Distribuzioni di frequenza 2.1 Informazione statistica e rilevazione dei dati 5 2.2 Distribuzioni di frequenza
DettagliMISURA DELLA VARIAZIONE CONCOMITANTE (COVARIAZIONE/ CONTROVARIAZIONE) DI VARIABILI CARDINALI O QUASI- CARDINALI
ANALISI DELLA CORRELAZIONE MISURA DELLA VARIAZIONE CONCOMITANTE (COVARIAZIONE/ CONTROVARIAZIONE) DI VARIABILI CARDINALI O QUASI- CARDINALI VINCOLI CHE SI IMPONGONO ALLA SUA UTILIZZAZIONE: LA RELAZIONE
DettagliIL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI
IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI Perchè confrontare le varianze stimate in due campioni? Torniamo all'esempio dei frinosomi Per poter applicare il test t avevamo detto che le varianze, e
DettagliEUROPEAN COMPUTER DRIVING LICENCE SYLLABUS VERSIONE 5.0
Pagina I EUROPEAN COMPUTER DRIVING LICENCE SYLLABUS VERSIONE 5.0 Modulo 4 Foglio elettronico Il seguente Syllabus è relativo al Modulo 4, Foglio elettronico, e fornisce i fondamenti per il test di tipo
DettagliSoluzioni prova scritta di Complementi di Probabilità e Statistica (29/06)
Soluzioni prova scritta di Complementi di Probabilità e Statistica (29/6). (a) Per costruire il box plot, vengono determinati minimo=,, massimo=,97, mediana=,455, I quartile=,3375 e III quartile=,745 dei
Dettagli1. Sono state eseguite 250 misure di temperatura che hanno rivelato i seguenti valori stimati di media e di deviazione standard per il campione
Inferenza di Intervallo 1. Sono state eseguite 250 misure di temperatura che hanno rivelato i seguenti valori stimati di media e di deviazione standard per il campione T = 300 K σ T = 50 a. Calcolare un
DettagliISTITUTO D ARTE A.VENTURI (Modena) PROGRAMMA di MATEMATICA SVOLTO dalle classi 2^P a.s. 2013/2014
ISTITUTO D ARTE A.VENTURI (Modena) PROGRAMMA di MATEMATICA SVOLTO dalle classi ^P a.s. / Aritmetica e algebra ripasso monomi e polinomi; regole dei prodotti notevoli (somma per differenza, quadrato di
DettagliCorso in Statistica Medica
Corso in Statistica Medica Introduzione alle tecniche statistiche di elaborazione dati Regressione e correlazione Dott. Angelo Menna Università degli Studi di Chieti G. d Annunziod Annunzio Anno Accademico
DettagliCOGNOME.NOME...MATR..
STATISTICA 29.01.15 - PROVA GENERALE (CHALLENGE) Modalità A (A) ai fini della valutazione verranno considerate solo le risposte riportate dallo studente negli appositi riquadri bianchi: in caso di necessità
DettagliProva Pratica di Statistica I+II - Prof. M. Romanazzi
1 Università di Venezia - Corso di Statistica I + II (Cb-Ga) Prova Pratica di Statistica I+II - Prof. M. Romanazzi 3 Giugno 2008 Cognome e Nome............................................ N. Matricola............
DettagliCognome e Nome:... Matricola e corso di laurea:...
Statistica - corso base Prof. B. Liseo Prova di esame dell 8 gennaio 2014 Cognome e Nome:................................................................... Matricola e corso di laurea:...................................................
DettagliEsperimentazioni di Fisica 1. Prova in itinere del 12 giugno 2018
Esperimentazioni di Fisica 1 Prova in itinere del 1 giugno 018 Esp-1 Prova in Itinere n. - - Page of 6 1/06/018 1. (1 Punti) Quesito L incertezza da associare alle misurazioni eseguite con un certo strumento
DettagliEsercitazione del
Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36
DettagliRegressione logistica. Strumenti quantitativi per la gestione
Regressione logistica Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/classes/4a_rlg.html#(22) 1/28 Metodi di classificazione I
DettagliEsercitazione Marzo 2019
Esercitazione 13 Marzo 019 Esercizio 1 Su un collettivo di 100 appartamenti ubicati nella stessa zona della città vengono rilevati i seguenti caratteri: X 1 affitto mensile pagato dal locatario (in Euro)
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2016-2017 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
Dettagli0 altimenti 1 soggetto trova lavoroentro 6 mesi}
Lezione n. 16 (a cura di Peluso Filomena Francesca) Oltre alle normali variabili risposta che presentano una continuità almeno all'interno di un certo intervallo di valori, esistono variabili risposta
DettagliMetodi Matematici e Informatici per la biologia. Esercizi
Metodi Matematici e Informatici per la biologia Esercizi Esercizio 1 Il modo migliore per isolare gli effetti delle variabili nascoste sulla variabile di risposta è di effettuare uno studio di osservazione
DettagliESEMPI DI DOMANDE PER LA PROVA SCRITTA DI STATISTICA SOCIALE
ESERCITAZIONE DI FINE CORSO ESEMPI DI DOMANDE PER LA PROVA SCRITTA DI STATISTICA SOCIALE 1. Si prenda in esame la seguente tabella che riporta la suddivisione di una popolazione femminile per titolo di
DettagliR - Esercitazione 2. Andrea Fasulo 20 Ottobre Università Roma Tre
R - Esercitazione 2 Andrea Fasulo fasulo.andrea@yahoo.it Università Roma Tre 20 Ottobre 2017 det(), solve() : calcolano determinante e inverso di una matrice quadrata. t() genera la matrice trasposta.
DettagliUniversità di Pavia Econometria Esercizi 4 Soluzioni
Università di Pavia Econometria 2008-2009 Esercizi 4 Soluzioni Maggio, 2009 Istruzioni: I commenti devono essere concisi! 1. Dato il modello di regressione lineare, con K regressori con E(ɛ) = 0 e E(ɛɛ
DettagliLEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell
LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Strumenti statistici in Excell Pacchetto Analisi di dati Strumenti di analisi: Analisi varianza: ad un fattore Analisi
DettagliCORSO DI INFORMATICA. CL3 - Biotecnologie
CORSO DI INFORMATICA CL3 - Biotecnologie Formattazione dei numeri Convertire in numeri i numeri memorizzati come testo Può capitare che occasionalmente i numeri vengano formattati e memorizzati nelle celle
DettagliLegge di Hardy-Weinberg
Legge di Hardy-Weinberg Popolazione in equilibrio Popolazione infinitamente grande No mutazioni No migrazione (geni non sono introdotti o persi) No selezione Incroci casuali Unione fra genotipi è casuale
DettagliAnalisi Discriminante Canonica con R
Università di Bologna - Facoltà di Scienze Statistiche Laurea Triennale in Statistica e Ricerca Sociale Corso di Analisi di Serie Storiche e Multidimensionali Prof.ssa Marilena Pillati Analisi Discriminante
DettagliSequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di:
Teoria dei Fenomeni Aleatori AA 01/13 Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di: N-pla o Sequenza
DettagliEsame di Statistica del 1 settembre 2004 (Corso di Laurea in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola
Esame di Statistica del 1 settembre 004 (Corso di Laurea in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola Es. 1 Es. Es. Es. 4 Somma Voto finale Attenzione: si consegnano SOLO
DettagliQuiz di verifica Classificazione
Quiz di verifica Classificazione Strumenti Quantitativi per la gestione Le domande 1 4 si riferiscono al seguente problema: Supponiamo di raccogliere dati per un gruppo di studenti della classe di SQG
DettagliLa media e la mediana sono indicatori di centralità, che indicano un centro dei dati.
La media e la mediana sono indicatori di centralità, che indicano un centro dei dati. Un indicatore che sintetizza in un unico numero tutti i dati, nascondendo quindi la molteplicità dei dati. Per esempio,
DettagliJMP 10 Student Edition: Guida rapida
JMP 10 Student Edition: Guida rapida Queste istruzioni presuppongono una tabella di dati aperta, le impostazioni delle preferenze predefinite, e le variabili di interesse con l appropriato tipo di modellazione.
DettagliLa matrice delle correlazioni è la seguente:
Calcolo delle componenti principali tramite un esempio numerico Questo esempio numerico puó essere utile per chiarire il calcolo delle componenti principali e per introdurre il programma SPAD. IL PROBLEMA
DettagliSequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di:
Teoria dei Fenomeni Aleatori AA 01/13 Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di: N-pla o Sequenza
DettagliStatistica Applicata Corso di Laurea in Scienze Naturali a. a. 2016/2017
Statistica Applicata Corso di Laurea in Scienze Naturali a. a. 2016/2017 prof. Federico Plazzi 19 Luglio 2017 Nome: Cognome: Matricola: Alcune indicazioni: La prova è constituita da quattro esercizi; dopo
DettagliStatistica inferenziale
Dipartimento di Fisica a.a. 2004/2005 Fisica Medica 2 Statistica inferenziale 6/5/2005 Relazione tra dati Possono esistere in uno studio connessioni tra dati differenti che possono legare caratteristiche:
DettagliSTATISTICA MULTIVARIATA SSD MAT/06
Università degli studi di Ferrara Dipartimento di Matematica A.A. 2018/2019 I semestre STATISTICA MULTIVARIATA SSD MAT/06 LEZIONE 4 - Questioni di analisi e applicazione della regressione lineare Pratica
DettagliL'analisi bivariata (associazione e cograduazione)
L'analisi bivariata (associazione e cograduazione) Prof. Stefano Nobile Corso di Metodologia della ricerca sociale L analisi bivariata L analisi bivariata è un analisi delle relazioni tra due caratteristiche
DettagliTecniche statistiche di analisi del cambiamento
Tecniche statistiche di analisi del cambiamento 07a-Ripasso: Anova ad un fattore (v. 1.9a, 29 dicembre 2018) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca
Dettaglinome di un menu per visualizzarlo e poi selezionate facendo clic sul comando che vi interessa.
1 (conoscere le basi di Excel) < I controlli della. Finestra > La finestra di apertura di Excel presenta una cartella di lavoro vuota; la finestra del programma occupa tutto lo spazio dello schermo, mentre
DettagliSTATISTICA CORSO BASE. Prova scritta del Tempo: 2 ore Cognome e Nome:... Matricola:...
STATISTICA CORSO BASE. Prova scritta del 7-2-2013. Tempo: 2 ore Cognome e Nome:.............................. Matricola:.............................. Attenzione: Prima di affrontare la prova si consiglia
Dettagli1 L analisi discriminante lineare
1 L analisi discriminante lineare L analisi discriminante lineare presuppone che p variabili (quantitative) Y 1,... Y p siano state misurate su osservazioni appartenenti a 2 o più gruppi: G 1,...,G k,
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2017-2018 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliA m n B n p = P m p. 0 1 a b c d. a b. 0 a 0 c Il risultato e lo stesso solo nel caso in cui c = 0 e a = d.
Matematica II, 220404 Il prodotto di matrici e un operazione parziale che prende in entrata una matrice A ed una matrice B, tali che il numero delle colonne di A sia uguale al numero delle righe di B,
DettagliDipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli
Dipartimento di Sociologia e Ricerca Sociale Corso di Laurea in Sociologia Insegnamento di Statistica (a.a. 2018-2019) dott.ssa Gaia Bertarelli Esercitazione n. 6 1. Si consideri un campione di 69 persone
Dettaglimateriale didattico II incontro
Piano Nazionale Lauree Scientifiche (PLS 016-017) Statistica Laboratorio di Statistica Le relazioni tra variabili. L indipendenza prof.ssa Angela Maria D'Uggento angelamaria.duggento@uniba.it materiale
DettagliI TEST STATISTICI. dott.ssa Gabriella Agrusti
I TEST STATISTICI dott.ssa Gabriella Agrusti Dulcis in fundo.. come scegliere un test statistico in base all ipotesi come stabilire se due variabili sono associate (correlazione di Pearson) come stabilire
DettagliProva scritta di Complementi di Probabilità e Statistica. 7 Dicembre 2012
Prova scritta di Complementi di Probabilità e Statistica 7 Dicembre. Un ingegnere vuole investigare se le caratteristiche di una superficie metallica sono influenzate dal tipo di pittura usata e dal tempo
DettagliProgetti Algoritmi e Strutture Dati A.A Si intende realizzare una coda di priorità mediante un max-heap.
Progetti Algoritmi e Strutture Dati A.A. 2017-2018 Esercizio 1 Si intende realizzare una coda di priorità mediante un max-heap. Ogni singolo elemento della struttura è rappresentato da una coppia < categoria,
DettagliFondamenti di statistica per il miglioramento genetico delle piante. Antonio Di Matteo Università Federico II
Fondamenti di statistica per il miglioramento genetico delle piante Antonio Di Matteo Università Federico II Modulo 2 Variabili continue e Metodi parametrici Distribuzione Un insieme di misure è detto
DettagliCAPITOLO 11 ANALISI DI REGRESSIONE
VERO FALSO CAPITOLO 11 ANALISI DI REGRESSIONE 1. V F Se c è una relazione deterministica tra due variabili,x e y, ogni valore dato di x,determinerà un unico valore di y. 2. V F Quando si cerca di scoprire
DettagliPROBABILITÀ ELEMENTARE
Prefazione alla seconda edizione XI Capitolo 1 PROBABILITÀ ELEMENTARE 1 Esperimenti casuali 1 Spazi dei campioni 1 Eventi 2 Il concetto di probabilità 3 Gli assiomi della probabilità 3 Alcuni importanti
DettagliAppendice 1: Verifiche scritte
ANNO SCOLASTICO 2015-2016 CLASSE 1 LB DISCIPLINA: FISICA DOCENTE: Romio Silvana A. PROGRAMMA Le misure delle grandezze. Introduzione alla fisica: la Fisica come scienza, limiti e validità di una teoria
DettagliMetodi Quantitativi per Economia, Finanza e Management. Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello
Metodi Quantitativi per Economia, Finanza e Management Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello 1. Introduzione ai modelli di regressione 2. Obiettivi 3. Le
Dettagli3 giugno 2019, es.1) Programmazione lineare
giugno 09, es.) Programmazione lineare Discutere il seguente problema di Programmazione lineare: trovare, se esiste, il massimo di p(x, x, x, x 4 ) = 5 x + x + x + 6 x 4 con i vincoli x k 0 ( k 4) e x
DettagliTeoria e tecniche dei test. Concetti di base
Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi
DettagliExcel. È data la distribuzione di 1863 famiglie italiane secondo il numero di componenti:
Excel È data la distribuzione di 1863 famiglie italiane secondo il numero di componenti: Calcolare per ogni classe della distribuzione: (a) le frequenze relative; Sia data la distribuzione degli studenti
DettagliStima dei parametri. I parametri di una pdf sono costanti che caratterizzano la sua forma. r.v. parameter. Assumiamo di avere un campione di valori
Stima dei parametri I parametri di una pdf sono costanti che caratterizzano la sua forma r.v. parameter Assumiamo di avere un campione di valori Vogliamo una funzione dei dati che permette di stimare i
DettagliStatistica di base per l analisi socio-economica
Laurea Magistrale in Management e comunicazione d impresa Statistica di base per l analisi socio-economica Giovanni Di Bartolomeo gdibartolomeo@unite.it Definizioni di base Una popolazione è l insieme
DettagliSTATISTICA CORSO BASE. Prova scritta del Tempo: 2 ore Cognome e Nome:... Matricola:...
STATISTICA CORSO BASE. Prova scritta del 7-2-2013. Tempo: 2 ore Cognome e Nome:.............................. Matricola:.............................. Attenzione: Prima di affrontare la prova si consiglia
DettagliLM 88 SOCIOLOGIA E RICERCA SOCIALE. Metodi Statistici per la Ricerca Sociale. Regressione lineare e correlazione
LM 88 SOCIOLOGIA E RICERCA SOCIALE Metodi Statistici per la Ricerca Sociale Regressione lineare e correlazione 1. Su un campione di individui sono rilevati i caratteri X (peso in Kg) e Y (altezza in cm),
DettagliData Import pulizia dati e Probabilità. Renato Mainetti
Data Import pulizia dati e Probabilità Renato Mainetti Importare dati in Matlab: Abbiamo visto come sia possibile generare array e matrici di dati. Per ora abbiamo sempre inserito i dati manualmente o
DettagliAnalisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali
Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Introduzione : analisi delle relazioni tra due caratteristiche osservate sulle stesse unità statistiche studio del comportamento di due caratteri
DettagliREGRESSIONE E CORRELAZIONE
REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.
DettagliModelli e procedure per l educazione degli adulti
CdL SEAFC a.a. 2016-2017 II semestre Pedagogia sperimentale. Modelli e procedure per l educazione degli adulti francesco.agrusti@uniroma3.it T6. Modelli e procedure di valutazione Ultimo appuntamento con
Dettaglii) Si tratta di uno studio di osservazione V F ii) Quale delle seguenti affermazioni è corretta? a b c
I COMPITO (3 crediti) ESERCIZIO 1 E stata effettuata una ricerca per studiare se il raccolto di una particolare specie di cereale Y (t/ha) è correlato linearmente con la quantità di fertilizzante applicato
DettagliCriteri di Valutazione della scheda (solo a carattere indicativo)
Criteri di Valutazione della scheda (solo a carattere indicativo) Previsioni - A Sono state fatte le previsioni e discussi i valori attesi insieme al ragionamento con cui sono stati calcolati? E stata
DettagliEsercizi riepilogativi (dai compiti dell A.A. 2001/02 IV canale)
Esercizi riepilogativi (dai compiti dell A.A. 2001/02 IV canale) Grafici e distribuzioni univariate 1. Da un campione di 100 aziende agricole della provincia di Bologna è stata rilevata la classe di superficie
DettagliPsicometria con Laboratorio di SPSS 1
Psicometria con Laboratorio di SPSS 1 1-Panoramica delle tecniche: Spiegazione intuitiva vers. 1.1 (vers. 1.1, 14 marzo 2018) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università
DettagliLab. 2 - Excel. Prof. De Michele e Farina
Lab. 2 - Excel Prof. De Michele e Farina 1 Utilizzo avanzato di un foglio elettronico: - Utilizzo di funzioni Regressioni lineari Istogrammi 2 La funzione somma restituisce la somma dei valori dei propri
Dettagliquesta variabile corrisponde alla somma ponderata delle variabili originarie in cui i pesi sono costituiti dai coefficienti a ij
5. COMPONENTI PRINCIPALI 5.1 Introduzione L analisi in componenti principali (CP) si pone l obiettivo di determinare quelle trasformazioni lineari delle h variabili originarie X i (i = 1, 2,, h), linearmente
DettagliINDICE PARTE METODOLOGICA
INDICE PARTE METODOLOGICA 1. Il processo di ricerca 1.1.Individuazione di un problema e formulazione delle ipotesi 1.2.Individuazione e definizione operativa delle variabili 1.2.1. Le variabili definite
Dettagli