Strumenti statistici per l analisi di dati genetici
|
|
- Elisabetta Baldi
- 8 anni fa
- Visualizzazioni
Transcript
1 Strumenti statistici per l analisi di dati genetici Luca Tardella + Maria Brigida Ferraro 1 luca.tardella@uniroma1.it Lezione #1 Introduzione al software R al suo utilizzo per l implementazione di tecniche statistiche elementari 21 marzo 2014
2 Premessa Presentazione del corso Ricognizione degli strumenti statistici appresi finora Prova finale Introduzione al reperimento ed installazione del software R Come documentarsi sul suo utilizzo Lettura di dati, manipolazione e scrittura su file dei risultati. Due grandi categorie delle metodologie statistiche: descrittive ed inferenziali Descrizione ed inferenza in pratica con R La probabilità e la simulazione con R La scrittura di un semplice report statistico Alcuni piccoli casi di studio
3 Piano delle lezioni Lezione #1 del 21/03/ LT - Introduzione al software R; Descrittiva; Test Lezione #2 del 04/04/ LT - Regressione; ANOVA Lezione #3 del 11/04/ MBF - Cluster (algoritmi e modelli) [cluster, mclust] ; Lezione #4 del 16/05/ LT - Preprocessing e modelli per espressione differenziale [Trascrittomica, limma] Lezione #5 del 21/03/ LT - classificazione supervisionata; SVM
4 Dalla lettura dei dati alla comprensione del contenuto delle variabili La prima grande distinzione da operare è legata alla tipologia dei dati: Dati qualitativi o su scala nominale (factor) [talvolta ordinabile] Dati quantitativi: discreti o continui Completezza dei dati, valori fuori scala e anomalie
5 Riorganizzazione dei dati Dobbiamo attrezzarci per poter selezionare in maniera opportuna solo le righe e le colonne che ci interessano utilizzando opportuni criteri di selezione. Possiamo usare un interfaccia grafica come Rcmdr (R-commander) subset(x, subset=..., select =... ) order, arrange:{plyr} Potremmo aver bisogno di eliminare colonne e/o righe Potremmo aver bisogno di usare un criterio di ordinamento delle righe o delle colonne.
6 Per una lettura sintetica delle singole variabili... Possiamo usare: tabelle grafici valori riassuntivi che colgono alcuni aspetti caratteristici di una distribuzione (posizione privilegiata/centrale, dispersione o variabilità, asimmetria)
7 Tabelle per variabili discrete [con poche modalità] per variabili continue [con tante modalità, con infinite modalità] Suggerimento estetico: usare un pacchetto aggiuntivo denominato epicalc e le funzioni tab1 [1 sola variabile] e tabpct [2 variabili]
8 Valori riassuntivi Se dobbiamo comunicare pochi numeri per descrivere un intera distribuzione quali comunichiamo? con quale significato? misure di posizione, tendenza centrale mean(...) median(...) quantile(...) Per la moda è un po più complicato... dovremmo passare talvolta per i grafici... qualche volta molti indici di posizione... (Five-number summary vedi anche boxplot(...)) var(...) o meglio sd(...) Ricordiamo anche la differente robustezza di alcuni indicatori rispetto a dati anomali... N.B. Né il boxplot né l istogramma o la stima di densità sono in grado di visualizzare un importante informazione sulla distribuzione dei dati: quale?
9 Rappresentazioni grafiche per dati qualitativi: torte (pie, pie3d {plotrix}) o grafici a barre/nastri (barplot). per dati discreti con poche modalità quantitative per dati continui (istogramma hist) con possibilità di sovrapporre versione allisciata ottenuta con density [attenzione però che l area totale sotto la curva è 1 e dunque questo deve valere anche per l istogramma!! boxplot
10 A cosa servono le rappresentazioni sommarie/sintetiche Delle distribuzioni semplici (di 1 sola variabile) per fare confronti che servirono anche... per introdurre la nozione di dipendenza statistica
11 Distribuzioni multiple Iniziamo da due variabili (distribuzioni doppie) Per variabili qualitative table(x=x,y=y) tabpct(x=x,y=y) [{epicalc} mosaic plot] visualizza o le distribuzioni percentuali di riga (distribuzioni condizionate ad un valore della variabile X) o le distribuzioni percentuali di colonna (distribuzioni condizionate ad un valore della variabile Y) [può essere utilizzata anche per variabili quantitative discrete con numero piccolo di modalità oppure continue raggruppate in classi] scatterplot, nuvola di punti o grafico a dispersione dall orientamento della nuvola di punti si evince una qualche forma di dipendenza statistica (e.g. relazione lineare o non lineare) estensione della stima di densità in 2 dimensioni (grafico 3d): kde2d(...) {MASS}
12 Distribuzioni multiple Se tutte le variabili sono quantitative possiamo visualizzare un intero data.frame ma in realtà visualizziamo solo le distribuzioni doppie di tutte le possibili coppie di variabili
13 Indici sintetici di dipendenza tra due variabili ed altre possibili visualizzazioni... tra due variabili qualitative con numero finito di modalità: indice X 2 (chi-quadrato) misura in qualche modo la lontananza dalla situazione ideale di variabili indipendenti per le quali dovrebbe presentarsi una tabella doppia in cui le frequenze relative della distribuzione doppia corrispondono al prodotto delle frequenze relative delle distribuzioni marginali tra due variabili quantitative: indice di correlazione lineare (di Bravais-Pearson). Indice fondamentale nello studio della dipendenza tra variabili quantitative una variabile quantitative rispetto ad una qualitativa: boxplot appaiati, nozione di variazione delle distribuzioni condizionate, indici di dipendenza in media (ANOVA)
14 Indici sintetici di dipendenza tra due variabili
15 Distribuzioni multiple Se tutte le variabili sono quantitative possiamo visualizzare un intero data.frame ma in realtà visualizziamo solo le distribuzioni doppie di tutte le possibili coppie di variabili. In effetti un modo sintetico di rappresentare graficamente le reazioni di dipendenza tra le coppie simultaneamente consiste nel rappresentare la matrice di correlazione attraverso il cosiddetto corrplot {corrplot} Un altro modo sarà quello di visualizzare le relazioni di dipendenza attraverso delle reti di dipendenza o grafi
16 Coefficiente di correlazione e coefficiente di correlazione parziale Il primo r XY riguarda solo la distribuzione doppia delle due variabili X e Y coinvolte. È interessante e caratterizzante quando raggiunge i due valori estremi ±1 (perfetta relazione lineare). Il secondo r XY.Z tiene conto non solo delle due variabili X e Y ma anche della loro dipendenza con le altre variabili considerate indicate con Z = (Z 1,..., Z k ). Tipicamente le Z sono tutte le altre variabili quantitative considerate tranne la X e la Y. Tale indice che varia sempre tra -1 e 1 è interessante soprattutto quando assume valore 0 (indipendenza di X da Y condizionatamente alla conoscenza delle altre variabili Z) [Conoscete già la nozione di regressione lineare?]
17 Il coefficiente di correlazione lineare E una misura di concordanza che si calcola esclusivamente qando abbiamo a disposizione due caratteri entrambi di tipo quantitativo. In effetti non è altro che un caso particolare dell indice Ω (vedi successivi approfondimenti) ma è meglio noto con le seguenti formule: r XY = Cov[X, Y ] Var[X ]Var[Y ] = σ XY σ 2 X σ 2 Y = σ XY σ X σ Y dove Cov[X, Y ] (indicato, spesso, anche con il simbolo σ XY è la covarianza tra X e Y. Cov[X, Y ] = 1 n n (x i x)(y i ȳ) = 1 n i=1 n n [ n n ] ε xi ε yi = 1 (x i y i ) xȳ n i=1 i=1 Var[X ] = 1 n Var[Y ] = 1 n i=1 (x i x) 2 = 1 n n (y i ȳ) 2 = 1 n i=1 i=1 n i=1 ε 2 x i ε 2 y i
18 Il significato della covarianza Cov[X, Y ] = 1 n n (x i x)(y i ȳ) i=1 Si valuta con un indicatore medio il prodotto tra la differenza tra la modalità del carattere X e la media di X la differenza tra la modalità del carattere Y e la media di Y Il prodotto ha un significato analogo a quanto visto per il numeratore di Ω con la differenza che i confronti non vengono fatti tra coppie di unità ma tra la singola unità e un termine di riferimento (la media). Per capire è utile riferirsi alla nuvola dei punti nella quale vengono evidenziate le linee delle medie dei due caratteri e i quadranti che contribuiscono positivamente e negativamente nella valutazione della correlazione (concordanza)
19 B=peso A=statura > plot(a,b,xlim=c(160,180),ylim=c(60,80)) > abline(v=mean(a),col= red )
20 Ancora una formula di r per distribuzioni di frequenze doppie Solo per non confondersi nella pratica: un conto è partire dalla distribuzione unitaria un conto è usare una distribuzione di frequenze H H K h=1 k=1 x hy k n hk n xȳ h=1 (x h x) 2 n h K k=1 (y k ȳ) 2 n k (Si può utilizzare come al solito anche per il calcolo di r quando si ha a disposizione la tabella doppia dei dati raggruppati in classi) In effetti, di regola, disponiamo dei dati a livello individuale (distribuzione unitaria doppia)
21 Come interpretare r: primo passo Sul significato del numeratore abbiamo già detto. Il ruolo del denominatore è quello di standardizzare l indice di correlazione. ovvero r r +1 r = 0 = X e Y sono incorrelati linearmente r = 1 = X e Y massimamente correlati linearmente negativamente r = +1 = X e Y massimamente correlati linearmente positivamente Il segno di r è facilmente interpretabile alla luce del significato di concordanza e discordanza. Per qunto riguarda il valore numerico, avere valori di r su in intervallo di riferimento standard r [ 1, +1] aiuta a calibrare la valutazione di r (ovvero rispondere a domande del tipo: c è tanta correlazione lineare? ce ne è poca?)
22 Come interpretare r: prima avvertenza Attenzione la terminologia non è casuale! r è il coefficiente di correlazione lineare (!) Nel linguaggio scientifico il termione correlazione viene utilizzato in senso generico. Nella statistica il coefficiente r è una misura della correlazione ed ha un senso specifico da non confondere ad esempio con la nozione di dipendenza in distribuzione tra deu variabili. Perché si chiama di correlazione lineare? Il coefficiente di correlazione lineare r assume il valore estremo positivo, +1, se e soltanto se i punti della nuvola sono perfettamente allineati lungo una retta (ideale) inclinata positivamente Il coefficiente di correlazione lineare r assume il valore estremo negativo, -1, se e soltanto se i punti della nuvola sono perfettamente allineati lungo una retta (ideale) inclinata negativamente
23 Analogamente per ogni coppia (i, j) vi è proporzionalità nelle variazioni di modalità (differenze) dei due caratteri δ ij = (b Y i b Y j ) d ij = (a X i a X j ) Se β è il coefficiente di proporzionalità δ ij = βd ij (b Y i b Y j ) = β(a X i a X j ) è facile vedere che questo avviene quando i punti sono allineati lungo una stessa retta y = α + βx con coefficiente angolare β. In tali caso r assume valore estremi ovvero +1 quando β > 0 e 1 quando β < 0.
24 Come interpretare r: seconda avvertenza Sui legami tra l incorrelazione e indipendenza in distribuzione. Indipendenza in distribuzione = Incorrelazione Incorrelazione = / Indipendenza in distribuzione Per esemplificare con un caso clamoroso la seconda affermazione consideriamo la seguente distribuzione (unitaria) doppia: X Y In effetti la Y dipende perfettamente dalla X dal momento che vale la relazione Y = X 2 eppure il coefficiente di correlazione lineare r vale 0!
25 Incorrelazione e indipendenza in distribuzione Indipendenti in distribuzione e dunque necessariamente incorrelati Incorrelati ma non indipendenti in distribuzione yindip yincor xindip xincor Incor.Max.Diprelati ma non indipendenti in distribuzione (anzi!) yincor.max.dip xincor.max.dip
26 Il coefficiente di correlazione parziale Formula semplice nel caso di 3 variabili (ovvero una sola Z) r XY.Z = r XY (r XZ r YZ ) 1 r 2 XZ 1 r 2 YZ Misura il legame di dipendenza (lineare) delle due variabili di interesse X e Y al netto dell eventuale dipendenza lineare che è presente sia tra la X e la Z sia tra la Y e la Z Formula un po più complessa nel caso siano presenti più di 3 variabili ma coincide con la nozione ordinaria di correlazione lineare tra i residui e1 XZ,..., en XZ ottenutii dalle relazioni di regressione lineare stimate (minimi quadrati) tra la variabile X e le Z. i residui e1 YZ,..., en YZ ottenuti dalla regressione di Y rispetto a Z.
27 I coefficienti di correlazione nulli e la distribuzione normale (multipla) Quando in una distribuzione normale (o gaussiana) multivariata per n variabili (X 1,..., X n ) il coefficiente di correlazione lineare Cor[X, Y ] è nulla allora le due variabili (aleatorie) sono indipendenti tra loro Quando in una distribuzione normale (o gaussiana) multivariata per n variabili (X 1,..., X n ) il coefficiente di correlazione parziale Cor[X i, X j Z] è nullo allora le due variabili (aleatorie) sono indipendenti tra loro condizionatamente alla conoscenza del vettore Z composto da tutte le variabili (X 1,..., X n ) tranne la X i e la X j
28 Esempio simulato Un esempio simulato per capire meglio > Z=runif(30) > X=2*Z+rnorm(30,sd=0.5) > Y=-Z+rnorm(30,sd=0.5)
Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it
Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Introduzione : analisi delle relazioni tra due caratteristiche osservate sulle stesse unità statistiche studio del comportamento di due caratteri
DettagliLezione n. 2 (a cura di Chiara Rossi)
Lezione n. 2 (a cura di Chiara Rossi) QUANTILE Data una variabile casuale X, si definisce Quantile superiore x p : X P (X x p ) = p Quantile inferiore x p : X P (X x p ) = p p p=0.05 x p x p Graficamente,
DettagliAnalisi delle relazioni tra due caratteri
Analisi delle relazioni tra due caratteri Le misure di connessione misurano il grado di associazione tra due caratteri qualsiasi sotto il profilo statistico (e non causale in quanto non è compito della
DettagliRELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della
RELAZIONE TRA VARIABILI QUANTITATIVE Lezione 7 a Accade spesso nella ricerca in campo biomedico, così come in altri campi della scienza, di voler studiare come il variare di una o più variabili (variabili
DettagliDott.ssa Caterina Gurrieri
Dott.ssa Caterina Gurrieri Le relazioni tra caratteri Data una tabella a doppia entrata, grande importanza riveste il misurare se e in che misura le variabili in essa riportata sono in qualche modo
DettagliRiassunto 24 Parole chiave 24 Commenti e curiosità 25 Esercizi 27 Appendice
cap 0 Romane - def_layout 1 12/06/12 07.51 Pagina V Prefazione xiii Capitolo 1 Nozioni introduttive 1 1.1 Introduzione 1 1.2 Cenni storici sullo sviluppo della Statistica 2 1.3 La Statistica nelle scienze
Dettagli1 Associazione tra variabili quantitative COVARIANZA E CORRELAZIONE
1 Associazione tra variabili quantitative ASSOCIAZIONE FRA CARATTERI QUANTITATIVI: COVARIANZA E CORRELAZIONE 2 Associazione tra variabili quantitative Un esempio Prezzo medio per Nr. Albergo cliente (Euro)
DettagliRelazioni statistiche: regressione e correlazione
Relazioni statistiche: regressione e correlazione È detto studio della connessione lo studio si occupa della ricerca di relazioni fra due variabili statistiche o fra una mutabile e una variabile statistica
DettagliSlide Cerbara parte1 5. Le distribuzioni teoriche
Slide Cerbara parte1 5 Le distribuzioni teoriche I fenomeni biologici, demografici, sociali ed economici, che sono il principale oggetto della statistica, non sono retti da leggi matematiche. Però dalle
DettagliCORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Test delle ipotesi sulla varianza In un azienda che produce componenti meccaniche, è stato
DettagliCapitolo 12 La regressione lineare semplice
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara
DettagliSPC e distribuzione normale con Access
SPC e distribuzione normale con Access In questo articolo esamineremo una applicazione Access per il calcolo e la rappresentazione grafica della distribuzione normale, collegata con tabelle di Clienti,
DettagliRette e curve, piani e superfici
Rette e curve piani e superfici ) dicembre 2 Scopo di questo articolo è solo quello di proporre uno schema riepilogativo che metta in luce le caratteristiche essenziali delle equazioni di rette e curve
DettagliSTATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione2: 04-03-2005
esercitazione 2 p. 1/12 STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione2: 04-03-2005 Luca Monno Università degli studi di Pavia luca.monno@unipv.it http://www.lucamonno.it
DettagliCorrezione dell Esame di Statistica Descrittiva (Mod. B) 1 Appello - 28 Marzo 2007 Facoltà di Astronomia
Correzione dell Esame di Statistica Descrittiva (Mod. B) 1 Appello - 8 Marzo 007 Facoltà di Astronomia ESERCIZIO 1 La seguente tabella riporta la distribuzione congiunta della situazione lavorativa e dello
DettagliProf.ssa Paola Vicard
Questa nota consiste perlopiù nella traduzione (con alcune integrazioni) da Descriptive statistics di J. Shalliker e C. Ricketts, 2000, University of Plymouth Consideriamo i dati nel file esercizio10_dati.xls.
DettagliMetodologia epidemiologica
Metodologia epidemiologica Verifica di ipotesi Quale test utilizzare? Statistica medica Alla fine di questa lezione dovreste essere in grado di: riconoscere i principali test utilizzati nel confronto di
DettagliProbabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)
Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B Eventi indipendenti: un evento non influenza l altro Eventi disgiunti: il verificarsi di un evento esclude l altro Evento prodotto:
DettagliCorso integrato di informatica, statistica e analisi dei dati sperimentali Altri esercizi_esercitazione V
Corso integrato di informatica, statistica e analisi dei dati sperimentali Altri esercizi_esercitazione V Sui PC a disposizione sono istallati diversi sistemi operativi. All accensione scegliere Windows.
DettagliStatistica multivariata. Statistica multivariata. Analisi multivariata. Dati multivariati. x 11 x 21. x 12 x 22. x 1m x 2m. x nm. x n2.
Analisi multivariata Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Cercare di capire le relazioni
DettagliAnalisi della performance temporale della rete
Analisi della performance temporale della rete In questo documento viene analizzato l andamento nel tempo della performance della rete di promotori. Alcune indicazioni per la lettura di questo documento:
DettagliPROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE
Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) PROBABILITÀ -
DettagliANALISI DELLE FREQUENZE: IL TEST CHI 2
ANALISI DELLE FREQUENZE: IL TEST CHI 2 Quando si hanno scale nominali o ordinali, non è possibile calcolare il t, poiché non abbiamo medie, ma solo frequenze. In questi casi, per verificare se un evento
DettagliAppunti di Statistica Descrittiva
Appunti di Statistica Descrittiva 30 dicembre 009 1 La tabella a doppia entrata Per studiare dei fenomeni con caratteristiche statistiche si utilizza l espediente della tabella a doppia entrata Per esempio
DettagliVARIANZA CAMPIONARIA E DEVIAZIONE STANDARD. Si definisce scarto quadratico medio o deviazione standard la radice quadrata della varianza.
VARIANZA CAMPIONARIA E DEVIAZIONE STANDARD Si definisce varianza campionaria l indice s 2 = 1 (x i x) 2 = 1 ( xi 2 n x 2) Si definisce scarto quadratico medio o deviazione standard la radice quadrata della
DettagliMacchine a stati finiti G. MARSELLA UNIVERSITÀ DEL SALENTO
Macchine a stati finiti 1 G. MARSELLA UNIVERSITÀ DEL SALENTO Introduzione Al più alto livello di astrazione il progetto logico impiega un modello, la cosiddetta macchina a stati finiti, per descrivere
DettagliProbabilità II Variabili casuali discrete
Probabilità II Variabili casuali discrete Definizioni principali. Valore atteso e Varianza. Teorema di Bienaymé - Čebičev. V.C. Notevoli: Bernoulli e Binomiale. Concetto di variabile casuale Cos'è una
DettagliVARIABILI ALEATORIE MULTIPLE E TEOREMI ASSOCIATI. Dopo aver trattato delle distribuzioni di probabilità di una variabile aleatoria, che
VARIABILI ALATORI MULTIPL TORMI ASSOCIATI Fonti: Cicchitelli Dall Aglio Mood-Grabill. Moduli 6 9 0 del programma. VARIABILI ALATORI DOPPI Dopo aver trattato delle distribuzioni di probabilità di una variabile
DettagliE naturale chiedersi alcune cose sulla media campionaria x n
Supponiamo che un fabbricante stia introducendo un nuovo tipo di batteria per un automobile elettrica. La durata osservata x i delle i-esima batteria è la realizzazione (valore assunto) di una variabile
DettagliLezione 10: Il problema del consumatore: Preferenze e scelta ottimale
Corso di Scienza Economica (Economia Politica) prof. G. Di Bartolomeo Lezione 10: Il problema del consumatore: Preferenze e scelta ottimale Facoltà di Scienze della Comunicazione Università di Teramo Scelta
DettagliMatematica generale CTF
Successioni numeriche 19 agosto 2015 Definizione di successione Monotonìa e limitatezza Forme indeterminate Successioni infinitesime Comportamento asintotico Criterio del rapporto per le successioni Definizione
DettagliCapitolo 2 Distribuzioni di frequenza
Edizioni Simone - Vol. 43/1 Compendio di statistica Capitolo 2 Distribuzioni di frequenza Sommario 1. Distribuzioni semplici. - 2. Distribuzioni doppie. - 3. Distribuzioni parziali: condizionate e marginali.
Dettagli2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale
BIOSTATISTICA 2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk
DettagliGeneral Linear Model. Esercizio
Esercizio General Linear Model Una delle molteplici applicazioni del General Linear Model è la Trend Surface Analysis. Questa tecnica cerca di individuare, in un modello di superficie, quale tendenza segue
DettagliUn po di statistica. Christian Ferrari. Laboratorio di Matematica
Un po di statistica Christian Ferrari Laboratorio di Matematica 1 Introduzione La statistica è una parte della matematica applicata che si occupa della raccolta, dell analisi e dell interpretazione di
DettagliMINIMI QUADRATI. REGRESSIONE LINEARE
MINIMI QUADRATI. REGRESSIONE LINEARE Se il coefficiente di correlazione r è prossimo a 1 o a -1 e se il diagramma di dispersione suggerisce una relazione di tipo lineare, ha senso determinare l equazione
Dettaglil insieme Y è detto codominio (è l insieme di tutti i valori che la funzione può assumere)
Che cos è una funzione? Assegnati due insiemi X e Y si ha una funzione elemento di X uno e un solo elemento di Y. f : X Y se esiste una corrispondenza che associa ad ogni Osservazioni: l insieme X è detto
DettagliDisegni di Ricerca e Analisi dei Dati in Psicologia Clinica. Indici di Affidabilità
Disegni di Ricerca e Analisi dei Dati in Psicologia Clinica Indici di Affidabilità L Attendibilità È il livello in cui una misura è libera da errore di misura È la proporzione di variabilità della misurazione
DettagliElementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 5-Indici di variabilità (vers. 1.0c, 20 ottobre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca
DettagliInferenza statistica. Statistica medica 1
Inferenza statistica L inferenza statistica è un insieme di metodi con cui si cerca di trarre una conclusione sulla popolazione sulla base di alcune informazioni ricavate da un campione estratto da quella
DettagliFONDAMENTI DI PSICOMETRIA - 8 CFU
Ψ FONDAMENTI DI PSICOMETRIA - 8 CFU STIMA DELL ATTENDIBILITA STIMA DELL ATTENDIBILITA DEFINIZIONE DI ATTENDIBILITA (affidabilità, fedeltà) Grado di accordo tra diversi tentativi di misurare uno stesso
DettagliRAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL
RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL 1 RAPPRESENTAZIONE GRAFICA Per l analisi dati con Excel si fa riferimento alla versione 2007 di Office, le versioni successive non differiscono
DettagliLA CORRELAZIONE LINEARE
LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad esempio, si può supporre che vi sia una relazione tra l insoddisfazione
Dettagliu 1 u k che rappresenta formalmente la somma degli infiniti numeri (14.1), ordinati al crescere del loro indice. I numeri u k
Capitolo 4 Serie numeriche 4. Serie convergenti, divergenti, indeterminate Data una successione di numeri reali si chiama serie ad essa relativa il simbolo u +... + u +... u, u 2,..., u,..., (4.) oppure
DettagliINDICE PREFAZIONE VII
INDICE PREFAZIONE VII CAPITOLO 1. LA STATISTICA E I CONCETTI FONDAMENTALI 1 1.1. Un po di storia 3 1.2. Fenomeno collettivo, popolazione, unità statistica 4 1.3. Caratteri e modalità 6 1.4. Classificazione
DettagliIntroduzione al MATLAB c Parte 2
Introduzione al MATLAB c Parte 2 Lucia Gastaldi Dipartimento di Matematica, http://dm.ing.unibs.it/gastaldi/ 18 gennaio 2008 Outline 1 M-file di tipo Script e Function Script Function 2 Costrutti di programmazione
DettagliIndice Prefazione xiii 1 Probabilità
Prefazione xiii 1 Probabilità 1 1.1 Origini del Calcolo delle Probabilità e della Statistica 1 1.2 Eventi, stato di conoscenza, probabilità 4 1.3 Calcolo Combinatorio 11 1.3.1 Disposizioni di n elementi
DettagliLEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010
LEZIONE 3 "Educare significa aiutare l'animo dell'uomo ad entrare nella totalità della realtà. Non si può però educare se non rivolgendosi alla libertà, la quale definisce il singolo, l'io. Quando uno
DettagliIstituto Comprensivo di Pralboino Curricolo Verticale
NUMERI -L alunno si muove con sicurezza nel calcolo scritto e mentale con i numeri naturali entro le centinaia di migliaia. -L alunno si muove nel calcolo scritto e con i numeri naturali entro le migliaia.
DettagliCorso di. Dott.ssa Donatella Cocca
Corso di Statistica medica e applicata Dott.ssa Donatella Cocca 1 a Lezione Cos'è la statistica? Come in tutta la ricerca scientifica sperimentale, anche nelle scienze mediche e biologiche è indispensabile
DettagliPROGETTO EM.MA PRESIDIO
PROGETTO EM.MA PRESIDIO di PIACENZA Bentornati Il quadro di riferimento di matematica : INVALSI e TIMSS A CONFRONTO LE PROVE INVALSI Quadro di riferimento per la valutazione Quadro di riferimento per i
DettagliMetodologia per l analisi dei dati sperimentali L analisi di studi con variabili di risposta multiple: Regressione multipla
Il metodo della regressione può essere esteso dal caso in cui si considera la variabilità della risposta della y in relazione ad una sola variabile indipendente X ad una situazione più generale in cui
DettagliTest statistici di verifica di ipotesi
Test e verifica di ipotesi Test e verifica di ipotesi Il test delle ipotesi consente di verificare se, e quanto, una determinata ipotesi (di carattere biologico, medico, economico,...) è supportata dall
DettagliLa distribuzione Normale. La distribuzione Normale
La Distribuzione Normale o Gaussiana è la distribuzione più importante ed utilizzata in tutta la statistica La curva delle frequenze della distribuzione Normale ha una forma caratteristica, simile ad una
DettagliMisure della dispersione o della variabilità
QUARTA UNITA Misure della dispersione o della variabilità Abbiamo visto che un punteggio di per sé non ha alcun significato e lo acquista solo quando è posto a confronto con altri punteggi o con una statistica.
DettagliIl concetto di correlazione
SESTA UNITA Il concetto di correlazione Fino a questo momento ci siamo interessati alle varie statistiche che ci consentono di descrivere la distribuzione dei punteggi di una data variabile e di collegare
DettagliUniversità del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva
Università del Piemonte Orientale Corsi di Laurea Triennale Corso di Statistica e Biometria Introduzione e Statistica descrittiva Corsi di Laurea Triennale Corso di Statistica e Biometria: Introduzione
Dettagli19txtI_BORRA_2013 18/11/13 10:52 Pagina 449 TAVOLE STATISTICHE
19txtI_BORRA_2013 18/11/13 10:52 Pagina 449 TAVOLE STATISTICHE Nell inferenza è spesso richiesto il calcolo di alcuni valori critici o di alcune probabilità per le variabili casuali che sono state introdotte
DettagliIntroduzione alle relazioni multivariate. Introduzione alle relazioni multivariate
Introduzione alle relazioni multivariate Associazione e causalità Associazione e causalità Nell analisi dei dati notevole importanza è rivestita dalle relazioni causali tra variabili Date due variabili
DettagliAnalisi di dati di frequenza
Analisi di dati di frequenza Fase di raccolta dei dati Fase di memorizzazione dei dati in un foglio elettronico 0 1 1 1 Frequenze attese uguali Si assuma che dalle risposte al questionario sullo stato
DettagliElaborazione dei dati su PC Regressione Multipla
21 Elaborazione dei dati su PC Regressione Multipla Analizza Regressione Statistiche Grafici Metodo di selezione Analisi dei dati 21.1 Introduzione 21.2 Regressione lineare multipla con SPSS 21.3 Regressione
DettagliDimensione di uno Spazio vettoriale
Capitolo 4 Dimensione di uno Spazio vettoriale 4.1 Introduzione Dedichiamo questo capitolo ad un concetto fondamentale in algebra lineare: la dimensione di uno spazio vettoriale. Daremo una definizione
DettagliLa Distribuzione Normale (Curva di Gauss)
1 DISTRIBUZIONE NORMALE o CURVA DI GAUSS 1. E la più importante distribuzione statistica continua e trova numerose applicazioni nello studio dei fenomeni biologici. 2. Fu proposta da Gauss (1809) nell'ambito
DettagliCURRICULUM SCUOLA PRIMARIA MATEMATICA
Ministero dell istruzione, dell università e della ricerca Istituto Comprensivo Giulio Bevilacqua Via Cardinale Giulio Bevilacqua n 8 25046 Cazzago San Martino (Bs) telefono 030 / 72.50.53 - fax 030 /
DettagliRegressione Mario Guarracino Data Mining a.a. 2010/2011
Regressione Esempio Un azienda manifatturiera vuole analizzare il legame che intercorre tra il volume produttivo X per uno dei propri stabilimenti e il corrispondente costo mensile Y di produzione. Volume
DettagliUNIVERSITÀ DEGLI STUDI DI MILANO-BICOCCA A. A. 2008-2009 FACOLTÀ DI ECONOMIA. Programma del modulo di STATISTICA I (6 crediti)
UNIVERSITÀ DEGLI STUDI DI MILANO-BICOCCA A. A. 2008-2009 FACOLTÀ DI ECONOMIA Programma del modulo di STATISTICA I (6 crediti) ECOCOM (lettere A-Lh): ECOCOM (lettere Li-Z): ECOBAN: ECOAMM (Lettere A-Lh):
DettagliLE SUCCESSIONI 1. COS E UNA SUCCESSIONE
LE SUCCESSIONI 1. COS E UNA SUCCESSIONE La sequenza costituisce un esempio di SUCCESSIONE. Ecco un altro esempio di successione: Una successione è dunque una sequenza infinita di numeri reali (ma potrebbe
DettagliISTITUTO COMPRENSIVO MONTEGROTTO TERME SCUOLA PRIMARIA DISCIPLINA: MATEMATICA - CLASSE PRIMA OBIETTIVI DI APPRENDIMENTO
PRIMA DELLA DISCIPLINA: MATEMATICA - CLASSE PRIMA L alunno si muove con sicurezza nel calcolo scritto e mentale con i numeri naturali. Legge e comprende testi che coinvolgono aspetti logici e matematici.
DettagliCURRICOLO DI MATEMATICA SCUOLA PRIMARIA MATEMATICA SEZIONE A : Traguardi formativi
CURRICOLO DI MATEMATICA SCUOLA PRIMARIA MATEMATICA SEZIONE A : Traguardi formativi FINE CLASSE TERZA SCUOLA PRIMARIA FINE SCUOLA PRIMARIA COMPETENZE SPECIFICHE ABILITÀ CONOSCENZE ABILITÀ CONOSCENZE Utilizzare
DettagliExcel Terza parte. Excel 2003
Excel Terza parte Excel 2003 TABELLA PIVOT Selezioniamo tutti i dati (con le relative etichette) Dati Rapporto tabella pivot e grafico pivot Fine 2 La tabella pivot viene messa di default in una pagina
DettagliAPPRENDIMENTO. 1. a. Conoscere, denominare classificare e verbalizzare semplici figure geometriche dello spazio e del piano.
matematica Comunicazione nella madrelingua 1. Descrive e denomina figure 1. a. Conoscere, denominare classificare e verbalizzare semplici figure geometriche dello spazio e del piano. - Terminologia specifica
DettagliEsame di Statistica del 17 luglio 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova).
Esame di Statistica del 17 luglio 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola Es. 1 Es. 2 Es. 3 Es. 4 Somma Voto finale Attenzione: si consegnano
DettagliPro e contro delle RNA
Pro e contro delle RNA Pro: - flessibilità: le RNA sono approssimatori universali; - aggiornabilità sequenziale: la stima dei pesi della rete può essere aggiornata man mano che arriva nuova informazione;
DettagliElementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 12-Il t-test per campioni appaiati vers. 1.2 (7 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca
DettagliAnalisi statistica delle funzioni di produzione
Analisi statistica delle funzioni di produzione Matteo Pelagatti marzo 28 Indice La funzione di produzione di Cobb-Douglas 2 2 Analisi empirica della funzione di produzione aggregata 3 Sommario Con la
DettagliStrutturazione logica dei dati: i file
Strutturazione logica dei dati: i file Informazioni più complesse possono essere composte a partire da informazioni elementari Esempio di una banca: supponiamo di voler mantenere all'interno di un computer
DettagliFacciamo qualche precisazione
Abbiamo introdotto alcuni indici statistici (di posizione, di variabilità e di forma) ottenibili da Excel con la funzione Riepilogo Statistiche Facciamo qualche precisazione Al fine della partecipazione
Dettagli4.1. La migliore relazione affettiva con la figura di riferimento principale
4.1. La migliore relazione affettiva con la figura di riferimento principale Nella seguente tabella sono riassunte le frequenze dei dati sensibili ottenute dallo spoglio dei dati raccolti nella parte preliminare
DettagliIndice Statistiche Univariate Statistiche Bivariate
Indice 1 Statistiche Univariate 1 1.1 Importazione di un file.data.............................. 1 1.2 Medie e variabilità................................... 6 1.3 Distribuzioni di frequenze...............................
DettagliA.S. 2012-1013 CLASSE PRIMA SCUOLA PRIMARIA D ISTITUTO COMPETENZA CHIAVE EUROPEA DISCIPLINA
ISTITUTO COMPRENSIVO STATALE di Scuola dell Infanzia, Scuola Primaria e Scuola Secondaria di 1 grado San Giovanni Teatino (CH) CURRICOLO A.S. 2012-1013 CLASSE PRIMA SCUOLA PRIMARIA OBIETTIVI DI Sviluppa
DettagliAnalisi di scenario File Nr. 10
1 Analisi di scenario File Nr. 10 Giorgio Calcagnini Università di Urbino Dip. Economia, Società, Politica giorgio.calcagnini@uniurb.it http://www.econ.uniurb.it/calcagnini/ http://www.econ.uniurb.it/calcagnini/forecasting.html
DettagliMacchine a stati finiti. Sommario. Sommario. M. Favalli. Le macchine a stati si utilizzano per modellare di sistemi fisici caratterizzabili mediante:
Sommario Macchine a stati finiti M. Favalli Engineering Department in Ferrara 4 Sommario (ENDIF) Analisiesintesideicircuitidigitali / 35 (ENDIF) Analisiesintesideicircuitidigitali 2 / 35 4 Le macchine
DettagliStatistica descrittiva: prime informazioni dai dati sperimentali
SECONDO APPUNTAMENTO CON LA SPERIMENTAZIONE IN AGRICOLTURA Statistica descrittiva: prime informazioni dai dati sperimentali La statistica descrittiva rappresenta la base di partenza per le applicazioni
DettagliBasi di matematica per il corso di micro
Basi di matematica per il corso di micro Microeconomia (anno accademico 2006-2007) Lezione del 21 Marzo 2007 Marianna Belloc 1 Le funzioni 1.1 Definizione Una funzione è una regola che descrive una relazione
DettagliLa variabile casuale Binomiale
La variabile casuale Binomiale Si costruisce a partire dalla nozione di esperimento casuale Bernoulliano che consiste in un insieme di prove ripetute con le seguenti caratteristiche: i) ad ogni singola
Dettagli1. Distribuzioni campionarie
Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 2012/2013 lezioni di statistica del 3 e 6 giugno 2013 - di Massimo Cristallo - 1. Distribuzioni campionarie
DettagliLuigi Piroddi piroddi@elet.polimi.it
Automazione industriale dispense del corso 10. Reti di Petri: analisi strutturale Luigi Piroddi piroddi@elet.polimi.it Analisi strutturale Un alternativa all analisi esaustiva basata sul grafo di raggiungibilità,
DettagliCAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI
VERO FALSO CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI 1. V F Un ipotesi statistica è un assunzione sulle caratteristiche di una o più variabili in una o più popolazioni 2. V F L ipotesi nulla unita
DettagliTRAGUARDI PER LO SVILUPPO DELLE COMPETENZE AL TERMINE DELLA SCUOLA PRIMARIA
SCUOLA PRIMARIA DI CORTE FRANCA MATEMATICA CLASSE QUINTA TRAGUARDI PER LO SVILUPPO DELLE COMPETENZE AL TERMINE DELLA SCUOLA PRIMARIA L ALUNNO SVILUPPA UN ATTEGGIAMENTO POSITIVO RISPETTO ALLA MATEMATICA,
DettagliIntroduzione al corso
Introduzione al corso Sistemi Informativi L-B Home Page del corso: http://www-db.deis.unibo.it/courses/sil-b/ Versione elettronica: introduzione.pdf Sistemi Informativi L-B Docente Prof. Paolo Ciaccia
DettagliPerché il logaritmo è così importante?
Esempio 1. Perché il logaritmo è così importante? (concentrazione di ioni di idrogeno in una soluzione, il ph) Un sistema solido o liquido, costituito da due o più componenti, (sale disciolto nell'acqua),
DettagliLineamenti di econometria 2
Lineamenti di econometria 2 Camilla Mastromarco Università di Lecce Master II Livello "Analisi dei Mercati e Sviluppo Locale" (PIT 9.4) La Regressione Multipla La Regressione Multipla La regressione multipla
DettagliIdentificazione dei Parametri Caratteristici di un Plasma Circolare Tramite Rete Neuronale
Identificazione dei Parametri Caratteristici di un Plasma Circolare Tramite Rete euronale Descrizione Il presente lavoro, facente segiuto a quanto descritto precedentemente, ha il fine di: 1) introdurre
DettagliRaggruppamenti Conti Movimenti
ESERCITAZIONE PIANO DEI CONTI Vogliamo creare un programma che ci permetta di gestire, in un DB, il Piano dei conti di un azienda. Nel corso della gestione d esercizio, si potranno registrare gli articoli
DettagliPROGRAMMA SVOLTO NELLA SESSIONE N.
Università C. Cattaneo Liuc, Corso di Statistica, Sessione n. 1, 2014 Laboratorio Excel Sessione n. 1 Venerdì 031014 Gruppo PZ Lunedì 061014 Gruppo AD Martedì 071014 Gruppo EO PROGRAMMA SVOLTO NELLA SESSIONE
DettagliSistemi Informativi Territoriali. Map Algebra
Paolo Mogorovich Sistemi Informativi Territoriali Appunti dalle lezioni Map Algebra Cod.735 - Vers.E57 1 Definizione di Map Algebra 2 Operatori locali 3 Operatori zonali 4 Operatori focali 5 Operatori
Dettagli1. Sia dato un poliedro. Dire quali delle seguenti affermazioni sono corrette.
. Sia dato un poliedro. (a) Un vettore x R n è un vertice di P se soddisfa alla seguenti condizioni: x P e comunque presi due punti distinti x, x 2 P tali che x x e x x 2 si ha x = ( β)x + βx 2 con β [0,
DettagliCapitolo 4: Ottimizzazione non lineare non vincolata parte II. E. Amaldi DEIB, Politecnico di Milano
Capitolo 4: Ottimizzazione non lineare non vincolata parte II E. Amaldi DEIB, Politecnico di Milano 4.3 Algoritmi iterativi e convergenza Programma non lineare (PNL): min f(x) s.v. g i (x) 0 1 i m x S
DettagliMacchine a stati finiti. Sommario. Sommario. M. Favalli. 5th June 2007
Sommario Macchine a stati finiti M. Favalli 5th June 27 4 Sommario () 5th June 27 / 35 () 5th June 27 2 / 35 4 Le macchine a stati si utilizzano per modellare di sistemi fisici caratterizzabili mediante:
DettagliBrugnaro Luca Boscaro Gianni (2009) 1
STATISTICA PER LE PROFESSIONI SANITARIE - LIVELLO BASE Brugnaro Luca Boscaro Gianni (2009) 1 Perché la statistica Prendere decisioni Bibliografia non soddisfacente Richieste nuove conoscenze Raccolta delle
Dettagli