Introduzione all analisi di arrays: clustering.
|
|
- Bianca Cavallaro
- 7 anni fa
- Visualizzazioni
Transcript
1 Statistica per la Ricerca Sperimentale Introduzione all analisi di arrays: clustering. Lezione 2-14 Marzo 2006 Stefano Moretti Dipartimento di Matematica, Università di Genova e Unità di Epidemiologia Molecolare, Istituto Nazionale per la Ricerca sul Cancro di Genova moretti@dima.unige.it Microarrays e loro funzione diagnostica Patologie diverse o sottoclassi della stessa patologia hanno dimostrato essere caratterizzate da diversi profili di espressione. un-supervised Identificazione di sottoclassi non note della patologia. supervised Identificazione di gruppi di geni predittori della patologia stessa. 1
2 Algoritmi di clustering Le relazioni di somiglianza tra i campioni (o geni) possono essere determinate attraverso le tecniche di clustering. Esempi: Clustering gerarchico agglomerativo K-means clustering Concetto basilare: Metriche o funzioni distanza Def.: Sia X un insieme non vuoto. Una funzione a valori reali d definita su X X è detta una metrica o una funzione distanza su X sse, presi comunque a,b,c X, soddisfa i seguenti assiomi: d(a,b) 0 e d(a,a)=0. (Simmetria) d(a,b)=d(b,a). (Disuguaglianza triangolare) d(a,b)+d(b,c) d(a,c). Se a b, allora d(a,b)>0. Dove sta scritto che devo per forza usare una metrica nel clustering gerarchico? (vedi funzione di dissimilarità basato sul coefficiente di correlazione di Pearson) 2
3 Clustering gerarchico Crea la filogenesi o gerarchia dell espressione dei geni o dei profili genici dei campioni. Simili agli algoritmi filogenetici. ATTENZIONE: Distanze diverse danno risultati diversi Metodi agglomerativi diversi forniscono risultati diversi Esempio: distanza euclidea sample a b c d e gene gene Sample d dist dist 2 = Gene sample c Gene 1 3
4 a b c d e a 0 b c d e d b a db c e a 0 db c e e a ae db c ae 0 db c c aec db aec 0 db Algoritmo per il clustering gerarchico Calcolare la distanza fra tutte le coppie di campioni Mettere i valori in una matrice Unire i campioni con punteggio inferiore Continuare a unire i successivi campioni con altri campioni o gruppi di campioni a minima distanza. 4
5 Metodi gerarchici agglomerativi nearest neighbour furthest neighbour average linkage centroid Clustering gerarchico Vantaggi Buona visualizzazione in due dimensioni Non necessità la conoscenza del numero di raggruppamenti che ci si aspetta Svantaggi Si puo avere piu di un albero per lo stesso set di dati in funzione sia della misura di dissimilarità utilizzata che del metodo di agglomerazione. Non è sempre chiaro dove è opportuno tagliare l albero per ottenere una partizione significativa 5
6 K-means clustering Si ricava una partizione dei campioni in gruppi con profili di espressione simile. k e il numero di clusters che l utente ritiene opportuno per un certo set di dati. Idea di fondo assegna casualmente ciascun punto ad uno dei k cluster calcola la media all interno di ciascuna classe cosi ottenuta e la media tra le medie minimizza la media all interno della classe e massimizza la distanza tra le classi attraverso un metodo iterattivo. 6
7 espressione Espressione in Gene condizione Esempio: Step 1 Algoritmo: k-means, Distanza Euclidea k 1 k 2 k espressione Espressione in condizione Gene 1 1 espressione Espressione in Gene condizione Esempio: Step 2 Algoritmo: k-means, Distanza Euclidea k 1 k 2 k espressione Espressione in condizione Gene 1 1 7
8 espressione Espressione in Gene condizione Esempio: Step 3 Algoritmo: k-means, Distanza Euclidea k 1 k 2 k 3 espressione Espressione in condizione Gene 1 1 espressione Espressione in Gene condizione Esempio: Step 4 Algoritmo: k-means, Distanza Euclidea k 1 k 2 k 3 espressione Espressione in condizione Gene 1 1 8
9 espressione Espressione in Gene condizione Esempio: Step 5 Algoritmo: k-means, Distanza Euclidea k 2 k k 1 espressione Espressione in condizione Gene 1 1 Algoritmo K-means 1) Si prenda un numero k di centroidi 2) Si assegna ogni gene al centroide piu vicino 3) Si muove ogni centroide nel punto che indica la media dei suoi geni 4) Si ripetono i passi 2-3 fino a che l algoritmo converge. 9
10 K-means clustering summary Vantaggi I campioni sono automaticamente assegnati alle classi E possibile variare la posizione iniziale dei centroidi per cercare di ridurre la dipendenza dalle condizioni iniziali Svantaggi Arbitrarieta di k Tutti i campioni sono forzati a stare in un unico cluster Quale metodo di clustering devo usare? Qual è la domanda biologica? Ho un idea preconcetta di quanti cluster debba ritrovare? A che tipo di somiglianza intendo riferirmi e come intendo misurarla? Può un gene essere presente in più di un cluster? 10
11 R R è un sistema open-source per l analisi statistica e la descrizione dei dati. Consiste di Un linguaggio Un ambiente run-time con Finestra grafici, debugger, ecc Accesso ad alcuni sistemi di funcioni, Può essere usato come Interattivo, attraverso un linguaggio di comando O esecuzione di programmi immagazzinati in file script 11
12 pro e contro Powerful, Molto utilizzato in statistica Facile da estendere Creare librerie Molte già disponibili Utilizzabile gratuitamente Unix, windows & Mac Molta documentazione Non è facile da imparare Basato sui comandi La documentazione a volte è un pò criptica Uso pesante della memoria Il peggio in windows A volte lento If you intend to do microarray data analysis Probably one of best options R e Microarray R è uno strumento popolare tra gli statistsici che analizzano I microarray Questo ha dato origine a varie applicaziioni sviluppate in R disponibili gratuitamente Il progetto Bioconductor raggruppa gran parte di questi sforzi 12
13 Il progetto Bioconductor Progetto Open source e open development software per l analisi e la comprensione di dati genomici. La maggior parte dei programmi è stata pensata come librerie di R. Documentazione esaustiva e materiale didattico al sito Ha raggiunto una certa stabilità ma si sta ancora evolvendo. quello che ora sembra uno standard potrebbe non esserlo più nel prossimo futuro. Ha raggiunto la versione
Cluster Analysis. La Cluster Analysis è il processo attraverso il quale vengono individuati raggruppamenti dei dati. per modellare!
La Cluster Analysis è il processo attraverso il quale vengono individuati raggruppamenti dei dati. Le tecniche di cluster analysis vengono usate per esplorare i dati e non per modellare! La cluster analysis
DettagliIntelligenza Artificiale. Clustering. Francesco Uliana. 14 gennaio 2011
Intelligenza Artificiale Clustering Francesco Uliana 14 gennaio 2011 Definizione Il Clustering o analisi dei cluster (dal termine inglese cluster analysis) è un insieme di tecniche di analisi multivariata
DettagliMisure di diversità tra unità statistiche. Loredana Cerbara
Misure di diversità tra unità statistiche Loredana Cerbara LA DISTANZA IN STATISTICA In statistica la distanza ha un significato diverso da quello che si può intuire in altre discipline, dove, peraltro,
DettagliPraticamente Statistica Laboratorio di software open source
Praticamente Statistica Laboratorio di software open source ORIENTAMENTO CONSAPEVOLE Imparare dai dati: la Statistica come strumento della conoscenza Alessio Pollice Dipartimento di Scienze Economiche
DettagliRiconoscimento e recupero dell informazione per bioinformatica
Riconoscimento e recupero dell informazione per bioinformatica Clustering: metodologie Manuele Bicego Corso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona Sommario Tassonomia
DettagliAnalisi dei Gruppi con R
Università di Bologna - Facoltà di Scienze Statistiche Laurea Triennale in Statistica e Ricerca Sociale Corso di Analisi di Serie Storiche e Multidimensionali Prof.ssa Marilena Pillati Analisi dei Gruppi
DettagliCluster Analysis (2 parte)
Cluster Analysis (2 parte) Esempio 2 Data set: Nel data set Dieta (Dieta.txt, Dieta.sav) sono contenute informazioni sul consumo medio dei principali alimenti in 16 paesi Europei. Paese Cereali (Ce) Riso
DettagliAlgoritmi di clustering
Algoritmi di clustering Dato un insieme di dati sperimentali, vogliamo dividerli in clusters in modo che: I dati all interno di ciascun cluster siano simili tra loro Ciascun dato appartenga a uno e un
DettagliRiconoscimento e recupero dell informazione per bioinformatica
Riconoscimento e recupero dell informazione per bioinformatica Filogenesi Manuele Bicego Corso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona Sommario Introduzione alla
DettagliRiconoscimento e recupero dell informazione per bioinformatica. Clustering: validazione. Manuele Bicego
Riconoscimento e recupero dell informazione per bioinformatica Clustering: validazione Manuele Bicego Corso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona Sommario Definizione
DettagliI metodi di Classificazione automatica
L Analisi Multidimensionale dei Dati Una Statistica da vedere I metodi di Classificazione automatica Matrici e metodi Strategia di AMD Anal Discrimin Segmentazione SI Per riga SI Matrice strutturata NO
DettagliROCK. A Robust Clustering Algorithm for Categorical Attributes. Sudipto Guha, Rajeev Rastogi, Kyuseok Shim
ROCK A Robust Clustering Algorithm for Categorical Attributes Sudipto Guha, Rajeev Rastogi, Kyuseok Shim Presentazione di Sara Liparesi e Francesco Nonni Sistemi Informativi per le Decisioni a.a. 2005/2006
DettagliIl problema del clustering
Il problema del clustering Stefano Rovetta 1 aprile 2003 Sommario Concetto di clustering Definizioni di distanze Modalità di raggruppamento Clustering con la tecnica k-means Clustering gerarchico Cautele
Dettagliviii Indice generale
Indice generale 1 Introduzione al processo di ricerca 1 Sommario 1 Il processo di ricerca 3 Concetti e variabili 5 Scale di misura 8 Test di ipotesi 10 Evidenza empirica 10 Disegni di ricerca 11 Sintesi
DettagliEsercizio 1: archivio CD e DVD
Esercizio 1: archivio CD e DVD Realizzare un applicazione Java per la creazione e la consultazione di un archivio di dischi ottici (CD e DVD). L applicazione riceve da standard input in maniera interattiva
DettagliAnalisi Statistica dei Dati Misurazione e gestione dei rischi a.a. 2007-2008
Analisi Statistica dei Dati Misurazione e gestione dei rischi a.a. 2007-2008 Dott. Chiara Cornalba COMUNICAZIONI La lezione del 30 ottobre è sospesa per missione all estero del Prof. Giudici. Dal 6 Novembre
DettagliCluster Analysis. Paese Cereali (Ce) Riso (R) Patate (P) Zucchero (Z) Verdure (Ver) Vino (Vi) Carne (Ca) Latte (L) Burro (B) Uova (U)
Analysis Esempio Stiamo studiando le abitudini alimentari nei Paesi europei. Sulla base dei dati a disposizione, ci chiediamo se si possano individuare sotto-aree con abitudini alimentari simili. Dati:
DettagliTeoria e tecniche dei test
Teoria e tecniche dei test Lezione 9 LA STANDARDIZZAZIONE DEI TEST. IL PROCESSO DI TARATURA: IL CAMPIONAMENTO. Costruire delle norme di riferimento per un test comporta delle ipotesi di fondo che è necessario
DettagliData Mining in SAP. Alessandro Ciaramella
UNIVERSITÀ DI PISA Corsi di Laurea Specialistica in Ingegneria Informatica per la Gestione d Azienda e Ingegneria Informatica Data Mining in SAP A cura di: Alessandro Ciaramella La Business Intelligence
DettagliIntroduzione al Calcolo Scientifico
Introduzione al Calcolo Scientifico Francesca Mazzia Dipartimento di Matematica Università di Bari Francesca Mazzia (Univ. Bari) Introduzione al Calcolo Scientifico 1 / 14 Calcolo Scientifico Insieme degli
DettagliIl punto di vista del mercato: una app con i dati sugli incidenti stradali
Il punto di vista del mercato: una app con i dati sugli incidenti stradali Come usare i dati dell ISTAT per creare applicazioni di mercato Il punto di vista di Evodevo, azienda specializzata in Open Data
DettagliClustering. Utilizziamo per la realizzazione dell'esempio due tipologie di software:
Esercizio Clustering Utilizziamo per la realizzazione dell'esempio due tipologie di software: - XLSTAT.xls - Cluster.exe XLSTAT.xls XLSTAT.xls è una macro di Excel che offre la possibilità di effettuare
DettagliPrincipi di Progettazione del Software a.a Introduzione al corso Prof. Luca Mainetti Università del Salento
Principi di Progettazione del Software a.a. 2016-2017 Prof. Università del Salento Il GSA Lab (www.gsalab.unisalento.it) Laboratorio di ricerca in ingegneria del software e sistemi interattivi La mission
DettagliPrincipi di Progettazione del Software a.a " Introduzione al corso! Prof. Luca Mainetti! Università del Salento!
Principi di Progettazione del Software a.a. 2015-2016" Introduzione al corso! Prof. Luca Mainetti! Università del Salento! Il GSA Lab (www.gsalab.unisalento.it)" Laboratorio di ricerca in ingegneria del
DettagliModulo III - Creazione di documenti, presentazioni e report
Modulo III - Creazione di documenti, presentazioni e report Elisabetta Ronchieri Università di Ferrara Dipartimento di Economia e Management e-mail: elisabetta.ronchieri@unife.it 1 Dicembre 2016 Elisabetta
DettagliANALISI DEI DATI PER IL MARKETING 2014
ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it LA CLASSIFICAZIONE CAP IX, pp.367-457 Problema generale della scienza (Linneo, ) Analisi discriminante Cluster Analysis
DettagliTeoria dell informazione
Corso di Laurea a Distanza in Ingegneria Elettrica Corso di Comunicazioni Elettriche Teoria dell informazione A.A. 2008-09 Alberto Perotti DELEN-DAUIN Modello di sistema di comunicazione Il modello di
DettagliX Lezione Analisi della varianza Esempi e esercizi CPS - Corso di studi in Informatica II parte: Statistica
Corso di Calcolo delle Probabilità e Statistica II Parte - STATISTICA X Lezione Analisi della varianza Esempi e esercizi 1 Argomenti della X Lezione Tests per il confronto di più medie: ANOVA Utilità e
DettagliClustering con Weka. L interfaccia. Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna. Algoritmo utilizzato per il clustering
Clustering con Weka Soluzioni degli esercizi Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna L interfaccia Algoritmo utilizzato per il clustering E possibile escludere un sottoinsieme
DettagliLinguistica Computazionale: esercitazioni
Esercitazione 1 Felice Dell'Orletta ItaliaNLP Lab (www.italianlp.it) presso Istituto di Linguistica Computazionale A. Zampolli CNR felice.dellorletta@ilc.cnr.it 24 settembre 2014 Linguistica Computazionale:
DettagliCartografie tematiche: principi e modalità di realizzazione. Mauro Giovanni Univ. di Trieste
Cartografie tematiche: principi e modalità di realizzazione Mauro Giovanni Univ. di Trieste Analisi GIS Mappare dove sono le cose Mappare cosa c è dentro Mappare il minimo e il massimo GIS Mappare le cose
DettagliCorso di Matematica per la Chimica
Dott.ssa Maria Carmela De Bonis a.a. 2013-14 Il best fitting In molte applicazioni accade di avere una certa quantità di dati (solitamente elevata) e di voler descrivere l andamento del fenomeno che ha
DettagliProblemi, istanze, soluzioni
lgoritmi e Strutture di Dati II 2 Problemi, istanze, soluzioni Un problema specifica una relazione matematica tra dati di ingresso e dati di uscita. Una istanza di un problema è formata dai dati di un
DettagliAnalisi dei dati di traffico esistenti per la definizione dei profili temporali: metodologia ed esempio di applicazione.
XIII Expert panel emissioni da trasporto su strada Roma, 4 ottobre 27 Analisi dei dati di traffico esistenti per la definizione dei profili temporali: metodologia ed esempio di applicazione. C. Lavecchia*;
DettagliUNIVERSITA' DEGLI STUDI DI CATANIA FACOLTA' DI SCIENZE MATEMATICHE, FISICHE E NATURALI MANIFESTO DEGLI STUDI
MANIFESTO DEGLI STUDI CORSO DI LAUREA Scienze Biologiche Triennale Classe 12 Anno Accademico 2006/2007 Nell A.A. 2006-2007 saranno attivati il 1, il 2 ed il 3 anno della Laurea in Scienze Biologiche. L
DettagliUniversità di Pisa A.A. 2004-2005
Università di Pisa A.A. 2004-2005 Analisi dei dati ed estrazione di conoscenza Corso di Laurea Specialistica in Informatica per l Economia e per l Azienda Tecniche di Data Mining Corsi di Laurea Specialistica
DettagliIntroduzione all analisi di Affymetrix GeneChip array.
Statistica per la Ricerca Sperimentale Introduzione all analisi di Affymetrix GeneChip array. Lezione 1-13 Marzo 2006 Stefano Moretti Dipartimento di Matematica, Università di Genova e Unità di Epidemiologia
DettagliSummeR School-DATA Mining and Data Analysis with R
SummeR School-DATA Mining and Data Analysis with R PROPONENTE Prof.ssa Luisa Bernardinelli, Prof. Mario Grassi e Dott. Davide Gentilini OBIETTIVI FORMATIVI La gestione e l analisi dei dati rappresenta
Dettagliyem Nuovo software per l analisi dell impatto elettromagnetico prodotto dalle stazioni radiobase in Friuli Venezia Giulia
yem Nuovo software per l analisi dell impatto elettromagnetico prodotto dalle stazioni radiobase in Friuli Venezia Giulia Salvagni M., Poles N., Moretuzzo M., Bampo A. miro.salvagni@arpa.fvg.it yem yem
DettagliL Automatic Control Telelab
Università di Siena L Marco Casini Dipartimento di Ingegneria dell Informazione Università di Siena, Italy Email: casini@ing.unisi.it UNIVERSITA DI SIENA 1 Sommario Introduzione all (ACT) Descrizione di
DettagliClustering Mario Guarracino Data Mining a.a. 2010/2011
Clustering Introduzione Il raggruppamento di popolazioni di oggetti (unità statistiche) in base alle loro caratteristiche (variabili) è da sempre oggetto di studio: classificazione delle specie animali,
DettagliIntroduzione al Linguaggio C ed all IDE DEV-C++
Microsoft Windows e Dev-C++ Introduzione al Linguaggio C ed all IDE DEV-C++ 1 Le Esercitazioni in Laboratorio! MTA + MLAB1/2: Edificio Via Valotti, primo piano e piano interrato! Orario: Giovedì 14:30-17:30!
DettagliAnalisi di dati Microarray: Esercitazione Matlab
Analisi di dati Microarray: Esercitazione Matlab Laboratorio di Bioinformatica II Pietro Lovato Anno Accademico 2010/2011 Contenuti 1 Introduzione DNA Microarray 2 Lavorare con una singola ibridazione
DettagliWeka Project. Weka. Weka Project. Formato.arff. Modalità di utilizzo di Weka. Formato.arff
Weka Project Weka Machine Learning Algorithms in Java Waikato Environment for Knowledge Analysis Algoritmi di Data Mining e Machine Learning realizzati in Java Preprocessing Classificazione Clustering
DettagliDESCRITTIVE, TEST T PER IL CONFRONTO DELLE MEDIE DI CAMPIONI INDIPENDENTI.
Corso di Laurea Specialistica in Biologia Sanitaria, Universita' di Padova C.I. di Metodi statistici per la Biologia, Informatica e Laboratorio di Informatica (Mod. B) Docente: Dr. Stefania Bortoluzzi
DettagliSistema Operativo (Software di base)
Il Software Il software del PC Il computer ha grandi potenzialità ma non può funzionare senza il software. Il software essenziale per fare funzionare il PC può essere diviso nelle seguenti componenti:
DettagliSCUOLA PRIMARIA - MORI
ISTITUTO COMPRENSIVO DI MORI Via Giovanni XXIII, n. 64-38065 MORI Cod. Fisc. 94024510227 - Tel. 0464-918669 Fax 0464-911029 www.icmori.it e-mail: segr.ic.mori@scuole.provincia.tn.it REPUBBLICA ITALIANA
Dettagli24 - Possibili approfondimenti
24 - Possibili approfondimenti Programmazione e analisi di dati Modulo A: Programmazione in Java Paolo Milazzo Dipartimento di Informatica, Università di Pisa http://www.di.unipi.it/ milazzo milazzo di.unipi.it
DettagliIl modello lineare misto
Il modello lineare misto (capitolo 9) A M D Marcello Gallucci Univerisità Milano-Bicocca Lezione: 15 GLM Modello Lineare Generale vantaggi Consente di stimare le relazioni fra due o più variabili Si applica
DettagliI TEST STATISTICI. dott.ssa Gabriella Agrusti
I TEST STATISTICI dott.ssa Gabriella Agrusti Dulcis in fundo.. come scegliere un test statistico in base all ipotesi come stabilire se due variabili sono associate (correlazione di Pearson) come stabilire
DettagliREGRESSIONE E CORRELAZIONE
REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.
DettagliSOFTWARE PER DATA LOGGER VACQ
SOFTWARE PER DATA LOGGER VACQ I software a disposizione sono stati sviluppati appositamente per ogni prodotto, esaltandone le specifiche tecniche senza tuttavia risultare incomprensibili all utente. Non
DettagliSCUOLA PRIMARIA - MORI
REPUBBLICA ITALIANA ISTITUTO COMPRENSIVO DI MORI Via Giovanni XXIII, n. 64-38065 MORI Cod. Fisc. 94024510227 - Tel. 0464-918669 Fax 0464-911029 www.icmori.it e-mail: segr.ic.mori@scuole.provincia.tn.it
DettagliDistributed P2P Data Mining. Autore: Elia Gaglio (matricola n 809477) Corso di Sistemi Distribuiti Prof.ssa Simonetta Balsamo
Distributed P2P Data Mining Autore: (matricola n 809477) Corso di Sistemi Distribuiti Prof.ssa Simonetta Balsamo A.A. 2005/2006 Il settore del Data Mining Distribuito (DDM): Data Mining: cuore del processo
DettagliSCUOLA PRIMARIA - MORI
REPUBBLICA ITALIANA ISTITUTO COMPRENSIVO DI MORI Via Giovanni XXIII, n. 64-38065 MORI Cod. Fisc. 94024510227 - Tel. 0464-918669 Fax 0464-911029 www.icmori.it e-mail: segr.ic.mori@scuole.provincia.tn.it
DettagliJava il Corso Fondamentale
Java il Corso Fondamentale Imparare a Programmare APP per Android, applicativi per Server e Desktop, applet e molto altro. IlTuoCorso - Ermes srl Via E.De Amicis 57 20123 Milano Il corso Ciao! Se desideri
DettagliLezione n. 1 _Complementi di matematica
Lezione n. 1 _Complementi di matematica INTRODUZIONE ALLA STATISTICA La statistica è una disciplina che si occupa di fenomeni collettivi ( cioè fenomeni in cui sono coinvolti più individui o elementi )
DettagliAnalisi dei gruppi (Cluster analysis)
Capitolo 10 Analisi dei gruppi (Cluster analysis) Partendo da un collettivo multidimensionale, l analisi dei gruppi mira ad assegnarne le unità a categorie non definite a priori, formando dei gruppi di
DettagliLa tecnologia dei microarray
La tecnologia dei microarray I microarray I progetti di sequenziamento (progetti permesso di identificare migliaia di geni genoma) ) hanno Migliaia di geni (ed i loro prodotti, le proteine) operano in
DettagliAlgoritmi e Strutture Dati
Algoritmi e Strutture Dati Capitolo 1 Un introduzione informale agli algoritmi Camil Demetrescu, Irene Finocchi, Giuseppe F. Italiano Definizione informale di algoritmo Insieme di istruzioni, definite
DettagliINTELLIGENZA ARTIFICIALE (elementi) 6 cfu
INTELLIGENZA ARTIFICIALE (elementi) 6 cfu Prof.ssa Stefania Bandini Dott. Alessandro Mosca Dipartimento di Informatica, Sistemistica e Comunicazione Università di Milano-Bicocca www.lintar.disco.unimib.it
DettagliStatistica Aziendale Avanzata
PROGRAMMA del corso, informazioni e fonti bibliografiche Statistica Aziendale Avanzata Modulo A / Modulo B Organizzazione del corso Anno Accademico 2015/16 Codice 91019 Docente responsabile prof.ssa Silvia
DettagliStrategie di annotazione di geni e genomi
Strategie di annotazione di geni e genomi Dr. Giovanni Emiliani giovanni.emiliani@unifi.it Bioinformatica A.A. 2011-1012 Concetti generali Le nuove tecnologie consentono l ottenimento di una grande mole
DettagliCampusboard LIM 78" Multi-Touch (10 tocchi) con LCD ottica corta
Codice: 297998 Prezzo: 1.200,00 Descrizione Questo kit è composto da una lavagna Interattiva multimediale 78" multitouch, videoproiettore ottica corta con staffa, software Easiteach, Campus DVD e Impara
DettagliSistema operativo (SO)
Diagramma a cipolla Sistema operativo (SO) Il calcolatore elabora informazioni codificate in sequenza di bit I dispositivi si interfacciano con il calcolatore tramite complessi protocolli di comunicazione
DettagliCorso Programmazione
Corso Programmazione 2008-2009 (docente) Fabio Aiolli E-mail: aiolli@math.unipd.it Web: www.math.unipd.it/~aiolli (docenti laboratorio) A. Ceccato, F. Di Palma, M. Gelain Dipartimento di Matematica Pura
DettagliInformatica ALGORITMI E LINGUAGGI DI PROGRAMMAZIONE. Francesco Tura. F. Tura
Informatica ALGORITMI E LINGUAGGI DI PROGRAMMAZIONE Francesco Tura francesco.tura@unibo.it 1 Lo strumento dell informatico: ELABORATORE ELETTRONICO [= calcolatore = computer] Macchina multifunzionale Macchina
DettagliModelli matematici e Data Mining
Modelli matematici e Data Mining Introduzione I modelli matematici giocano un ruolo critico negli ambienti di business intelligence e sistemi di supporto alle decisioni. Essi rappresentano un astrazione
DettagliINFORMATICA SANITARIA Domande ed Esercizi di Preparazione all Esame (Parti 8-17)
Università degli Studi di Padova Corso di Laurea Specialistica in Bioingegneria A.A. 2006-2007 2007 INFORMATICA SANITARIA Domande ed Esercizi di Preparazione all Esame (Parti 8-17) Giovanni Sparacino Dipartimento
DettagliLezione 4. Problemi trattabili e soluzioni sempre più efficienti. Gianluca Rossi
Lezione 4 Problemi trattabili e soluzioni sempre più efficienti Gianluca Rossi Trattabile o intrattabile? Consideriamo ora il problema, ben noto a tutti gli studenti a partire dalla scuola media, di calcolare
DettagliDBMS. Alice Pavarani
DBMS Alice Pavarani DBMS Insieme di programmi che offrono gli strumenti per gestire una base di dati Permette di: definire la struttura delle tabelle recuperare le informazioni manipolare i dati memorizzati
DettagliCorso di Access. Modulo L2 A (Access) 1.4 Le maschere
Corso di Access Modulo L2 A (Access) 1.4 Le maschere 1 Prerequisiti Concetto di database Interfaccia utente Elementi grafici (etichette, caselle di testo, pulsanti) 2 1 Introduzione Ora che sappiamo usare
DettagliRadar e Sistema di Puntamento con Arduino e Processing
Radar e Sistema di Puntamento con Arduino e Processing ISTITUTO INTERNAZIONALE EDOARDO AGNELLI Istituto Tecnico Industriale - Liceo Scientifico Classe IV Eln. Premessa L uso della scheda Arduino è oramai
DettagliSISTEMI OPERATIVI, RETI, INTERNET
Competenze e Unità didattica formativa capitalizzabile 4.1 SISTEMI OPERATIVI, RETI, INTERNET Comprendere il significato dell'evoluzione dei sistemi operativi. Comprendere che cosa fa un sistema operativo
DettagliSeconda Parte Specifica per la tipologia di scuola - Statistica sanitaria e Biometria - 22/07/2016
Domande relative alla specializzazione in: Statistica sanitaria e Biometria Scenario 1: In uno studio prospettivo condotto per valutare la relazione tra l'uso di estrogeni e rischio di cancro alla mammella,
DettagliFractals. Anna Carbone Politecnico di Torino November 2, 2016
Fractals Anna Carbone Politecnico di Torino www.polito.it/noiselab Caffé November 2, 2016 Fractals: Everywhere ever and ever (sempre e dovunque) Fractals: Everywhere ever and ever (sempre e dovunque) Middle
DettagliIntroduzione alla Statistica con R Lezione 1
Introduzione alla Statistica con R Lezione 1 Sergio Camiz Chi sono? Laureato in Matematica 1969 (Università di Roma) Professore dal 1975 Dottore di ricerca in Analisi dei Dati dal 2002 (Université Paris
DettagliMATEMATICA CLASSE QUINTA
MATEMATICA CLASSE QUINTA UNITÀ DIDATTICA N. 1 IL NUMERO 1. Rappresentare, leggere, scrivere e operare con i numeri naturali e decimali avendo la consapevolezza del valore posizionale delle cifre. 2. Operare
DettagliCapitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica
Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università
DettagliSistema operativo & file system 1
Il software (sw) Software di sistema e file system Lezione 1b L esecuzione di programmi è lo scopo di un elaboratore I programmi sono algoritmi codificati in un particolare linguaggio di programmazione
DettagliLETTI PER VOI: L uso delle tecniche di matching nella valutazione di efficacia di un farmaco. Cinzia Di Novi. Università Ca Foscari di Venezia,
LETTI PER VOI: L uso delle tecniche di matching nella valutazione di efficacia di un farmaco Cinzia Di Novi Università Ca Foscari di Venezia, Dipartimento di Economia Il matching statistico è sempre più
DettagliLaboratorio di Python (con Linux)
8 a lezione Università di Bologna 2, 4 maggio 2012 Sommario 1 2 3 Diversi Python 2.6 vs 2.7 v.s 3.x La versione di Python installata sulle macchine del laboratorio è la 2.6 (per l esattezza 2.6.6 ). Versioni
DettagliFilomena Maggino, L analisi dei dati nell indagine statistica. Volume 2: l esplorazione dei dati e la validazione dei risultati, ISBN: 88-8453-351-1
Filomena Maggino, L analisi dei dati nell indagine statistica. Volume 2: l esplorazione dei dati e la validazione dei risultati, ISBN: 88-8453-351-1 (print) ISBN: 88-8453-350-3 (online), Firenze University
DettagliLinux e i software liberi. di Nardean Lorenzo e Redigolo Marco
Linux e i software liberi di Nardean Lorenzo e Redigolo Marco Indice INTRODUZIONE - Cos'è Linux - Software libero - Software libero proprietario - Versioni Linux - Distribuzioni STORIA - L idea - Prima
DettagliIntroduzione a Matlab (e al Calcolo Numerico)
Introduzione a Matlab (e al Calcolo Numerico) Giuseppe Rodriguez Università di Roma Tor Vergata Seminario nell ambito del corso di Fondamenti di Informatica per gli studenti di Ingegneria Meccanica e Ingegneria
DettagliUNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:
UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA Prof.ssa Donatella Siepi donatella.siepi@unipg.it tel: 075 5853525 2 LEZIONE Statistica descrittiva STATISTICA DESCRITTIVA Rilevazione dei dati Rappresentazione
DettagliLinguaggio C: introduzione
Dipartimento di Elettronica ed Informazione Politecnico di Milano Informatica e CAD (c.i.) - ICA Prof. Pierluigi Plebani A.A. 2008/2009 Linguaggio C: introduzione La presente dispensa e da utilizzarsi
DettagliSCOPO DELL ANALISI DI CORRELAZIONE
CORRELAZIONE 1 SCOPO DELL ANALISI DI CORRELAZIONE STUDIARE LA RELAZIONE TRA DUE VARIABILI X E Y 2 diagrammi di dispersione un diagramma di dispersione (o grafico di dispersione) èuna rappresentazione grafica
DettagliUniversità di Bergamo Facoltà di Ingegneria INGEGNERIA DEL SOFTWARE. Paolo Salvaneschi A4_3 V2.1. Progettazione. Metodi e Linguaggi
Università di Bergamo Facoltà di Ingegneria INGEGNERIA DEL SOFTWARE Paolo Salvaneschi A4_3 V2.1 Progettazione Metodi e Linguaggi Il contenuto del documento è liberamente utilizzabile dagli studenti, per
DettagliArchitettura. Nome Modulo Tipologia lezioni Ore Docente SSD Ruolo Interno Affidamento. Vincenzo Conti
Anno Accademico 2015 2016 A.A. Settore Scientifico Disciplinare CFU Insegnamento Ore di aula Mutuazione 2015/16 ING-INF/05 6 Algoritmi e Strutture Dati (a scelta) 48 No Classe Corso di studi Tipologia
DettagliSTATISTICA DESCRITTIVA. Elementi di statistica medica GLI INDICI INDICI DI DISPERSIONE STATISTICA DESCRITTIVA
STATISTICA DESCRITTIVA Elementi di statistica medica STATISTICA DESCRITTIVA È quella branca della statistica che ha il fine di descrivere un fenomeno. Deve quindi sintetizzare tramite pochi valori(indici
DettagliAnalisi ABC incrociata
1 Analisi ABC L analisi ABC incrociata è un metodo che permette di suddividere in classi una serie di oggetti. Permette perciò di raggruppare per classi secondo i valori di una variabile. Ad esempio classificazione
DettagliApprendimento Automatico (Feature Selection e Kernel Learning)
Apprendimento Automatico (Feature Selection e Kernel Learning) Fabio Aiolli www.math.unipd.it/~aiolli Sito web del corso www.math.unipd.it/~aiolli/corsi/1516/aa/aa.html Servono tutti gli attributi? Gli
DettagliFondamenti di Informatica 9. Esercitazione in linguaggio C
Esercitazione in linguaggio C Fondamenti di Informatica 9. Esercitazione in linguaggio C Lo sviluppo dei programmi Compilazione dei file sorgente, link e caricamento La libreria di run time L ambiente
DettagliDalla prima lezione. LABORATORIO DI PROGRAMMAZIONE Corso di laurea in matematica 7 VARIABILI E COSTANTI 28/02/2016. Concetto di algoritmo
LABORATORIO DI PROGRAMMAZIONE Corso di laurea in matematica 7 VARIABILI E COSTANTI Marco Lapegna Dipartimento di Matematica e Applicazioni Universita degli Studi di Napoli Federico II wpage.unina.it/lapegna
DettagliCHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)
CHEMIOMETRIA Applicazione di metodi matematici e statistici per estrarre (massima) informazione chimica (affidabile) da dati chimici INCERTEZZA DI MISURA (intervallo di confidenza/fiducia) CONFRONTO CON
DettagliTabella 1 Parametri del generatore di traffico
Tabella 1 Parametri del generatore di traffico 3.5 Bit error rate tests BER tests sono usati per determinare il tasso di errori in una trasmissione o in una rete punto-punto. Questi test sono effettuati
DettagliSistema DANTE. Scheda prodotto SISTEMA DANTE
PAG. 1 DI 11 SISTEMA DANTE Sistema professionale per l annotazione di eventi che consente raccolta, analisi, presentazione e gestione di dati osservati in tempo reale o su registrazione video. PAG. 2 DI
DettagliIstruzioni per l analisi in componenti principali con R
Istruzioni per l analisi in componenti principali con R Vi ricordo che in nero sono state inserite le note e in rosso le istruzioni da digitare sulla console di R Importare il dataset gelati
DettagliDocente: Prof. Marco Patella Tutor: Vincenzo Lomonaco
Università di Bologna Facoltà di Ingegneria C.d.L. in Ing. Gestionale Fondamenti di Informatica T-1 (A-K) A.A. 2015/16 Docente: Prof. Marco Patella Tutor: Vincenzo Lomonaco 1 Obiettivi del corso Il corso
Dettagli