Laboratorio di dati e sistemi multimediali

Documenti analoghi
Esplorazione grafica di dati multivariati. N. Del Buono

Metodi e tecniche di analisi dei dati nella ricerca psico-educativa Parte III

Esplorazione grafica di dati multivariati. N. Del Buono

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:

ISTITUTO OMNICOMPRENSIVO ALTO ORVIETANO FABRO PROGRAMMAZIONE ANNUALE MATEMATICA CLASSE II SECONDARIA I GRADO

Matematica per Analisi dei Dati,

UDA MATEMATICA. Progettazione per unità di apprendimento. Percorso di istruzione di primo livello primo periodo didattica PROF:...

MATEMATICA CLASSE TERZA

Ministero della Pubblica Istruzione UFFICIO SCOLASTICO REGIONALE DEL VENETO DIREZIONE DIDATTICA STATALE VIGONZA

Capitolo 1. Analisi Discriminante. 1.1 Introduzione. 1.2 Un analisi discriminante Descrizione del dataset

PROGETTAZIONE ANNUALE DI MATEMATICA - CLASSE 2^ scuola secondaria di primo grado

INDICATORI DI TENDENZA CENTRALE

CURRICOLO VERTICALE PER COMPETENZE DISCIPLINARI Scuola Primaria - MATEMATICA - COMPETENZA CHIAVE EUROPEA: COMPETENZA MATEMATICA

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di tendenza centrale

INDICATORI DI TENDENZA CENTRALE

PROGRAMMAZIONE DISCIPLINARE SCUOLA PRIMARIA

INDICATORI DI TENDENZA CENTRALE

CURRICOLO DI MATEMATICA

le scale di misura scala nominale scala ordinale DIAGNOSTICA PSICOLOGICA lezione si basano su tre elementi:

Istituto Comprensivo di Pralboino Curricolo Verticale

CURRICOLO DI ISTITUTO

OBIETTIVI DI APPRENDIMENTO CONTENUTI ABILITÀ

Cifre significative delle misure di grandezze fisiche

OBIETTIVI DI APPRENDIMENTO DI MATEMATICA-SCUOLA SECONDARIA DI PRIMO GRADO

PIANO DI LAVORO DEL DOCENTE anno scolastico 2016/2017. Classe e Indirizzo 1^B AFM n. ore settimanali: 4 Monte orario annuale: 132

Teoria della misurazione e significanza delle statistiche. Psicometria 1 - Lezione 4 Lucidi presentati a lezione AA 2000/2001 dott.

Scale di Misurazione Lezione 2

Lezione n. 1 _Complementi di matematica

DISPENSE SU TEORIA DEGLI INSIEMI E NUMERI

Teoria e tecniche dei test. Concetti di base

Re = f (A) f. 2 ),,, f (af. n )}

ISTITUTO COMPRENSIVO DI DONGO curricolo verticale per la scuola primaria Area di apprendimento: MATEMATICA

Corso di Didattica della Matematica

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:

MISURE ARGOMENTI DELLE LEZIONI 6. ELEMENTI DI TEORIA DEI SISTEMI DI MISURA 7. LE MISURE DIMENSIONALI

Variabili e scale di misura

NUMERI ED OPERAZIONI indicatori descrittori valutazione

MATEMATICA TRAGUARDI PER LO SVILUPPO DELLE COMPETENZE AL TERMINE DELLA SCUOLA SECONDARIA DI PRIMO GRADO

OBIETTIVI di APPRENDIMENTO INDICAZIONI (dalle indicazioni Nazionali)

Università degli Studi di Cassino. Corso di Laurea in Economia Aziendale. Corso di. Statistica. Docente: Simona Balzano.

ISTITUTO SCOLASTICO COMPRENSIVO MINEO

- Spiega il procedimento seguito, anche in forma scritta, mantenendo il controllo sia sul processo risolutivo, sia sui risultati.

Learning by doing Attività all aperto/outdoor Training Lezione frontale Esercitazioni individuali Compito di apprendimento Approccio dialogico

PROGETTAZIONE DISCIPLINARE MATEMATICA classe 2^

PROGRAMMA a.s CLASSE 1 O

Traguardi per lo sviluppo delle competenze. Obiettivi operativi. essenziali

STATISTICA 1 ESERCITAZIONE 1 CLASSIFICAZIONE DELLE VARIABILI CASUALI

Dipartimento di Fisica a.a. 2004/2005 Fisica Medica 2 Campionamento 29/4/2005

Matematica ed Elementi di Statistica. L insieme dei numeri reali

Prof. Giulio Vidotto (Università di Padova) Lez Trasformazione delle misure e significanza delle statistiche

OBIETTIVI DI APPRENDIMENTO CONTENUTI ABILITÀ

Esplorazione dei dati

PROGETTAZIONE ANNUALE DI MATEMATICA - CLASSE 3^ scuola secondaria di primo grado

MATEMATICA E COMPETENZE DI BASE IN SCIENZA E TECNOLOGIA MATEMATICA CONCORRENTI DISCIPLINA DI RIFERIMENTO: MATEMATICA COMPETENZA DISCIPLINE tutte

GLI INSIEMI NUMERICI N Z Q R -C. Prof.ssa Maddalena Dominijanni

Analisi della varianza

CORSO DI AZZERAMENTO DI MATEMATICA

Cosa c è alla base? Un esempio

SCUOLA PRIMARIA MATEMATICA (Classe 1ª)

Fondamenti di Informatica - 1. Prof. B.Buttarazzi A.A. 2011/2012

LA CONOSCENZA DEL MONDO. OBIETTIVI DI APPRENDIMENTO 3 anni 4 anni 5 anni

Lezione 1

Lezione 2. La conoscenza del mondo

Tipi di variabili. Indici di tendenza centrale e di dispersione

FONDAZIONE MALAVASI. Scuola secondaria di 1 grado A. MANZONI

DIPARTIMENTO DI ELETTRONICA E INFORMAZIONE. Numeri in virgola. Marco D. Santambrogio Ver. aggiornata al 10 Novembre 2015

TRAGUARDI PER LO SVILUPPO DELLE COMPETENZE

MATEMATICA CLASSE NUMERO Contare sia in senso progressivo sia in senso regressivo.

La Statistica: introduzione e approfondimenti

I.4 Rappresentazione dell informazione

NUMERI SCUOLA SECONDARIA I GRADO

Prof. Anna Paola Ercolani (Università di Roma) Lez. 1 - La misura del comportamento - cosa misuriamo?

Classe 2^ - STA - UdA n 1: Metrologia - Principi di funzionamento della strumentazione di base PRINCIPI DI FUNZIONAMENTO DELLA STRUMENTAZIONE DI BASE

Costanti e Variabili

MATEMATICA- SCUOLA PRIMARIA

Laboratorio di dati e sistemi multimediali

DIPARTIMENTO DI ELETTRONICA E INFORMAZIONE. Numeri in virgola. Marco D. Santambrogio Ver. aggiornata al 14 Novembre 2014

Istituto Comprensivo di Pralboino Curricolo Verticale

CURRICOLO MATEMATICA - CLASSE TERZA -

Classe Prima. Concetti topologici. Confronti Classificazioni Grafici. Confronti, ordinamenti e grandezze misurabili

Livello di misura Scala Nominale Scala Ordinale Scala di Rapporti. Scala Nominale

SCUOLA DELL INFANZIA. Scuola dell infanzia: 5 ANNI

LICEO SCIENZE UMANE/ARTISTICO G. PASCOLI

DECLINAZIONE COMPETENZE SCUOLA PRIMARIA: MATEMATICA CLASSI 1 a 2 a 3 a

IC BOSCO CHIESANUOVA - CURRICOLO UNITARIO - SCUOLA SECONDARIA I

Rappresentazioni Tabellari e Grafiche. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica

CURRICOLO DI MATEMATICA SCUOLA SECONDARIA DI PRIMO GRADO

Università degli Studi di Palermo Facoltà di Economia. CdS Sviluppo Economico e Cooperazione Internazionale. Appunti del corso di Matematica

Strumenti di indagine per la valutazione psicologica

MATEMATICA SCUOLA SECONDARIA CLASSE TERZA

Curricolo Verticale di matematica Scuola primaria

Progettazione Curricolare di MATEMATICA. Dalla Progettazione Curricolare alla Progettazione per Competenze

Come attribuire i punteggi M I S U R A R E

Sistemi di numerazione

Importanza delle incertezze nelle misure fisiche

ANALISI CHIMICO FARMACEUTICA I

Da dove partiamo? ESERCITIAMOCI TEMPO: 2 h

Programma di matematica classe Prima

La Rappresentazione dell Informazione

Numeri. Spazio e figure Percepisce la propria posizione nello spazio e stima distanze e volumi a partire. Relazioni, dati e previsioni.

Transcript:

Laboratorio di dati e sistemi multimediali Scienze e tecnologie Multimediale Prof. Christian Micheloni

Introduzione Nel corso di questa lezione faremmo uso dell iris data set per introdurre i concetti base dell analisi dei dati. Scale dei dati (nominale, ordinale, intervallo, rapporto) Rappresentazione mediante insiemi, vettori e matrici Misure di dissimilarità (inner product norms, Lebesgue norms, ecc ) Misure di similarità(coseno, sovrapposizione, Jaccard, ecc ) Relazioni tra sequenze (Hamming, Levenshtein, ecc ) Estrazioni di dati da segnali continui mediante quantizzazione e campionamento. Laboratorio di dati e sistemi multimediali 2

IRIS Data Set E uno dei più popolari data set di riferimento. Fu originariamente creato nel 1935 da un botanico americano Edgar Anderson Esamina la distribuzione geografica dei fiori di iris nella penisola Gaspè del Quebec Nel 1936 Ronal Aylmer Fisher usò il data set di Anderson come esempio per l analisi multivariata discriminativa. Successivamente l IRIS data set divenne uno dei più popolari data set utilizzati nell analisi statistica e nell analisi dati Laboratorio di dati e sistemi multimediali 3

IRIS Data Set E composto dalla misurazione di 150 fiori di iris 50 campioni per ognuna delle tre specie di iris considerati Iris Setosa Iris Virginica Iris Versicolor Per ognuno dei 150 fiori sono stati estratti 4 valori numerici Lunghezza sepalo Larghezza sepalo Lunghezza petalo Larghezza petalo Laboratorio di dati e sistemi multimediali 4

IRIS Data Set Il data set originale può essere prelevato da https://archive.ics.uci.edu/ml/datasets/iris Ognuno dei 150 fiori viene chiamato oggetto Ognuna delle tre specie è una classe Ognuna delle quattro misure una caratteristica Laboratorio di dati e sistemi multimediali 5

Domande tipiche dell analisi dei dati Quale dei dati potrebbe contenere errori o un assegnamento di classe errato? Qual è l errore generato dall arrotondamento dei valori decimali? Come sono correlate le diverse misure (lunghezza e larghezza petalo)? Quale coppia di misure è maggiormente correlato? Stima di dati non presenti nel data set (non esiste un fiore con un sepalo largo1.8 cm. Quale sarebbe la lunghezza del petalo che ci aspettiamo da un fiore con lunghezza del sepalo di 1.8cm? A quale specie apparterrebbe un fiore con larghezza del sepalo pari a 1.8cm? E possibile che le tre specie contengono delle sotto specie che possono essere individuate analizzando i dati? Laboratorio di dati e sistemi multimediali 6

Data sets Misurazioni numeriche possono avere diversi significati semantici anche se sono rappresentati dallo stesso dato numerico Per identificare il significato semantico di misurazioni numeriche, si utilizzano 4 diverse scale Scala Operazioni Esempio Statistica Nominale = Marco, Sandra, Fuoco Moda Ordinale < > A,B,C,D, Mediana Intervallo + - 2015, 20 C Media Ratio * / 21 anni, 30 C Media generalizzata Laboratorio di dati e sistemi multimediali 7

Data Set (2) Il primo tipo di scala verifica solo la proprietà di uguaglianza o diseguaglianza Questi tipi di dati possono essere rappresentati dalla modo (elemento più frequente) Per i tipi ordinali anche le operazioni «maggiore di» e «minore di» assumono significato Per questo livello di scala possiamo utilizzare anche le operazioni della prima scala (questo è valido per ogni scala che può usare le operazioni delle scale sottostanti) L operazione e definiscono degli ordinamenti totali tali che vale: Antisimmetria x y (y x) (x = y) Transitività x y y z x z Totalità x y (y x) Questi tipi di dati possono essere rappresentati dal valore mediano Laboratorio di dati e sistemi multimediali 8

Data Set (3) Per la scala intervallo sono valide anche le operazioni di addizione e sottrazione. Queste caratteristiche hanno degli zeri arbitrari Questi dati possono essere rappresentati dal valore di media n x = 1 n k=1 x k Per i tipi di misurazioni di tipo rapporto anche la moltiplicazione e la divisione sono operazioni valide Possono essere rappresentati dalla media generalizzata m_α(x) = α 1 n n k=1 Le caratteristiche del IRIS data set sono dell ultimo tipo x k α Laboratorio di dati e sistemi multimediali 9

Rappresentazione di insiemi e Matrici Si definisce una caratteristica «feature» numerica con l insieme X = x 1,, x n R p con n elementi dove ogni elemento è vettore di dimensione p formato da valori reali Quando p=1 si dice di operare su un data set scalare Quando abbiamo misurazioni relative a più feature possiamo rappresentare i dati in matrici x 1 (1) x n (1) x 1 p x n p Laboratorio di dati e sistemi multimediali 10