5. La Market Basket Analysis

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "5. La Market Basket Analysis"

Transcript

1 5. La Market Basket Analysis Riccardo Massari Metodi statistici per il Marketing Luiss, Roma R. Massari (Docente: P. D'Urso) 5. MBA / 51

2 Cosa impareremo sulla Market Basket Analysis 1 La Market Basket Analysis Introduzione e denizioni Frequenza degli itemset Le regole associative 2 Data mining delle regole associative 3 Tabelle di contingenza e Market Basket Analysis Il lift 4 MBA e R 5 Esercizi R. Massari (Docente: P. D'Urso) 5. MBA / 51

3 Sommario 1 La Market Basket Analysis Introduzione e denizioni Frequenza degli itemset Le regole associative 2 Data mining delle regole associative 3 Tabelle di contingenza e Market Basket Analysis Il lift 4 MBA e R 5 Esercizi R. Massari (Docente: P. D'Urso) 5. MBA / 51

4 Market Basket Analysis Nel Data Mining, le regole associative (Association Rules) sono un metodo per individuare regolarità e ricorrenze in grandi database. Le regole associative trovano largo uso nell'analisi delle transazioni commerciali. In questo caso si parla di Market Basket Analysis. R. Massari (Docente: P. D'Urso) 5. MBA / 51

5 Ad esempio, ogni volta che un cliente eettua un acquisto (transazione) vengono raccolte informazioni, come la lista dei prodotti (item) presenti nel carrello della spesa (market basket). Questi dati vengono raccolti in un database di transazioni. Con le tecniche del Data Mining è possibile studiare le relazioni tra i prodotti presenti in queste transazioni. Queste relazioni sono dette regole associative. R. Massari (Docente: P. D'Urso) 5. MBA / 51

6 Un po' di terminologia e notazioni Indichiamo con: item un prodotto o un servizio; I l'insieme di tutti gli item (ad esempio, tutti i prodotti disponibili in un supermercato); t j la generica transazione, che contiene alcuni degli item in I (l'elenco dei prodotti acquistati da un cliente); D il database che contiene tutte le transazioni osservate in un certo ambito spazio-temporale (tutte le transazioni avvenute in un supermercato in un giorno). R. Massari (Docente: P. D'Urso) 5. MBA / 51

7 Un esempio di database di transazioni Consideriamo un semplice esempio con 8 transazioni: TID Items (prodotti acquistati) 1 Pane, Latte, Burro 2 Pane, Latte, Carne, Olio 3 Latte, Carne, Frutta 4 Carne, Olio, Frutta 5 Pane, Burro, Olio, Frutta 6 Latte, Frutta 7 Pane, Burro, Olio, Carne, Frutta 8 Latte, Olio, Carne Ciascuna riga della tabella è riferita ad una transazione del database. L'insieme di tutti gli item è I =(Pane, Latte, Burro, Carne, Olio, Frutta). R. Massari (Docente: P. D'Urso) 5. MBA / 51

8 Itemset e transazioni Un itemset X è un generico insieme di item, X I. Una transazione contiene l'itemset X se X è un sottoinsieme della transazione, ossia: t j X Nel nostro esempio, possibili itemset sono (Pane, Olio) o (Carne, Frutta). La seconda transazione dell'esempio, (Pane, Latte, Carne, Olio), contiene l'itemset (Pane, Olio) ma non l'itemset (Carne, Frutta). R. Massari (Docente: P. D'Urso) 5. MBA / 51

9 Obiettivi della Market Basket Analysis Gli obiettivi della Market Basket Analysis possono essere così riassunti: 1 vericare con quale frequenza alcuni itemset sono presenti nelle transazioni osservate; 2 vericare con quale frequenza alcuni itemset sono presenti nelle transazioni osservate congiuntamente ad altri itemset. Per il primo punto, si calcola la frequenza di un itemset. Per il secondo punto si utilizzano le regole associative. R. Massari (Docente: P. D'Urso) 5. MBA / 51

10 Frequenza La frequenza (support count) dell'itemset X, è il numero di transazioni di un database che contengono l'itemset X, e viene indicata con σ(x ) Consideriamo l'itemset (Pane, Olio) e il database di transazioni di esempio. La sua frequenza è σ(pane, Olio)=3, dal momento che compare nelle transazioni 2, 5 e 7. TID Items (prodotti acquistati) 1 Pane, Latte, Burro 2 Pane, Latte, Carne, Olio 3 Latte, Carne, Frutta 4 Carne, Olio, Frutta 5 Pane, Burro, Olio, Frutta 6 Latte, Frutta 7 Pane, Burro, Olio, Carne, Frutta 8 Latte, Olio, Carne R. Massari (Docente: P. D'Urso) 5. MBA / 51

11 Frequenza relativa La frequenza relativa, o supporto, di un itemset è: s(x ) = σ(x ) m dove m è il numero di transazioni osservate. La frequenza relativa è la frazione di transazioni che contengono un itemset. La frequenza relativa dell'itemset (Pane, Olio) è s(pane, Olio)=3/8=0.38. R. Massari (Docente: P. D'Urso) 5. MBA / 51

12 Itemset frequenti Un itemset si dice frequente (frequent itemset) se la sua frequenza relativa è maggiore o uguale ad un certo valore soglia (minsup) pressato. Nell'esempio, supponiamo che sia stato ssato minsup = 0.5. L'itemset (Pane, Olio) non è frequente. Esiste qualche itemset frequente? Vericare per esercizio (suggerimento: ricordare che un itemset può anche essere composto da un solo item). R. Massari (Docente: P. D'Urso) 5. MBA / 51

13 Regola associativa Siano dati due itemset, X e Y, tali che: 1 sia X che Y siano sottoinsiemi dell'insieme I (insieme di tutti gli item presenti nel database delle transazioni); 2 X e Y non hanno elementi in comune. Una regola associativa tra i due itemset è denita come una implicazione, dalla forma X Y che si legge se si verica X, allora si verica Y. L'itemset X è detto l'antecedente della regola (lhs, left hand side). L'itemset Y è detto il conseguente della regola (rhs, right hand side). R. Massari (Docente: P. D'Urso) 5. MBA / 51

14 Esempio Dato il nostro esempio, una possibile regola associativa è: (Pane, Olio) (Carne) Data questa regola, ci si può chiedere quanto spesso i clienti comprano la carne insieme al pane e all'olio. Inoltre, tra i clienti che comprano pane ed olio, quanti comprano anche la carne? R. Massari (Docente: P. D'Urso) 5. MBA / 51

15 Metriche delle regole associative Per valutare la forza di una regola associativa sono necessari degli indici che ne valutino le caratteristiche. Questi indici sono anche detti metriche. Le metriche più utilizzate per valutare una regola associativa X Y sono: 1 Supporto; 2 Condenza. R. Massari (Docente: P. D'Urso) 5. MBA / 51

16 Supporto di una regola associativa Il supporto di una regola associativa è la frazione di transazioni che contengono sia X che Y sul totale delle transazioni s(x Y ) = σ(x Y ) m Con riferimento all'esempio già visto, il supporto della regola (Pane, Olio) (Carne) è 2/8=0.25, dal momento che i tre prodotti sono presenti in due transazioni (2 e 7) su otto. TID Items (prodotti acquistati) 1 Pane, Latte, Burro 2 Pane, Latte, Carne, Olio 3 Latte, Carne, Frutta 4 Carne, Olio, Frutta 5 Pane, Burro, Olio, Frutta 6 Latte, Frutta 7 Pane, Burro, Olio, Carne, Frutta 8 Latte, Olio, Carne R. Massari (Docente: P. D'Urso) 5. MBA / 51

17 Osservazione Tutte le regole associative generate dallo stesso itemset hanno lo stesso supporto, pari alla frequenza relativa dell'itemset. L'itemset (Pane, Olio, Carne) ha frequenza relativa pari a 0.25, e genera le seguenti 6 regole, tutte con supporto pari a 0.25 (controllare per esercizio). Regola associativa Supporto (Pane, Olio) (Carne) s = 0.25 (Pane, Carne) (Olio) s = 0.25 (Carne, Olio) (Pane) s = 0.25 (Pane) (Carne, Olio) s = 0.25 (Carne) (Pane, Olio) s = 0.25 (Olio) (Pane, Carne) s = 0.25 R. Massari (Docente: P. D'Urso) 5. MBA / 51

18 Condenza di una regola associativa La condenza di una regola associativa misura quanto spesso gli item in Y compaiono nelle transazioni che contengono X c(x Y ) = σ(x Y ) σ(x ) La condenza della regola (Pane, Olio) (Carne) è 2/3=0.67, ossia la carne è presente in due delle tre transazioni in cui sono presenti pane e olio. TID Items (prodotti acquistati) 1 Pane, Latte, Burro 2 Pane, Latte, Carne, Olio 3 Latte, Carne, Frutta 4 Carne, Olio, Frutta 5 Pane, Burro, Olio, Frutta 6 Latte, Frutta 7 Pane, Burro, Olio, Carne, Frutta 8 Latte, Olio, Carne R. Massari (Docente: P. D'Urso) 5. MBA / 51

19 Simmetria delle metriche Il supporto è una metrica simmetrica: s(x Y ) = σ(x Y ) m La condenza non è simmetrica: c(x Y ) = σ(x Y ) σ(x ) = σ(y X ) m σ(y X ) σ(y ) = s(y X ) = c(y X ) Osservazione: c(x Y ) = c(y X ) se e solo se σ(x ) = σ(y ) R. Massari (Docente: P. D'Urso) 5. MBA / 51

20 Sommario 1 La Market Basket Analysis Introduzione e denizioni Frequenza degli itemset Le regole associative 2 Data mining delle regole associative 3 Tabelle di contingenza e Market Basket Analysis Il lift 4 MBA e R 5 Esercizi R. Massari (Docente: P. D'Urso) 5. MBA / 51

21 Data mining delle regole associative Indichiamo con minsup e minconf valori soglia predeniti per il supporto e la condenza, rispettivamente. Un primo approccio per il data mining delle regole associative è il seguente: Association rules mining problem - Brute Force approach Dato un database di transazioni, il problema del data mining delle regole associative consiste nell'individuare all'interno del database tutte le regole X Y tali che: s(x Y ) minsup c(x Y ) minconf R. Massari (Docente: P. D'Urso) 5. MBA / 51

22 Osservazione Questa procedura è molto impegnativa dal punto di vista computazionale. Come osservato precedentemente, tutte le regole associative generate dallo stesso itemset hanno lo stesso supporto. Se l'itemset che genera un dato insieme di regole non è frequente, possiamo evitare di considerare tutte le regole generate da questo itemset, perché sicuramente non soddisfano il requisito: s(x Y ) minsup Questo approccio riduce drasticamente il numero di regole da considerare. R. Massari (Docente: P. D'Urso) 5. MBA / 51

23 Esempio Tornando all'esempio precedente: Regola associativa Supporto Condenza (Pane, Olio) (Carne) s = 0.25 c=0.67 (Pane, Carne) (Olio) s = 0.25 c=0.67 (Carne, Olio) (Pane) s = 0.25 c=0.5 (Pane) (Carne, Olio) s = 0.25 c=0.5 (Carne) (Pane, Olio) s = 0.25 c=0.4 (Olio) (Pane, Carne) s = 0.25 c=0.4 Se minsup = 0.5 possiamo eliminare dall'analisi le 6 regole. R. Massari (Docente: P. D'Urso) 5. MBA / 51

24 Data mining delle regole associative: Two step approach Un approccio alternativo è il seguente: Two step approach 1 generare un elenco di tutti gli itemset frequenti; 2 generare le regole a partire dagli itemset frequenti e considerare solo quelle che hanno condenza maggiore o uguale a minconf (regole forti). R. Massari (Docente: P. D'Urso) 5. MBA / 51

25 Generazione degli itemset frequenti Considerare solo gli itemset frequenti sposta il problema computazionale dal dominio delle regole a quello degli itemset. Occorrerebbe calcolare la frequenza di ogni itemset. Potenzialmente, un insieme I di n item può generare no a M = 2 n 1 itemset frequenti, detti itemset candidati. R. Massari (Docente: P. D'Urso) 5. MBA / 51

26 Se l'insieme I è composto di 5 items, gli itemset da controllare sono 31, come nella gura sottostante. Fonte: Tan et al. (2006) Introduction to Data Mining. R. Massari (Docente: P. D'Urso) 5. MBA / 51

27 Apriori principle La complessità computazionale della generazione degli itemset frequenti può essere semplicata grazie al seguente principio. Teorema: Apriori principle Se un itemset è frequente, allora anche tutti i suoi sottoinsiemi sono frequenti. Da questo teorema deriva che se un itemset non è frequente, allora neanche gli insiemi che lo contengono (supeset) sono frequenti. R. Massari (Docente: P. D'Urso) 5. MBA / 51

28 Rappresentazione graca dell'apriori principle/1 Fonte: Tan et al. (2006) Se (c, d, e) è un itemset frequente, tutti gli itemset in esso contenuti sono anch'essi frequenti. R. Massari (Docente: P. D'Urso) 5. MBA / 51

29 Rappresentazione graca dell'apriori principle/2 Fonte: Tan et al. (2006) Se (a, b) non è frequente, tutti gli itemset che lo contengono sono non frequenti e possono essere eliminati (support-based pruning). R. Massari (Docente: P. D'Urso) 5. MBA / 51

30 Sommario 1 La Market Basket Analysis Introduzione e denizioni Frequenza degli itemset Le regole associative 2 Data mining delle regole associative 3 Tabelle di contingenza e Market Basket Analysis Il lift 4 MBA e R 5 Esercizi R. Massari (Docente: P. D'Urso) 5. MBA / 51

31 Database di transazioni in forma binaria Un database di transazioni può anche essere rappresentato in forma binaria, con una matrice di dati in cui le colonne sono gli item, le righe le transazioni. Si assegna un valore pari a 1 ad un item se è presente in una transazione, 0 altrimenti. In questo modo ciascun item è rappresentato da una variabile binaria. R. Massari (Docente: P. D'Urso) 5. MBA / 51

32 Nel nostro esempio: TID Pane Latte Burro Carne Olio Frutta R. Massari (Docente: P. D'Urso) 5. MBA / 51

33 Tabella di contingenza Il confronto tra due item X e Y (o tra due itemset, più in generale) può essere eettuato tramite una tabella di contingenza del tipo: Y X 0 1 TOT. 0 n 00 n 01 n 0. 1 n 10 n 11 n 1. TOT. n.0 n.1 n dove (in particolare): n 11 è il numero di transazioni in cui compare sia X che Y. n 1. è il numero complessivo di transazioni in cui compare X (frequenza, o support count, di X ). n.1 è il numero complessivo di transazioni in cui compare Y (frequenza, o support count, di Y ). n è il numero totale di transazioni. R. Massari (Docente: P. D'Urso) 5. MBA / 51

34 Esempio Siano X =Pane e Y =Latte. La tabella di contingenza che rappresenta le transazioni con riferimento a questi due item è la seguente: Latte Pane 0 1 TOT TOT Ad esempio, n 11 = 2 rappresenta il totale di transazioni in cui sono stati acquistati sia il pane che il latte. n 1. = 4 è il totale di transazioni in cui è stato acquistato il pane, mentre n.1 = 5 è il totale di quelle in cui è stato acquistato il latte. R. Massari (Docente: P. D'Urso) 5. MBA / 51

35 Supporto e condenza per tabelle di contingenza Le formule per il calcolo del supporto e della condenza della regola associativa X Y diventano: s(x Y ) = n 11 n c(x Y ) = n 11 n 1. c(y X ) = n 11 n.1 R. Massari (Docente: P. D'Urso) 5. MBA / 51

36 Esempio Latte Pane 0 1 TOT TOT Nel nostro esempio, considerando la regola associativa Pane Latte, abbiamo che: s = 2 = 0.25, ossia il 25% dei clienti acquistano sia pane che latte. 8 c = 2 = 0.5, per cui il 50% dei clienti che hanno acquistato il pane 4 hanno acquistato anche il latte. c(latte Pane) = 2 = R. Massari (Docente: P. D'Urso) 5. MBA / 51

37 Osservazione La condenza di una regola può portare a risultati fuorvianti. Consideriamo la seguente tabella di contingenza, dove vengono riportati i consumi di vino e bevande analcoliche su un campione di 1000 persone. Bevande Vino 0 1 TOT TOT Il supporto della regola Vino Bevande è = 175/1000 = La condenza è 175/250 = 0.7. Se ssiamo minsup = 0.15 e minconf = 0.5, la regola considerata è forte. R. Massari (Docente: P. D'Urso) 5. MBA / 51

38 Osserviamo che la percentuale di chi acquista bevande analcoliche, indipendentemente dal fatto che acquisti vino o meno, è pari a 800/1000, ossia 80%. Questa percentuale è più elevata di quella di chi acquista bevande analcoliche tra i consumatori di vino, 70% (condenza). Consumare vino riduce, anche se di poco, la probabilità di acquistare bevande analcoliche, contrariamente a quanto suggerito dalla regola forte Vino Bevande. Il problema è che la condenza non tiene conto della correlazione esistente tra i due itemset della regola di associazione. R. Massari (Docente: P. D'Urso) 5. MBA / 51

39 Lift della regola associativa Una misura che tiene conto della correlazione tra itemset è il lift. Il lift della regola di associazione X Y è dato da: l(x Y ) = n 11/n 1. n.1 /n = n 11 n 11 dove n = n 1. n.1 11 è la frequenza congiunta attesa in caso di n indipendenza tra le due variabili binarie. R. Massari (Docente: P. D'Urso) 5. MBA / 51

40 Interpretazione del lift Se l > 1 c'è una associazione positiva tra gli itemset X e Y. Se l = 1 l'itemset X è indipendente dall'itemset Y. Se l < 1 c'è una associazione negativa tra gli itemset X e Y. Nell'esempio, anzitutto osserviamo che n 11 = = 200 e quindi l = 175/200 = 0.875, il che mostra una relazione negativa tra il consumo di bevande analcoliche e quello del vino. R. Massari (Docente: P. D'Urso) 5. MBA / 51

41 Sommario 1 La Market Basket Analysis Introduzione e denizioni Frequenza degli itemset Le regole associative 2 Data mining delle regole associative 3 Tabelle di contingenza e Market Basket Analysis Il lift 4 MBA e R 5 Esercizi R. Massari (Docente: P. D'Urso) 5. MBA / 51

42 Market Basket Analysis con R Il pacchetto arules fornisce gli strumenti per l'analisi di database con la Market Basket Analysis (insieme al pacchetto arulesviz, per la visualizzazione dei risultati). Un tutorial molto interessante, si trova al seguente indirizzo: R. Massari (Docente: P. D'Urso) 5. MBA / 51

43 Sommario 1 La Market Basket Analysis Introduzione e denizioni Frequenza degli itemset Le regole associative 2 Data mining delle regole associative 3 Tabelle di contingenza e Market Basket Analysis Il lift 4 MBA e R 5 Esercizi R. Massari (Docente: P. D'Urso) 5. MBA / 51

44 Esercizio 1 Data la seguente tabella di contingenza: verdure surgelati 0 1 Tot Tot calcolare il supporto della regola verdure surgelati; 2 calcolarne la condenza; 3 calcolarne il lift. R. Massari (Docente: P. D'Urso) 5. MBA / 51

45 Soluzioni esercizio 1 1 Supporto Condenza Lift R. Massari (Docente: P. D'Urso) 5. MBA / 51

46 Esercizio 2 Data la seguente tabella di contingenza: birra pannolini 0 1 Tot Tot calcolare il supporto della regola pannolini birra; 2 calcolarne la condenza; 3 calcolarne il lift. R. Massari (Docente: P. D'Urso) 5. MBA / 51

47 Soluzioni esercizio 2 1 Supporto Condenza Lift R. Massari (Docente: P. D'Urso) 5. MBA / 51

48 Esercizio 3 Data la seguente tabella di contingenza: olio burro 0 1 Tot Tot calcolare il supporto della regola burro olio; 2 calcolarne la condenza; 3 calcolarne il lift. R. Massari (Docente: P. D'Urso) 5. MBA / 51

49 Soluzioni esercizio 3 1 Supporto Condenza Lift R. Massari (Docente: P. D'Urso) 5. MBA / 51

50 Esercizio 4 Data la seguente tabella di contingenza: carne pesce 0 1 Tot Tot calcolare il supporto della regola carne pesce; 2 calcolarne la condenza; 3 calcolarne il lift. R. Massari (Docente: P. D'Urso) 5. MBA / 51

51 Soluzioni esercizio 4 1 Supporto Condenza Lift R. Massari (Docente: P. D'Urso) 5. MBA / 51

Regole associative Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007

Regole associative Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007 Regole associative Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 26/27 Introduzione Le regole associative si collocano tra i metodi di apprendimento non supervisionato e sono volte

Dettagli

Parallel Frequent Set Counting

Parallel Frequent Set Counting Parallel Frequent Set Counting Progetto del corso di Calcolo Parallelo AA 2001-02 Salvatore Orlando 1 Cosa significa association mining? Siano dati un insieme di item un insieme di transazioni, ciascuna

Dettagli

Lecture 14. Association Rules

Lecture 14. Association Rules Lecture 14 Association Rules Giuseppe Manco Readings: Chapter 6, Han and Kamber Chapter 14, Hastie, Tibshirani and Friedman Association Rule Mining Dato un insieme di transazioni, trovare le regole che

Dettagli

Regole associative. Il problema della scoperta di regole associative può essere espresso come segue Sia I = {i 1

Regole associative. Il problema della scoperta di regole associative può essere espresso come segue Sia I = {i 1 Regole associative Regole associative Le regole associative descrivono correlazioni di eventi e possono essere viste come regole probabilistiche. Due eventi sono correlati quando sono frequentemente osservati

Dettagli

Regole associative. Regole associative. Regole associative. Regole associative

Regole associative. Regole associative. Regole associative. Regole associative Le regole associative descrivono correlazioni di eventi e possono essere viste come regole probabilistiche. Due eventi sono correlati quando sono frequentemente osservati insieme. Esempio: database di

Dettagli

Regole di associazione

Regole di associazione M B G Regole di associazione ATA MINING: REGOLE I ASSOCIAZIONE - 1 Regole di associazione Ricerca di correlazioni in una collezione di dati strumento efficace per analizzare i dati senza conoscenza a priori

Dettagli

Parallel Frequent Set Counting

Parallel Frequent Set Counting Parallel Frequent Set Counting Progetto del corso di Calcolo Parallelo AA 2010-11 Salvatore Orlando 1 Cosa significa association mining? Siano dati un insieme di item un insieme di transazioni, ciascuna

Dettagli

Giuseppe Manco. Readings: Chapter 6, Han and Kamber Chapter 14, Hastie, Tibshirani and Friedman. Association rules mining

Giuseppe Manco. Readings: Chapter 6, Han and Kamber Chapter 14, Hastie, Tibshirani and Friedman. Association rules mining Lecture 14 Association Rules Giuseppe Manco Readings: Chapter 6, Han and Kamber Chapter 14, Hastie, Tibshirani and Friedman Association Rule Mining Dato un insieme di transazioni, trovare le regole che

Dettagli

Ingegneria della Conoscenza e Sistemi Esperti Lezione 2: Apprendimento non supervisionato

Ingegneria della Conoscenza e Sistemi Esperti Lezione 2: Apprendimento non supervisionato Ingegneria della Conoscenza e Sistemi Esperti Lezione 2: Apprendimento non supervisionato Dipartimento di Elettronica e Informazione Politecnico di Milano Apprendimento non supervisionato Dati un insieme

Dettagli

Pattern Sequenziali. Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna

Pattern Sequenziali. Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna Pattern Sequenziali Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna Pattern sequenziali Spesso alle transazioni sono associate informazioni temporali che permettono di collegare tra

Dettagli

Analisi Multivariata Prova intermedia del 20 aprile 2011

Analisi Multivariata Prova intermedia del 20 aprile 2011 Analisi Multivariata Prova intermedia del 20 aprile 20 Esercizio A Sia X N 3 (µ, Σ) con µ = [ 3,, 4] e 2 0 Σ = 2 5 0 0 0 2 Quali delle seguenti variabili casuali è indipendente? Motivare la risposta. A.

Dettagli

Informatica per le discipline umanistiche 2 lezione 11

Informatica per le discipline umanistiche 2 lezione 11 Informatica per le discipline umanistiche 2 lezione 11 Come si fa a costruire una base di dati? Dipende. Le persone che si iscrivono in università forniscono dati che popolano il database dellʼuniversità

Dettagli

Verifica 3 aprile Soluzioni

Verifica 3 aprile Soluzioni Università di Pisa A.A. 2007-2008 Data Mining - Corso di Laurea Specialistica in Informatica per l economia e l Azienda Verifica 3 aprile 2008 - Soluzioni Esercizio 1 - Sequential Patterns (8 punti) Si

Dettagli

Dispense Associazione PRELIMINARY DRAFT

Dispense Associazione PRELIMINARY DRAFT Dispense Associazione PRELIMINARY DRAFT Cristina Mollica & Jan Martin Rossi January 3, 2019 1 Esercizio 3 - Prova scritta 12-01-2018 Esercizio 3. Si consideri la distribuzione doppia di un campione di

Dettagli

Sono molti i casi in cui è possibile osservare o misurare su ognuna delle unità statistica di un collettivo più

Sono molti i casi in cui è possibile osservare o misurare su ognuna delle unità statistica di un collettivo più 1 Lavorare con più variabili Una delle finalità più comuni della raccolta di dati è la ricerca di relazioni tra fenomeni differenti del tipo causa effetto, con l obiettivo di interpretare, prevedere, simulare

Dettagli

Analisi dell associazione tra due caratteri

Analisi dell associazione tra due caratteri Analisi dell associazione tra due caratteri Non ci accontentiamo di analizzare il singolo fenomeno, considerato indipendentemente da altri fenomeni Ci interessano le relazioni che possono esistere tra

Dettagli

Esercizi di statistica

Esercizi di statistica Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..

Dettagli

Distribuzioni campionarie. Antonello Maruotti

Distribuzioni campionarie. Antonello Maruotti Distribuzioni campionarie Antonello Maruotti Outline 1 Introduzione 2 Concetti base Si riprendano le considerazioni fatte nella parte di statistica descrittiva. Si vuole studiare una popolazione con riferimento

Dettagli

Analisi Statistica dei Dati Misurazione e gestione dei rischi a.a. 2007-2008

Analisi Statistica dei Dati Misurazione e gestione dei rischi a.a. 2007-2008 Analisi Statistica dei Dati Misurazione e gestione dei rischi a.a. 2007-2008 Dott. Chiara Cornalba Argomenti Market Basket Analysis: Odds Ratio e Regole associative 2 Posizionamento prodotti Tanto più

Dettagli

Esercizi svolti. delle matrici

Esercizi svolti. delle matrici Esercizi svolti. astratti. Si dica se l insieme delle coppie reali (x, y) soddisfacenti alla relazione x + y è un sottospazio vettoriale di R La risposta è sì, perchè l unica coppia reale che soddisfa

Dettagli

Analisi bivariata. Il caso di caratteri qualitativi

Analisi bivariata. Il caso di caratteri qualitativi Analisi bivariata Il caso di caratteri qualitativi Pagina 337 Che cosa è l analisi bivariata? E lo studio congiunto di due caratteri Esempio nel caso di caratteri qualitativi: I valori delle celle derivano

Dettagli

PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE

PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) PROBABILITÀ SCHEDA

Dettagli

Algoritmi per la programmazione lineare: il metodo del simplesso

Algoritmi per la programmazione lineare: il metodo del simplesso Algoritmi per la programmazione lineare: il metodo del simplesso Dipartimento di Informatica, Universita' di Pisa A.A. 2018/2019 Contenuti della lezione Problemi di programmazione lineare, forma standard

Dettagli

NOZIONI DI CALCOLO DELLE PROBABILITÀ

NOZIONI DI CALCOLO DELLE PROBABILITÀ NOZIONI DI CALCOLO DELLE PROBABILITÀ ESPERIMENTO CASUALE: un esperimento si dice casuale quando gli esiti (manifestazioni o eventi) non possono essere previsti con certezza. PROVA: le ripetizioni, o occasioni

Dettagli

Sottospazi vettoriali

Sottospazi vettoriali Capitolo 6 Sottospazi vettoriali 6.1 Introduzione Riprendiamo un argomento già studiato ampiamente nel corso di Geometria, i sottospazi vettoriali di uno spazio vettoriale. Ci limiteremo a darne la definizione,

Dettagli

Statistica 1 A.A. 2015/2016

Statistica 1 A.A. 2015/2016 Corso di Laurea in Economia e Finanza Statistica 1 A.A. 2015/2016 (8 CFU, corrispondenti a 48 ore di lezione frontale e 24 ore di esercitazione) Prof. Luigi Augugliaro 1 / 27 Numeri indici e rapporti statistici

Dettagli

Parte V: Rilassamento Lagrangiano

Parte V: Rilassamento Lagrangiano Parte V: Rilassamento Lagrangiano Tecnica Lagrangiana Consideriamo il seguente problema di Programmazione Lineare Intera: P 1 min c T x L I Ax > b Cx > d x > 0, intera in cui A = matrice m x n C = matrice

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Misura dell associazione tra due caratteri Uno store manager è interessato a studiare la relazione

Dettagli

Dr. Marco Vicentini Anno Accademico Rev 02/04/2011

Dr. Marco Vicentini Anno Accademico Rev 02/04/2011 Università degli Studi di Padova Facoltà di Psicologia, L4, Psicometria, Modulo B Dr. Marco Vicentini marco.vicentini@unipd.it Anno Accademico 2010 2011 Rev 02/04/2011 Tabelle di contingenza Percentuali

Dettagli

Statistica Inferenziale

Statistica Inferenziale Statistica Inferenziale Prof. Raffaella Folgieri Email: folgieri@mtcube.com aa 2009/2010 Riepilogo lezione 1 Abbiamo visto: Definizioni di statistica, statistica inferenziale, probabilità (interpretazione

Dettagli

Fonti e strumenti statistici per la comunicazione

Fonti e strumenti statistici per la comunicazione Fonti e strumenti statistici per la comunicazione Introduzione all analisi bivariata: il caso di caratteri qualitativi Prof.ssa Isabella Mingo A.A. 016-017 Che cosa è l analisi bivariata? E lo studio congiunto

Dettagli

UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA.

UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA. Lezione 4 DISTRIBUZIONE DI FREQUENZA 1 DISTRIBUZIONE DI PROBABILITA Una variabile i cui differenti valori seguono una distribuzione di probabilità si chiama variabile aleatoria. Es:il numero di figli maschi

Dettagli

Statistica Descrittiva Soluzioni 8. Dipendenza

Statistica Descrittiva Soluzioni 8. Dipendenza ISTITUZIONI DI STATISTICA A. A. 2007/2008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona

Dettagli

Regole di Associazione

Regole di Associazione Metodologie per Sistemi Intelligenti Regole di Associazione Prof. Pier Luca Lanzi Laurea in Ingegneria Informatica Politecnico di Milano Polo regionale di Como Esempio Esempio Regole di Associazione Scopo

Dettagli

Probabilità: teoremi e distribuzioni

Probabilità: teoremi e distribuzioni Probabilità: teoremi e distribuzioni OBIETTIVO DIDATTICO DELLA LEZIONE Illustrare le più importanti distribuzioni di probabilità che vengono utilizzate in statistica Distribuzioni di probabilità 1. La

Dettagli

Università degli Studi di Cassino. Esercitazione di Statistica 2 dell Simona Balzano

Università degli Studi di Cassino. Esercitazione di Statistica 2 dell Simona Balzano Università degli Studi di Cassino Esercitazione di Statistica dell 8.0.007 Simona Balzano Esercizio 1 Uno studente supera una prova con probabilità pari a 0,6. Considerando un campione di ampiezza 10,

Dettagli

Sistemi lineari. Lorenzo Pareschi. Dipartimento di Matematica & Facoltá di Architettura Universitá di Ferrara

Sistemi lineari. Lorenzo Pareschi. Dipartimento di Matematica & Facoltá di Architettura Universitá di Ferrara Sistemi lineari Lorenzo Pareschi Dipartimento di Matematica & Facoltá di Architettura Universitá di Ferrara http://utenti.unife.it/lorenzo.pareschi/ lorenzo.pareschi@unife.it Lorenzo Pareschi (Univ. Ferrara)

Dettagli

STATISTICA (2) ESERCITAZIONE 2. Dott.ssa Antonella Costanzo

STATISTICA (2) ESERCITAZIONE 2. Dott.ssa Antonella Costanzo STATISTICA (2) ESERCITAZIONE 2 5.02.2014 Dott.ssa Antonella Costanzo Esercizio 1. La v.c. Normale: uso delle tavole E noto che un certo tipo di dati si distribuiscono secondo una gaussiana di media 10

Dettagli

Corso di Laurea in Informatica Calcolo delle Probabilità e Statistica (269AA) A.A. 2016/17 - Prova del

Corso di Laurea in Informatica Calcolo delle Probabilità e Statistica (269AA) A.A. 2016/17 - Prova del Corso di Laurea in Informatica Calcolo delle Probabilità e Statistica (69AA) A.A. 06/7 - Prova del 07-07-07 La durata della prova è di tre ore. Le risposte devono essere adeguatamente giustificate. Problema

Dettagli

NOTE DI ALGEBRA LINEARE v = a 1 v a n v n, w = b 1 v b n v n

NOTE DI ALGEBRA LINEARE v = a 1 v a n v n, w = b 1 v b n v n NOTE DI ALGEBRA LINEARE 2- MM 9 NOVEMBRE 2 Combinazioni lineari e generatori Sia K un campo e V uno spazio vettoriale su K Siano v,, v n vettori in V Definizione Un vettore v V si dice combinazione lineare

Dettagli

= elemento che compare nella seconda riga e quinta colonna = -4 In generale una matrice A di m righe e n colonne si denota con

= elemento che compare nella seconda riga e quinta colonna = -4 In generale una matrice A di m righe e n colonne si denota con Definizione di matrice Una matrice (di numeri reali) è una tabella di m x n numeri disposti su m righe e n colonne. I numeri che compaiono nella tabella si dicono elementi della matrice. La loro individuazione

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 015-016 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per la

Dettagli

Metodi Statistici per il Marketing. #05 Elementi di statistica inferenziale e di teoria dei campioni

Metodi Statistici per il Marketing. #05 Elementi di statistica inferenziale e di teoria dei campioni Corso di Metodi Statistici per il Marketing LUISS A.A. 2017-2018 #05 Elementi di statistica inferenziale e di teoria dei campioni 15 Marzo 2018 Alessio Guandalini (Docente: P. D Urso) #05 Elementi di statistica

Dettagli

Scoperta di sequenze di comportamento

Scoperta di sequenze di comportamento Scoperta di sequenze di comportamento Vincenzo Antonio Manganaro vincenzomang@virgilio.it, www.statistica.too.it Indice 1 Definizione del problema ed esempi. 1 2 Scoperta di sequenze. 5 3 Algoritmi per

Dettagli

materiale didattico II incontro

materiale didattico II incontro Piano Nazionale Lauree Scientifiche (PLS 016-017) Statistica Laboratorio di Statistica Le relazioni tra variabili. L indipendenza prof.ssa Angela Maria D'Uggento angelamaria.duggento@uniba.it materiale

Dettagli

STATISTICA 1 ESERCITAZIONE 6

STATISTICA 1 ESERCITAZIONE 6 STATISTICA 1 ESERCITAZIONE 6 Dott. Giuseppe Pandolfo 5 Novembre 013 CONCENTRAZIONE Osservando l ammontare di un carattere quantitativo trasferibile su un collettivo statistico può essere interessante sapere

Dettagli

Lezione 5 Corso di Statistica. Francesco Lagona

Lezione 5 Corso di Statistica. Francesco Lagona Lezione 5 Corso di Statistica Francesco Lagona Università Roma Tre F. Lagona (francesco.lagona@uniroma3.it) 1 / 23 obiettivi della lezione familiarizzare con le distribuzioni bivariate, le distribuzioni

Dettagli

UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA.

UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA. Lezione 4 DISTRIBUZIONE DI FREQUENZA 1 DISTRIBUZIONE DI PROBABILITA Una variabile i cui differenti valori seguono una distribuzione di probabilità si chiama variabile aleatoria. Es:il numero di figli maschi

Dettagli

1 Ampliamento del piano e coordinate omogenee

1 Ampliamento del piano e coordinate omogenee 1 Ampliamento del piano e coordinate omogenee Vogliamo dare una idea, senza molte pretese, dei concetti che stanno alla base di alcuni calcoli svolti nella classificazione delle coniche. Supponiamo di

Dettagli

Universita degli Studi di Roma Tor Vergata Facolta di Ingegneria Edile ed Edile/Architettura. Geometria Proiettiva Docente F.

Universita degli Studi di Roma Tor Vergata Facolta di Ingegneria Edile ed Edile/Architettura. Geometria Proiettiva Docente F. Universita degli Studi di Roma Tor Vergata Facolta di Ingegneria Edile ed Edile/Architettura Geometria Proiettiva Docente F. Flamini CONICHE PROIETTIVE: Classificazione e forme canoniche proiettive Si

Dettagli

Esercitazione di Statistica Indici di associazione

Esercitazione di Statistica Indici di associazione Esercitazione di Statistica Indici di associazione 28/10/2015 La relazione tra caratteri Indipendenza logica Quando si suppone che tra due caratteri non ci sia alcuna relazione di causa-effetto. Indipendenza

Dettagli

Esercizi di Probabilità e Statistica

Esercizi di Probabilità e Statistica Esercizi di Probabilità e Statistica Samuel Rota Bulò 29 maggio 2007 Test di indipendenza su tabelle di contingenza. Catene di Markov Esercizio Per controllare l efficacia di un vaccino vengono scelti

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2017-2018 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

MATEMATICA CORSO A II APPELLO 21 Luglio 2011

MATEMATICA CORSO A II APPELLO 21 Luglio 2011 MATEMATICA CORSO A II APPELLO 21 Luglio 2011 Soluzioni 1. Da un indagine statistica su un campione di 100 coppie è emersa la seguente tabella di frequenza del numero di figli: NUMERO FIGLI 0 1 2 3 4 5

Dettagli

Grafici e tabelle permettono di fare valutazioni qualitative, non quantitative. E necessario poter sintetizzare i dati attraverso due importanti

Grafici e tabelle permettono di fare valutazioni qualitative, non quantitative. E necessario poter sintetizzare i dati attraverso due importanti Grafici e tabelle permettono di fare valutazioni qualitative, non quantitative. E necessario poter sintetizzare i dati attraverso due importanti indici : Indici di posizione Indici di variazione Indici

Dettagli

IPOTESI SULLA FORMA DELLA DISTRIBUZIONE CASO DI UN CAMPIONE

IPOTESI SULLA FORMA DELLA DISTRIBUZIONE CASO DI UN CAMPIONE IPOTESI SULLA FORMA DELLA DISTRIBUZIONE CASO DI UN CAMPIONE Questo tipo di ipotesi non è fondata su un parametro PROBLEMA (1) Si vuole verificare se in una certa fascia oraria, dalle 18:00 alle 19:00,

Dettagli

Analisi delle corrispondenze

Analisi delle corrispondenze Analisi delle corrispondenze Obiettivo: analisi delle relazioni tra le modalità di due (o più) caratteri qualitativi Individuazione della struttura dell associazione interna a una tabella di contingenza

Dettagli

Capitolo 12. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 12.1: Suggerimento

Capitolo 12. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 12.1: Suggerimento Capitolo Suggerimenti agli esercizi a cura di Elena Siletti Esercizio.: Suggerimento Per verificare se due fenomeni sono dipendenti in media sarebbe necessario confrontare le medie condizionate, in questo

Dettagli

Successioni, massimo e minimo limite e compattezza in R

Successioni, massimo e minimo limite e compattezza in R Università di Roma Tor Vergata Corso di Laurea in Scienze e Tecnologie per i Media Successioni, massimo e minimo limite e compattezza in R Massimo A. Picardello BOZZA 10.11.2011 21:24 i CAPITOLO 1 Successioni

Dettagli

Ulteriori applicazioni del test del Chi-quadrato (χ 2 )

Ulteriori applicazioni del test del Chi-quadrato (χ 2 ) Ulteriori applicazioni del test del Chi-quadrato (χ 2 ) Finora abbiamo confrontato con il χ 2 le numerosità osservate in diverse categorie in un campione con le numerosità previste da un certo modello

Dettagli

Statistica Sociale - modulo A

Statistica Sociale - modulo A Statistica Sociale - modulo A e-mail: stella.iezzi@uniroma2.it in Excel in Excel e un evento (soggetto, entita, accadimento, caratteristica) osservato e registrato che si differenzia dall evento stesso,

Dettagli

incompatibili compatibili complementari eventi composti probabilità composta

incompatibili compatibili complementari eventi composti probabilità composta Un evento si dice casuale, o aleatorio, se il suo verificarsi dipende esclusivamente dal caso. La probabilità matematica p di un evento aleatorio è il rapporto fra il numero dei casi favorevoli f e il

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Associazione, correlazione e dipendenza tra caratteri In un collettivo di 11 famiglie è stata

Dettagli

PROVE SCRITTE, A.A. 2012/2013 P (Z = 2) = P (B 1 R 2 ) + P (R 1 B 2 ) = P (B 1 )P (R 2 B 1 ) = P (R 1 )P (B 2 R 1 ) =

PROVE SCRITTE, A.A. 2012/2013 P (Z = 2) = P (B 1 R 2 ) + P (R 1 B 2 ) = P (B 1 )P (R 2 B 1 ) = P (R 1 )P (B 2 R 1 ) = PROVE SCRITTE, A.A. 202/20 Giugno 20 () Un'urna contiene palline rosse e 2 palline bianche. Le estraiamo senza rimpiazzo nché non otteniamo almeno una pallina per ciascun colore. Denotiamo con X il numero

Dettagli

Corso di Laurea in Informatica Calcolo delle Probabilità e Statistica (269AA) A.A. 2016/17 - Prova del

Corso di Laurea in Informatica Calcolo delle Probabilità e Statistica (269AA) A.A. 2016/17 - Prova del Corso di Laurea in Informatica Calcolo delle Probabilità e Statistica (269AA) A.A. 206/7 - Prova del 207-09-08 La durata della prova è di tre ore. Le risposte devono essere adeguatamente giustificate.

Dettagli

Analisi dei dati corso integrato - Algebra lineare, e a b c 0. le soluzioni del sistema lineare omogeneo x d e f 2. a b c.

Analisi dei dati corso integrato - Algebra lineare, e a b c 0. le soluzioni del sistema lineare omogeneo x d e f 2. a b c. Analisi dei dati corso integrato - Algebra lineare 4.3.8 e 5.3.8-1 1. Nella lezione precedente abbiamo definito lo spazio nullo e lo spazio delle colonne di una matrice; ora definiamo lo spazio delle righe

Dettagli

Indice. Percentili Decili Quartili Ranghi Percentili

Indice. Percentili Decili Quartili Ranghi Percentili Indici di Posizione Indice Percentili Decili Quartili Ranghi Percentili quartile; con tale termine si intende una determinata percentuale di dati della distribuzione. I percentili, i quartili, i decili

Dettagli

Lezione 5 Corso di Statistica. Domenico Cucina

Lezione 5 Corso di Statistica. Domenico Cucina Lezione 5 Corso di Statistica Domenico Cucina Università Roma Tre D.Cucina (domenico.cucina@uniroma3.it) 1 / 24 obiettivi della lezione familiarizzare con le distribuzioni bivariate, le distribuzioni condizionate

Dettagli

5. Analisi dei dati di input

5. Analisi dei dati di input Anno accademico 2007/08 Analisi e scelta dei dati di input Per l esecuzione di una simulazione è necessario disporre di dati di input che siano una adeguata rappresentazione di ciò che accadrà in realtà

Dettagli

SOTTOSPAZI E OPERAZIONI IN SPAZI DIVERSI DA R n

SOTTOSPAZI E OPERAZIONI IN SPAZI DIVERSI DA R n SPAZI E SOTTOSPAZI 1 SOTTOSPAZI E OPERAZIONI IN SPAZI DIVERSI DA R n Spazi di matrici. Spazi di polinomi. Generatori, dipendenza e indipendenza lineare, basi e dimensione. Intersezione e somma di sottospazi,

Dettagli

NUMERI INTERI E POTENZE

NUMERI INTERI E POTENZE Saper operare con le potenze di numeri interi - Prof. Di Caprio 1 Obiettivo NUMERI INTERI E POTENZE In questa lezione richiameremo alcune proprietà dei numeri interi, e impareremo a operare con le potenze.

Dettagli

Analisi delle corrispondenze

Analisi delle corrispondenze Capitolo 11 Analisi delle corrispondenze L obiettivo dell analisi delle corrispondenze, i cui primi sviluppi risalgono alla metà degli anni 60 in Francia ad opera di JP Benzécri e la sua equipe, è quello

Dettagli

Programmazione lineare: basi e soluzioni di base

Programmazione lineare: basi e soluzioni di base Programmazione lineare:basi e soluzioni di base p. 1/33 Programmazione lineare: basi e soluzioni di base Mariantonia Cotronei Facoltà di Ingegneria Università degli Studi Mediterranea di Reggio Calabria

Dettagli

Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010.

Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010. Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010 Statistica Esercitazione 4 12 maggio 2010 Dipendenza in media. Covarianza e

Dettagli

CP110 Probabilità: Esame 4 giugno Testo e soluzione

CP110 Probabilità: Esame 4 giugno Testo e soluzione Dipartimento di Matematica, Roma Tre Pietro Caputo 202-3, II semestre 4 giugno, 203 CP0 Probabilità: Esame 4 giugno 203 Testo e soluzione . (6 pts) Un urna contiene inizialmente pallina rossa e 0 palline

Dettagli

Capitolo 5 Variabili aleatorie discrete notevoli Insegnamento: Statistica Applicata Corso di Laurea in "Scienze e Tecnologie Alimentari"

Capitolo 5 Variabili aleatorie discrete notevoli Insegnamento: Statistica Applicata Corso di Laurea in Scienze e Tecnologie Alimentari Levine, Krehbiel, Berenson Statistica Capitolo 5 Variabili aleatorie discrete notevoli Insegnamento: Statistica Applicata Corso di Laurea in "Scienze e Tecnologie Alimentari" Unità Integrata Organizzativa

Dettagli

MATRICI E SISTEMI LINEARI

MATRICI E SISTEMI LINEARI MATRICI E SISTEMI LINEARI - PARTE I - Felice Iavernaro Dipartimento di Matematica Università di Bari 27 Febbraio 2006 Felice Iavernaro (Univ. Bari) Matrici e Sistemi lineari 27/02/2006 1 / 1 Definizione

Dettagli

Matematica Lezione 21

Matematica Lezione 21 Università di Cagliari Corso di Laurea in Farmacia Matematica Lezione 21 Sonia Cannas 13/12/2018 Introduzione alla statistica descrittiva Statistica La statistica è una disciplina il cui fine è lo studio

Dettagli

1 Continuità di una funzione

1 Continuità di una funzione I.I.S. C. Marzoli - Liceo Scientico Statale G. Galilei Palazzolo s/o Classe 5I - Anno Scolastico 05/06 - Prof. Simone Alghisi Alcuni esercizi relativi alle funzioni continue Continuità di una funzione

Dettagli

Fonti e strumenti statistici per la comunicazione. La costruzione di misure relative semplici e complesse. Prof.ssa Isabella Mingo

Fonti e strumenti statistici per la comunicazione. La costruzione di misure relative semplici e complesse. Prof.ssa Isabella Mingo Fonti e strumenti statistici per la comunicazione La costruzione di misure relative semplici e complesse Prof.ssa Isabella Mingo A.A. 2018-2019 I numeri indice Si costruiscono rapportando due intensità

Dettagli

Y M F Calcolare X e darne un adeguata interpretazione;

Y M F Calcolare X e darne un adeguata interpretazione; Corso di Laurea INTERACOLTÀ - Esercitazione di tatistica n 4 EERCIZIO 1: Nella tabella sono riportati i dati inerenti il numero di anni di attività () ed il sesso () di 48 agenti di commercio dell azienda

Dettagli

Esercitazione. 24 Aprile 2012

Esercitazione. 24 Aprile 2012 Esercitazione 24 Aprile 2012 Il modello di regressione logistica viene utilizzato quando si è interessati a studiare o analizzare la relazione causale tra una variabile dipendente dicotomica e una o più

Dettagli

L'analisi bivariata (associazione e cograduazione)

L'analisi bivariata (associazione e cograduazione) L'analisi bivariata (associazione e cograduazione) Prof. Stefano Nobile Corso di Metodologia della ricerca sociale L analisi bivariata L analisi bivariata è un analisi delle relazioni tra due caratteristiche

Dettagli

Esercitazione 2 SAT. 11 Novembre Denizione del problema SAT

Esercitazione 2 SAT. 11 Novembre Denizione del problema SAT Esercitazione 2 SAT Corso di Fondamenti di Informatica II BIAR2 (Ing. Informatica e Automatica) e BSIR2 (Ing. dei Sistemi) A.A. 2010/2011 11 Novembre 2010 Sommario Scopo della esercitazione è quello di

Dettagli

Regole associative con Weka

Regole associative con Weka Regole associative con Weka Soluzioni degli esercizi Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna Apriori parametri e output In questa fase utilizzeremo il data set CensusTrainining.arff

Dettagli

Regole associative con Weka Testo degli esercizi. Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna

Regole associative con Weka Testo degli esercizi. Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna Regole associative con Weka Testo degli esercizi Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna Apriori parametri e output In questa fase utilizzeremo il data set CensusTrainining.arff

Dettagli

Elementi di teoria degli insiemi

Elementi di teoria degli insiemi ppendice Elementi di teoria degli insiemi.1 Introduzione Comincia qui l esposizione di alcuni concetti primitivi, molto semplici da un punto di vista intuitivo, ma a volte difficili da definire con grande

Dettagli

Definizione 1 Un insieme (V, +, ) dotato delle due operazioni: - + somma di elementi v 1 V, v 2 V ;

Definizione 1 Un insieme (V, +, ) dotato delle due operazioni: - + somma di elementi v 1 V, v 2 V ; Spazi vettoriali Definizione Un insieme (V, +, ) dotato delle due operazioni: - + somma di elementi v V, v V ; - prodotto per uno scalare λ K, (K campo); e chiuso rispetto ad esse, è uno spazio vettoriale

Dettagli

I Componenti del processo decisionale 7

I Componenti del processo decisionale 7 Indice Introduzione 1 I Componenti del processo decisionale 7 1 Business intelligence 9 1.1 Decisioni efficaci e tempestive........ 9 1.2 Dati, informazioni e conoscenza....... 12 1.3 Ruolo dei modelli

Dettagli

Esercitazioni del corso: STATISTICA

Esercitazioni del corso: STATISTICA A. A. 0-0 Esercitazioni del corso: STATISTICA Sommario Esercitazione 4: Medie e varianze marginali Medie e varianze condizionate Scomposizione della varianza Indipendenza in media ESERCIZIO UNIVERSITÀ

Dettagli

Capitolo 11 Test chi-quadro

Capitolo 11 Test chi-quadro Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 11 Test chi-quadro Insegnamento: Statistica Corsi di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara Docenti: Dott.

Dettagli

Esercitazioni per il corso di Logica Matematica

Esercitazioni per il corso di Logica Matematica Esercitazioni per il corso di Logica Matematica Luca Motto Ros 02 marzo 2005 Nota importante. Queste pagine contengono appunti personali dell esercitatore e sono messe a disposizione nel caso possano risultare

Dettagli

Corso di Laurea in Informatica Applicata Esame di Calcolo delle Probabilità e Statistica Prova scritta dell 11 gennaio 2007

Corso di Laurea in Informatica Applicata Esame di Calcolo delle Probabilità e Statistica Prova scritta dell 11 gennaio 2007 Corso di Laurea in Informatica Applicata Esame di Calcolo delle Probabilità e Statistica Prova scritta dell 11 gennaio 007 Primo esercizio Per una certa stampante S 1, la probabilità che un generico foglio

Dettagli