ELABORATO FINALE DI STATISTICA:

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "ELABORATO FINALE DI STATISTICA:"

Transcript

1 ELABORATO FINALE DI STATISTICA: PRIMA PARTE Analisi Descrittiva e Inferenziale di un campione di dati SECONDA PARTE Anova ad una via

2 PRIMA PARTE Analisi Descrittiva e Inferenziale di un campione di dati Dataset di riferimento: 5.out Introduzione: la STATISTICA La Statistica è una disciplina, molto importante nell ambito manageriale, che si occupa della trattazione dei dati rilevati su fenomeni misurabili, con lo scopo di sintetizzarli e interpretarli per prendere decisioni strategiche a riguardo. La statistica si divide in due classi principali: - DESCRITTIVA Questa si occupa di sintetizzare e rappresentare i dati a nostra disposizione. Nonostante sia molto utile, presenta un limite molto rilevante: essa si basa su un campione, quindi con essa non si può estendere l analisi a tutta la popolazione. - INFERENZIALE Questa è composta da un complesso di metodi che consentono di generalizzare ed estendere i dati del campione alla popolazione. I dati del campione vengono quindi considerati un fenomeno probabilistico. IL PROBLEMA STATISTICO Analisi di mercato per prossima apertura di un ristorante in una data location. Il campione a disposizione per l analisi è formato da persone che abitano nella città in cui si vuole iniziare la nuova attività, ed è costituito da potenziale clienti del futuro ristorante. Di queste persone abbiamo a disposizione dati riguardanti il reddito, l età e il sesso di appartenenza. Queste informazioni sono sufficienti per trarre conclusioni relative alla tipologia di locale da costituire. Il proprietario manifesta dubbi sulla tipologia di ristorante da creare: un luogo di lusso, rivolto a persone con un certo reddito e di una certa età, in grado di apprezzare l alto prezzo dei prodotti e l elevata qualità del locale; in alternativa una trattoria, con prodotti meno ricercati e più economici, in grado di essere apprezzati da ogni età e da un più esteso gruppo di persone. In base all analisi dei dati in nostro possesso si deciderà la tipologia di locale e la ricercatezza del menù offerto. Le considerazioni riguardanti il campione verranno poi estese a tutta la popolazione con metodi adeguati. Descrizione del DATASET: Un fenomeno statistico è caratterizzato da tre elementi fondamentali: - avere a disposizione le UNITA STATISTICHE: CAMPIONE= sottoinsieme di unità statistiche provenienti dalla popolazione selezionate per l analisi POPOLAZIONE= insieme degli elementi che si prendono in considerazione - le VARIABILI STATISTICHE: fenomeni che sono oggetto di studio. Esse possono essere: di tipo QUALITATIVO= non sono ordinabili, quindi non sono variabili numeriche. di tipo QUANTITATIVO= variabili numeriche, le cui risposte sono ordinabili. Si suddividono a loro volta in: CONTINUE, se derivano da un processo di misurazione, DISCRETE, se derivano da un processo di conteggio e assumono valori interi.

3 - la MATRICE DEI DATI o DATASET: rappresenta i dati a disposizione organizzati in una matrice di righe e colonne. Nelle colonne della matrice vengono inserite le variabili, mentre nelle righe le unità statistiche (o record). Il dataset, nel nostro caso, è formato da: - ampiezza del campione: 73 abitanti - n variabili: 3 - classificazione variabili: - reddito: per persona, variabile aleatoria continua - sesso: variabile aleatoria qualitativa: modalità corrispondente ai maschi, modalità corrispondente alle femmine. Maschi= 50, Femmine= 3 - età: variabile aleatoria quantitativa continua. ANALISI DEL CAMPIONE L analisi del nostro campione verrà svolta in un primo momento solo per la variabile età; successivamente anche per la variabile reddito. Entrambe le analisi verranno svolte essenzialmente in due parti: statistica descrittiva statistica inferenziale. STATISTICA DESCRITTIVA Il punto di partenza di ogni analisi statistica è il dataset. La statistica descrittiva consiste nell elaborazione dei dati contenuti nel dataset, la quale produce una sintesi rappresentabili con diversi grafici. E quindi un complesso di vari metodi che comprendono la raccolta, la presentazione e la caratterizzazione di un insieme di dati. Il suo scopo è di descrivere le caratteristiche del campione di riferimento in maniera appropriata. OBBIETTIVO DELLA NOSTRA ANALISI: Analizzare con gli strumenti statistici a nostra disposizione le variabili età, reddito e sesso, cercando di arrivare a conclusioni che permettano di prendere decisioni strategiche riguardo alla tipologia del ristorante da aprire e ai prodotti che in esso saranno disponibili. ANALISI DELLA VARIABILE ETA Per una corretta sinterizzazione dei dati si calcola per prima cosa la distribuzione delle frequenze per tutto il campione: per Frequenza si intende il conteggio del numero di unità statistiche (per le variabili numeriche) che cadono in un certo intervallo di valori, detto classe, oppure il conteggi delle unità statistiche (per le variabili categoriali) che assumono una data modalità. Nel nostro caso conteggeremo le persone che appartengono ad un determinato intervallo di età. Per organizzare i nostri dati in classi di raggruppamento, cioè intervalli di valori, è necessario calcolare innanzi tutto le principali misure descrittive della variabile età: Descriptive Statistics: età Variable N Mean Median TrMean StDev SE Mean età 73 45,53 46,00 45,45 5,7,84 Variable Minimum Maximum Q Q3 età 9,00 70,00 36,00 58,00 3

4 Vedo che i dati a disposizione sono 73 e sono compresi da un minimo di 9 a un massimo di 70 anni. Grazie a questi dati posso calcolare il RANGE del mio campione, pari alla differenza tra il valore massimo e quello minimo: 70-9=5. Inoltre, approssimando il valore della MEDIA (mean) per eccesso, si può affermare che l età media del campione è di circa 46 anni. Valuteremo più avanti l eventuale presenza di outliers, valori estremi che modificano significatamene l analisi. La MEDIANA (median) è anch essa pari a 46 anni. Questa rappresenta l elemento centrale di una successione ordinata di dati e non è soggetta a distorsioni provocate da osservazioni estreme. Il PRIMO e il TERZO QUARTILE (Q, Q3) sono rispettivamente di 36 e 58 anni. Lo SCARTO QUADRATICO MEDIO (StDev) vale circa 6 anni e ci aiuta a stabilire la dispersione dei dati intorno alla media. A questo punto si può passare a definire l ampiezza delle classi in cui suddividerò i miei dati. Vista l ampiezza del campione, sarà sufficiente suddividere i dati in 6 classi. E infatti buona norma scegliere un numero di classi da un minimo di 5 a un massimo di 5. Esse devono inoltre essere equispaziate e con estremi interi. Per determinare l ampiezza delle classi uso la formula: ampiezza classi = range / n classi Il valore risulta essere circa 9. Calcolo così: classi di età Count CumCnt Percent CumPct ) 5-4,74,74 ) ,8,9 3) ,66 46,58 4) ,70 60,7 5) ,66 84,93 6) ,07 00,00 N= 73 Noto intanto che gli estremi delle classi scelte sono disgiunte; questa è una buona norma per evitare il conteggio di valori estremi in classi contigue. La tabella presenta quattro colonne rappresentanti quattro diverse misure di frequenza:. frequenze ASSOLUTE. frequenze ASSOLUTE CUMULATE (che si ottengono sommando al numero di persone all interno di una classe quelle delle classi precedenti) 3. frequenze PERCENTUALI (si ottengono dividendo le frequenze assolute per il totale di persone e moltiplicando per 00) 4. frequenze PERCENTUALI CUMULATE (si ottengono come le cumulate assolute ma sommando le frequenze percentuali) Commento Dalla distribuzione delle frequenze si può notare come le classi più frequenti sono due, quella con età compresa tra i 35 e i 44 anni e quella dai 45 ai 64 anni, con entrambe una percentuale del 4,66% e 8 unità statistiche. Vi è poi la classe dai 5 ai 34 anni con una percentuale del 9,8%, subito seguita dalla classe dai 65 ai 74 anni con il 5,07% e da quella dai 45 ai 54 anni con il 3,70%. La classe con meno unità statistiche e la più bassa frequenza percentuale è quella dai 5 ai 4 anni. Da questi risultati si può osservare che la popolazione che stiamo analizzando è composta di persone di varie età, distribuite maggiormente nell età adulta, tra i 35 e i 64 anni. Nel nostro campione vi è invece una bassissima presenza di giovani al di sotto dei 5 anni. Questo ultimo dato è di grande utilità: possiamo fin d ora supporre che sarà conveniente rivolgersi ad una clientela adulta, che presenza gusti e necessità diverse da quelli di clienti molto giovani. 4

5 Per un analisi più veloce e immediata dei dati appena calcolati, possiamo usare un ausilio grafico: possiamo costruire un ISTOGRAMMA. Questo è un diagramma a barre verticali in cui le barre rettangolari hanno come base gli intervalli in cui sono state raggruppate le osservazioni. Nell asse delle ascisse è riportato il fenomeno preso in considerazione suddiviso in classi, mentre nell asse delle ordinate è riportata la frequenza. Nel nostro caso utilizzeremo l istogramma delle frequenze percentuali, molto usato per l analisi in statistica descrittiva. Un altro grafico molto utili nell analisi statistica è il POLIGONO, che come l istogramma presenta nell asse orizzontale il fenomeno oggetto di analisi, e in quello verticale il numero,la percentuale o la frequenza relativa di osservazioni per ogni intervallo di raggruppamento. Noi utilizziamo il poligono delle frequenze percentuali. Esso si costruisce scegliendo il punto medio di ciascuna classe a rappresentare tutte le osservazioni che cadono nella classe stessa, e congiungendo poi la sequenza dei punti medi alla percentuale di osservazioni nella classe corrispondente. POLIGONO DELLA VARIABILE ETA' 5 FREQUENZE % ETA'(anni)

6 Il BOXPLOT è un indicatore di variabilità che fornisce una rappresentazione grafica dei dati sulla base dei cinque numeri di sintesi: il valore minimo, il primo quartile, la mediana, il terzo quartile e il valore massimo del campione. Una scatola rettangolare i cui lati orizzontali,dove si congiungono i segmenti tratteggiati, rappresentano il primo e il terzo quartile.una linea orizzontale all interno del rettangolo che rappresenta la mediana e due segmenti tratteggiati che si iniziano ai lati del quadrato e finiscono al X max e X min. Da questo diagramma si può vedere come la mediana(linea continua all interno del rettangolo) sia spostata verso l alto,ciò genera l asimmetria già evidenziata dallo studio degli indici di sintesi.inoltre si vede come le linee tratteggiate siano pressoché della stessa lunghezza. All interno del rettangolo ci sono il 50% delle osservazioni Rappresentata la distribuzione dei dati, si procede all analisi degli INDICI STATISTICI, che si dividono in: misure di variabilità, di posizione e di forma. Essi si applicano solo su variabili numeriche, quando si considerano dati quantitativi. Le misure di posizione (dette misure di tendenza centrale,perché solitamente le osservazioni si concentrano attorno ad un valore centrale):. media aritmetica: si calcola dividendo dei valori osservati per il numero totale di osservazioni. E il punto di equilibrio tra le osservazioni più grandi e quelle più piccole, e si basa su tutte le osservazioni dell insieme di dati. Per questo motivo la media presenta un grosso limite: è molto influenzata da valori estremi, o outliers. Dove:n = ampiezza del campione. X i = i-esima osservazione della variabile età.. mediana: è il valore centrale di una successione ordinata di dati. E l osservazione che, nella serie di dati, lascia alla sua destra la metà delle osservazioni e a sinistra l altra metà di osservazioni. Non si basa su tutti dati del campione, e quindi non risulta influenzata dagli outliers. Rappresenta un buona misura sostitutiva della media in presenza di valori estremi. 3. moda: è il valore più frequente in un insieme di dati. Non è influenzata dagli outliers, ma viene utilizzata solo per scopi descrittivi per la sua maggiore variabilità rispetto alle altre misure di posizione. 4. midrange: è dato dalla media tra la più piccola e la più grande delle osservazioni di un insieme di dati. Midrange=(Xmax + Xmin)/. E molto influenzato dalla presenza di outliers. 5.media interquartile: è la media tra il primo e il terzo quartile 6

7 Media interquartile= (Q + Q 3 )/ I quartili sono misure descrittive che dividono i dati ordinati in quattro parti. Il primo quartile (Q) è il valore che lascia il 5% delle osservazioni più piccole e il 75% di quelle più grandi. Il terzo quartile (Q3) è tale che il 75% delle osservazioni sia più piccolo, mentre il 5% sia più grande. Le misure di variabilità ( misurano la quantità di dispersione presente nei dati):. Range: (o intervallo di variazione) è la differenza tra l osservazione più grande e quella più piccola di un insieme di dati. Misura la dispersione totale nell insieme di dati, ma non tiene conto di come essi si distribuiscano effettivamente tra il valore più piccolo e quello più grande. E quindi inadeguata in presenza di valori estremi.. Range Interquartile: è la differenza tra il terzo e il primo quartile in un insieme di dati. Sintetizza la dispersione del 50% delle osservazioni che occupano le posizioni centrali, e pertanto non è influenzata da valori estremi. 3. Varianza: è approssimativamente la media dei quadrati sugli scarti di ciascuna osservazione dalla media: più grande è il valore, più alta è la variabilità dei dati, in quanto essi si discostano maggiormente dal valore di posizione centrale. Sintetizza quindi la dispersione dei valori attorno alla media. L unità di misura corrisponde al quadrato di quella dei dati di partenza. S = Σ (X i ) / n- 4. Scarto quadratico medio: è la radice quadrata della varianza. E espresso nell unità di misura originaria ei dati. Anch esso ci aiuta a stabilire se e quanto i dati sono concentrati o dispersi intorno alla loro media. Per quasi tutti gli insiemi di dati, la maggior parte dei valori osservati si trova nell intervallo centrato sulla media e i cui estremi distano dalla media per uno scarto quadratico medio. Le misure di forma: prendono in considerazione la forma della distribuzione dei dati, cioè il modo in cui si distribuiscono. Per descrivere la forma è sufficiente confrontare la media con la mediana: asimmetria negativa o distribuzione obliqua a sinistra: media < mediana asimmetria positiva o distribuzione obliqua a destra: media > mediana simmetria: media = mediana. Il nostro campione di dati presenta una leggera asimmetria negativa, poichè la media è leggermente inferiore alla mediana. Poiché l analisi fatta fin d ora non può essere estesa a tutta la popolazione, limite della statistica descrittiva stessa, dobbiamo passare alla statistica inferenziale. LA STATISTICA INFERENZIALE Per poter ricavare conclusioni sulla popolazione, sulla base del campione, abbiamo bisogno di passare alla statistica inferenziale. E possibile considerare i dati statistici generati da un fenomeno probabilistico, da una variabile aleatoria casuale che può assumere infinite modalità. Il mio obiettivo è quello di verificare se la media calcolata per il mio campione coincide con quella della popolazione a cui appartiene. Per fare ciò devo individuare una funzione in grado di fornire la probabilità con la quale si realizza un certo dato. Lo strumento della statistica che ci viene in aiuto è la VERIFICA DI IPOTESI. Essa traduce un problema reale in un problema statistico e in base ai risultati 7

8 osservati sulla statistica campionaria permette di trarre conclusioni sulla verosimiglianza dell ipotesi formulata. La verifica d ipotesi ha inizio con la considerazione di una proposizione riguardante un parametro della popolazione. Si formula quindi un sistema di ipotesi composto da: - Ipotesi nulla H 0 :è sottoposta a verifica. Essa si riferisce sempre ad un parametro della popolazione, mai ad una statistica campionaria e in genere coincide con lo stato celle cose. Si riferisce al caso in cui il parametro della popolazione assuma il valore specificato da colui che compie l indagine. - Ipotesi Alternativa H : rappresenta la conclusione a cui si giunge quando si rifiuta l ipotesi nulla, qualora sulla base del campione si possa ritenere che è poco probabile che H 0 sia vera. Essa non contiene mai un segno di uguale, ed è l ipotesi opposta a quella nulla. Ritornando alla nostra analisi, supponiamo che la media della popolazione sia μ = 46; impongo allora il seguente sistema di ipotesi: H 0 : μ = 46 H : μ 46 Determinato il nostro sistema, dovremo verificare se l ipotesi nulla è vera o meno. A questo scopo supponiamo di poter estrarre dalla popolazione un infinità di campioni diversi con le proprie medie. A questo punto è necessaria la statistica test, una funzione che, fissata la media della popolazione, possa restituire la probabilità che ho di estrarre un campione con una determinata media. Per affrontare questa analisi è molto importante fissare la componente di incertezza o di rischio per determinare il valore della probabilità in base al quale accetto o meno l ipotesi nulla. Tutto ciò consiste nel dividere lo spazio campionario in due zone, una di accettazione e una di rifiuto. Le due zone sono separate dal valore al quale corrisponde la minima probabilità di accettare H 0, cioè al valore critico dello spazio campionario. Nella verifica di ipotesi è però molto facile compiere degli errori. I due più importanti e frequenti sono: - errore di prima specie: si verifica se si rifiuta l ipotesi nulla quando è vera. La probabilità che si verifichi un errore di questo tipo si chiama livello di significatività e si indica con il simbolo α. Per coefficiente ci confidenza (-α) si intende la probabilità che l ipotesi nulla non sia rifiutata quando è vera. E il complemento a uno dell errore di prima specie - errore di seconda specie: si verifica se si accetta l ipotesi nulla quando è falsa. La probabilità che si verifichi un errore di seconda specie è β, che viene anche detto rischio β o rischio del consumatore. La potenza della statistica test (- β) rappresenta la probabilità di rifiutare l ipotesi nulla quando è falsa. Scelgo il livello di significatività pari al 5%, e quindi α = 0,05. Esistono due tipologie di statistica test per test ad un campione: il Test Z, utilizzato in caso sia noto lo scarto quadratico medio della popolazione vera e propria; il Test T, utilizzato quando non si conosce lo scarto quadratico medio reale. Test T di Student Nel nostro caso è noto solo lo scarto quadratico medio del campione, è quindi utilizziamo questa statistica test. Il test T di Student è dato dalla seguente formula: x μ t = S n 8

9 One-Sample T: età Test of mu = 46 vs mu not = 46 Variable N Mean StDev SE Mean età 73 45,53 5,7,84 Variable 95,0% CI T P età ( 4,87; 49,0) -0,5 0,80 Histogram of età (with Ho and 95% t-confidence interval for the mean) 5 Frequency X Ho _ [ ] età Basandomi sulla regola decisionale del p-value (sistema usato dal software per prendere decisioni con aree piuttosto che percentili in un sistema di ipotesi) che mi dice di accettare H 0 se il p-value >=α, rifiutare H 0 se invece il p-value <α. Nel nostro caso il p-value è maggiore dell intervallo di confidenza scelto, quindi l ipotesi nulla viene accettata: l età media della nostra popolazione è di 46 anni. Questo vuol dire che il ristorante che sta per nascere, dovrà avere un arredamento sobrio, e in ogni modo adatto a signori e signore di mezza età. Anche il menù dovrà essere adatto a questa fascia d età. 9

10 ANALISI DELLA VARIABILE REDDITO Riprendiamo l analisi della seconda variabile, il reddito del nostro campione. Verrà eseguite le stese operazioni utilizzate per l analisi della variabile età, e anche gli stessi strumenti statistici. ANALISI DESCRITTIVA Le misure descrittive di base, che verranno utilizzate per calcolare le classi di reddito e per lo studio degli indici sono: Descriptive Statistics: reddito Variable N Mean Median TrMean StDev SE Mean reddito Variable Minimum Maximum Q Q3 reddito La media è abbastanza spostata dalla mediana. Questo ci permette di osservare fin d ora la probabile presenza di outliers, valori estremi che influenzano la media. La distribuzione è caratterizzata da un asimmetria positiva: infatti il valore della media è maggiore di quello della mediana. Il valore minimo di reddito è 80, mentre il valore massimo è di Il nostro range di valori sarà quindi: =3465. Lo scarto quadratico medio è di 93; ciò significa che la maggioranza dei dati si discostano dalla media di questo valore. Dividiamo ora i dati del reddito in classi. Anche per questa variabile scegliamo la divisione in 6 classi, tutte di uguale ampiezza pari a 45. Otteniamo: Tally for Discrete Variables: classi di reddito classi di reddito Count CumCnt Percent CumPct ) ,36 38,36 ) ,8 56,6 3) ,9 79,45 4) ,07 94,5 5) , 98,63 6) ,37 00,00 N= 73 Come si può notare dalla terza colonna, che rappresenta le frequenze percentuali, la classe di reddito più frequente è quella dai 80 ai 44 euro con circa il 38%. La seconda classe è quella dai 4670 ai 694 euro con il 3,9%, seguita dalla classe dai 45 ai 4669 euro con il 7,8 %, e da quella dai 695 ai 959 euro con il 5,07%. Le classi di reddito meno frequenti sono le ultime due, quelle dei redditi più alti, e cioè quella dai 960 agli 404 euro con il 4,%, e quella dagli 405 ai 3650 euro con l,37%. E probabile che sia in quest ultima il valore estremo che influenza la nostra media. Possiamo ora rappresentare la nostra variabile con metodi grafici, e cioè con l ISTOGRAMMA e il POLIGONO DELLE FREQUENZE PERCENTUALI della variabile reddito. 0

11 ISTOGRAMMA DELLA VARIABILE REDDITO 40 FREQUENZE % REDDITO POLIGONO DELLA VARIABILE REDDITO 30 FREQUENZE % REDDITO Nei grafici è rappresentata la distribuzione dei dati e si notano facilmente tutte le osservazioni fatte precedentemente: la frequenza di reddito delle varie classi, l andamento asimmetrico positivo della curva e così via. Per un analisi più approfondita della situazione conviene differenziare i due gruppi: maschi e femmine. Analizzando separatamente le distribuzioni di frequenze del reddito delle due categorie e facendo i dovuti confronti, si giungerà a risultati più attendibili.

12 Partiamo dalla categoria maschi. Individuiamo innanzitutto le misure descrittive di questo gruppo: Descriptive Statistics: reddito_maschi Variable N Mean Median TrMean StDev SE Mean reddito_ Variable Minimum Maximum Q Q3 reddito_ Le unità statistiche di questo campione sono 50. il valore minimo di reddito dei maschi è 560, mentre il valore massimo è Il range è : =3085. La media è 495, mentre la mediana è 4680: anche la distribuzione di frequenza del reddito dei maschi presenta quindi un asimmetria positiva, però è molto meno accentuata di quella della variabile reddito totale. Lo scarto quadratico medio è 503: tale sarà quindi la quantità di cui la maggioranza dei dati si discosta dalla media. Dividiamo ora i valori di reddito della categoria maschi in classi, utilizzando la stessa divisione precedentemente calcolata per il reddito totale: classi ci reddito_maschi Count CumCnt Percent CumPct ) ,00 6,00 ) ,00 50,00 3) ,00 74,00 4) ,00 9,00 5) ,00 98,00 6) ,00 00,00 N= 50 Vediamo che le classi più frequenti sono le prime tre: la prima che va dai 80 ai 44 euro con il 6%, le altre due, che vanno dai 45 ai 4669 e dai 4670 ai 694 euro, con il 4%. Vi è poi la classe dai 695 ai 959 con il 8%. La classe dai 960 ai 404 euro con il 6%, e quella da 405 ai 3650 con il %. La situazione rimane molto simile a quella generale, con la differenza che la distribuzione di maschi nelle prime 3 categorie di reddito è piuttosto omogenea. Rappresentiamo graficamente la situazione per avere un idea più chiara della situazione: POLIGONO DELLA VARIABILE REDDITO_MASCHI 30 FREQUENZE % REDDITO MASCHI

13 BOXPLOT REDDITO_MASCHI reddito_maschi Passiamo ora ad effettuare la stessa analisi per il reddito delle donne. Cominciamo con l osservare le misure descrittive: Descriptive Statistics: reddito_donne Variable N Mean Median TrMean StDev SE Mean reddito_ Variable Minimum Maximum Q Q3 reddito_ Le unità statistiche in questo caso sono solo 3, il valore minimo è 80, mentre il valore massimo è Il range risulta essere quindi: =70. Il valore appena trovato è molto più basso del range dei maschi; questo sta a significare che probabilmente le donne del nostro campione hanno redditi mediamente più bassi degli uomini. Ciò si vede anche dalla media che in questo caso vale 73, contro i 495 dei maschi. Il valore della mediana è 573, molto più basso della media; avremo dunque anche qui una distribuzione di frequenza asimmetrica positiva. Probabilmente anche qui vi è la presenza di un valore estremo, che potrebbe essere un reddito più basso degli altri. Lo scarto quadratico medio è 78: questo vuol dire che il gruppo delle donne è meno variabile di quello degli uomini. Dividiamo ora il gruppo del reddito delle donne in classi, seguendo la stessa suddivisione utilizzata in precedenza: classi di reddito_donne Count CumCnt Percent CumPct ) , 65, ) ,35 69,57 3) ,74 9,30 4) ,70 00,00 N= 3 Si vede che la classe di reddito più frequente è di gran lunga quella dai 80 ai 44 euro, con il 65,%. L altra classe significativa è quella dai 4670 ai 694 euro con il.74%. Le altre due classi presenti, quella dai 695 ai 959 euro con l 8,70% e quella dai 45 ai 4669 euro, sono poco presenti. S può notare che anche se vi 3

14 fosse la presenza di valori estremi non influenzerebbero significativamente questa distribuzione: la prima classe rimarrebbe comunque la più frequente. Rappresentiamo anche per le femmine i dati trovati coni grafici opportuni: POLIGONO DELLA VARIABILE REDDITO_FEMMINE 30 FREQUENZE % REDDITO FEMMINE BOXPLOT REDDITO_FEMMINE reddito_donne A questo punto è necessario fare un confronto più approfondito, prima di passare all analisi inferenziale dei nostri dati. Osservando e confrontando i dati appena calcolati per maschi e femmine, si nota che in media i maschi hanno un reddito più elevato delle donne: 495 contro 73 euro. Nonostante questa grande differenza nella media, la distribuzione dei redditi nelle due categorie è molto simile. Infatti nonostante il range degli uomini sia molto più vasto di quello delle donne, le frequenze più alte di reddito si riscontrano in 4

15 entrambi i casi nella prima classe, quella compresa tra i 80 e i 44 euro. Dopo questa classe nelle donne c è un abbassamento della percentuale che superati i 694 cade velocemente verso lo zero. Negli uomini invece si mantiene più o meno la stessa percentuale fino a 694 euro, e poi le frequenze scendono più o meno rapidamente. Per vedere meglio questi andamenti, possiamo visualizzare i due poligoni delle frequenze percentuali delle due categorie sovrapposti nello stesso grafico: POLIGONO DI CONFRONTO DEL REDDITO 30 FREQUENZE % REDDITO E utile anche un altro confronto grafico, quello dei boxplot delle due categorie di redito: BOXPLOT DI CONFRONTO REDDITO REDDITO reddito_maschi reddito_donne 5

16 Possiamo concludere che dai dati in nostro possesso la tipologia di ristorante più adeguato alle esigenze del nostro campione di persone è un trattoria, con un arredamento adatto a persone di mezza età e che presenti prezzi medio bassi. Il menù da proporre sarà probabilmente composto da piatti tradizionali, abbondanti e composti sia da carne che da pesce, così da incontrare i gusti della maggioranza. Si pone a questo punto un ulteriore problema: queste conclusioni sono state fatte rispetto al nostro campione, per arricchirle e renderle utilizzabile bisognerebbe conoscere tutta la popolazione. Devo passare quindi dall analisi descrittiva a quella inferenziale, e cercare di generalizzare i risultati ottenuti. ANALISI INFERENZIALE Anche in questo caso utilizzo la verifica di ipotesi e applico la statistica test più appropriata. Dobbiamo applicare in questo caso un test a due campioni e, visto che ancora una volta non conosco la varianza della popolazione ma solo quella del campione, utilizzo un test T di Student. La Statistica test in questo caso è. t = ( X X ) ( μ μ ) S p + n n dove: S p = ( n ) S + ( n ) ( n ) + ( n ) S S p = varianza ponderata X = media degli elementi del campione estratto dalla popolazione S = ampiezza del campione estratto dalla popolazione Il mio sistema di ipotesi è: H0: μ = μ H: μ > μ L ipotesi nulla H 0 rappresenta la situazione in cui il reddito medio maschile e quello femminile coincidano. L ipotesi alternativa H rappresenta invece il caso in cui il reddito maschile sia maggiore di quello femminile. Visto il sistema di ipotesi il test sarà ad una coda e il livello di significatività che scelgo è pari a α = 0,0. 6

17 Two-Sample T-Test and CI: reddito-maschi; reddito-donne Two-sample T for reddito-maschi vs reddito-donne N Mean StDev SE Mean reddito reddito Difference = mu reddito-maschi - mu reddito-donne Estimate for difference: 95 99% lower bound for difference: 54 T-Test of difference = 0 (vs >): T-Value = 3,6 P-Value = 0,00 DF = 7 Both use Pooled StDev = 756 Da questi dati osservo che il p-value è pari a 0.00, e quindi è inferiore al mio livello di significatività. Per questo motivo posso rifiutare l ipotesi nulla a favore di quella alternativa. CONCLUSIONI Dopo quest ultima analisi possiamo dire con certezza che la popolazione maschile guadagna di più di quella femminile. In seguito alle analisi effettuate fino a questo momento, è possibile determinare il tipo di ristorante più adeguato per il tipo di persone analizzate. Probabilmente sarà una trattoria-pizzeria, con un arredamento informale ma comunque elegante, adatto a persone adulte. Il locale offrirà una vasta scelta di piatti locali e tradizionali, con l aggiunta di qualche piatto leggero e meno abbondante per assecondare anche le necessità di bambini o persone con poco appetito. Il menù offrirà una varietà di scelta considerevole: piatti di carne, di pesce, e pizza. I prezzi saranno mediamente bassi, anche se portate particolarmente ricche in quantità e ricercate nel gusto, avranno prezzi elevati. Per quanto riguarda le bevande, la scelta non sarà molto ampia, soprattutto per quelle alla spina. Per i vini invece si avrà un occhio di riguardo, per permettere a eventuali intenditori di trovare il miglior abbinamento tra portate prelibate e vino. In questo modo siamo riusciti ad arrivare ad un compromesso: abbiamo una vasta gamma di prodotti, che sono prevalentemente rivolti a persone con un reddito non molto alto,come ad esempio le donne, ma vi è anche la possibilità di gustare piatti più costosi per coloro che possono permetterselo e anche per le donne, tenendo conto che molto spesso è l uomo a pagare per loro, soprattutto se sposate. Le nostre conclusioni sono sufficienti convincerci della nostra scelta. Tuttavia si potrebbe migliorarle studiando altri dati riguardanti locali di ristorazione, desideri delle persone; oppure interrogando più giovani e adolescenti per conoscere meglio le loro esigenze. 7

18 SECONDA PARTE Anova ad una via Dataset di riferimento: anova_beer_ IL PROBLEMA STATISTICO E stata fatta un indagine su &9 diverse birre di cui si è rilevato il prezzo e il tipo. L obiettivo è quello di realizzare una completa analisi descrittiva della variabile risposta e quindi condurre un Analisi della varianza ad una via, e i relativi confronti multipli sulla variabile price rispetto ai fattori type. Descrizione del DATASET Popolazione: l insieme delle birre Campione: sottoinsieme della popolazione Unità statistiche: 69 Variabile risposta: Price. E un aspetto del fenomeno di interesse oggetto di studio, del quale è disponibile una serie di misurazioni Fattore controllato: Type; esso può assumere cinque livelli o modalità, ogni livello identifica un gruppo; ogni gruppo contiene una o più risposte. Dato che per ogni tipo di birra ( fattore f i ) è stato assegnato un numero diverso di unità statistiche, posso dire che l esperimento è sbilanciato. STATISTICA DESCRITTIVA DELLA VARIABILE RISPOSTA Un assunzione necessaria per la validità della procedura ANOVA è la normalità delle distribuzioni dei gruppi da cui vengono prese le misure. Per verificare quest assunzione si effettua quindi l analisi descrittiva del campione. Rileviamo intanto le principali misure statistiche della variabile Price($) : Descriptive Statistics: Price($) Variable N Mean Median TrMean StDev SE Mean Price($) 69 4,963 4,790 4,947,447 0,74 Variable Minimum Maximum Q Q3 Price($),360 7,800 3,890 6,75 Otteniamo così I principali indici statistici, che ci saranno utili per la divisione in classi e per lo studio della distribuzione di frequenza della nostra variabile. Con lo stesso procedimento utilizzato nella prima parte della relazione, calcoliamo il range dei dati e decidiamo in quante classi raggrupparli. Il RANGE vale: X max X min nel nostro caso quindi vale: 7,8-,36=5,44. Dividiamo quindi i dati in 6 classi. Approssimando il range a 6, otteniamo lassi di ampiezza: 6/6=. Otteniamo quindi la seguente distribuzione delle frequenze: 8

19 classi di prezzi Count CumCnt Percent CumPct ),00-, ,4 0,4 )3,00-3, ,84 8,99 3)4,00-4, ,9 5,7 4)5,00-5, ,84 7,0 5)6,00-6, ,9 9,30 6)7,00-7, ,70 00,00 N= 69 Si può osservare che la massima frequenza si raggiunge nella classe 3. Se consideriamo le frequenze percentuali (colonna 3), la classe 3, che va dai 4,00 ai 4,99 dollari, è presente al 3,9%. E seguita: dalla classe 5, dai 6,00 ai 6,99 dollari, con il 0,9%; dalle classi e 4, che vanno rispettivamente dai 3,00 ai 3,99 e dai 5,00 ai 5,99, con entrambe il 8,84%; dalla classe,dai,00 ai,99 dollari, con il 0,4%; e infine dalla classe 6, dai 7,00 ai 7,99 dollari, con l 8,7%. Vediamo più dell 80% delle informazioni sono distribuite nelle quattro classi centrali in maniera abbastanza omogenea, mentre poi le frequenze tendono a diminuire nelle due classi estreme. La distribuzione quindi sembra abbastanza simmetrica. Per vedere meglio la distribuzione di frequenze della nostra variabile, costruiamo l istogramma relativo: ISTOGRAMMA DEI PREZZI 0 FREQUENZE % PREZZI ($) Dall istogramma delle frequenze si vede come la distribuzione sia piuttosto simmetrica. Per una completa analisi, bisogna però analizzare gli indici statistici già rilevati nella tabella delle misure statistiche principali. Indici di posizione Media: nel nostro caso risulta essere pari a dollari. Mediana: è dollari. La mediana rilevata è minore della media, quindi in realtà la distribuzione della variabile prezzi è quella di una leggera asimmetria positiva. Moda: il valore più frequente è 4,0 dollari ( X ) Midrange: max + X Midrange = min, quindi: (7,8+,36)/=5,08 ( Q ) Media interquartile: Q MediaInterquartile = 3, quindi: (3,89+6,75)=5,085 9

20 Indici di variabilità Range: già calcolato, è uguale a 5.44 dollari Range interquartile: Rangeint erquartile = Q3 Q, quindi: 6,75-3,89=,385. E questo il livello di dispersione entrale dei dati. Varianza: approssimativamente è la media degli scarti di ciascuna osservazione dalla media: ( X X ) i S = n Scarto quadratico medio: ha la stessa funzione della varianza, ma ha il pregio di avere la stessa unità di misura dei dati misurati. Corrisponde alla radice quadrata della varianza e nel nostro caso corrisponde a:.447. Il valore basso dello scarto sta a significare che i dati non si discostano molto dalla media. Coefficiente di variazione: è un indice utile quando si devono confrontare insiemi di dati con unità di misura differenti; è dimensionale e vale: S CV = X 00 30% Misure di forma Misurano la simmetria o il tipo di asimmetria della distribuzione. Dagli indici calcolati si rileva la leggera asimmetria positiva già visibile dalle frequenze percentuali e dall istogramma della variabile. Per un analisi completa della situazione sarà utile introdurre anche il secondo grafico fondamentale per l analisi di una variabile: il boxplot. BOXPLOT DELLA FREQUENZA DEI PREZZI 8 7 PREZZI ($) TIPO DI BIRRA Da questo diagramma si può vedere che la linea della mediana è leggermente spostata verso il basso rispetto alla media (segnalata dal puntino nero dentro alla scatola ), ciò genera l asimmetria. Le linee verticali al di fuori della scatola, che vanno dai quartili al minimo e massimo, sono pressoché uguali. Questo ci fa pensare che la 0

21 distribuzione può essere considerata simmetrica, e quindi si può considerare la normalità della distribuzione dei gruppi. Questa assunzione però sarà specificata con più chiarezza quando verrà effettuata l analisi della varianza. Terminata l analisi descrittiva della nostra variabile risposta possiamo ora passare alla statistica inferenziale, che in questo caso coinciderà con l analisi della varianza: l ANOVA. ANALISI DELLA VARIANZA: ANOVA ad una via Per confrontare le medie dei tre diversi campioni si utilizza una procedura di statistica inferenziale: l ANOVA AD UNA VIA (dall inglese Analysis Of Variance). Attraverso quest analisi possiamo estendere le osservazioni fatte riguardo al campione a tutta la popolazione, e siamo in grado di trarre delle conclusioni circa le possibili differenze fra le medie dei diversi gruppi. Il nostro obiettivo è quindi quello di confrontare i diversi livelli di tipo di birra e vedere se inducono una differente risposta media nelle osservazioni. Per applicare tale procedura è necessario che siano verificate le seguenti assunzioni: - La raccolta dei dati deve avvenire attraverso randomizzazione : è una procedura che permette di associare ad ogni unità statistica un livello di fattore in maniera del tutto casuale. - La distribuzione della media campionaria deve approssimativamente essere una distribuzione normale. Il Teorema del limite centrale ci assicura che se le unità statistiche sono indipendenti le une dalle altre, la distribuzione è abbastanza simmetrica e la numerosità campionaria è superiore a 5, si può approssimare la distribuzione come una normale. Se invece la numerosità campionaria è superiore a 4-5, si può dire che la distribuzione è normale indipendentemente dalla sua forma reale. Il campione di riferimento in questo caso è composto da 69 unità statistiche, e presenta anche una forma piuttosto simmetrica. Si può senz altro approssimare la sua distribuzione ad una normale. - I gruppi devono avere la stessa varianza. Molto importante è che le osservazioni derivano da una misurazione, e quindi quando applico un fattore f i (Type) il risultato di una misura y ij (risposta) è soggetto ad una componente di errore casuale, per cui: Y ij = μ i + E ij Dove: i = indice dei livelli dei fattori, varia quindi da a 5; j = indice della rilevazione che varia in base al tipo di fattore; Y ij = risposta ottenuta nel rilevamento j con il fattore al livello i; μ i = valore reale della misura al livello i; E ij = errore commesso nella rilevazione j con fattore i. A questo punto possiamo applicare la procedura, la quale consiste nel suddividere la variabilità totale delle osservazioni in una variabilità attribuibile tra i gruppi e una variabilità dovuta al caso inerente alle variazioni all interno dei gruppi.

22 SVOLGIMENTO Prima di passare all analisi di varianza vera e propria, possiamo confrontare i boxplot dei 5 tipi di birra. Boxplots of Price($) by Type (means are indicated by solid circles) Price($) Type Nel grafico sono indicate con puntini rossi le medie dei vari tipi di birra. Le birre più economiche sono quelle del gruppo quattro, le bionde leggere, mentre le più costose sono invece quelle del gruppo due, cioè le scure doppio malto. Si nota inoltre che le distribuzioni dei tipi sono quasi tutte leggermente asimmetriche positive, poiché la media è maggiore della mediana; solamente il livello 4 presenta un asimmetria negativa. Questo è anche il gruppo dove la media si distanzia di più dalla mediana. E invece il tipo di birra uno che presenta la maggiore variabilità. Dopo questa analisi, che ha solo una validità descrittiva, per determinare cosa succede realmente alla popolazione bisogna passare alla verifica di ipotesi. Il sistema di ipotesi, anche con questa procedura, è caratterizzato da un ipotesi nulla e da un ipotesi alternativa. Assumiamo che l ipotesi nulla H 0 sia che tutte le medie dei fattori siano tra loro uguali; nel caso in cui questo non sia vero, rifiuto H 0 e accetto l ipotesi alternativa H per cui esiste almeno un valore delle medie diverso: H 0 : μ = μ = μ3 = μ 4 = μ5 H = esiste almeno un μi tale che μ μ i, j i = j =,,3,4, 5 i j Risolvo il sistema attraverso una statistica test F di Fisher o di Snedecor e scelgo un livello di significatività pari a α = 0,05. Per utilizzare tale test è necessario studiare la variabilità dei dati. Si distinguono tre tipi di variabilità: - VARIABILITA TOTALE (SST): è la somma dei quadrati totali, ottenuta sommando i quadrati delle differenze tra ciascuna osservazione e la media complessiva:

23 dove: Y è la media complessiva Y ij è l osservazione i-esima del gruppo j-esimo n j è il numero di osservazioni del gruppo j-esimo Il numero di gradi di libertà di SST è n-, dove n è il numero delle osservazioni, e cioè 69. La variabilità totale nel nostro caso presenta 68 gradi di libertà. - VARIABILITA TRA GRUPPI (SSA): rappresenta la variabilità attribuibile alle differenze tra i gruppi (tipi di birra), e si ottiene sommando i quadrati delle differenze tra le medie campionarie di ciascun gruppo e la media complessiva: c i= n j ( ) Y Y dove: Y j è la media del gruppo j-esimo. I gradi di libertà di SSA sono c-, dove c è il numero dei livelli di fattore, che nel caso delle birre sono cinque. - VARIABILITA TRA I GRUPPI (SSW): rappresenta la variabilità dovuta al caso e inerente alle variazioni all interno dei gruppi. Si ottiene sommando i quadrati delle differenze tra ciascuna osservazione e la media del gruppo di appartenenza: I gradi di libertà di SSW sono n-c. SST = SSW = j= i= c nj j j= i= ( ) Y ij Y ( ) Y ij Y La relazione che lega i tre tipi di variabilità è: SST = SSA + SSW. Si può calcolare la statistica F per l ANOVA, ma prima bisogna calcolare le medie dei quadrati degli indici di variabilità appena analizzati: SSA SSW SST MSA MSA = MSW = MST = F = c n c n MSW La nostra statistica presenta quindi una distribuzione con (c-,n-c) gradi di libertà. Studiamo la varianza ad una via con un metodo molto più semplice: invece di svolgere tutti i calcoli sopra descritti, utilizziamo il software MINITAB, come abbiamo già fatto per tutte le altre analisi: One-way ANOVA: Price($) versus Type Analysis of Variance for Price($) Source DF SS MS F P Type 4 87,34,88 5,4 0,000 Error 64 54,970 0,859 Total 68 4,84 Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ,856,960 (---*----) 7 6,4965 0,7557 (---*---) 3 0 5,840 0,907 (----*---) 4 6 3,6044 0,673 (---*---) 5 3 4,0754,340 (---*---) Pooled StDev = 0,968 3,6 4,8 6,0 7, c nj 3

24 Il p-value (P) è minore del livello di significatività scelto (0,00<0,05), quindi rifiuto l ipotesi nulla. Questo significa che il costo dei cinque diversi tipi di birra è diverso. A questo punto bisogna confrontare i risultati ottenuti per determinare quale sia il tipo di birra più conveniente. Per fare ciò si utilizza un procedimento detto stima puntuale Per ottenere questa informazione uso il criterio dei minimi quadrati,con il quale si ricava la stima i-esima: τ = Y Trovo così le seguenti cinque stime: τ = stima puntuale del tipo τ = stima puntuale del tipo τ = stima puntuale del tipo 3 3 τ 4 = stima puntuale del tipo 4 τ = stima puntuale del tipo 5 5 i Y i Questo procedimento viene utilizzato solamente quando c è differenza tra le medie. Questo vuol dire che si passa a valutare questa stima solo quando si rifiuta l ipotesi nulla. Il grafico che rappresenta tutto ciò è: Main Effects Plot - Data Means for Price($) 6,5 Price($) 5,5 4,5 3,5 3 Type 4 5 Come avevamo già osservato dai boxplot il tipo di birra più economico risulta essere proprio il 4, e cioè quello formato dalle birre bionde leggere. Anche la stima puntuale, però, ha solo una valenza descrittiva. Bisogna verificare se quanto visto vale anche per l intera popolazione. Ancora una volta utilizziamo quindi la statistica inferenziale, e in particolare un procedimento detto confronti multipli a coppie : 4

25 Tukey's pairwise comparisons Family error rate = 0,0500 Individual error rate = 0,0066 Critical value = 3,97 Intervals for (column level mean) - (row level mean) -,5989-0, ,06-0,3644 0,65, ,803,9859,709,3 3,7983 3, ,397,465 0,6543 -,444,80 3,3796,849 0,5004 Con questo procedimento si effettuano confronti a coppie tra i prezzi di ciascun tipo di c c ( c ) birra, e il metodo utilizzato è quello di Turkey, che prevede = confronti. n Questa procedura analizza se tra i diversi tipi di birra ci sono differenze significative oppure no. Quando gli intervalli riportati nella matrice comprendono lo zero, significa che non c è una differenza significativa tra le risposte medie ottenute dai due tipi di birra considerati; quando lo zero non è invece compreso, allora la differenza è di una certa importanza. Abbiamo quindi: - confronto -: differenza significativa tra i due tipi di birra; - confronto -3: differenza non significativa (-,06<0<0,65) - confronto -4: differenza significativa - confronto -5: differenza non significativa (-0,397<0<,80) - confronto -3: differenza non significativa (-0,3644<0<,7093) - confronto -4: differenza significativa - confronto -5: differenza significativa - confronto 3-4: differenza significativa - confronto 3-5: differenza significativa - confronto 4-5: differenza non significativa (-,444<0<0,5004) I risultati ottenuti con i confronti multipli a coppie rispecchiano quelli tratti con le stime puntuali sul campione. CONCLUSIONI Dopo queste analisi accurate, possiamo concludere che il tipo di birra più economico è il quattro, è cioè quello formato dalle bionde leggere. In realtà però non esistono grandi differenze tra queste birre e quelle del gruppo cinque, le ultra leggere. Sicuramente le più costose sono invece le birre scure del gruppo due, le quali differiscono significativamente dai gruppi 4 o 5. 5

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2014-2015 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

L Analisi della Varianza ANOVA (ANalysis Of VAriance)

L Analisi della Varianza ANOVA (ANalysis Of VAriance) L Analisi della Varianza ANOVA (ANalysis Of VAriance) 1 CONCETTI GENERALI Finora abbiamo descritto test di ipotesi finalizzati alla verifica di ipotesi sulla differenza tra parametri di due popolazioni

Dettagli

Il concetto di valore medio in generale

Il concetto di valore medio in generale Il concetto di valore medio in generale Nella statistica descrittiva si distinguono solitamente due tipi di medie: - le medie analitiche, che soddisfano ad una condizione di invarianza e si calcolano tenendo

Dettagli

La distribuzione Normale. La distribuzione Normale

La distribuzione Normale. La distribuzione Normale La Distribuzione Normale o Gaussiana è la distribuzione più importante ed utilizzata in tutta la statistica La curva delle frequenze della distribuzione Normale ha una forma caratteristica, simile ad una

Dettagli

Un po di statistica. Christian Ferrari. Laboratorio di Matematica

Un po di statistica. Christian Ferrari. Laboratorio di Matematica Un po di statistica Christian Ferrari Laboratorio di Matematica 1 Introduzione La statistica è una parte della matematica applicata che si occupa della raccolta, dell analisi e dell interpretazione di

Dettagli

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione)

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione) Esercitazione #5 di Statistica Test ed Intervalli di Confidenza (per una popolazione) Dicembre 00 1 Esercizi 1.1 Test su media (con varianza nota) Esercizio n. 1 Il calore (in calorie per grammo) emesso

Dettagli

STATISTICA IX lezione

STATISTICA IX lezione Anno Accademico 013-014 STATISTICA IX lezione 1 Il problema della verifica di un ipotesi statistica In termini generali, si studia la distribuzione T(X) di un opportuna grandezza X legata ai parametri

Dettagli

Stima per intervalli Nei metodi di stima puntuale è sempre presente un ^ errore θ θ dovuto al fatto che la stima di θ in genere non coincide con il parametro θ. Sorge quindi l esigenza di determinare una

Dettagli

Corso di. Dott.ssa Donatella Cocca

Corso di. Dott.ssa Donatella Cocca Corso di Statistica medica e applicata Dott.ssa Donatella Cocca 1 a Lezione Cos'è la statistica? Come in tutta la ricerca scientifica sperimentale, anche nelle scienze mediche e biologiche è indispensabile

Dettagli

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: Esempi di domande risposta multipla (Modulo II) 1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: 1) ha un numero di elementi pari a 5; 2) ha un numero di elementi

Dettagli

Statistica. Lezione 6

Statistica. Lezione 6 Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 6 a.a 011-01 Dott.ssa Daniela Ferrante

Dettagli

CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI

CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI VERO FALSO CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI 1. V F Un ipotesi statistica è un assunzione sulle caratteristiche di una o più variabili in una o più popolazioni 2. V F L ipotesi nulla unita

Dettagli

Inferenza statistica. Statistica medica 1

Inferenza statistica. Statistica medica 1 Inferenza statistica L inferenza statistica è un insieme di metodi con cui si cerca di trarre una conclusione sulla popolazione sulla base di alcune informazioni ricavate da un campione estratto da quella

Dettagli

Grafici delle distribuzioni di frequenza

Grafici delle distribuzioni di frequenza Grafici delle distribuzioni di frequenza L osservazione del grafico può far notare irregolarità o comportamenti anomali non direttamente osservabili sui dati; ad esempio errori di misurazione 1) Diagramma

Dettagli

Corso di Psicometria Progredito

Corso di Psicometria Progredito Corso di Psicometria Progredito 3.1 Introduzione all inferenza statistica Prima Parte Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014

Dettagli

Capitolo 12 La regressione lineare semplice

Capitolo 12 La regressione lineare semplice Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 29-Analisi della potenza statistica vers. 1.0 (12 dicembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

iovanella@disp.uniroma2.it http://www.disp.uniroma2.it/users/iovanella Verifica di ipotesi

iovanella@disp.uniroma2.it http://www.disp.uniroma2.it/users/iovanella Verifica di ipotesi iovanella@disp.uniroma2.it http://www.disp.uniroma2.it/users/iovanella Verifica di ipotesi Idea di base Supponiamo di avere un idea del valore (incognito) di una media di un campione, magari attraverso

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 5-Indici di variabilità (vers. 1.0c, 20 ottobre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

Indici di dispersione

Indici di dispersione Indici di dispersione 1 Supponiamo di disporre di un insieme di misure e di cercare un solo valore che, meglio di ciascun altro, sia in grado di catturare le caratteristiche della distribuzione nel suo

Dettagli

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a) Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B Eventi indipendenti: un evento non influenza l altro Eventi disgiunti: il verificarsi di un evento esclude l altro Evento prodotto:

Dettagli

VERIFICA DELLE IPOTESI

VERIFICA DELLE IPOTESI VERIFICA DELLE IPOTESI Nella verifica delle ipotesi è necessario fissare alcune fasi prima di iniziare ad analizzare i dati. a) Si deve stabilire quale deve essere l'ipotesi nulla (H0) e quale l'ipotesi

Dettagli

Analisi Statistica per le Imprese (6 CFU) - a.a. 2010-2011 Prof. L. Neri RICHIAMI DI STATISTICA DESCRITTIVA UNIVARIATA

Analisi Statistica per le Imprese (6 CFU) - a.a. 2010-2011 Prof. L. Neri RICHIAMI DI STATISTICA DESCRITTIVA UNIVARIATA Analisi Statistica per le Imprese (6 CFU) - a.a. 2010-2011 Prof. L. Neri RICHIAMI DI STATISTICA DESCRITTIVA UNIVARIATA 1 Distribuzione di frequenza Punto vendita e numero di addetti PUNTO VENDITA 1 2 3

Dettagli

LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE

LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE DESCRIZIONE DEI DATI DA ESAMINARE Sono stati raccolti i dati sul peso del polmone di topi normali e affetti da una patologia simile

Dettagli

Misure della dispersione o della variabilità

Misure della dispersione o della variabilità QUARTA UNITA Misure della dispersione o della variabilità Abbiamo visto che un punteggio di per sé non ha alcun significato e lo acquista solo quando è posto a confronto con altri punteggi o con una statistica.

Dettagli

Indici (Statistiche) che esprimono le caratteristiche di simmetria e

Indici (Statistiche) che esprimono le caratteristiche di simmetria e Indici di sintesi Indici (Statistiche) Gran parte della analisi statistica consiste nel condensare complessi pattern di osservazioni in un indicatore che sia capace di riassumere una specifica caratteristica

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 10-Il test t per un campione e la stima intervallare (vers. 1.1, 25 ottobre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia,

Dettagli

Analisi della performance temporale della rete

Analisi della performance temporale della rete Analisi della performance temporale della rete In questo documento viene analizzato l andamento nel tempo della performance della rete di promotori. Alcune indicazioni per la lettura di questo documento:

Dettagli

Statistiche campionarie

Statistiche campionarie Statistiche campionarie Sul campione si possono calcolare le statistiche campionarie (come media campionaria, mediana campionaria, varianza campionaria,.) Le statistiche campionarie sono stimatori delle

Dettagli

Prova di autovalutazione Prof. Roberta Siciliano

Prova di autovalutazione Prof. Roberta Siciliano Prova di autovalutazione Prof. Roberta Siciliano Esercizio 1 Nella seguente tabella è riportata la distribuzione di frequenza dei prezzi per camera di alcuni agriturismi, situati nella regione Basilicata.

Dettagli

risulta (x) = 1 se x < 0.

risulta (x) = 1 se x < 0. Questo file si pone come obiettivo quello di mostrarvi come lo studio di una funzione reale di una variabile reale, nella cui espressione compare un qualche valore assoluto, possa essere svolto senza necessariamente

Dettagli

Dimensione di uno Spazio vettoriale

Dimensione di uno Spazio vettoriale Capitolo 4 Dimensione di uno Spazio vettoriale 4.1 Introduzione Dedichiamo questo capitolo ad un concetto fondamentale in algebra lineare: la dimensione di uno spazio vettoriale. Daremo una definizione

Dettagli

Capitolo 13: L offerta dell impresa e il surplus del produttore

Capitolo 13: L offerta dell impresa e il surplus del produttore Capitolo 13: L offerta dell impresa e il surplus del produttore 13.1: Introduzione L analisi dei due capitoli precedenti ha fornito tutti i concetti necessari per affrontare l argomento di questo capitolo:

Dettagli

Facciamo qualche precisazione

Facciamo qualche precisazione Abbiamo introdotto alcuni indici statistici (di posizione, di variabilità e di forma) ottenibili da Excel con la funzione Riepilogo Statistiche Facciamo qualche precisazione Al fine della partecipazione

Dettagli

LABORATORIO EXCEL XLSTAT 2008 SCHEDE 2 e 3 VARIABILI QUANTITATIVE

LABORATORIO EXCEL XLSTAT 2008 SCHEDE 2 e 3 VARIABILI QUANTITATIVE Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) LABORATORIO EXCEL

Dettagli

Come costruire una distribuzione di frequenze per caratteri quantitativi continui

Come costruire una distribuzione di frequenze per caratteri quantitativi continui Come costruire una distribuzione di frequenze per caratteri quantitativi continui Consideriamo i dati contenuti nel primo foglio di lavoro (quello denominato dati) del file esempio2.xls. I dati si riferiscono

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 12-Il t-test per campioni appaiati vers. 1.2 (7 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

Esercitazione n.2 Inferenza su medie

Esercitazione n.2 Inferenza su medie Esercitazione n.2 Esercizio L ufficio del personale di una grande società intende stimare le spese mediche familiari dei suoi impiegati per valutare la possibilità di attuare un programma di assicurazione

Dettagli

LE FUNZIONI A DUE VARIABILI

LE FUNZIONI A DUE VARIABILI Capitolo I LE FUNZIONI A DUE VARIABILI In questo primo capitolo introduciamo alcune definizioni di base delle funzioni reali a due variabili reali. Nel seguito R denoterà l insieme dei numeri reali mentre

Dettagli

LEZIONE n. 5 (a cura di Antonio Di Marco)

LEZIONE n. 5 (a cura di Antonio Di Marco) LEZIONE n. 5 (a cura di Antonio Di Marco) IL P-VALUE (α) Data un ipotesi nulla (H 0 ), questa la si può accettare o rifiutare in base al valore del p- value. In genere il suo valore è un numero molto piccolo,

Dettagli

1. Distribuzioni campionarie

1. Distribuzioni campionarie Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 2012/2013 lezioni di statistica del 3 e 6 giugno 2013 - di Massimo Cristallo - 1. Distribuzioni campionarie

Dettagli

LE SUCCESSIONI 1. COS E UNA SUCCESSIONE

LE SUCCESSIONI 1. COS E UNA SUCCESSIONE LE SUCCESSIONI 1. COS E UNA SUCCESSIONE La sequenza costituisce un esempio di SUCCESSIONE. Ecco un altro esempio di successione: Una successione è dunque una sequenza infinita di numeri reali (ma potrebbe

Dettagli

Statistica e biometria. D. Bertacchi. Variabili aleatorie. V.a. discrete e continue. La densità di una v.a. discreta. Esempi.

Statistica e biometria. D. Bertacchi. Variabili aleatorie. V.a. discrete e continue. La densità di una v.a. discreta. Esempi. Iniziamo con definizione (capiremo fra poco la sua utilità): DEFINIZIONE DI VARIABILE ALEATORIA Una variabile aleatoria (in breve v.a.) X è funzione che ha come dominio Ω e come codominio R. In formule:

Dettagli

Capitolo 11 Test chi-quadro

Capitolo 11 Test chi-quadro Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 11 Test chi-quadro Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università di Padova

Dettagli

Per studio di funzione intendiamo un insieme di procedure che hanno lo scopo di analizzare le proprietà di una funzione f ( x) R R

Per studio di funzione intendiamo un insieme di procedure che hanno lo scopo di analizzare le proprietà di una funzione f ( x) R R Studio di funzione Per studio di funzione intendiamo un insieme di procedure che hanno lo scopo di analizzare le proprietà di una funzione f ( x) R R : allo scopo di determinarne le caratteristiche principali.

Dettagli

Capitolo 2. Operazione di limite

Capitolo 2. Operazione di limite Capitolo 2 Operazione di ite In questo capitolo vogliamo occuparci dell operazione di ite, strumento indispensabile per scoprire molte proprietà delle funzioni. D ora in avanti riguarderemo i domini A

Dettagli

RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL

RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL 1 RAPPRESENTAZIONE GRAFICA Per l analisi dati con Excel si fa riferimento alla versione 2007 di Office, le versioni successive non differiscono

Dettagli

4 3 4 = 4 x 10 2 + 3 x 10 1 + 4 x 10 0 aaa 10 2 10 1 10 0

4 3 4 = 4 x 10 2 + 3 x 10 1 + 4 x 10 0 aaa 10 2 10 1 10 0 Rappresentazione dei numeri I numeri che siamo abituati ad utilizzare sono espressi utilizzando il sistema di numerazione decimale, che si chiama così perché utilizza 0 cifre (0,,2,3,4,5,6,7,8,9). Si dice

Dettagli

Analisi e diagramma di Pareto

Analisi e diagramma di Pareto Analisi e diagramma di Pareto L'analisi di Pareto è una metodologia statistica utilizzata per individuare i problemi più rilevanti nella situazione in esame e quindi le priorità di intervento. L'obiettivo

Dettagli

Psicometria (8 CFU) Corso di Laurea triennale STANDARDIZZAZIONE

Psicometria (8 CFU) Corso di Laurea triennale STANDARDIZZAZIONE Psicometria (8 CFU) Corso di Laurea triennale Un punteggio all interno di una distribuzione è in realtà privo di significato se preso da solo. Sapere che un soggetto ha ottenuto un punteggio x=52 in una

Dettagli

Analisi di dati di frequenza

Analisi di dati di frequenza Analisi di dati di frequenza Fase di raccolta dei dati Fase di memorizzazione dei dati in un foglio elettronico 0 1 1 1 Frequenze attese uguali Si assuma che dalle risposte al questionario sullo stato

Dettagli

ANALISI DELLE FREQUENZE: IL TEST CHI 2

ANALISI DELLE FREQUENZE: IL TEST CHI 2 ANALISI DELLE FREQUENZE: IL TEST CHI 2 Quando si hanno scale nominali o ordinali, non è possibile calcolare il t, poiché non abbiamo medie, ma solo frequenze. In questi casi, per verificare se un evento

Dettagli

f(x) = 1 x. Il dominio di questa funzione è il sottoinsieme proprio di R dato da

f(x) = 1 x. Il dominio di questa funzione è il sottoinsieme proprio di R dato da Data una funzione reale f di variabile reale x, definita su un sottoinsieme proprio D f di R (con questo voglio dire che il dominio di f è un sottoinsieme di R che non coincide con tutto R), ci si chiede

Dettagli

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010 LEZIONE 3 "Educare significa aiutare l'animo dell'uomo ad entrare nella totalità della realtà. Non si può però educare se non rivolgendosi alla libertà, la quale definisce il singolo, l'io. Quando uno

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2013-2014 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

Siamo così arrivati all aritmetica modulare, ma anche a individuare alcuni aspetti di come funziona l aritmetica del calcolatore come vedremo.

Siamo così arrivati all aritmetica modulare, ma anche a individuare alcuni aspetti di come funziona l aritmetica del calcolatore come vedremo. DALLE PESATE ALL ARITMETICA FINITA IN BASE 2 Si è trovato, partendo da un problema concreto, che con la base 2, utilizzando alcune potenze della base, operando con solo addizioni, posso ottenere tutti

Dettagli

L analisi dei rischi: l aspetto statistico Ing. Pier Giorgio DELLA ROLE Six Sigma Master Black Belt

L analisi dei rischi: l aspetto statistico Ing. Pier Giorgio DELLA ROLE Six Sigma Master Black Belt L analisi dei rischi: l aspetto statistico Ing. Pier Giorgio DELL ROLE Six Sigma Master lack elt Dicembre, 009 Introduzione Nell esecuzione dei progetti Six Sigma è di fondamentale importanza sapere se

Dettagli

Statistica descrittiva: prime informazioni dai dati sperimentali

Statistica descrittiva: prime informazioni dai dati sperimentali SECONDO APPUNTAMENTO CON LA SPERIMENTAZIONE IN AGRICOLTURA Statistica descrittiva: prime informazioni dai dati sperimentali La statistica descrittiva rappresenta la base di partenza per le applicazioni

Dettagli

3. Confronto tra medie di due campioni indipendenti o appaiati

3. Confronto tra medie di due campioni indipendenti o appaiati BIOSTATISTICA 3. Confronto tra medie di due campioni indipendenti o appaiati Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk MARTA BLANGIARDO

Dettagli

Istituzioni di Statistica e Statistica Economica

Istituzioni di Statistica e Statistica Economica Istituzioni di Statistica e Statistica Economica Università degli Studi di Perugia Facoltà di Economia, Assisi, a.a. 2013/14 Esercitazione n. 4 A. Si supponga che la durata in giorni delle lampadine prodotte

Dettagli

SPC e distribuzione normale con Access

SPC e distribuzione normale con Access SPC e distribuzione normale con Access In questo articolo esamineremo una applicazione Access per il calcolo e la rappresentazione grafica della distribuzione normale, collegata con tabelle di Clienti,

Dettagli

Test statistici di verifica di ipotesi

Test statistici di verifica di ipotesi Test e verifica di ipotesi Test e verifica di ipotesi Il test delle ipotesi consente di verificare se, e quanto, una determinata ipotesi (di carattere biologico, medico, economico,...) è supportata dall

Dettagli

Esercizi test ipotesi. Prof. Raffaella Folgieri Email: folgieri@mtcube.com aa 2009/2010

Esercizi test ipotesi. Prof. Raffaella Folgieri Email: folgieri@mtcube.com aa 2009/2010 Esercizi test ipotesi Prof. Raffaella Folgieri Email: folgieri@mtcube.com aa 2009/2010 Verifica delle ipotesi - Esempio quelli di Striscia la Notizia" effettuano controlli casuali per vedere se le pompe

Dettagli

VARIABILI E DISTRIBUZIONI DI FREQUENZA A.A. 2010/2011

VARIABILI E DISTRIBUZIONI DI FREQUENZA A.A. 2010/2011 VARIABILI E DISTRIBUZIONI DI FREQUENZA A.A. 2010/2011 1 RAPPRESENTARE I DATI: TABELLE E GRAFICI Un insieme di misure è detto serie statistica o serie dei dati 1) Una sua prima elementare elaborazione può

Dettagli

Misure di base su una carta. Calcoli di distanze

Misure di base su una carta. Calcoli di distanze Misure di base su una carta Calcoli di distanze Per calcolare la distanza tra due punti su una carta disegnata si opera nel modo seguente: 1. Occorre identificare la scala della carta o ricorrendo alle

Dettagli

I ESERCITAZIONE. Gruppo I 100 individui. Trattamento I Nuovo Farmaco. Osservazione degli effetti sul raffreddore. Assegnazione casuale

I ESERCITAZIONE. Gruppo I 100 individui. Trattamento I Nuovo Farmaco. Osservazione degli effetti sul raffreddore. Assegnazione casuale I ESERCITAZIONE ESERCIZIO 1 Si vuole testare un nuovo farmaco contro il raffreddore. Allo studio partecipano 200 soggetti sani della stessa età e dello stesso sesso e con caratteristiche simili. i) Che

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Test delle ipotesi per la media (varianza nota), p-value del test Il manager di un fast-food

Dettagli

( x) ( x) 0. Equazioni irrazionali

( x) ( x) 0. Equazioni irrazionali Equazioni irrazionali Definizione: si definisce equazione irrazionale un equazione in cui compaiono uno o più radicali contenenti l incognita. Esempio 7 Ricordiamo quanto visto sulle condizioni di esistenza

Dettagli

E naturale chiedersi alcune cose sulla media campionaria x n

E naturale chiedersi alcune cose sulla media campionaria x n Supponiamo che un fabbricante stia introducendo un nuovo tipo di batteria per un automobile elettrica. La durata osservata x i delle i-esima batteria è la realizzazione (valore assunto) di una variabile

Dettagli

Il confronto fra proporzioni

Il confronto fra proporzioni L. Boni Il rapporto Un rapporto (ratio), attribuendo un ampio significato al termine, è il risultato della divisione di una certa quantità a per un altra quantità b Il rapporto Spesso, in maniera più specifica,

Dettagli

Metodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Metodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo Metodi statistici per l economia (Prof. Capitanio) Slide n. 9 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 TEST D IPOTESI Partiamo da un esempio presente sul libro di testo.

Dettagli

Alessandro Pellegrini

Alessandro Pellegrini Esercitazione sulle Rappresentazioni Numeriche Esistono 1 tipi di persone al mondo: quelli che conoscono il codice binario e quelli che non lo conoscono Alessandro Pellegrini Cosa studiare prima Conversione

Dettagli

Capitolo Terzo Valore attuale e costo opportunità del capitale

Capitolo Terzo Valore attuale e costo opportunità del capitale Capitolo Terzo Valore attuale e costo opportunità del capitale 1. IL VALORE ATTUALE La logica di investimento aziendale è assolutamente identica a quella adottata per gli strumenti finanziari. Per poter

Dettagli

Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI

Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI 1. L azienda Wood produce legno compensato per costruzioni

Dettagli

Il significato della MEDIA e della MEDIANA in una raccolta di dati numerici

Il significato della MEDIA e della MEDIANA in una raccolta di dati numerici Il significato della MEDIA e della MEDIANA in una raccolta di dati numerici Ogni qual volta si effettua una raccolta di dati di tipo numerico è inevitabile fornirne il valore medio. Ma che cos è il valore

Dettagli

Abbiamo costruito il grafico delle sst in funzione del tempo (dal 1880 al 1995).

Abbiamo costruito il grafico delle sst in funzione del tempo (dal 1880 al 1995). ANALISI DI UNA SERIE TEMPORALE Analisi statistica elementare Abbiamo costruito il grafico delle sst in funzione del tempo (dal 1880 al 1995). Si puo' osservare una media di circa 26 C e una deviazione

Dettagli

3 GRAFICI DI FUNZIONI

3 GRAFICI DI FUNZIONI 3 GRAFICI DI FUNZIONI Particolari sottoinsiemi di R che noi studieremo sono i grafici di funzioni. Il grafico di una funzione f (se non è specificato il dominio di definizione) è dato da {(x, y) : x dom

Dettagli

PROGRAMMA SVOLTO NELLA SESSIONE N.

PROGRAMMA SVOLTO NELLA SESSIONE N. Università C. Cattaneo Liuc, Corso di Statistica, Sessione n. 1, 2014 Laboratorio Excel Sessione n. 1 Venerdì 031014 Gruppo PZ Lunedì 061014 Gruppo AD Martedì 071014 Gruppo EO PROGRAMMA SVOLTO NELLA SESSIONE

Dettagli

~ Copyright Ripetizionando - All rights reserved ~ http://ripetizionando.wordpress.com STUDIO DI FUNZIONE

~ Copyright Ripetizionando - All rights reserved ~ http://ripetizionando.wordpress.com STUDIO DI FUNZIONE STUDIO DI FUNZIONE Passaggi fondamentali Per effettuare uno studio di funzione completo, che non lascia quindi margine a una quasi sicuramente errata inventiva, sono necessari i seguenti 7 passaggi: 1.

Dettagli

Capitolo 25: Lo scambio nel mercato delle assicurazioni

Capitolo 25: Lo scambio nel mercato delle assicurazioni Capitolo 25: Lo scambio nel mercato delle assicurazioni 25.1: Introduzione In questo capitolo la teoria economica discussa nei capitoli 23 e 24 viene applicata all analisi dello scambio del rischio nel

Dettagli

Elementi di Statistica descrittiva Parte I

Elementi di Statistica descrittiva Parte I Elementi di Statistica descrittiva Parte I Che cos è la statistica Metodo di studio di caratteri variabili, rilevabili su collettività. La statistica si occupa di caratteri (ossia aspetti osservabili)

Dettagli

Logica Numerica Approfondimento 1. Minimo Comune Multiplo e Massimo Comun Divisore. Il concetto di multiplo e di divisore. Il Minimo Comune Multiplo

Logica Numerica Approfondimento 1. Minimo Comune Multiplo e Massimo Comun Divisore. Il concetto di multiplo e di divisore. Il Minimo Comune Multiplo Logica Numerica Approfondimento E. Barbuto Minimo Comune Multiplo e Massimo Comun Divisore Il concetto di multiplo e di divisore Considerato un numero intero n, se esso viene moltiplicato per un numero

Dettagli

ESERCIZIO N 4. Fatturato Supermercati [0;500) 340 [500;1000) 368 [1000;5000) 480 [5000;10000) 37 [10000;20000) 15 taglia = 1240

ESERCIZIO N 4. Fatturato Supermercati [0;500) 340 [500;1000) 368 [1000;5000) 480 [5000;10000) 37 [10000;20000) 15 taglia = 1240 ESERCIZIO N 4 Fatturato Supermercati [0;500) 340 [500;1000) 368 [1000;5000) 480 [5000;10000) 37 [10000;20000) 15 taglia = 1240 PUNTO a CALCOLO MODA E QUARTILI La moda rappresenta quell'elemento del campione

Dettagli

Basi di matematica per il corso di micro

Basi di matematica per il corso di micro Basi di matematica per il corso di micro Microeconomia (anno accademico 2006-2007) Lezione del 21 Marzo 2007 Marianna Belloc 1 Le funzioni 1.1 Definizione Una funzione è una regola che descrive una relazione

Dettagli

Capitolo 2 Distribuzioni di frequenza

Capitolo 2 Distribuzioni di frequenza Edizioni Simone - Vol. 43/1 Compendio di statistica Capitolo 2 Distribuzioni di frequenza Sommario 1. Distribuzioni semplici. - 2. Distribuzioni doppie. - 3. Distribuzioni parziali: condizionate e marginali.

Dettagli

Università del Piemonte Orientale. Corsi di Laurea Triennale di area tecnica. Corso di Statistica Medica

Università del Piemonte Orientale. Corsi di Laurea Triennale di area tecnica. Corso di Statistica Medica Università del Piemonte Orientale Corsi di Laurea Triennale di area tecnica Corso di Statistica Medica Campionamento e distribuzione campionaria della media Corsi di laurea triennale di area tecnica -

Dettagli

ESEMPIO 1: eseguire il complemento a 10 di 765

ESEMPIO 1: eseguire il complemento a 10 di 765 COMPLEMENTO A 10 DI UN NUMERO DECIMALE Sia dato un numero N 10 in base 10 di n cifre. Il complemento a 10 di tale numero (N ) si ottiene sottraendo il numero stesso a 10 n. ESEMPIO 1: eseguire il complemento

Dettagli

SISTEMI DI NUMERAZIONE E CODICI

SISTEMI DI NUMERAZIONE E CODICI SISTEMI DI NUMERAZIONE E CODICI Il Sistema di Numerazione Decimale Il sistema decimale o sistema di numerazione a base dieci usa dieci cifre, dette cifre decimali, da O a 9. Il sistema decimale è un sistema

Dettagli

Calcolo delle probabilità

Calcolo delle probabilità Calcolo delle probabilità Laboratorio di Bioinformatica Corso A aa 2005-2006 Statistica Dai risultati di un esperimento si determinano alcune caratteristiche della popolazione Calcolo delle probabilità

Dettagli

OCCUPATI SETTORE DI ATTIVITA' ECONOMICA

OCCUPATI SETTORE DI ATTIVITA' ECONOMICA ESERCIZIO 1 La tabella seguente contiene i dati relativi alla composizione degli occupati in Italia relativamente ai tre macrosettori di attività (agricoltura, industria e altre attività) negli anni 1971

Dettagli

Rapporto dal Questionari Insegnanti

Rapporto dal Questionari Insegnanti Rapporto dal Questionari Insegnanti SCUOLA CHIC81400N N. Docenti che hanno compilato il questionario: 60 Anno Scolastico 2014/15 Le Aree Indagate Il Questionario Insegnanti ha l obiettivo di rilevare la

Dettagli

STATISTICA DESCRITTIVA. Le misure di tendenza centrale

STATISTICA DESCRITTIVA. Le misure di tendenza centrale STATISTICA DESCRITTIVA Le misure di tendenza centrale 1 OBIETTIVO Individuare un indice che rappresenti significativamente un insieme di dati statistici. 2 Esempio Nella tabella seguente sono riportati

Dettagli

Metodi Matematici e Informatici per la Biologia----31 Maggio 2010

Metodi Matematici e Informatici per la Biologia----31 Maggio 2010 Metodi Matematici e Informatici per la Biologia----31 Maggio 2010 COMPITO 4 (3 CREDITI) Nome: Cognome: Matricola: ISTRUZIONI Gli esercizi che seguono sono di tre tipi: Domande Vero/Falso: cerchiate V o

Dettagli

INTEGRALI DEFINITI. Tale superficie viene detta trapezoide e la misura della sua area si ottiene utilizzando il calcolo di un integrale definito.

INTEGRALI DEFINITI. Tale superficie viene detta trapezoide e la misura della sua area si ottiene utilizzando il calcolo di un integrale definito. INTEGRALI DEFINITI Sia nel campo scientifico che in quello tecnico si presentano spesso situazioni per affrontare le quali è necessario ricorrere al calcolo dell integrale definito. Vi sono infatti svariati

Dettagli

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008 Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica 18 dicembre 008 Esame sull intero programma: esercizi da A a D Esame sulla seconda parte del programma: esercizi

Dettagli

L analisi dei dati. Capitolo 4. 4.1 Il foglio elettronico

L analisi dei dati. Capitolo 4. 4.1 Il foglio elettronico Capitolo 4 4.1 Il foglio elettronico Le più importanti operazioni richieste dall analisi matematica dei dati sperimentali possono essere agevolmente portate a termine da un comune foglio elettronico. Prenderemo

Dettagli

ESAME DI STATO DI LICEO SCIENTIFICO CORSO SPERIMENTALE P.N.I. 2004

ESAME DI STATO DI LICEO SCIENTIFICO CORSO SPERIMENTALE P.N.I. 2004 ESAME DI STAT DI LICE SCIENTIFIC CRS SPERIMENTALE P.N.I. 004 Il candidato risolva uno dei due problemi e 5 dei 0 quesiti in cui si articola il questionario. PRBLEMA Sia la curva d equazione: ke ove k e

Dettagli

STATISTICA DESCRITTIVA UNIVARIATA

STATISTICA DESCRITTIVA UNIVARIATA Capitolo zero: STATISTICA DESCRITTIVA UNIVARIATA La STATISTICA è la scienza che si occupa di fenomeni collettivi che richiedono lo studio di un grande numero di dati. Il termine STATISTICA deriva dalla

Dettagli

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità C

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità C Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità C Cognome Nome: Part time: Numero di matricola: Diurno: ISTRUZIONI: Il punteggio relativo alla prima parte dell esame viene calcolato

Dettagli

Calcolo del Valore Attuale Netto (VAN)

Calcolo del Valore Attuale Netto (VAN) Calcolo del Valore Attuale Netto (VAN) Il calcolo del valore attuale netto (VAN) serve per determinare la redditività di un investimento. Si tratta di utilizzare un procedimento che può consentirci di

Dettagli