Controllo statistico di qualità. Introduzione



Documenti analoghi
Controllo statistico di qualità

Statistical Process Control

Controllo statistico di qualità. Introduzione

Carte di controllo per attributi

Statistical Process Control

Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI

ANALISI GRAFICHE PER IL CONTROLLO DELLA QUALITA : ESEMPI DI APPLICAZIONI

SPC e distribuzione normale con Access

PRODUZIONE DI LENTI A CONTATTO

Analisi di dati di frequenza

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione)

E naturale chiedersi alcune cose sulla media campionaria x n

Capitolo 12 La regressione lineare semplice


LE CARTE DI CONTROLLO (4)

Facciamo qualche precisazione

La variabile casuale Binomiale

Dimensione di uno Spazio vettoriale

Controllo Statistico della Qualità. Qualità come primo obiettivo dell azienda produttrice di beni

I ESERCITAZIONE. Gruppo I 100 individui. Trattamento I Nuovo Farmaco. Osservazione degli effetti sul raffreddore. Assegnazione casuale

Relazioni statistiche: regressione e correlazione

La distribuzione Normale. La distribuzione Normale

Metodi statistici per le ricerche di mercato

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1

GESTIONE INDUSTRIALE DELLA QUALITÀ A

Regressione Mario Guarracino Data Mining a.a. 2010/2011

1. Distribuzioni campionarie

Metodi Statistici di Controllo della Qualità Prof. Paolo Cozzucoli

Statistica. Lezione 6

CAPACITÀ DI PROCESSO (PROCESS CAPABILITY)

Un po di statistica. Christian Ferrari. Laboratorio di Matematica

Metodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)

Inferenza statistica. Statistica medica 1

Test statistici di verifica di ipotesi

RELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della

VERIFICA DELLE IPOTESI

3. Confronto tra medie di due campioni indipendenti o appaiati

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8

Prof.ssa Paola Vicard

Statistiche campionarie

PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE

La categoria «ES» presenta (di solito) gli stessi comandi

Corso integrato di informatica, statistica e analisi dei dati sperimentali Altri esercizi_esercitazione V

Il concetto di valore medio in generale

13. Campi vettoriali

Calcolo delle probabilità

Prova scritta di Complementi di Probabilità e Statistica. 31 Ottobre 2012

Analisi e diagramma di Pareto

Temi di Esame a.a Statistica - CLEF

MINIMI QUADRATI. REGRESSIONE LINEARE

Indici di dispersione

RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL

VALORE DELLE MERCI SEQUESTRATE

La distribuzione Gaussiana

STATISTICA IX lezione

Test d ipotesi. Statistica e biometria. D. Bertacchi. Test d ipotesi

PROGRAMMA SVOLTO NELLA SESSIONE N.

Verifica di ipotesi

LA CORRELAZIONE LINEARE

LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE

I Metodi statistici utili nel miglioramento della qualità 27

IN MATLAB distribuzione di frequenza. >> x(1)=7.5; >> for i=2:7 x(i)=x(i-1)+5; end. IN MATLAB distribuzione di frequenza

matematica probabilmente

Il campionamento statistico

Il Controllo Interno di Qualità dalla teoria alla pratica: guida passo per passo IL MODELLO TEORICO. Pasquale Iandolo

Esercizi test ipotesi. Prof. Raffaella Folgieri aa 2009/2010

Il confronto fra proporzioni

Elementi di Psicometria con Laboratorio di SPSS 1

L analisi dei rischi: l aspetto statistico Ing. Pier Giorgio DELLA ROLE Six Sigma Master Black Belt

Introduzione all analisi dei segnali digitali.

VERIFICA DELLE IPOTESI

ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE

Excel Terza parte. Excel 2003

OCCUPATI SETTORE DI ATTIVITA' ECONOMICA

Statistica e biometria. D. Bertacchi. Variabili aleatorie. V.a. discrete e continue. La densità di una v.a. discreta. Esempi.

ANALISI DI CORRELAZIONE

Abbiamo costruito il grafico delle sst in funzione del tempo (dal 1880 al 1995).

LEZIONE n. 5 (a cura di Antonio Di Marco)

IL COLLAUDO DI ACCETTAZIONE

Le Carte di Controllo del Processo

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008

Psicometria (8 CFU) Corso di Laurea triennale STANDARDIZZAZIONE

VARIANZA CAMPIONARIA E DEVIAZIONE STANDARD. Si definisce scarto quadratico medio o deviazione standard la radice quadrata della varianza.

4. Operazioni elementari per righe e colonne

Esercitazione n.2 Inferenza su medie

SISTEMA di GESTIONE QUALITÀ Non Conformità ed Efficacia delle Azioni Correttive Preventive

CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI

LA VALUTAZIONE DI PORTAFOGLIO. Giuseppe G. Santorsola 1

CAPITOLO I. Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa Programmazione Dinamica

Una sperimentazione. Probabilità. Una previsione. Calcolo delle probabilità. Nonostante ciò, è possibile dire qualcosa.

Istituzioni di Statistica e Statistica Economica

Slide Cerbara parte1 5. Le distribuzioni teoriche

Statistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice

Esercitazione n.1 (v.c. Binomiale, Poisson, Normale)

Corso di Laurea in Ingegneria Informatica Anno Accademico 2014/2015 Calcolo delle Probabilità e Statistica Matematica

La grafica. La built-in funzione grafica plot. x spezzata poligonale. discretizzato

LABORATORIO EXCEL XLSTAT 2008 SCHEDE 2 e 3 VARIABILI QUANTITATIVE

Transcript:

Controllo statistico di qualità 1 Introduzione Un azienda vorrebbe che tutti i pezzi prodotti siano uguali: vuole cioè che la produzione sia affidabile. L affidabilità della produzione è affidata a due momenti distinti: la progettazione della produzione (off line) e il controllo che la produzione sia almeno conforme ai parametri specificati (on line). 2 1

I 7 strumenti del controllo statistico di qualità ESEMPIO: Una azienda farmaceutica decide di effettuare un controllo sul processo di iniezione di un farmaco, per le cure tumorali, all interno di appositi flaconi. L azienda assume come tollerabiliun quantitativo minimo di medicinale nei flaconi pari a 82 ml e uno massimo di 118 ml e in fase di progetto stabilisce un quantitativo obbiettivo (target) di 95 ml. Gli operatori addetti a tale compito hanno a disposizione le misure del contenuto dei flaconi del prodotto medicinale riportate nella tabella 3 I dati Un primo approccio al problema può essere la costruzione di un istogramma. DOMANDA: quale informazione si perde effettuando un istogramma? 4 2

30 Istogramma dei dati 25 20 15 10 5 0 80 85 90 95 100 105 110 115 120 Dall istogramma si può subito notare come i dati seguano approssimativamente una distribuzione normale, con una piuttosto accentuata variabilità dei dati. Rispetto al target aziendale il processo è abbastanza centrato, ma la variabilità risulta eccessiva per cui potrebbe essere necessaria una azione correttiva sulla variabilità del processo 5 Normal plot dei dati dell esempio precedente 0.997 0.99 0.98 0.95 0.90 Normal Probability Plot 0.75 Probability 0.50 0.25 0.10 0.05 0.02 0.01 0.003 80 85 90 95 100 105 110 115 Data 6 3

Un istogramma consente di valutare la precisione del processo produttivo tramite l analisi di dispersione della distribuzione dei dati, anche in relazione ai limiti di tolleranza. 7 Dalla sovrapposizione dell istogramma con la retta del valore obbiettivo si può verificare il posizionamento del valore centrale dei dati rispetto al target assegnato 8 4

9 10 5

11 ESEMPIO 12 6

13 14 7

15 16 8

La carta dei 3-sigma Se dovesse essere disponibile una valutazione teorica (storica o di progetto) della varianza della popolazione e della media, usando il teorema del limite centrale σ è possibile sostituire il parametro kcon 3, per la varianza σ e per media W = si può usare quella della popolazione. n Esempio: parametro di flusso monitorato in una azienda con media e varianza nota n=5 17 18 9

19 20 10

21 22 11

23 Costruire la carta di controllo della media in Matlab I dati sono in numero 12*10: ci sono 12 gruppi (i giorni) e ogni gruppo ha numerosità campionaria pari a 10. Quindi N = 120, k = 12 sottogruppi, ciascuno di taglia n = 10, i = 1,...,12. Assegnare i dati ad una matrice. i 24 12

Costruire la carta di controllo della media in Matlab >> x x = >> xbarplot(x,0.9973, spec, range ) 94 97 92 94 106 108 95 98 111 85 109 110 108 118 92 100 109 92 105 111 96 110 108 97 105 97 101 102 93 99 97 109 95 96 103 88 85 96 93 93 94 92 108 99 95 91 88 96 93 103 95 99 101 80 98 101 106 95 103 83 111 100 90 98 110 85 111 109 104 97 115 93 109 92 108 89 103 95 91 99 95 93 105 97 102 99 86 96 110 92 94 99 87 114 100 102 99 115 84 89 110 85 93 101 84 89 113 91 93 104 84 86 109 99 100 100 94 91 113 109 >> m=mean(x ); Le medie vengono fatte sulle righe. Queste medie sono quelle plottate sulla carta di controllo. Quindi sulle ascisse si riportano i giorni (in sequenza). 25 CONF (optional) is the confidence level of the upper and lower plotted confidence limits. CONF is 0.9973 by default. This means that 99.73% of the plotted points should fall between the control limits if the process is in control. SPECS (optional) is a two element vector for the lower and upper specification limits of the response. SIGMAEST (optional) specifies how XBARPLOT should estimate sigma. Possible values are 'std' (the default) to use the average within-subgroup standard deviation, 'range' to use the average subgroup range, and 'variance' to use the square root of the pooled variance. OUTLIERS = XBARPLOT(DATA,CONF, SPECS,SIGMAEST) returns a vector of indices to the rows where the mean of DATA is out of control. >> xbarplot(x,0.9973, spec, range ) 26 13

Le linee di controllo La linea centrale è rappresentata dalla media delle medie Le linee superiore ed inferiore corrispondono a x ± z x 1 k xi k i = 1 = (1 CONF )/2 σ n range : si usa l escursione standard std : si usa uno stimatore della deviazione standard variance : si usa uno stimatore della deviazione standard pesata σ 27 >> xbarplot(x,0.9973,spec,'variance )') Questa è la carta per la media con i limiti di controlloche dipendono dalla pooled variance che sostituisce direttamente la deviazione standard. 28 14

Opzione range 29 Con l opzione range >> xbarplot(x,0.9973,spec, range') Questa è la carta per la media con i limiti di controllo che dipendono dal range R σ d 2 per stimare σ (la variabilità del processo) 30 15

Se la dimensione campionaria è abbastanza grande (>10,12) l uso del ranger è poco efficiente per la stima della varianza. Stesse considerazioni valgono nel caso di dimensione variabile (poiché si potrebbe perdere in efficienza) [ ] 2 2 Vale che E S = σ e invece E S σ. Quindi σ non può essere valutato con S. 2 ( ) [ ] Opzione std Se X N µ, σ E S = σ c dove c è un parametro che dipende da n 4 4 n 1! 2 2 n n n n 1 c4 = e! 1 2 n 1 n 1 = 2 2 2 2 2 1! 2 Pertanto sostituiamo E S con S ed abbiamo che [ ] 4 π k S 1 σ dove S = S c k 31 i= 1 i >> xbarplot(x,0.9973,spec,'std') Questa è la carta per la media con i limiti di controllo che dipendono dalla deviazione standard. S σ c 4 per stimare la variabilità del processo 32 16

REGOLE DI ZONA Per le regole di zona non c è una functionin MATLAB. Possiamo sovrapporre le linee per la lettura del grafico, usando la variabilità stimata per il processo. Se si usa una carta dell escursione: >> mean(range(x))/3.078 ans= 7.5807 33 Le linee di zona sono: x ± 7.58; x ± 2*7.58; x ± 3*7.58 Usare il comando holdon per sovrapporre le regole di zona. >> x1low=mean(mean(x))-ones(12,1)*7.58; >> x1up=mean(mean(x))+ones(12,1)*7.58; >> x2low=mean(mean(x))-2*ones(12,1)*7.58; >> x2up=mean(mean(x))+2*ones(12,1)*7.58; >> x3low=mean(mean(x))-3*ones(12,1)*7.58; >> x3up=mean(mean(x))+3*ones(12,1)*7.58; >> hold on >>plot([1:12],x1low,'-b',[1:12],x1up,'-b',[1:12],x2low,'-p',[1:12],x2up,'-p',[1:12], x3up,'-k',[1:12],x3low,'-k') >> 34 17

La carta della media va letta assieme ad una carta che restituisca la variabilità del campione casuale. Carta dell escursione Carta della dev.standard I limiti di controllo della carta della deviazione standard [ ] 3D[ S] E S Esiste una procedura in MATLAB per generarla >> schart(x) con D S s c 4 2 [ ] = σ 1 c 1 c 2 4 4 35 Non c è una procedura per costruire la carta di controllo per l escursione. >> r=range(x) r = 26 26 24 16 17 28 20 13 27 29 27 27 Calcolare la media delle escursioni: 1 k Ri k i = 1 R = [ ] Var W 2 [ ] σ Var R = d = σ σ 2 R 2 3 2 R R = d3 R = d3 d2 σ σ σ 36 18

Carta dell escursione >> lcent=mean(range(x))*ones(12,1); >> lup=lcent*1.777; >> ldown=lcent*0.223; >> plot([1:1:12],range(x),'-*b',[1:1:12],lcent, '-r',[1:1:12],lup,'-g',[1:1:12],ldown,'-g') >> axis([1,12,0,45]) Carta della dev.standard >> schart(x) 37 Carta di tolleranza 120 carta di tolleranza 115 110 105 100 95 90 85 >> hold on >> >> c2=2*ones(1,10); >> plot(c2,x(:,2),'g*-') >> 80 0 2 4 6 8 10 12 19

La carta della tolleranza è una carta sulla distribuzione della variabile che si sta monitorando. La carta della media è una carta sulla distribuzione della media campionaria della variabile che si sta monitorando. 39 La carta di controllo e il processo stocastico relativo alla produzione 40 20

Come si leggono le variazioni sulle carte di controllo Uno spostamento della media del processo produttivo, provoca l appariredi una anomalia sulla carta di controllo della media: anche quando tale variazione sarà minima i punti della carta di controllo reagiranno in maniera apprezzabile Una variazione nella dispersione del processo produttivo provocherà anomalie avvertibili sia sulla carta di controllo della media che su quella della escursione, che tenderanno a distanziarsi tra di loro. 41 Carte MR (moving range) Non avendo più a disposizione gruppi di misurazioni, ma singoli valori, i limiti della carta di controllo cambiano. In Matlabnon c è una procedura. 42 21

In Matlab >> for i=1:14 mr(i)=abs(x(i+1)-x(i)); end n 1 1 MR = MRi n 1 i= 1 3 UCL = X + MR 1.128 CL = X 3 LCL = X MR 1.128 >> lineup=ones(15,1)*(mean(x)+3/1.128*mean(mr)); >> linedown=ones(15,1)*(mean(x)-3/1.128*mean(mr)); >> linecenter=ones(15,1)*mean(x); >> plot([1:1:15],x,'r',[1:1:15],lineup,'-g',[1:1:15],linedown,'-g',[1:1:15],linecenter,'-p') 43 Per l escursione si usano gli stessi limiti della carta dell escursione classica, sostituendo l escursione media con la media della moving average. 44 22

Curva caratteristica operativa Diremo che il processo è in controllo statistico se per ogni t, indice dei sottogruppi, x ( LimInf, LimSup). t Regione di accettazione 45 Curva caratteristica operativa Diremo che il processo è in controllo statistico se per ogni t, indice dei sottogruppi, x ( LimInf, LimSup). α = P(rigettare H µ = µ ) 0 0 β = P(rigettare H µ µ ) 1 0 t Regione di accettazione = P( x ( LCL, UCL) µ = µ ) t = P( x ( LCL, UCL) µ µ ) t 0 0 FALSO ALLARME MANCATO ALLARME 46 23

Non avendo ipotesi alternative certe, immaginiamo che l ipotesi alternativa possa essere strutturata come segue: µ = µ 1 = µ 0 + kσ Se la popolazione è gaussiana, allora β = P( x ( LCL, UCL) µ = µ + kσ ) t ( µ σ ) ( µ σ ) UCL 0 + k LCL 0 + k = Φ Φ σ / n σ / n Il plot dei valori assunti da questo parametro per un opportuno valore di k, si chiama curva caratteristica operativa. σ σ Se UCL = µ 0 + L e LCL = µ 0 L, allora n n ( L k n ) ( L k n ) β = Φ Φ e quindi perdiamo la dipendenza sia dalla deviazione standard che dalla media (che magari sono incognite!). NB: Per usare le curve operative è necessario avere qualche informazione in più sulla natura del processo (ad esempio che la popolazione è gaussiana). 47 0 Torniamo al nostro esempio dei flaconi. Siccome i limiti che abbiamo u- satosono di tipo σ µ 0 ± L dove L = 3, n = 10 e σ R / d2 allora si ha n ( 3 k 10 ) ( 3 k 10 ) β = Φ Φ 1 0.9 0.8 0.7 0.6 0.5 0.4 Curva operativa >> k=[0.1:0.2:3]; >> z=normcdf(3-k.*sqrt(10))- normcdf(-3-k.*sqrt(10)); >> plot(k,z) Per k=1, vale circa 0.3 la probabilitàdi un mancato allarme. 0.3 0.2 0.1 0 0 0.5 1 1.5 2 2.5 3 Per valori di k inferiori, aumenta la probabilità di un mancato allarme. 48 24

Spesso sui testi si incontrano famiglie di curve operative. Questo perché si cerca di capire al variare della taglia del sottogruppo come varia la probabilità di un mancato allarme. 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 ( 3 k n ) ( 3 k n ) β = Φ Φ Curve operative al variare di n n=8 n=5 n=12 0 0 0.5 1 1.5 2 2.5 3 Ogni plot corrisponde ad un valore di n. 49 Altro uso della curva operativa Nella progettazione delle carte di controllo è necessario specificare sia la dimensione del campione che la frequenza di campionamento. Più grande è il campione più è sensibile il rilevamento di una variazione all interno del processo. La pratica corrente tende a diminuire la dimensione del campione e ad aumentare la frequenza di campionamento. ( ) ( ) Si fissa β, e si cerca quel valore di z tale che Φ z Φ z = β ossia, ricordando le proprietà della gaussiana... ( z β ) 2Φ 1 = β β β β 1 β + 1 z β = Φ zβ = 3 k n 2 è possibile ricavare n Per k=1 β = 0.3 >> ((3-norminv((0.3+1)/2,0,1)))^2 n = 6 50 25

Strategia di scelta dei sottogruppi ma sono costosi! La pratica industriale corrente preferisce la prima strategia aumentando la frequenza 51 Approcci per la costruzione dei sottogruppi Approccio SNAPSHOT Quanti k? Approccio RANDOM 52 26

ARL (average long run) Sia T la variabile aleatoria che indica il numero di sottogruppi da estrarre prima di avere un punto fuori i limiti della carta di controllo. T ha legge... k 1...geometrica, P( T = k) = p(1 p), k = 1,2,... 1 E [ T ] = ARL, tempo medio per avere un fuori controllo p Quanto vale p? Nella carta 3-sigma, la probabilità che il processo sia in controllo statistico è data dalla legge dei 3-sigma, ossia >> normcdf(3,0,1)-normcdf(-3,0,1) ans= 0.9973 Quindi la probabilità che il processo vada fuori controllo è [ ] 370 >> 1-0.9973 ans= E T = 53 0.0027 Strategia six-sigma La carta di controllo può essere utilizzata per descrivere la capacità del processo di produrre all interno dei valori di specifica. Nell esempio dei flaconi prodotti per l ospedale, i limiti di specifica stabiliti in fase di progettazione erano 82 ml e 118 ml. >>h=(max(mean(x))-min(mean(x)))/4; >> c(1)=min(mean(x)); >> for i=2:5 c(i)=c(i-1)+h; end >>n=histc(mean(x),c); >>centri(1)=(c(1)+c(2))/2; >> for i=2:4 centri(i)=(c(i)+c(i-1))/2; end >>bar(centri,n(1:4)) 54 27

In che modo? Basta calcolare P( X < 82) + P( X > 118) ipotizzando che... X N(98.6,7.51) che sono le stime trovate con la carta di controllo per µ e σ. >> inf=(82-98.6)/7.51; >> sup=(118-98.6)/7.51; >> 1-(normcdf(sup)-normcdf(inf)) ans= 0.0184 p=1-diff(normcdf(spec,mean(mean(x)),7.51)) Ossia circa lo 0.0184 per cento (184 parti su 10.000) di flaconi prodotti cadranno al di fuori delle specifiche, stante la produzione osservata e monitorata dalla carta di controllo. Più in generale indichiamo con TL x TU x p = e P( X < TL ) + P( X > TU ) = Φ 1 ˆ σ + Φ ˆ σ 55 Il valore minimo p lo si ha quando la media coincide con il centro dell'intervallo di TU + TL tolleranza me =. 2 e >> x=[90:0.1:110]; >> y=normcdf(88,x,7.51)+ (1-normcdf(112,x,7.51)); >> plot(x,y) Il valore effettivo di non conformi deve essere tale che p < p dove p è il e T T livello di difettosità tollerabile TL TU e questo valore minimo vale pmin = 2Φ 2 ˆ σ 56 28

INDICE DI CAPACITA DEL PROCESSO Altro modo per misurare l indice di capacità del processo è il cosidetto PCR (process capability ratio) : TU TL C p = 6σ Si noti che 6 σ è la definizione di base della capacità del processo. In genere la deviazione standard non si conosce e quindi va stimata dai dati (carta dell'escursione) R d 2 (S-chart) S c 4 57 Andamento indice PCR Se il processo non è centrato, avere PCR>1 non garantisce che il processo produca la quasi totalitàdei prodotti entro i limiti di specifica (è capace di farlo, ma non è detto che lo faccia) Ci vuole un indice che tenga conto della centratura. C pk TU µ µ TL = min, 3σ 3σ Da solo, non basta! 58 29

Relazioni tra i due indici 59 Un impiegato esce di casa tutti i giorni alle 8.00 e deve entrare al lavoro alle 8.30. Per raggiungere l ufficio in auto ha due possibilità: attraversare la città, o seguire un percorso di campagna, più lungo ma meno trafficato. Per decidere quale sia il percorso più conveniente, misura il tempo di percorrenza più volte su entrambi i percorsi e trova che attraversando la città impiega mediamente 25 minuti, mentre per il percorso in campagna occorrono in media 28 minuti. Quale percorso gli conviene seguire? Vecchia risposta: l uomo dovrebbe scegliere il percorso cittadino, che in media è più veloce Risposta Sei Sigma: la medianon è un indicatore significativo per questo studio. Infatti l impiegato è penalizzato quando arriva in ritardo, ma non ha alcun beneficio quando arriva in anticipo. L uomo definirebbe come difettosi i percorsi che richiedono più di 30 minuti di viaggio. Quindi si deve analizzare l intera distribuzionedei dati nei due casi, riportata in figura. Come si vede, il percorso cittadino presenta una forte variabilità dei dati, perché è molto influenzato (oltre che poco prevedibilmente) dal traffico; il percorso di campagna invece richiede un tempo praticamente costante. Visto l alto numero di difetti nel caso del percorso cittadino, è evidente che quello di campagna è preferibile dal punto di vista dell impiegato. 60 30

Il six-sigma program della Motorola anni 80 Obbiettivi: USL LSL > 12σ { USL LSL} min µ, µ > 4.5σ C C p pk > 2 e > 1.5 In Matlab >> spec=[82 118]; >> [p,cp,cpk]=capable(vec,spec) p = 0.0351 cp= 0.7119 cpk= 0.6565 Cp< 1, quindi il processo non è capace (ossia rientra nei limiti specificati) Cpk< 1, il processo non è centrato rispetto alla media Cosa descrive p? La capacità che il processo produca entro i limiti specificati 61 Carta p Si basa sulla percentuale di pezzi non conformi nel sottogruppo monitorato. La numerosità campionaria dei sottogruppi può essere non costante. La numerosità campionaria deve essere elevata. Perché? La v.a. binomiale (e di Bernoulli) gioca un ruolo fondamentale. 62 31

D La percentuale di pezzi non conformi è data da pˆ =, dove D ha legge... n...binomiale di parametri n e p. I limiti di controllo sono: p(1 p) p ± 3 (se np > 5, n(1- p) > 5 D è approx. gaussiana) n Se p non è nota, si può sostituire con una stima p k 1 Di num.pezzi non conformi p = pi dove pi = = k n n i= 1 Il MATLAB non ha una procedura per la costruzione della carta p 63 Esempio: Un concentrato di succo d'arancia è congelato e imballato in lattine di cartone da 180ml. Queste lattine sono costruite usando una macchina che avvolge il cartone e poi lo appoggia su un pannello inferiore in metallo. Ispezionando una lattina, possiamo stabilire se, quando è piena, si può avere una perdita del succo dalla cucitura laterale o dal pannello inferiore. Tale non conformità può comportare un sigillo improprio sulla guarnizione laterale oppure sul pannello inferiore. Vogliamo costruire una carta di controllo per migliorare la percentuale di lattine non conformi prodotte dalla macchina. A questo scopo vengono selezionati 30 campioni di n = 50 lattine ciascuno, ogni mezz ora su 3 periodi della giornata in cui la macchina è sempre in funzione. >> d d = Columns 1 through 17 12 15 8 10 4 7 16 9 14 10 5 6 17 12 22 8 10 Columns 18 through 30 5 13 11 20 18 24 15 9 12 7 13 9 6 64 32

I valori da plottare sulla carta sono le percentuali di non conformità >> p=d/50 p = Columns 1 through 10 0.2400 0.3000 0.1600 0.2000 0.0800 0.1400 0.3200 0.1800 0.2800 0.2000 Columns 11 through 20 0.1000 0.1200 0.3400 0.2400 0.4400 0.1600 0.2000 0.1000 0.2600 0.2200 Columns 21 through 30 0.4000 0.3600 0.4800 0.3000 0.1800 0.2400 0.1400 0.2600 0.1800 0.1200 I limiti sono >> mean(p)+3*sqrt(mean(p)*(1-mean(p))/50) ans = 0.4102 >> mean(p)-3*sqrt(mean(p)*(1-mean(p))/50) ans = 0.0524 65 >> cent=mean(p)*ones(1,30); >> upp=(mean(p)+3*sqrt(mean(p)*(1-mean(p))/50))*ones(1,30); >> low=(mean(p)-3*sqrt(mean(p)*(1-mean(p))/50))*ones(1,30); >> plot(k,p,'b*-',k,low,'r-',k,upp,'r-',k,cent,'g-') >> title( P-chart ) 0.5 0.45 P chart Nuovo operatore 0.4 0.35 0.3 0.25 Nuova partita di cartone 0.2 0.15 0.1 0.05 0 5 10 15 20 25 30 Il campione 15 e 23 sono fuori controllo statistico: questi vanno monitorati. Rieffettuiamo il grafico della carta eliminando questi campioni. 66 33

Costruiamo un nuovo vettore d1, che contiene la difettosità registrata, eliminando i due valori critici. >> d1(1:14)=d(1:14) >> d1(15:21)=d(16:22) >> d1(22:28)=d(24:30) E ripetiamo tutta la procedura 0.4 0.35 P chart Sottogruppo 20 (no. 21 nel vecchio campione) 0.3 0.25 0.2 0.15 0.1 0.05 0 0 5 10 15 20 25 30 67 Questa è la carta senza aver eliminato i sottogruppi 15 e 23 ma con i limiti upper and lower calcolati al secondo giro: 0.5 P chart 0.45 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 0 5 10 15 20 25 30 Se non si ritiene significativa la causa che ha portato al fuori controllo statistico nel sottogruppo 21, allora per future ispezioni si mantengono questi come limiti della carta di controllo. 68 34

Supponiamo che siano stati campionati altri 24 sottogruppi: per monitorare il processo usiamo i limiti di controllo che sono stati calcolati prima. d2=[9,6,12,5,6,4,6,3,7,6,2,4,3,6,5,4,8,5,6,7,5,6,3,5]; P chart 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 >> cent2= mean(p1)*ones(1,24); >> low2= low1(1)*ones(1,24); >> upp2= upp1(1)*ones(1,24); >> plot(k2,p2,'b*-', k2,low2,'r-',k2,upp2,'r-', k2,cent2,'g-') Il processo è in controllo statistico. Ma 0 30 35 40 45 50 55 69 se mettiamo tutti i dati assieme 0.5 P chart 0.45 0.4 0.35 0.3 0.25 0.2 Cambiamento della macchina per imballaggio? 0.15 0.1 0.05 0 0 10 20 30 40 50 60 Possiamo dire con maggiore precisione se le percentuali di non conformità sono effettivamente diverse? 70 35

H : p = p 0 1 2 H : p > p 1 1 2 La regione critica risulta: 1 1 n p + n p Z > z0.05 p(1 p) + dove p = n1 n2 n1 + n2 1 1 2 2 1.645 p 0.2150 (senza sottogruppi 15 e 23) p 1 2 0.1108 n =?, n =? 1 2 p p 1 2 28 28 1 1 Di 301 pi 28 i= 1 28 i= 1 50 1400 54 54 1 1 Di 133 pi 24 i= 31 24 i= 31 50 1200 = = = = = = Pertanto si rigetta l'ipotesi nulla......e facendo i conti si ha p = 0.1669 e la regione critica (0.0241, ) 71 Visto che c è stato un miglioramento nella produzione, si ricalcolano anche i limiti di controllo >> hold on >> lcent1=ones(24,1)*mean(d2/50); >> lup1=ones(24,1)*(mean(d2/50)+3*sqrt(mean(d2/50)*(1-mean(d2/50))/24)); >> llow1=ones(24,1)*(mean(d2/50)-3*sqrt(mean(d2/50)*(1-mean(d2/50))/24)); >> plot([31:1:54],d2/50,'-b*',[31:1:54],lcent1,'-g',[31:1:54],lup1,'-r, [31:1:54],llow1,'-g') 0.6 New P-chart 0.5 0.4 0.3 0.2 0.1 0-0.1 0 10 20 30 40 50 60 72 36

Il limite inferiore è negativo!! Quindi bisogna prendere il limite inferiore pari a 0. * Se pè piccolo, nva scelto grande!! Ad esempio per p=0.01, abbiamo n=500 (media almeno 5)!! * Siccome lo shift da p vale δ =3 2 ( 1 ) 3 n = ( 1 p) p δ p p n δ = 0.04, p = 0.01 n = 56 0.5 0.4 0.3 0.2 0.1 0 New P-chart 5 10 15 20 25 30 35 40 45 50 ( ) 1 p p 9(1 p) * p 3 > 0 n > n p p = 0.05 n = 171 73 Carta np Si lavora non con la percentuale dei pezzi non conformi, ma con il numero di pezzi non conformi. D La percentuale di pezzi non conformi è data da pˆ =, dove D ha legge......binomiale di parametri n e p. Si lavora con D N( np, np(1- p)) I limiti della carta di controllo sono dunque: np ± 3 np(1 p) Tornando all esempio di prima p viene sostituito con p n 74 37

25 Np chart 20 15 10 5 0 0 5 10 15 20 25 30 Se le taglie dei sottogruppi sono diverse, una tecnica molto diffusa consiste nel k 1 sostituire a n la media campionaria delle taglie n = ni k i = 1 75 Effettuare un grafico della curva caratteristica operativa β = P( p ( LCL, UCL) p = p ) i = P( D ( nlcl, nucl) p = p ) i 1 1 Usando la cdf binomiale β = P( D (2.62, 20.51) p = p ) i 1 >> p=[0.01:0.02:1]; >> app=binocdf(20.5120,50,p)- binocdf(2.6214,50,p); >> plot(p,app) Con gli stessi ragionamenti si possono calcolare gli altri parametri che abbiamo incontrato nelle precedenti lezioni. 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 Curva caratteristica per P-chart 0 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 76 38

Carta c Misura il numero di difetti in un lotto controllato. Il campionamento deve essere costante. E utile quando vi è da controllare un materiale con un flusso di produzione continuo (rullo di tessuto o un cavo elettrico). La non conformità è da esprimersi per unità da definire (difetti al m^2, etc.) Il lotto è inscindibile. 77 La v.a. che conta il numero di difetti per unità di misura è......una v.a. di Poisson I limiti della carta di controllo sono c ± 3 c dove c è la costante di Poisson. In mancanza di un valore teorico per c si utilizza la media campionaria. Esercizio: Si riporta il numero di non-conformità osservato in 26 campioni prodotti in una successione di 100 circuiti stampati (100 circuiti stampati = 1 lotto). >> c=[21,24,16,12,15,5,28,20,31, 25,20,24,16, 19,10,17,13,22,18, 39,30,24,16,19,17,15]; >> central=mean(c) = 19.67; >> upp=central+3*sqrt(central)=32.97; >> low=central-3*sqrt(central)=6.36; Esercizio: eliminare il campione 20 e 6 e rifare la carta di controllo. 40 35 30 25 20 15 10 C chart 5 0 5 10 15 20 25 30 78 39

Nell esempio precedente, è stato preso in considerazione un solo lotto. Tuttavia questo tipo di scelta non è statisticamente significativa. Sarebbe meglio ispezionare più lotti, perché c è maggiore possibilità di incontrare non conformità. Ad esempio potremmo essere interessati ad ispezionare 2 lotti e mezzo, ossia 250 circuiti. Carta U Si calcola il numero di non conformità totale e lo si rapporta al numero di lotti esaminati. Siccome x rappresenta il num. di pezzi non conformi totali, è una v.a. di Poisson, di cui x / n rappresenta la media campionaria. x u = n u = u 3 u n 79 1 rotolo=50 m^2 di tessuto La tabella riporta il numdi difetti. Num. Num. m^2 Num.dif. Num.Di rotoli ispez. 1 500 14 10.0=500/50 2 400 12 8.0=400/50 3 650 20 13.0 4 500 11 10.0 5 475 7 9.5 6 500 10 10.0 7 600 21 12.0 8 525 16 10.5 9 600 19 12.0 10 625 23 12.5 Totale 153 107.50 153 u = 107.5 u u ± 3 m k 1 con m = ni k i = 1 80 40

I valori della linea blu sono il numero di difetti diviso il numero di lotti esaminati (ultima colonna). >> punt=[14/10,12/8,20/13,11/10,7/9.5,1,21/12,16/10.5,19/12,23/12.5]; >> taglie=[10,8,13,10,9.5,10,12,10.5,12,12.5]; >> cent=ones(10,1)*153/107.5; >> lineup= ones(10,1)*(153/107.5+3*sqrt(153/(107.5*mean(taglie)))); >> linedown= ones(10,1)*(153/107.5-3*sqrt(153/(107.5*mean(taglie)))); >>plot([1:10],punt, b-*,[1:10],cent, g-,[1:10],lineup, r-,[1:10],linedown, r- ) 81 Limiti carte Shewhart Caratteristica principale delle carte di Shewhartè che nel metodo di calcolo del valore della statistica da inserire nella carta di controllo, esse fanno uso unicamente dell informazione sul processo contenute nel solo ultimo istante di osservazione, ignorando tutti quelli precedenti. Ciò rende la carta di Shewartrelativamente insensibile alle piccole variazioni del livello del processo (di ampiezza in genere non superiore a 1.5 volte la deviazione standard) Carte CUMSUM (cumulative sum) = somme cumulate Carte EWMA (Exponential Weighted Moving Average) = medie mobili pesate esponenzialmente. 82 41

Queste due carte funzionano bene nei confronti di piccoli salti di livello mentre non reagiscono così velocemente come la carta di Shewarth per salti di livello elevato. Può quindi risultare utile combinare l uso della carta di Shewartcon questi due tipi di carta. Shewart chart Esempio: i dati che andiamo ad 14 esaminare sono stati costruiti al 13 seguente modo. I primi 20 sono stati selezionati da una popolazione gaussiana di media 10 e 12 11 deviazione standard 1. I rimanenti 10 sono stati selezionati da una 10 popolazione gaussiana di media 9 11 e di deviazione standard 1. Questi ultimi si possono 8 pensare come selezionati da un 7 processo che è andato fuori controllo statistico. 6 5 10 15 20 25 30 La carta della media non segnala subito la variazione! 83 Nella carta CUMSUM si effettua il grafico di i ( ) ( ) S = x µ = x µ + S i j 0 i 0 i 1 j= 1 >> s(1)=x(1)-10; >> for i=2:30 s(i)=s(i-1)+(x(i)-10) end 10 8 6 carta cumsum Quali sono i limiti di controllo? 4 2 0-2 -4 0 5 10 15 20 25 30 Utile per misurazioni uniche. Altrimenti si usa la media campionaria dei sottogruppi. 84 42

Exponential chart Serve a monitorare un processo che media i dati in modo che a questa media viene dato sempre meno peso, mano manoche il tempo passa Viene valutata su tutto il processo e non sui sottogruppi razionali Più sensibile ai driftnel tempo Robusta nel caso non normale 85 >>ewmaplot(x ) 11.5 Exponentially Weighted Moving Average (EWMA) Chart 11 EWMA 10.5 10 CL 9.5 9 0 5 10 15 20 25 30 Sample Number Attenzione: per vettori di misurazioni uniche, il vettore dei dati va passato sotto forma di vettore colonna. 86 43

DIAGRAMMI DI CORRELAZIONE Consideriamo 10 coppie di dati che mettono in relazione la percentuale di riuscita di un certo esperimento in laboratorio con la temperatura alla quale l esperimento è condotto. >> x=[100, 110, 120, 130, 140, 150, 160, 170, 180, 190]; >> y=[45, 52, 54, 63, 62, 68, 75, 76, 92, 88]; Il coefficiente di correlazione di Pearson esprime il grado di relazione lineare esistente tra due campioni casuali. >> r=corrcoef(x,y) E un numero adimensionale. i Assume valori tra -1 e 1. r = Uno strumento grafico utile per visualizzare il grado di dipendenza lineare esistente tra i due campioni, è lo scatterdiagram(o diagramma di dispersione). >>polytool(x,y) 1.0000 0.9772 0.9772 1.0000 E una function del MATLAB che consente di approssimare i punti dello scatter-diagram con un polinomio. 87 I punti sul grafico si riferiscono alle coppie ( x, y ) La retta in verde è la retta di regressione lineare. i i I coefficienti della retta sono determinati con il metodo dei mnimi quadrati. Le rette rosse sono i limiti dell intervallo di confidenza. 88 44

Per conoscere i coefficienti della retta di regressione: >> beta beta = 0.4964-4.4727 La retta di regressione è y = 0.4964x 4.4727 89 >> residuals residuals = -0.1636 1.8727-1.0909 2.9455-3.0182-1.9818 0.0545-3.9091 7.1273-1.8364 Se la retta di regressione lineare è y = α x + β e si indica con y = α x + β l'ordinata sulla retta in corrispondenza del dato i esimo, il residuo i-esimo è e = y y. i i i i i 90 45

Riprendendo l esperimento condotto in laboratorio, detta Y la v.a. che descrive la percentuale di riuscita dell esperimento e detta X la temperatura alla quale l esperimento è condotto, si ha Y = α X + β Per effetto degli errori di misurazione yi = α xi + β + ε i ε rappresenta lo scostamento del dato sperimentale dal valore i ottenuto usando il modello lineare in assenza di bias il valore ε proviene da una gaussiana di media 0. i Adeguatezza del modello: validazione E necessario verificare che i residui provengano da una popolazione gaussiana: a) Normplot b) Test di Kolmogorov-Smirnov 91 Adeguatezza del Modello ANALISI DEI RESIDUI 0.95 0.90 Normal Probability Plot >> [H,P,KSSTAT,CV] = KSTEST(residuals/standard) H = 0 Probability 0.75 0.50 0.25 P = 0.8054 KSSTAT = 0.1933 0.10 0.05-4 -2 0 2 4 6 Data CV = 0.4093 >> 92 46

Il coefficiente di correlazione non è una misura generale della relazione tra due variabili, ma esprime solo il grado di linearità della correlazione in un grafico a dispersione. C è un solo caso in cui, quando il coefficiente di correlazione è nullo, allora le variabili aleatorie sono addirittura indipendenti: quando X e Y sono congiuntamente gaussiane. Gaussiana (congiunta) bidimensionale Esempio : La f XY ( x, y) = 2πσ for ( x, y) R funzione densità di probabilità di una normale bivariata è : 2 1 1 exp 2 2 1 σ ρ 2(1 ρ ) Y X,( µ, µ ) R X Y 2, con parametri σ 2 ( x µ ) 2ρ( x µ )( y µ ) ( y µ ) X σ X 2 X > 0, σ Y σ X X σ > 0 e ρ (-1,1). Y Y + 2 Y 2 Y σ µ = E X µ = E Y Y 2 X 2 Y [ X ] [ ] [ X ] [ Y ] σ = Var σ = Var ρ ( 1,1) 94 47