Controllo statistico di qualità - Università degli Studi della Basilicata
Transcript
Controllo statistico di qualità - Università degli Studi della Basilicata
24/01/2013 Controllo statistico di qualità 1 Introduzione • Un’azienda vorrebbe che tutti i pezzi prodotti siano uguali: vuole cioè che la produzione sia affidabile. • L’affidabilità della produzione è affidata a due momenti distinti: la progettazione della produzione (off line) e il controllo che la produzione sia almeno conforme ai parametri specificati (on line). 2 1 24/01/2013 I 7 strumenti del controllo statistico di qualità ESEMPIO: Una azienda farmaceutica decide di effettuare un controllo sul processo di iniezione di un farmaco, per le cure tumorali, all’interno di appositi flaconi. L’azienda assume come tollerabili un quantitativo minimo di medicinale nei flaconi pari a 82 ml e uno massimo di 118 ml e in fase di progetto stabilisce un quantitativo obbiettivo (target) di 95 ml. Gli operatori addetti a tale compito hanno a disposizione le misure del contenuto dei flaconi del prodotto medicinale riportate nella tabella 3 I dati Un primo approccio al problema può essere la costruzione di un istogramma. DOMANDA: quale informazione si perde effettuando un istogramma? 4 2 24/01/2013 Istogramma dei dati 30 25 20 15 10 5 0 80 85 90 95 100 105 110 115 120 Dall’istogramma si può subito notare come i dati seguano approssimativamente una distribuzione normale, con una piuttosto accentuata variabilità dei dati. Rispetto al target aziendale il processo è abbastanza centrato, ma la variabilità risulta eccessiva per cui potrebbe essere necessaria una azione correttiva sulla variabilità del processo 5 Normal plot dei dati dell’esempio precedente Normal Probability Plot 0.997 0.99 0.98 0.95 0.90 Probability 0.75 0.50 0.25 0.10 0.05 0.02 0.01 0.003 80 85 90 95 100 Data 105 110 115 6 3 24/01/2013 Un istogramma consente di valutare la precisione del processo produttivo tramite l’analisi di dispersione della distribuzione dei dati, anche in relazione ai limiti di tolleranza. 7 Dalla sovrapposizione dell’istogramma con la retta del valore obbiettivo si può verificare il posizionamento del valore centrale dei dati rispetto al target assegnato 8 4 24/01/2013 9 10 5 24/01/2013 11 ESEMPIO 12 6 24/01/2013 13 14 7 24/01/2013 15 16 8 24/01/2013 La carta dei 3-sigma Se dovesse essere disponibile una valutazione teorica (storica o di progetto) della varianza della popolazione e della media, usando il teorema del limite centrale σ è possibile sostituire il parametro k con 3, per la varianza σ W = e per media n si può usare quella della popolazione. Esempio: parametro di flusso monitorato in una azienda con media e varianza nota n=5 17 18 9 24/01/2013 19 20 10 24/01/2013 21 22 11 24/01/2013 23 Costruire la carta di controllo della media in Matlab I dati sono in numero 12*10: ci sono 12 gruppi (i giorni) e ogni gruppo ha numerosità campionaria pari a 10. Quindi N = 120, k = 12 sottogruppi, ciascuno di taglia ni = 10, i = 1,...,12. Assegnare i dati ad una matrice. 24 12 24/01/2013 Costruire la carta di controllo della media in Matlab >> x >> xbarplot(x’,0.9973, spec,’range’) x= 94 108 105 85 93 111 109 102 99 93 97 118 97 96 103 100 92 99 115 104 92 92 101 93 95 90 108 86 84 84 94 106 108 95 98 111 85 109 110 100 109 92 105 111 96 110 108 97 102 93 99 97 109 95 96 103 88 93 94 92 108 99 95 91 88 96 99 101 80 98 101 106 95 103 83 98 110 85 111 109 104 97 115 93 89 103 95 91 99 95 93 105 97 96 110 92 94 99 87 114 100 102 89 110 85 93 101 84 89 113 91 86 109 99 100 100 94 91 113 109 >> m=mean(x’); Le medie vengono fatte sulle righe. Queste medie sono quelle plottate sulla carta di controllo. Quindi sulle ascisse si riportano i giorni (in sequenza). 25 CONF (optional) is the confidence level of the upper and lower plotted confidence limits. CONF is 0.9973 by default. This means that 99.73% of the plotted points should fall between the control limits if the process is in control. SPECS (optional) is a two element vector for the lower and upper specification limits of the response. SIGMAEST (optional) specifies how XBARPLOT should estimate sigma. Possible values are 'std' (the default) to use the average within-subgroup standard deviation, 'range' to use the average subgroup range, and 'variance' to use the square root of the pooled variance. OUTLIERS = XBARPLOT(DATA,CONF, SPECS,SIGMAEST) returns a vector of indices to the rows where the mean of DATA is out of control. >> xbarplot(x’,0.9973, spec,’range’) 26 13 24/01/2013 Le linee di controllo La linea centrale è rappresentata dalla media delle medie Le linee superiore ed inferiore corrispondono a 1 k x = ∑ xi k i =1 x ± z(1−CONF )/ 2 σ n ‘range’: si usa l’escursione standard ‘std’: si usa uno stimatore della deviazione standard ‘variance’: si usa uno stimatore della deviazione standard pesata ⇒σ 27 >> xbarplot(x’,0.9973,spec,'variance’)') Questa è la carta per la media con i limiti di controllo che dipendono dalla pooled variance che sostituisce direttamente la deviazione standard. 28 14 24/01/2013 Opzione ‘range’ 29 Con l’opzione ‘range’ >> xbarplot(x’,0.9973,spec,‘range') Questa è la carta per la media con i limiti di controllo che dipendono dal range σ← R per stimare σ (la variabilità del processo) d2 30 15 24/01/2013 Opzione ‘std’ Se la dimensione campionaria è abbastanza grande (>10,12) l’uso del range R è poco efficiente per la stima della varianza. Stesse considerazioni valgono nel caso di dimensione variabile (poiché si potrebbe perdere in efficienza) Vale che E S 2 = σ 2 e invece E [ S ] ≠ σ . Quindi σ non può essere valutato con S . Se X ≈ N ( µ , σ 2 ) ⇒ E [ S ] = σ c4 dove c4 è un parametro che dipende da n n − 1 ! 2 2 e n ! = n n − 1 n − 2 ⋯ 1 π c4 = n −1 n −1 2 2 2 2 2 1 ! − 2 Pertanto sostituiamo E [ S ] con S ed abbiamo che S 1 k σ ≈ dove S = ∑ Si c4 k i =311 >> xbarplot(x,0.9973,spec,'std') Questa è la carta per la media con i limiti di controllo che dipendono dalla deviazione standard. σ← S per stimare la variabilità del processo 32 c4 16 24/01/2013 REGOLE DI ZONA Per le regole di zona non c’è una function in MATLAB. Possiamo sovrapporre le linee per la lettura del grafico, usando la variabilità stimata per il processo. Se si usa una carta dell’escursione: >> mean(range(x))/3.078 ans = 7.5807 33 Le linee di zona sono: x ± 7.58; x ± 2*7.58; x ± 3*7.58 Usare il comando hold on per sovrapporre le regole di zona. >> x1low=mean(mean(x))-ones(12,1)*7.58; >> x1up=mean(mean(x))+ones(12,1)*7.58; >> x2low=mean(mean(x))-2*ones(12,1)*7.58; >> x2up=mean(mean(x))+2*ones(12,1)*7.58; >> x3low=mean(mean(x))-3*ones(12,1)*7.58; >> x3up=mean(mean(x))+3*ones(12,1)*7.58; >> hold on >> plot([1:12],x1low,'-b',[1:12],x1up,'-b',[1:12],x2low,'-p',[1:12],x2up,'-p',[1:12], x3up,'-k',[1:12],x3low,'-k') >> 34 17 24/01/2013 La carta della media va letta assieme ad una carta che restituisca la variabilità del campione casuale. Carta dell’escursione Carta della dev.standard Esiste una procedura in MATLAB per generarla I limiti di controllo della carta della deviazione standard >> schart(x) E [ S ] ∓ 3D [ S ] con D [ S ] = σ 1 − c42 ≈ s 1 − c42 c4 35 Non c’è una procedura per costruire la carta di controllo per l’escursione. >> r=range(x) r= 26 26 24 16 17 28 20 13 27 29 27 27 Calcolare la media delle escursioni: R= 1 k ∑ Ri k i =1 Var [W ] = Var [ R ] σ2 σ R2 ⇒d = 2 σ 2 3 R d2 σ R = d3σ ⇒ σ R = d3 36 18 24/01/2013 Carta dell’escursione >> lcent=mean(range(x))*ones(12,1); >> lup=lcent*1.777; >> ldown=lcent*0.223; >> plot([1:1:12],range(x),'-*b',[1:1:12],lcent, '-r',[1:1:12],lup,'-g',[1:1:12],ldown,'-g') >> axis([1,12,0,45]) Carta della dev.standard >> schart(x) 37 Carta di tolleranza carta di tolleranza 120 115 110 105 100 >> hold on >> … >> c2=2*ones(1,10); >> plot(c2,x(:,2),'g*-') >> … 95 90 85 80 0 2 4 6 8 10 12 19 24/01/2013 La carta della tolleranza è una carta sulla distribuzione della variabile che si sta monitorando. La carta della media è una carta sulla distribuzione della media campionaria della variabile che si sta monitorando. 39 La carta di controllo e il processo stocastico relativo alla produzione… 40 20 24/01/2013 Come si leggono le variazioni sulle carte di controllo Uno spostamento della media del processo produttivo, provoca l’apparire di una anomalia sulla carta di controllo della media: anche quando tale variazione sarà minima i punti della carta di controllo reagiranno in maniera apprezzabile Una variazione nella dispersione del processo produttivo provocherà anomalie avvertibili sia sulla carta di controllo della media che su quella della escursione , che tenderanno a distanziarsi tra di loro. 41 Carte MR (moving range) Non avendo più a disposizione gruppi di misurazioni, ma singoli valori, i limiti della carta di controllo cambiano. In Matlab non c’è una procedura. 42 21 24/01/2013 In Matlab >> for i=1:14 mr(i)=abs(x(i+1)-x(i)); end 1 n −1 MR = ∑ MRi n − 1 i =1 UCL = X + 3 MR 1.128 CL = X LCL = X − 3 MR 1.128 >> lineup=ones(15,1)*(mean(x)+3/1.128*mean(mr)); >> linedown=ones(15,1)*(mean(x)-3/1.128*mean(mr)); >> linecenter=ones(15,1)*mean(x); >> plot([1:1:15],x,'r',[1:1:15],lineup,'-g',[1:1:15],linedown,'-g',[1:1:15],linecenter,'-p') 43 Per l’escursione si usano gli stessi limiti della carta dell’ escursione classica, sostituendo l’ escursione media con la media della moving average. 44 22 24/01/2013 Curva caratteristica operativa Diremo che il processo è in controllo statistico se per ogni t , indice dei sottogruppi, xt ∈ ( LimInf , LimSup ). Regione di accettazione 45 Curva caratteristica operativa Diremo che il processo è in controllo statistico se per ogni t , indice dei sottogruppi, xt ∈ ( LimInf , LimSup ). Regione di accettazione α = P (rigettare H 0 | µ = µ0 ) = P( xt ∉ ( LCL, UCL) | µ = µ0 ) β = P(rigettare H1 | µ ≠ µ0 ) = P( xt ∈ ( LCL, UCL) | µ ≠ µ0 ) FALSO ALLARME MANCATO ALLARME 46 23 24/01/2013 Non avendo ipotesi alternative certe, immaginiamo che l’ipotesi alternativa possa essere strutturata come segue: µ = µ1 = µ0 + kσ Se la popolazione è gaussiana, allora β = P ( xt ∈ ( LCL, UCL) | µ = µ0 + kσ ) UCL − ( µ0 + kσ ) LCL − ( µ0 + kσ ) = Φ −Φ σ/ n σ/ n Il plot dei valori assunti da questo parametro per un opportuno valore di k, si chiama curva caratteristica operativa. Se UCL = µ0 + L σ e LCL = µ0 − L n ( ) ( σ n , allora β = Φ L − k n − Φ −L − k n ) e quindi perdiamo la dipendenza sia dalla deviazione standard che dalla media (che magari sono incognite!). NB: Per usare le curve operative è necessario avere qualche informazione in più sulla natura del processo (ad esempio che la popolazione è 47 gaussiana). Torniamo al nostro esempio dei flaconi. Siccome i limiti che abbiamo usato sono di tipo µ0 ± L σ dove L = 3, n = 10 e σ ≈ R / d 2 allora si ha ( n ) ( β = Φ 3 − k 10 − Φ −3 − k 10 ) Curva operativa >> k=[0.1:0.2:3]; >> z=normcdf(3-k.*sqrt(10))normcdf(-3-k.*sqrt(10)); >> plot(k,z) 1 0.9 0.8 0.7 0.6 Per k=1, vale circa 0.3 la probabilità di un mancato allarme. 0.5 0.4 0.3 Per valori di k inferiori, aumenta la probabilità di un mancato allarme. 0.2 0.1 0 0 0.5 1 1.5 2 2.5 3 48 24 24/01/2013 Spesso sui testi si incontrano famiglie di curve operative. Questo perché si cerca di capire al variare della taglia del sottogruppo come varia la probabilità di un mancato allarme. ( ) ( β = Φ 3 − k n − Φ −3 − k n ) Curve operative al variare di n 1 n=8 n=5 n=12 0.9 Ogni plot corrisponde ad un valore di n. 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 0.5 1 1.5 2 2.5 3 49 Altro uso della curva operativa Nella progettazione delle carte di controllo è necessario specificare sia la dimensione del campione che la frequenza di campionamento. • Più grande è il campione più è sensibile il rilevamento di una variazione all’interno del processo. • La pratica corrente tende a diminuire la dimensione del campione e ad aumentare la frequenza di campionamento. Si fissa β , e si cerca quel valore di z β tale che Φ ( zβ ) − Φ ( − zβ ) = β ossia, ricordando le proprietà della gaussiana... β +1 ⇒ z = 3 − k n β 2 ⇒ è possibile ricavare n 2Φ ( z β ) − 1 = β ⇒ z β = Φ −1 Per k=1 β = 0.3 >> ((3-norminv((0.3+1)/2,0,1)))^2 n=6 50 25 24/01/2013 Strategia di scelta dei sottogruppi …ma sono costosi! La pratica industriale corrente preferisce la prima strategia – aumentando la frequenza 51 Approcci per la costruzione dei sottogruppi Approccio SNAPSHOT Quanti k? Approccio RANDOM 52 26 24/01/2013 ARL (average long run) Sia T la variabile aleatoria che indica il numero di sottogruppi da estrarre prima di avere un punto fuori i limiti della carta di controllo. T ha legge... ...geometrica, P(T = k ) = p(1 − p)k −1 , k = 1, 2,... E [T ] = 1 ARL, tempo medio per avere un fuori controllo p Quanto vale p? Nella carta 3-sigma, la probabilità che il processo sia in controllo statistico è data dalla legge dei 3-sigma, ossia >> normcdf(3,0,1)-normcdf(-3,0,1) ans = Quindi la probabilità che il processo vada fuori controllo è 0.9973 >> 1-0.9973 ans = E [T ] = 370 0.0027 53 Strategia six-sigma La carta di controllo può essere utilizzata per descrivere la capacità del processo di produrre all’interno dei valori di specifica. Nell’esempio dei flaconi prodotti per l’ospedale, i limiti di specifica stabiliti in fase di progettazione erano 82 ml e 118 ml. >>h= (max(mean(x))-min(mean(x)))/4; >> c(1)=min(mean(x)); >> for i=2:5 c(i)=c(i-1)+h; end >>n=histc(mean(x),c); >>centri(1)=(c(1)+c(2))/2; >> for i=2:4 centri(i)=(c(i)+c(i-1))/2; end >>bar(centri,n(1:4)) 54 27 24/01/2013 In che modo? Basta calcolare P ( X < 82) + P( X > 118) ipotizzando che... X ≈ N (98.6, 7.51) che sono le stime trovate con la carta di controllo per µ e σ. >> inf=(82-98.6)/7.51; >> sup=(118-98.6)/7.51; >> 1-(normcdf(sup)-normcdf(inf)) p=1-diff(normcdf(spec,mean(mean(x)),7.51)) ans = 0.0184 Ossia circa lo 0.0184 per cento (184 parti su 10.000) di flaconi prodotti cadranno al di fuori delle specifiche, stante la produzione osservata e monitorata dalla carta di controllo. Più in generale indichiamo con TU − x T − x pe = P( X < TL ) + P ( X > TU ) = Φ L + 1 − Φ σˆ ˆ σ 55 Il valore minimo pe lo si ha quando la media coincide con il centro dell'intervallo di tolleranza me = TU + TL . 2 >> x=[90:0.1:110]; >> y=normcdf(88,x,7.51)+ (1-normcdf(112,x,7.51)); >> plot(x,y) Il valore effettivo di non conformi deve essere tale che pe < pT dove pT è il livello di difettosità tollerabile TL − TU e questo valore minimo vale pmin = 2Φ 2σˆ 56 28 24/01/2013 INDICE DI CAPACITA’ DEL PROCESSO Altro modo per misurare l’indice di capacità del processo è il cosidetto PCR (process capability ratio) : Cp = TU − TL 6σ Si noti che 6σ è la definizione di base della capacità del processo. In genere la deviazione standard non si conosce e quindi va stimata dai dati (carta dell'escursione) (S-chart) R d2 S c4 57 Andamento indice PCR Se il processo non è centrato, avere PCR>1 non garantisce che il processo produca la quasi totalità dei prodotti entro i limiti di specifica (è capace di farlo, ma non è detto che lo faccia) Ci vuole un indice che tenga conto della centratura. T − µ µ − TL C pk = min U , 3σ 3σ Da solo, non basta! 58 29 24/01/2013 Relazioni tra i due indici 59 Un impiegato esce di casa tutti i giorni alle 8.00 e deve entrare al lavoro alle 8.30. Per raggiungere l’ufficio in auto ha due possibilità: attraversare la città, o seguire un percorso di campagna, più lungo ma meno trafficato. Per decidere quale sia il percorso più conveniente, misura il tempo di percorrenza più volte su entrambi i percorsi e trova che attraversando la città impiega mediamente 25 minuti, mentre per il percorso in campagna occorrono in media 28 minuti. Quale percorso gli conviene seguire? Vecchia risposta: l’uomo dovrebbe scegliere il percorso cittadino, che in media è più veloce Risposta Sei Sigma: la media non è un indicatore significativo per questo studio. Infatti l’impiegato è penalizzato quando arriva in ritardo, ma non ha alcun beneficio quando arriva in anticipo. L’uomo definirebbe come difettosi i percorsi che richiedono più di 30 minuti di viaggio. Quindi si deve analizzare l’intera distribuzione dei dati nei due casi, riportata in figura. Come si vede, il percorso cittadino presenta una forte variabilità dei dati, perché è molto influenzato (oltre che poco prevedibilmente) dal traffico; il percorso di campagna invece richiede un tempo praticamente costante. Visto l’alto numero di difetti nel caso del percorso cittadino, è evidente che quello di campagna è preferibile dal punto di vista dell’impiegato. 60 30 24/01/2013 Il six-sigma program della Motorola – anni ‘80 Obbiettivi: Cp > 2 USL − LSL > 12σ min {USL − µ , µ − LSL} > 4.5σ e C pk > 1.5 In Matlab p = 0.0351 cp = 0.7119 cpk = 0.6565 >> spec=[82 118]; >> [p,Cp,Cpk]=capable(vec,spec) Cp < 1, quindi il processo non è capace (ossia rientra nei limiti specificati) Cpk< 1, il processo non è centrato rispetto alla media Cosa descrive p? La capacità che il processo produca entro i limiti specificati 61 Carta p • Si basa sulla percentuale di pezzi non conformi nel sottogruppo monitorato. • La numerosità campionaria dei sottogruppi può essere non costante. • La numerosità campionaria deve essere elevata. Perché? • La v.a. binomiale (e di Bernoulli) gioca un ruolo fondamentale. 62 31 24/01/2013 La percentuale di pezzi non conformi è data da pˆ = D , dove D ha legge... n ...binomiale di parametri n e p. I limiti di controllo sono: p(1 − p) (se np > 5,n(1- p) > 5 D è approx. gaussiana) n p±3 Se p non è nota, si può sostituire con una stima p D num.pezzi non conformi 1 k p = ∑ pi dove pi = i = k i =1 n n Il MATLAB non ha una procedura per la costruzione della carta p 63 Esempio: Un concentrato di succo d'arancia è congelato e imballato in lattine di cartone da 180ml. Queste lattine sono costruite usando una macchina che avvolge il cartone e poi lo appoggia su un pannello inferiore in metallo. Ispezionando una lattina, possiamo stabilire se, quando è piena, si può avere una perdita del succo dalla cucitura laterale o dal pannello inferiore. Tale non conformità può comportare un sigillo improprio sulla guarnizione laterale oppure sul pannello inferiore. Vogliamo costruire una carta di controllo per migliorare la percentuale di lattine non conformi prodotte dalla macchina. A questo scopo vengono selezionati 30 campioni di n = 50 lattine ciascuno, ogni mezz’ora su 3 periodi della giornata in cui la macchina è sempre in funzione. >> d d= Columns 1 through 17 12 15 8 10 4 7 16 9 14 10 5 6 17 12 22 8 10 Columns 18 through 30 5 13 11 20 18 24 15 9 12 7 13 9 6 64 32 24/01/2013 I valori da plottare sulla carta sono le percentuali di non conformità >> p=d/50 p= Columns 1 through 10 0.2400 0.3000 0.1600 0.2000 0.0800 0.1400 0.3200 0.1800 0.2800 0.2000 Columns 11 through 20 0.1000 0.1200 0.3400 0.2400 0.4400 0.1600 0.2000 0.1000 0.2600 0.2200 Columns 21 through 30 0.4000 0.3600 0.4800 0.3000 0.1800 0.2400 0.1400 0.2600 0.1800 0.1200 I limiti sono >> mean(p)-3*sqrt(mean(p)*(1-mean(p))/50) >> mean(p)+3*sqrt(mean(p)*(1-mean(p))/50) ans = ans = 0.4102 0.0524 65 >> cent=mean(p)*ones(1,30); >> upp=(mean(p)+3*sqrt(mean(p)*(1-mean(p))/50))*ones(1,30); >> low=(mean(p)-3*sqrt(mean(p)*(1-mean(p))/50))*ones(1,30); >> plot(k,p,'b*-',k,low,'r-',k,upp,'r-',k,cent,'g-') >> title(‘P-chart’) P chart Nuovo operatore 0.5 0.45 0.4 Nuova partita di cartone 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 5 10 15 20 25 30 Il campione 15 e 23 sono fuori controllo statistico: questi vanno monitorati. Rieffettuiamo il grafico della carta eliminando questi campioni. 66 33 24/01/2013 Costruiamo un nuovo vettore d1, che contiene la difettosità registrata, eliminando i due valori critici . >> d1(1:14)=d(1:14) >> d1(15:21)=d(16:22) >> d1(22:28)=d(24:30) E ripetiamo tutta la procedura Sottogruppo 20 (no. 21 nel vecchio campione) P chart 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 0 5 10 15 20 25 30 67 Questa è la carta senza aver eliminato i sottogruppi 15 e 23 ma con i limiti upper and lower calcolati al secondo giro: P chart 0.5 0.45 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 0 5 10 15 20 25 30 Se non si ritiene significativa la causa che ha portato al fuori controllo statistico nel sottogruppo 21, allora per future ispezioni si mantengono questi come limiti della carta di controllo. 68 34 24/01/2013 Supponiamo che siano stati campionati altri 24 sottogruppi: per monitorare il processo usiamo i limiti di controllo che sono stati calcolati prima. >> cent2= mean(p1)*ones(1,24); >> low2= low1(1)*ones(1,24); >> upp2= upp1(1)*ones(1,24); >> plot(k2,p2,'b*-', k2,low2,'r-',k2,upp2,'r-', k2,cent2,'g-') d2=[9,6,12,5,6,4,6,3,7,6,2,4,3,6,5,4,8,5,6,7,5,6,3,5]; P chart 0.4 0.35 0.3 0.25 0.2 Il processo è in controllo statistico. 0.15 0.1 Ma… 0.05 0 30 35 40 45 50 55 69 …se mettiamo tutti i dati assieme… P chart 0.5 0.45 0.4 0.35 Cambiamento della macchina per imballaggio? 0.3 0.25 0.2 0.15 0.1 0.05 0 0 10 20 30 40 50 60 Possiamo dire con maggiore precisione se le percentuali di non conformità sono effettivamente diverse? 70 35 24/01/2013 H 0 : p1 = p2 La regione critica risulta: H1 : p1 > p2 1 1 n p +n p Z > z0.05 p (1 − p ) + dove p = 1 1 2 2 n1 + n2 n1 n2 1.645 p1 ← 0.2150 (senza sottogruppi 15 e 23) n1 = ?, n2 = ? p2 ← 0.1108 1 28 1 28 D 301 pi = ∑ i = ∑ 28 i =1 28 i =1 50 1400 54 1 1 54 Di 133 p2 = p = = ∑ i 24 i∑ 24 i =31 1200 =31 50 p1 = ...e facendo i conti si ha p = 0.1669 e la regione critica (0.0241,∞) Pertanto si rigetta l'ipotesi nulla... 71 Visto che c’è stato un miglioramento nella produzione, si ricalcolano anche i limiti di controllo >> hold on >> lcent1=ones(24,1)*mean(d2/50); >> lup1=ones(24,1)*(mean(d2/50)+3*sqrt(mean(d2/50)*(1-mean(d2/50))/24)); >> llow1=ones(24,1)*(mean(d2/50)-3*sqrt(mean(d2/50)*(1-mean(d2/50))/24)); >> plot([31:1:54],d2/50,'-b*',[31:1:54],lcent1,'-g',[31:1:54],lup1,'-r‘, [31:1:54],llow1,'-g') New P-chart 0.6 0.5 0.4 0.3 0.2 0.1 0 -0.1 0 10 20 30 40 50 60 72 36 24/01/2013 Il limite inferiore è negativo!! Quindi bisogna prendere il limite inferiore pari a 0. New P-chart * Se p è piccolo, n va scelto grande!! Ad esempio per p=0.01, abbiamo n=500 (media almeno 5)!! 0.5 0.4 * Siccome lo shift da p vale δ =3 (1 − p ) p ⇒ 0.3 n 0.2 2 3 n = (1 − p ) p δ 0.1 δ = 0.04, p = 0.01 ⇒ n = 56 * p −3 (1 − p ) p n >0⇒n> 0 5 9(1 − p ) p 10 15 20 25 30 35 40 45 50 p = 0.05 ⇒ n = 171 73 Carta np Si lavora non con la percentuale dei pezzi non conformi, ma con il numero di pezzi non conformi. La percentuale di pezzi non conformi è data da pˆ = D , dove D ha legge... n ...binomiale di parametri n e p. Si lavora con D ≈ N (np, np (1- p )) I limiti della carta di controllo sono dunque: np ± 3 np (1 − p) p viene sostituito con p Tornando all’esempio di prima… 74 37 24/01/2013 Np chart 25 20 15 10 5 0 0 5 10 15 20 25 30 ⊗ Se le taglie dei sottogruppi sono diverse, una tecnica molto diffusa consiste nel sostituire a n la media campionaria delle taglie n = 1 k ∑ ni k i =1 75 Effettuare un grafico della curva caratteristica operativa β = P( pi ∈ ( LCL,UCL) | p = p1 ) Usando la cdf binomiale = P( Di ∈ ( nLCL, nUCL) | p = p1 ) β = P( Di ∈ (2.62, 20.51) | p = p1 ) Curva caratteristica per P-chart 1 >> p=[0.01:0.02:1]; >> app=binocdf(20.5120,50,p)binocdf(2.6214,50,p); >> plot(p,app) 0.9 0.8 0.7 0.6 0.5 Con gli stessi ragionamenti si possono calcolare gli altri parametri che abbiamo incontrato nelle precedenti lezioni. 0.4 0.3 0.2 0.1 0 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 76 38 24/01/2013 Carta c • Misura il numero di difetti in un lotto controllato. • Il campionamento deve essere costante. • E’ utile quando vi è da controllare un materiale con un flusso di produzione continuo (rullo di tessuto o un cavo elettrico). • La non conformità è da esprimersi per unità da definire (difetti al m^2, etc.) • Il lotto è inscindibile. 77 La v.a. che conta il numero di difetti per unità di misura è .... ...una v.a. di Poisson I limiti della carta di controllo sono c ± 3 c dove c è la costante di Poisson. In mancanza di un valore teorico per c si utilizza la media campionaria. Esercizio: Si riporta il numero di non-conformità osservato in 26 campioni prodotti in una successione di 100 circuiti stampati (100 circuiti stampati = 1 lotto). C chart >> c=[21,24,16,12,15,5,28,20,31, 25,20,24,16, 19,10,17,13,22,18, 39,30,24,16,19,17,15]; >> central=mean(c) = 19.67; >> upp=central+3*sqrt(central)=32.97; >> low=central-3*sqrt(central)=6.36; 40 35 30 25 20 Esercizio: eliminare il campione 20 e 6 e rifare la carta di controllo. 15 10 5 0 5 10 15 20 25 30 78 39 24/01/2013 Nell’esempio precedente, è stato preso in considerazione un solo lotto. Tuttavia questo tipo di scelta non è statisticamente significativa. Sarebbe meglio ispezionare più lotti, perché c’è maggiore possibilità di incontrare non conformità. Ad esempio potremmo essere interessati ad ispezionare 2 lotti e mezzo, ossia 250 circuiti. Carta U Si calcola il numero di non conformità totale e lo si rapporta al numero di lotti esaminati. Siccome x rappresenta il num. di pezzi non conformi totali, è una v.a. di Poisson, di cui x / n rappresenta la media cam- u= x n u =u ∓3 u n pionaria. 79 1 rotolo=50 m^2 di tessuto – La tabella riporta il num di difetti. Num. Num. m^2 Num.dif. Num. Di rotoli ispez. 1 500 14 10.0=500/50 2 400 12 8.0=400/50 3 650 20 13.0 4 500 11 10.0 5 475 7 9.5 6 500 10 10.0 7 600 21 12.0 8 525 16 10.5 9 600 19 12.0 10 625 Totale 23 12.5 153 107.50 u= 153 107.5 u ±3 u m con m = 1 k ∑ ni k i =1 80 40 24/01/2013 I valori della linea blu sono il numero di difetti diviso il numero di lotti esaminati (ultima colonna). >> punt=[14/10,12/8,20/13,11/10,7/9.5,1,21/12,16/10.5,19/12,23/12.5]; >> taglie=[10,8,13,10,9.5,10,12,10.5,12,12.5]; >> cent=ones(10,1)*153/107.5; >> lineup= ones(10,1)*(153/107.5+3*sqrt(153/(107.5*mean(taglie)))); >> linedown= ones(10,1)*(153/107.5-3*sqrt(153/(107.5*mean(taglie)))); >>plot([1:10],punt,’b-*’,[1:10],cent,’g-’,[1:10],lineup,’r-’,[1:10],linedown,’r-’) 81 Limiti carte Shewhart Caratteristica principale delle carte di Shewhart è che nel metodo di calcolo del valore della statistica da inserire nella carta di controllo, esse fanno uso unicamente dell’informazione sul processo contenute nel solo ultimo istante di osservazione, ignorando tutti quelli precedenti. Ciò rende la carta di Shewart relativamente insensibile alle piccole variazioni del livello del processo (di ampiezza in genere non superiore a 1.5 volte la deviazione standard) Carte CUMSUM (cumulative sum) = somme cumulate Carte EWMA (Exponential Weighted Moving Average) = medie mobili pesate esponenzialmente. 82 41 24/01/2013 Queste due carte funzionano bene nei confronti di piccoli salti di livello mentre non reagiscono così velocemente come la carta di Shewarth per salti di livello elevato. Può quindi risultare utile combinare l’uso della carta di Shewart con questi due tipi di carta. Shewart chart Esempio: i dati che andiamo ad esaminare sono stati costruiti al seguente modo. I primi 20 sono stati selezionati da una popolazione gaussiana di media 10 e deviazione standard 1. I rimanenti 10 sono stati selezionati da una popolazione gaussiana di media 11 e di deviazione standard 1. Questi ultimi si possono pensare come selezionati da un processo che è andato fuori controllo statistico. 14 13 12 11 10 9 8 7 6 5 10 15 20 25 30 La carta della media non segnala subito la variazione! 83 Nella carta CUMSUM si effettua il grafico di i Si = ∑ ( x j − µ0 ) = ( xi − µ0 ) + Si −1 j =1 carta cumsum >> s(1)=x(1)-10; >> for i=2:30 s(i)=s(i-1)+(x(i)-10) end 10 8 6 4 Quali sono i limiti di controllo? 2 0 -2 -4 0 5 10 15 20 25 30 Utile per misurazioni uniche. Altrimenti si usa la media campionaria dei sottogruppi. 84 42 24/01/2013 Exponential chart • Serve a monitorare un processo che media i dati in modo che a questa media viene dato sempre meno peso, mano mano che il tempo passa • Viene valutata su tutto il processo e non sui sottogruppi razionali • Più sensibile ai drift nel tempo • Robusta nel caso non normale 85 >>ewmaplot(x’) Exponentially Weighted Moving Average (EWMA) Chart 11.5 11 EWMA 10.5 CL 10 9.5 9 0 5 10 15 Sample Number 20 25 30 Attenzione: per vettori di misurazioni uniche, il vettore dei dati va passato sotto forma di 86 vettore colonna. 43 24/01/2013 DIAGRAMMI DI CORRELAZIONE Consideriamo 10 coppie di dati che mettono in relazione la percentuale di riuscita di un certo esperimento in laboratorio con la temperatura alla quale l’esperimento è condotto. >> x=[100, 110, 120, 130, 140, 150, 160, 170, 180, 190]; >> y=[45, 52, 54, 63, 62, 68, 75, 76, 92, 88]; Il coefficiente di correlazione di Pearson esprime il grado di relazione lineare esistente tra due campioni casuali. >> r=corrcoef(x,y) • E’ un numero adimensionale. r= i Assume valori tra -1 e 1. Uno strumento grafico utile per visualizzare il grado di dipendenza lineare esistente tra i due campioni, è lo scatter diagram (o diagramma di dispersione) . 1.0000 0.9772 0.9772 1.0000 >>polytool(x,y) E’ una function del MATLAB che consente di approssimare i punti dello scatter-diagram con un polinomio. 87 I punti sul grafico si riferiscono alle coppie ( xi , yi ) La retta in verde è la retta di regressione lineare. I coefficienti della retta sono determinati con il metodo dei mnimi quadrati. Le rette rosse sono i limiti dell’ intervallo di confidenza . 88 44 24/01/2013 Per conoscere i coefficienti della retta di regressione: >> beta beta = 0.4964 -4.4727 La retta di regressione è y = 0.4964 x − 4.4727 89 >> residuals residuals = -0.1636 1.8727 -1.0909 2.9455 -3.0182 -1.9818 0.0545 -3.9091 7.1273 -1.8364 ⌢ Se la retta di regressione lineare è y = α x + β e si indica con yi = α xi + β l'ordinata sulla retta in corrispondenza del dato i − esimo, il residuo ⌢ i -esimo è ei = yi − yi . 90 45 24/01/2013 Adeguatezza del modello: validazione Riprendendo l’esperimento condotto in laboratorio, detta Y la v.a. che descrive la percentuale di riuscita dell’esperimento e detta X la temperatura alla quale l’esperimento è condotto, si ha Y =αX +β Per effetto degli errori di misurazione yi = α xi + β + ε i ε i rappresenta lo scostamento del dato sperimentale dal valore ottenuto usando il modello lineare ⇒ in assenza di bias il valore ε i proviene da una gaussiana di media 0. E’ necessario verificare che i residui provengano da una popolazione gaussiana: a) Normplot b) Test di Kolmogorov-Smirnov 91 Adeguatezza del Modello – ANALISI DEI RESIDUI >> [H,P,KSSTAT,CV] = KSTEST(residuals/standard) Normal Probability Plot 0.95 0.90 H= 0 P= 0.8054 Probability 0.75 0.50 KSSTAT = 0.1933 0.25 0.10 0.05 CV = 0.4093 -4 -2 0 2 Data 4 6 >> 92 46 24/01/2013 Il coefficiente di correlazione non è una misura generale della relazione tra due variabili, ma esprime solo il grado di linearità della correlazione in un grafico a dispersione. C’è un solo caso in cui, quando il coefficiente di correlazione è nullo, allora le variabili aleatorie sono addirittura indipendenti: quando X e Y sono congiuntamente gaussiane. Gaussiana (congiunta) bidimensionale Esempio : La funzione densità di probabilità di una normale bivariata è : ( x − µ X )2 2 ρ ( x − µ X )( y − µ Y ) ( y − µ Y )2 1 exp − − + 2(1 − ρ 2 ) σ X2 σ Xσ Y σ Y2 2πσ X σ Y 1 − ρ 2 for ( x, y ) ∈ R 2 , ( µ X , µ Y ) ∈ R 2 , con parametri σ X > 0, σ Y > 0 e ρ ∈ (-1,1). f XY ( x, y ) = 1 µ X = E[X ] µY = E [Y ] σ X2 = Var[ X ] σ Y2 = Var[Y ] ρ ∈ (−1,1) 94 47 24/01/2013 Contour plots σ X = 1, σ Y = 1, µ X = 0, µ Y = 0, ρ = 0 σ X = 1, σ Y = 1, µ X = 0, µ Y = 0, ρ = 0.9 σ X = 1, σ Y = 1, µ X = 0, µ Y = 0, ρ = 0 95 Gli outliers possono modificare significativamente il valore del coefficiente di correlazione. 48 24/01/2013 49