Controllo statistico di qualità - Università degli Studi della Basilicata

Transcript

Controllo statistico di qualità - Università degli Studi della Basilicata
24/01/2013
Controllo statistico di qualità
1
Introduzione
• Un’azienda vorrebbe che tutti i pezzi prodotti
siano uguali: vuole cioè che la produzione sia
affidabile.
• L’affidabilità della produzione è affidata a due
momenti distinti: la progettazione della
produzione (off line) e il controllo che la
produzione sia almeno conforme ai parametri
specificati (on line).
2
1
24/01/2013
I 7 strumenti del controllo statistico di qualità
ESEMPIO: Una azienda farmaceutica decide di effettuare un controllo sul processo di iniezione
di un farmaco, per le cure tumorali, all’interno di appositi flaconi. L’azienda assume come tollerabili un quantitativo minimo di medicinale nei flaconi pari a 82 ml e uno massimo di 118 ml e
in fase di progetto stabilisce un quantitativo obbiettivo (target) di 95 ml. Gli operatori addetti
a tale compito hanno a disposizione le misure del contenuto dei flaconi del prodotto medicinale riportate nella tabella
3
I dati
Un primo approccio al problema può essere la costruzione di un istogramma.
DOMANDA: quale informazione si perde effettuando un istogramma?
4
2
24/01/2013
Istogramma dei dati
30
25
20
15
10
5
0
80
85
90
95
100
105
110
115
120
Dall’istogramma si può subito notare come i dati seguano approssimativamente una
distribuzione normale, con una piuttosto accentuata variabilità dei dati. Rispetto al target
aziendale il processo è abbastanza centrato, ma la variabilità risulta eccessiva per cui potrebbe essere necessaria una azione correttiva sulla variabilità del processo
5
Normal plot dei dati dell’esempio precedente
Normal Probability Plot
0.997
0.99
0.98
0.95
0.90
Probability
0.75
0.50
0.25
0.10
0.05
0.02
0.01
0.003
80
85
90
95
100
Data
105
110
115
6
3
24/01/2013
Un istogramma consente di valutare la precisione del processo produttivo tramite
l’analisi di dispersione della distribuzione dei dati, anche in relazione ai limiti di
tolleranza.
7
Dalla sovrapposizione dell’istogramma con la retta del valore obbiettivo si può
verificare il posizionamento del valore centrale dei dati rispetto al target assegnato
8
4
24/01/2013
9
10
5
24/01/2013
11
ESEMPIO
12
6
24/01/2013
13
14
7
24/01/2013
15
16
8
24/01/2013
La carta dei 3-sigma
Se dovesse essere disponibile una valutazione teorica (storica o di progetto) della
varianza della popolazione e della media, usando il teorema del limite centrale
σ
è possibile sostituire il parametro k con 3, per la varianza σ W =
e per media
n
si può usare quella della popolazione.
Esempio: parametro di flusso monitorato in una azienda con media e varianza nota
n=5
17
18
9
24/01/2013
19
20
10
24/01/2013
21
22
11
24/01/2013
23
Costruire la carta di controllo della media in Matlab
I dati sono in numero 12*10: ci sono 12 gruppi (i giorni) e ogni gruppo ha numerosità
campionaria pari a 10. Quindi
N = 120, k = 12 sottogruppi, ciascuno di taglia ni = 10, i = 1,...,12.
Assegnare i dati ad una matrice.
24
12
24/01/2013
Costruire la carta di controllo della media in Matlab
>> x
>> xbarplot(x’,0.9973, spec,’range’)
x=
94
108
105
85
93
111
109
102
99
93
97
118
97
96
103
100
92
99
115
104
92
92
101
93
95
90
108
86
84
84
94 106 108 95 98 111 85 109 110
100 109 92 105 111 96 110 108 97
102 93 99 97 109 95 96 103 88
93 94 92 108 99 95 91 88 96
99 101 80 98 101 106 95 103 83
98 110 85 111 109 104 97 115 93
89 103 95 91 99 95 93 105 97
96 110 92 94 99 87 114 100 102
89 110 85 93 101 84 89 113 91
86 109 99 100 100 94 91 113 109
>> m=mean(x’);
Le medie vengono
fatte sulle righe.
Queste medie sono quelle plottate sulla carta di controllo. Quindi
sulle ascisse si riportano i giorni (in sequenza).
25
CONF (optional) is the confidence level of the upper and lower plotted confidence
limits. CONF is 0.9973 by default. This means that 99.73% of the plotted points should
fall between the control limits if the process is in control.
SPECS (optional) is a two element vector for the lower and upper specification limits
of the response.
SIGMAEST (optional) specifies how XBARPLOT should estimate sigma. Possible values are
'std' (the default) to use the average within-subgroup standard deviation, 'range' to use the
average subgroup range, and 'variance' to use the square root of the pooled variance.
OUTLIERS =
XBARPLOT(DATA,CONF,
SPECS,SIGMAEST)
returns a vector of indices to
the rows where the mean of
DATA is out of control.
>> xbarplot(x’,0.9973,
spec,’range’)
26
13
24/01/2013
Le linee di controllo
La linea centrale è rappresentata dalla
media delle medie
Le linee superiore ed inferiore
corrispondono a
1 k
x = ∑ xi
k i =1
x ± z(1−CONF )/ 2
σ
n
‘range’: si usa l’escursione standard
‘std’: si usa uno stimatore della
deviazione standard
‘variance’: si usa uno stimatore
della deviazione standard pesata
⇒σ
27
>> xbarplot(x’,0.9973,spec,'variance’)')
Questa è la carta per la
media con i limiti di controllo che dipendono
dalla pooled variance
che sostituisce direttamente la deviazione standard.
28
14
24/01/2013
Opzione ‘range’
29
Con l’opzione ‘range’
>> xbarplot(x’,0.9973,spec,‘range')
Questa è la carta per la media con i limiti di controllo che dipendono dal range
σ←
R
per stimare σ (la variabilità del processo)
d2
30
15
24/01/2013
Opzione ‘std’
Se la dimensione campionaria è abbastanza grande (>10,12) l’uso del range R è poco
efficiente per la stima della varianza.
Stesse considerazioni valgono nel caso di dimensione variabile (poiché si potrebbe
perdere in efficienza)
Vale che E  S 2  = σ 2 e invece E [ S ] ≠ σ .
Quindi σ non può essere valutato con S .
Se X ≈ N ( µ , σ 2 ) ⇒ E [ S ] = σ c4 dove c4 è un parametro che dipende da n
n 
 − 1 !
2
 2  e  n  ! =  n  n − 1 n − 2 ⋯  1  π
c4 =
   

  
n −1  n −1 
 2   2  2  2
 2
1
!
−


 2

Pertanto sostituiamo E [ S ] con S ed abbiamo che
S
1 k
σ ≈ dove S = ∑
Si
c4
k i =311
>> xbarplot(x,0.9973,spec,'std')
Questa è la carta per la media con i limiti di controllo che dipendono dalla deviazione
standard.
σ←
S
per stimare la variabilità del processo
32
c4
16
24/01/2013
REGOLE DI ZONA
Per le regole di zona non
c’è una function in
MATLAB.
Possiamo sovrapporre le linee per la lettura del grafico, usando la variabilità stimata
per il processo. Se si usa una carta dell’escursione:
>> mean(range(x))/3.078
ans =
7.5807
33
Le linee di zona sono: x ± 7.58; x ± 2*7.58; x ± 3*7.58
Usare il comando hold on
per sovrapporre le regole
di zona.
>> x1low=mean(mean(x))-ones(12,1)*7.58;
>> x1up=mean(mean(x))+ones(12,1)*7.58;
>> x2low=mean(mean(x))-2*ones(12,1)*7.58;
>> x2up=mean(mean(x))+2*ones(12,1)*7.58;
>> x3low=mean(mean(x))-3*ones(12,1)*7.58;
>> x3up=mean(mean(x))+3*ones(12,1)*7.58;
>> hold on
>> plot([1:12],x1low,'-b',[1:12],x1up,'-b',[1:12],x2low,'-p',[1:12],x2up,'-p',[1:12],
x3up,'-k',[1:12],x3low,'-k')
>>
34
17
24/01/2013
La carta della media va letta assieme ad una carta che restituisca la variabilità del campione casuale.
Carta dell’escursione
Carta della dev.standard
Esiste una procedura in MATLAB per generarla
I limiti di controllo della
carta della deviazione
standard
>> schart(x)
E [ S ] ∓ 3D [ S ]
con D [ S ] = σ 1 − c42
≈
s
1 − c42
c4
35
Non c’è una procedura per costruire la carta di controllo per l’escursione.
>> r=range(x)
r=
26 26 24 16 17 28 20 13 27 29 27 27
Calcolare la media delle escursioni:
R=
1 k
∑ Ri
k i =1
Var [W ] =
Var [ R ]
σ2
σ R2
⇒d = 2
σ
2
3
R

 d2 
σ R = d3σ ⇒ σ R = d3 
36
18
24/01/2013
Carta dell’escursione
>> lcent=mean(range(x))*ones(12,1);
>> lup=lcent*1.777;
>> ldown=lcent*0.223;
>> plot([1:1:12],range(x),'-*b',[1:1:12],lcent,
'-r',[1:1:12],lup,'-g',[1:1:12],ldown,'-g')
>> axis([1,12,0,45])
Carta della dev.standard
>> schart(x)
37
Carta di tolleranza
carta di tolleranza
120
115
110
105
100
>> hold on
>> …
>> c2=2*ones(1,10);
>> plot(c2,x(:,2),'g*-')
>> …
95
90
85
80
0
2
4
6
8
10
12
19
24/01/2013
La carta della tolleranza è una carta sulla distribuzione della variabile che si sta monitorando.
La carta della media è una carta sulla distribuzione della media campionaria della variabile
che si sta monitorando.
39
La carta di controllo e il processo stocastico relativo alla produzione…
40
20
24/01/2013
Come si leggono le variazioni sulle carte di controllo
Uno spostamento della media del
processo produttivo, provoca l’apparire di una anomalia sulla carta
di controllo della media: anche
quando tale variazione sarà minima
i punti della carta di controllo
reagiranno in maniera apprezzabile
Una variazione nella dispersione del processo produttivo provocherà anomalie avvertibili sia sulla carta di controllo della media che su quella della
escursione , che tenderanno a distanziarsi tra di loro.
41
Carte MR (moving range)
Non avendo più a disposizione gruppi di
misurazioni, ma singoli valori, i limiti della
carta di controllo cambiano.
In Matlab non c’è una procedura.
42
21
24/01/2013
In Matlab
>> for i=1:14 mr(i)=abs(x(i+1)-x(i)); end
1 n −1
MR =
∑ MRi
n − 1 i =1
UCL = X +
3
MR
1.128
CL = X
LCL = X −
3
MR
1.128
>> lineup=ones(15,1)*(mean(x)+3/1.128*mean(mr));
>> linedown=ones(15,1)*(mean(x)-3/1.128*mean(mr));
>> linecenter=ones(15,1)*mean(x);
>> plot([1:1:15],x,'r',[1:1:15],lineup,'-g',[1:1:15],linedown,'-g',[1:1:15],linecenter,'-p')
43
Per l’escursione si usano gli
stessi limiti della carta dell’
escursione classica, sostituendo
l’ escursione media con la media
della moving average.
44
22
24/01/2013
Curva caratteristica operativa
Diremo che il processo è in controllo statistico se per ogni
t , indice dei sottogruppi, xt ∈ ( LimInf , LimSup ).
Regione di accettazione
45
Curva caratteristica operativa
Diremo che il processo è in controllo statistico se per ogni
t , indice dei sottogruppi, xt ∈ ( LimInf , LimSup ).
Regione di accettazione
α = P (rigettare H 0 | µ = µ0 ) = P( xt ∉ ( LCL, UCL) | µ = µ0 )
β = P(rigettare H1 | µ ≠ µ0 ) = P( xt ∈ ( LCL, UCL) | µ ≠ µ0 )
FALSO ALLARME
MANCATO ALLARME
46
23
24/01/2013
Non avendo ipotesi alternative certe, immaginiamo che l’ipotesi alternativa possa essere strutturata come segue: µ = µ1 = µ0 + kσ
Se la popolazione è gaussiana, allora
β = P ( xt ∈ ( LCL, UCL) | µ = µ0 + kσ )
 UCL − ( µ0 + kσ ) 
 LCL − ( µ0 + kσ ) 
= Φ
−Φ

σ/ n
σ/ n




Il plot dei valori assunti da questo parametro per un opportuno valore
di k, si chiama curva caratteristica operativa.
Se UCL = µ0 + L
σ
e LCL = µ0 − L
n
(
) (
σ
n
, allora
β = Φ L − k n − Φ −L − k n
)
e quindi perdiamo la dipendenza sia dalla deviazione standard che dalla media (che magari sono incognite!).
NB: Per usare le curve operative è necessario avere qualche informazione in più sulla natura del processo (ad esempio che la popolazione è
47
gaussiana).
Torniamo al nostro esempio dei flaconi. Siccome i limiti che abbiamo usato sono di tipo
µ0 ± L
σ
dove L = 3, n = 10 e σ ≈ R / d 2 allora si ha
(
n
) (
β = Φ 3 − k 10 − Φ −3 − k 10
)
Curva operativa
>> k=[0.1:0.2:3];
>> z=normcdf(3-k.*sqrt(10))normcdf(-3-k.*sqrt(10));
>> plot(k,z)
1
0.9
0.8
0.7
0.6
Per k=1, vale circa 0.3 la probabilità di un mancato allarme.
0.5
0.4
0.3
Per valori di k inferiori, aumenta
la probabilità di un mancato
allarme.
0.2
0.1
0
0
0.5
1
1.5
2
2.5
3
48
24
24/01/2013
Spesso sui testi si incontrano famiglie di curve operative. Questo
perché si cerca di capire al variare della taglia del sottogruppo come
varia la probabilità di un mancato allarme.
(
) (
β = Φ 3 − k n − Φ −3 − k n
)
Curve operative al variare di n
1
n=8
n=5
n=12
0.9
Ogni plot corrisponde
ad un valore di n.
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
0.5
1
1.5
2
2.5
3
49
Altro uso della curva operativa
Nella progettazione delle carte di controllo è necessario specificare sia la
dimensione del campione che la frequenza di campionamento.
• Più grande è il campione più è sensibile il rilevamento di una variazione
all’interno del processo.
• La pratica corrente tende a diminuire la dimensione del campione e ad
aumentare la frequenza di campionamento.
Si fissa β , e si cerca quel valore di z β tale che Φ ( zβ ) − Φ ( − zβ ) = β ossia,
ricordando le proprietà della gaussiana...
 β +1  ⇒ z = 3 − k n
β

 2 
⇒ è possibile ricavare n
2Φ ( z β ) − 1 = β ⇒ z β = Φ 
−1
Per k=1
β = 0.3
>> ((3-norminv((0.3+1)/2,0,1)))^2
n=6
50
25
24/01/2013
Strategia di scelta dei sottogruppi
…ma sono costosi!
La pratica industriale corrente preferisce la prima strategia – aumentando la frequenza
51
Approcci per la costruzione dei sottogruppi
Approccio SNAPSHOT
Quanti k?
Approccio RANDOM
52
26
24/01/2013
ARL (average long run)
Sia T la variabile aleatoria che indica il numero di sottogruppi da
estrarre prima di avere un punto fuori i limiti della carta di controllo.
T ha legge...
...geometrica, P(T = k ) = p(1 − p)k −1 , k = 1, 2,...
E [T ] =
1
ARL, tempo medio per avere un fuori controllo
p
Quanto vale p? Nella carta 3-sigma, la probabilità che il processo sia in
controllo statistico è data dalla legge dei 3-sigma, ossia
>> normcdf(3,0,1)-normcdf(-3,0,1)
ans =
Quindi la probabilità che il processo
vada fuori controllo è
0.9973
>> 1-0.9973
ans =
E [T ] = 370
0.0027
53
Strategia six-sigma
La carta di controllo può essere utilizzata per descrivere la capacità del
processo di produrre all’interno dei valori di specifica.
Nell’esempio dei flaconi prodotti per l’ospedale, i limiti di specifica
stabiliti in fase di progettazione erano 82 ml e 118 ml.
>>h= (max(mean(x))-min(mean(x)))/4;
>> c(1)=min(mean(x));
>> for i=2:5 c(i)=c(i-1)+h; end
>>n=histc(mean(x),c);
>>centri(1)=(c(1)+c(2))/2;
>> for i=2:4 centri(i)=(c(i)+c(i-1))/2; end
>>bar(centri,n(1:4))
54
27
24/01/2013
In che modo?
Basta calcolare P ( X < 82) + P( X > 118) ipotizzando che...
X ≈ N (98.6, 7.51) che sono le stime trovate con la carta di controllo per
µ e σ.
>> inf=(82-98.6)/7.51;
>> sup=(118-98.6)/7.51;
>> 1-(normcdf(sup)-normcdf(inf))
p=1-diff(normcdf(spec,mean(mean(x)),7.51))
ans =
0.0184
Ossia circa lo 0.0184 per cento (184 parti su 10.000) di flaconi prodotti
cadranno al di fuori delle specifiche, stante la produzione osservata e
monitorata dalla carta di controllo.
Più in generale indichiamo con
 TU − x 
T − x 
pe = P( X < TL ) + P ( X > TU ) = Φ  L
 + 1 − Φ  σˆ 
ˆ
σ




55
Il valore minimo pe lo si ha quando la media coincide con il centro dell'intervallo di
tolleranza me =
TU + TL
.
2
>> x=[90:0.1:110];
>> y=normcdf(88,x,7.51)+
(1-normcdf(112,x,7.51));
>> plot(x,y)
Il valore effettivo di non
conformi deve essere tale
che pe < pT dove pT è il
livello di difettosità
tollerabile
 TL − TU 
e questo valore minimo vale pmin = 2Φ 

 2σˆ 
56
28
24/01/2013
INDICE DI CAPACITA’ DEL PROCESSO
Altro modo per misurare l’indice di capacità del processo è il cosidetto
PCR (process capability ratio) :
Cp =
TU − TL
6σ
Si noti che 6σ è la definizione di base della capacità del processo.
In genere la deviazione standard non si conosce e quindi va stimata
dai dati
(carta dell'escursione)
(S-chart)
R
d2
S
c4
57
Andamento indice PCR
Se il processo non è centrato, avere PCR>1 non
garantisce che il processo produca la quasi totalità dei prodotti entro i limiti di specifica (è capace di farlo, ma non è detto che lo faccia)
Ci vuole un indice che tenga conto della centratura.
 T − µ µ − TL 
C pk = min  U
,

3σ 
 3σ
Da solo, non basta!
58
29
24/01/2013
Relazioni tra i due indici
59
Un impiegato esce di casa tutti i giorni alle 8.00 e deve entrare al lavoro alle 8.30. Per
raggiungere l’ufficio in auto ha due possibilità: attraversare la città, o seguire un percorso
di campagna, più lungo ma meno trafficato. Per decidere quale sia il percorso più conveniente, misura il tempo di percorrenza più volte su entrambi i percorsi e trova che
attraversando la città impiega mediamente 25 minuti, mentre per il percorso in campagna occorrono in media 28 minuti. Quale percorso gli conviene seguire?
Vecchia risposta: l’uomo dovrebbe scegliere il percorso cittadino, che in media è più veloce
Risposta Sei Sigma: la media non è un
indicatore significativo per questo studio.
Infatti l’impiegato è penalizzato quando
arriva in ritardo, ma non ha alcun beneficio quando arriva in anticipo. L’uomo definirebbe come difettosi i percorsi che
richiedono più di 30 minuti di viaggio.
Quindi si deve analizzare l’intera distribuzione dei dati nei due casi, riportata
in figura. Come si vede, il percorso cittadino presenta una forte variabilità dei dati, perché
è molto influenzato (oltre che poco prevedibilmente) dal traffico; il percorso di campagna
invece richiede un tempo praticamente costante. Visto l’alto numero di difetti nel caso
del percorso cittadino, è evidente che quello di campagna è preferibile
dal punto di vista dell’impiegato.
60
30
24/01/2013
Il six-sigma program della Motorola – anni ‘80
Obbiettivi:
Cp > 2
USL − LSL > 12σ
min {USL − µ , µ − LSL} > 4.5σ
e
C pk > 1.5
In Matlab
p = 0.0351
cp = 0.7119
cpk = 0.6565
>> spec=[82 118];
>> [p,Cp,Cpk]=capable(vec,spec)
Cp < 1, quindi il processo non è capace (ossia rientra nei limiti specificati)
Cpk< 1, il processo non è centrato rispetto alla media
Cosa descrive p?
La capacità che il processo produca entro i limiti specificati
61
Carta p
• Si basa sulla percentuale di pezzi non conformi
nel sottogruppo monitorato.
• La numerosità campionaria dei sottogruppi
può essere non costante.
• La numerosità campionaria deve essere
elevata. Perché?
• La v.a. binomiale (e di Bernoulli) gioca un
ruolo fondamentale.
62
31
24/01/2013
La percentuale di pezzi non conformi è data da pˆ =
D
, dove D ha legge...
n
...binomiale di parametri n e p.
I limiti di controllo sono:
p(1 − p)
(se np > 5,n(1- p) > 5 D è approx. gaussiana)
n
p±3
Se p non è nota, si può sostituire con una stima p
D num.pezzi non conformi
1 k
p = ∑ pi dove pi = i =
k i =1
n
n
Il MATLAB non ha una procedura per la costruzione della carta p
63
Esempio: Un concentrato di succo d'arancia è congelato e imballato in lattine di cartone da 180ml. Queste lattine sono costruite usando una macchina che avvolge il
cartone e poi lo appoggia su un pannello inferiore in metallo. Ispezionando una lattina, possiamo stabilire se, quando è piena, si può avere una perdita del succo dalla
cucitura laterale o dal pannello inferiore. Tale non conformità può comportare un
sigillo improprio sulla guarnizione laterale oppure sul pannello inferiore.
Vogliamo costruire una carta di controllo per migliorare la percentuale di lattine non
conformi prodotte dalla macchina.
A questo scopo vengono selezionati 30 campioni di n = 50 lattine ciascuno, ogni
mezz’ora su 3 periodi della giornata in cui la macchina è sempre in funzione.
>> d
d=
Columns 1 through 17
12 15
8 10
4
7 16
9 14 10
5
6 17 12 22
8 10
Columns 18 through 30
5 13 11 20 18 24 15
9 12
7 13
9
6
64
32
24/01/2013
I valori da plottare sulla carta sono le percentuali di non conformità
>> p=d/50
p=
Columns 1 through 10
0.2400 0.3000 0.1600 0.2000 0.0800 0.1400 0.3200 0.1800 0.2800 0.2000
Columns 11 through 20
0.1000 0.1200 0.3400 0.2400 0.4400 0.1600 0.2000 0.1000 0.2600 0.2200
Columns 21 through 30
0.4000 0.3600 0.4800 0.3000 0.1800 0.2400 0.1400 0.2600 0.1800 0.1200
I limiti sono
>> mean(p)-3*sqrt(mean(p)*(1-mean(p))/50)
>> mean(p)+3*sqrt(mean(p)*(1-mean(p))/50)
ans =
ans =
0.4102
0.0524
65
>> cent=mean(p)*ones(1,30);
>> upp=(mean(p)+3*sqrt(mean(p)*(1-mean(p))/50))*ones(1,30);
>> low=(mean(p)-3*sqrt(mean(p)*(1-mean(p))/50))*ones(1,30);
>> plot(k,p,'b*-',k,low,'r-',k,upp,'r-',k,cent,'g-')
>> title(‘P-chart’)
P chart
Nuovo
operatore
0.5
0.45
0.4
Nuova
partita di
cartone
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
5
10
15
20
25
30
Il campione 15 e 23 sono fuori controllo statistico: questi vanno monitorati.
Rieffettuiamo il grafico della carta eliminando questi campioni.
66
33
24/01/2013
Costruiamo un nuovo vettore d1, che contiene la difettosità registrata, eliminando i due valori
critici .
>> d1(1:14)=d(1:14)
>> d1(15:21)=d(16:22)
>> d1(22:28)=d(24:30)
E ripetiamo tutta la procedura
Sottogruppo 20
(no. 21 nel vecchio
campione)
P chart
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
0
5
10
15
20
25
30
67
Questa è la carta senza aver eliminato i sottogruppi 15 e 23 ma con i limiti upper and lower
calcolati al secondo giro:
P chart
0.5
0.45
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
0
5
10
15
20
25
30
Se non si ritiene significativa la causa che ha portato al fuori controllo statistico nel
sottogruppo 21, allora per future ispezioni si mantengono questi come limiti della
carta di controllo.
68
34
24/01/2013
Supponiamo che siano stati campionati altri 24 sottogruppi: per monitorare il processo usiamo
i limiti di controllo che sono stati calcolati prima.
>> cent2=
mean(p1)*ones(1,24);
>> low2=
low1(1)*ones(1,24);
>> upp2=
upp1(1)*ones(1,24);
>> plot(k2,p2,'b*-',
k2,low2,'r-',k2,upp2,'r-',
k2,cent2,'g-')
d2=[9,6,12,5,6,4,6,3,7,6,2,4,3,6,5,4,8,5,6,7,5,6,3,5];
P chart
0.4
0.35
0.3
0.25
0.2
Il processo è in controllo
statistico.
0.15
0.1
Ma…
0.05
0
30
35
40
45
50
55
69
…se mettiamo tutti i dati assieme…
P chart
0.5
0.45
0.4
0.35
Cambiamento
della macchina
per imballaggio?
0.3
0.25
0.2
0.15
0.1
0.05
0
0
10
20
30
40
50
60
Possiamo dire con maggiore precisione se le percentuali di non conformità sono effettivamente diverse?
70
35
24/01/2013
H 0 : p1 = p2
La regione critica risulta:
H1 : p1 > p2
1 1
n p +n p
Z > z0.05 p (1 − p )  +  dove p = 1 1 2 2
n1 + n2
 n1 n2 
1.645
p1 ← 0.2150 (senza sottogruppi 15 e 23)
n1 = ?, n2 = ?
p2 ← 0.1108
1 28
1 28 D
301
pi = ∑ i =
∑
28 i =1
28 i =1 50 1400
54
1
1 54 Di 133
p2 =
p
=
=
∑ i 24 i∑
24 i =31
1200
=31 50
p1 =
...e facendo i conti si ha p = 0.1669 e
la regione critica (0.0241,∞)
Pertanto si rigetta l'ipotesi nulla...
71
Visto che c’è stato un miglioramento nella produzione, si ricalcolano anche i limiti di controllo
>> hold on
>> lcent1=ones(24,1)*mean(d2/50);
>> lup1=ones(24,1)*(mean(d2/50)+3*sqrt(mean(d2/50)*(1-mean(d2/50))/24));
>> llow1=ones(24,1)*(mean(d2/50)-3*sqrt(mean(d2/50)*(1-mean(d2/50))/24));
>> plot([31:1:54],d2/50,'-b*',[31:1:54],lcent1,'-g',[31:1:54],lup1,'-r‘, [31:1:54],llow1,'-g')
New P-chart
0.6
0.5
0.4
0.3
0.2
0.1
0
-0.1
0
10
20
30
40
50
60
72
36
24/01/2013
Il limite inferiore è negativo!! Quindi bisogna prendere il limite inferiore pari a 0.
New P-chart
* Se p è piccolo, n va scelto
grande!! Ad esempio per
p=0.01, abbiamo n=500 (media
almeno 5)!!
0.5
0.4
* Siccome lo shift da p
vale δ =3
(1 − p ) p ⇒
0.3
n
0.2
2
3
n =   (1 − p ) p
δ 
0.1
δ = 0.04, p = 0.01 ⇒ n = 56
* p −3
(1 − p ) p
n
>0⇒n>
0
5
9(1 − p )
p
10
15
20
25
30
35
40
45
50
p = 0.05 ⇒ n = 171
73
Carta np
Si lavora non con la percentuale dei pezzi non conformi, ma con il numero di pezzi non
conformi.
La percentuale di pezzi non conformi è data da pˆ =
D
, dove D ha legge...
n
...binomiale di parametri n e p.
Si lavora con D ≈ N (np, np (1- p ))
I limiti della carta di controllo sono dunque: np ± 3 np (1 − p)
p viene sostituito con p
Tornando all’esempio di prima…
74
37
24/01/2013
Np chart
25
20
15
10
5
0
0
5
10
15
20
25
30
⊗ Se le taglie dei sottogruppi sono diverse, una tecnica molto diffusa consiste nel
sostituire a n la media campionaria delle taglie n =
1 k
∑ ni
k i =1
75
Effettuare un grafico della curva caratteristica operativa
β = P( pi ∈ ( LCL,UCL) | p = p1 )
Usando la cdf binomiale
= P( Di ∈ ( nLCL, nUCL) | p = p1 )
β = P( Di ∈ (2.62, 20.51) | p = p1 )
Curva caratteristica per P-chart
1
>> p=[0.01:0.02:1];
>> app=binocdf(20.5120,50,p)binocdf(2.6214,50,p);
>> plot(p,app)
0.9
0.8
0.7
0.6
0.5
Con gli stessi ragionamenti
si possono calcolare gli
altri parametri che abbiamo
incontrato nelle precedenti
lezioni.
0.4
0.3
0.2
0.1
0
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
76
38
24/01/2013
Carta c
• Misura il numero di difetti in un lotto
controllato.
• Il campionamento deve essere costante.
• E’ utile quando vi è da controllare un
materiale con un flusso di produzione
continuo (rullo di tessuto o un cavo elettrico).
• La non conformità è da esprimersi per unità
da definire (difetti al m^2, etc.)
• Il lotto è inscindibile.
77
La v.a. che conta il numero di difetti per unità di misura è ....
...una v.a. di Poisson
I limiti della carta di controllo sono c ± 3 c dove c è la costante di Poisson.
In mancanza di un valore teorico per c si utilizza la media campionaria.
Esercizio: Si riporta il numero di non-conformità osservato in 26 campioni prodotti in
una successione di 100 circuiti stampati (100 circuiti stampati = 1 lotto).
C chart
>> c=[21,24,16,12,15,5,28,20,31,
25,20,24,16, 19,10,17,13,22,18,
39,30,24,16,19,17,15];
>> central=mean(c) = 19.67;
>> upp=central+3*sqrt(central)=32.97;
>> low=central-3*sqrt(central)=6.36;
40
35
30
25
20
Esercizio: eliminare il campione 20 e
6 e rifare la carta di controllo.
15
10
5
0
5
10
15
20
25
30
78
39
24/01/2013
Nell’esempio precedente, è stato preso in considerazione un solo lotto. Tuttavia questo
tipo di scelta non è statisticamente significativa. Sarebbe meglio ispezionare più lotti,
perché c’è maggiore possibilità di incontrare non conformità.
Ad esempio potremmo essere interessati ad ispezionare 2 lotti e mezzo, ossia 250 circuiti.
Carta U
Si calcola il numero di non conformità totale e lo si rapporta al numero di lotti esaminati.
Siccome x rappresenta il num.
di pezzi non conformi totali,
è una v.a. di Poisson, di cui x / n
rappresenta la media cam-
u=
x
n
u =u ∓3
u
n
pionaria.
79
1 rotolo=50 m^2 di tessuto – La tabella riporta il num di difetti.
Num.
Num. m^2
Num.dif.
Num. Di
rotoli ispez.
1
500
14
10.0=500/50
2
400
12
8.0=400/50
3
650
20
13.0
4
500
11
10.0
5
475
7
9.5
6
500
10
10.0
7
600
21
12.0
8
525
16
10.5
9
600
19
12.0
10
625
Totale
23
12.5
153
107.50
u=
153
107.5
u ±3
u
m
con m =
1 k
∑ ni
k i =1
80
40
24/01/2013
I valori della linea blu sono il numero di difetti diviso il numero di lotti esaminati (ultima
colonna).
>> punt=[14/10,12/8,20/13,11/10,7/9.5,1,21/12,16/10.5,19/12,23/12.5];
>> taglie=[10,8,13,10,9.5,10,12,10.5,12,12.5];
>> cent=ones(10,1)*153/107.5;
>> lineup= ones(10,1)*(153/107.5+3*sqrt(153/(107.5*mean(taglie))));
>> linedown= ones(10,1)*(153/107.5-3*sqrt(153/(107.5*mean(taglie))));
>>plot([1:10],punt,’b-*’,[1:10],cent,’g-’,[1:10],lineup,’r-’,[1:10],linedown,’r-’)
81
Limiti carte Shewhart
Caratteristica principale delle carte di Shewhart è che nel
metodo di calcolo del valore della statistica da inserire nella
carta di controllo, esse fanno uso unicamente
dell’informazione sul processo contenute nel solo ultimo
istante di osservazione, ignorando tutti quelli precedenti.
Ciò rende la carta di Shewart relativamente insensibile alle
piccole variazioni del livello del processo (di ampiezza in
genere non superiore a 1.5 volte la deviazione standard)
Carte CUMSUM (cumulative sum) = somme cumulate
Carte EWMA (Exponential Weighted Moving Average) = medie mobili pesate esponenzialmente.
82
41
24/01/2013
Queste due carte funzionano bene nei confronti di piccoli salti di livello mentre non reagiscono così velocemente come la carta di Shewarth per salti di livello elevato. Può quindi
risultare utile combinare l’uso della carta di Shewart con questi due tipi di carta.
Shewart chart
Esempio: i dati che andiamo ad
esaminare sono stati costruiti al
seguente modo. I primi 20 sono
stati selezionati da una popolazione gaussiana di media 10 e
deviazione standard 1. I rimanenti
10 sono stati selezionati da una
popolazione gaussiana di media
11 e di deviazione standard 1.
Questi ultimi si possono
pensare come selezionati da un
processo che è andato fuori
controllo statistico.
14
13
12
11
10
9
8
7
6
5
10
15
20
25
30
La carta della media non segnala subito la variazione!
83
Nella carta CUMSUM si effettua il grafico di
i
Si = ∑ ( x j − µ0 ) = ( xi − µ0 ) + Si −1
j =1
carta cumsum
>> s(1)=x(1)-10;
>> for i=2:30
s(i)=s(i-1)+(x(i)-10)
end
10
8
6
4
Quali sono i limiti
di controllo?
2
0
-2
-4
0
5
10
15
20
25
30
Utile per misurazioni uniche. Altrimenti si usa
la media campionaria dei sottogruppi.
84
42
24/01/2013
Exponential chart
• Serve a monitorare un processo che media i
dati in modo che a questa media viene dato
sempre meno peso, mano mano che il tempo
passa
• Viene valutata su tutto il processo e non sui
sottogruppi razionali
• Più sensibile ai drift nel tempo
• Robusta nel caso non normale
85
>>ewmaplot(x’)
Exponentially Weighted Moving Average (EWMA) Chart
11.5
11
EWMA
10.5
CL
10
9.5
9
0
5
10
15
Sample Number
20
25
30
Attenzione: per vettori di misurazioni uniche, il vettore dei dati va passato sotto forma di
86
vettore colonna.
43
24/01/2013
DIAGRAMMI DI CORRELAZIONE
Consideriamo 10 coppie di dati che mettono in relazione la percentuale di riuscita di un certo
esperimento in laboratorio con la temperatura alla quale l’esperimento è condotto.
>> x=[100, 110, 120, 130, 140, 150, 160, 170, 180, 190];
>> y=[45, 52, 54, 63, 62, 68, 75, 76, 92, 88];
Il coefficiente di correlazione di Pearson esprime il grado di relazione lineare esistente tra due
campioni casuali.
>> r=corrcoef(x,y)
• E’ un numero adimensionale.
r=
i Assume valori tra -1 e 1.
Uno strumento grafico utile per visualizzare il grado di dipendenza
lineare esistente tra i due campioni, è lo scatter diagram (o diagramma di dispersione) .
1.0000 0.9772
0.9772 1.0000
>>polytool(x,y)
E’ una function del MATLAB che consente di approssimare i punti dello scatter-diagram con
un polinomio.
87
I punti sul grafico si riferiscono
alle coppie ( xi , yi )
La retta in verde è la retta di
regressione lineare.
I coefficienti della retta sono
determinati con il metodo dei
mnimi quadrati.
Le rette rosse sono i limiti dell’
intervallo di confidenza .
88
44
24/01/2013
Per conoscere i coefficienti della retta di regressione:
>> beta
beta =
0.4964 -4.4727
La retta di regressione è
y = 0.4964 x − 4.4727
89
>> residuals
residuals =
-0.1636
1.8727
-1.0909
2.9455
-3.0182
-1.9818
0.0545
-3.9091
7.1273
-1.8364
⌢
Se la retta di regressione lineare è y = α x + β e si indica con yi = α xi + β
l'ordinata sulla retta in corrispondenza del dato i − esimo, il residuo
⌢
i -esimo è ei = yi − yi .
90
45
24/01/2013
Adeguatezza del modello: validazione
Riprendendo l’esperimento condotto in laboratorio, detta Y la v.a. che descrive la percentuale
di riuscita dell’esperimento e detta X la temperatura alla quale l’esperimento è condotto, si ha
Y =αX +β
Per effetto degli errori di misurazione
yi = α xi + β + ε i
ε i rappresenta lo scostamento del dato sperimentale dal valore
ottenuto usando il modello lineare ⇒ in assenza di bias il valore ε i proviene da una gaussiana di media 0.
E’ necessario verificare che i residui provengano da una popolazione gaussiana:
a) Normplot
b) Test di Kolmogorov-Smirnov
91
Adeguatezza del Modello – ANALISI DEI RESIDUI
>> [H,P,KSSTAT,CV] =
KSTEST(residuals/standard)
Normal Probability Plot
0.95
0.90
H=
0
P=
0.8054
Probability
0.75
0.50
KSSTAT = 0.1933
0.25
0.10
0.05
CV = 0.4093
-4
-2
0
2
Data
4
6
>>
92
46
24/01/2013
Il coefficiente di correlazione non è una misura generale della relazione
tra due variabili, ma esprime solo il grado di linearità della correlazione
in un grafico a dispersione.
C’è un solo caso in cui, quando il coefficiente di correlazione è nullo, allora le variabili aleatorie
sono addirittura indipendenti: quando X e Y sono congiuntamente gaussiane.
Gaussiana (congiunta) bidimensionale
Esempio : La funzione densità di probabilità di una normale bivariata è :

 ( x − µ X )2 2 ρ ( x − µ X )( y − µ Y ) ( y − µ Y )2  
1
exp −
−
+

 2(1 − ρ 2 )  σ X2
σ Xσ Y
σ Y2  
2πσ X σ Y 1 − ρ 2


for ( x, y ) ∈ R 2 , ( µ X , µ Y ) ∈ R 2 , con parametri σ X > 0, σ Y > 0 e ρ ∈ (-1,1).
f XY ( x, y ) =
1
µ X = E[X ]
µY = E [Y ]
σ X2 = Var[ X ]
σ Y2 = Var[Y ]
ρ ∈ (−1,1)
94
47
24/01/2013
Contour plots
σ X = 1, σ Y = 1, µ X = 0, µ Y = 0, ρ = 0
σ X = 1, σ Y = 1, µ X = 0, µ Y = 0, ρ = 0.9
σ X = 1, σ Y = 1, µ X = 0, µ Y = 0, ρ = 0
95
Gli outliers possono modificare significativamente il valore
del coefficiente di correlazione.
48
24/01/2013
49