Prova scritta (e soluzioni) del 28 marzo 2013

Transcript

Prova scritta (e soluzioni) del 28 marzo 2013
Prova scritta
Affidabilità dei sistemi stocastici e controllo statistico di qualità
28 Marzo 2013
1. Un’azienda che produce batterie per cellulari sta effettuando dei test per confrontare tre
tipi diversi di batterie da utilizzare su un nuovo cellulare. Si vuole confrontare il tempo
di vita delle tre batterie quando vengono utilizzate a pieno regime (talk-time). Vengono
selezionate 10 batterie, a caso, e per ognuno dei 3 tipi, misurato il tempo di vita
(arrotondato) in ore della loro durata quando il telefono viene usato senza interruzione. I
tempi in ore sono riportati in tabella.
B1
0,28
0,53
1,23
0,01
1,14
0,17
0,02
0,14
0,20
0,46
B2
0,07
1,56
2,18
0,36
0,10
0,03
0,12
0,01
0,28
0,30
B3
0,66
0,34
0,48
0,38
0,04
0,18
1,25
0,55
0,99
0,23
a) Stabilire con una analisi ANOVA se le tre batterie hanno una durata media differente
(effettuare l’analisi dei residui solo dopo aver effettuato l’ANOVA). Stimare la
variabilità totale.
b) Per il campione casuale B1, stimare: tempo di vita medio, funzione densità di guasto e
funzione di affidabilità ed effettuarne dei grafici. Formulare una ipotesi sulla legge di
distribuzione della popolazione da cui proviene il campione e sottoporla a test.
c) E’ possibile stabilire quale batteria ha una maggiore affidabilità?
d) Limitatamente alla batteria B1, se il dispositivo in esame ha funzionato fino al tempo 1
ora qual è la probabilità che funzioni per un altro intervallo di tempo pari a 30 minuti?
Usare i parametri stimati al punto b).
2. Un’azienda che produce scarpe da trekking vuole lanciare una nuova linea. Per questo
motivo seleziona 13 scalatori, ad ognuno dei quali fa indossare una scarpa da trekking
della vecchia linea produttiva ed una scarpa da trekking della nuova linea. Viene poi
misurato il numero di chilometri percorsi prima che inizi il deterioramento della scarpa. I
dati sono riportati in tabella. Dopo aver effettuato una analisi descrittiva per entrambi i
campioni, stabilire con un test di ipotesi se c’è differenza.
Old 460
New 530
420
525
520
500
515
505
490
520
490
450
500
495
550
575
480
474
530
515
518
490
515
480
475
493
3. Un processo risulta in controllo statistico con x = 39.7 e R = 2.5 . La carta di controllo
usa sottocampioni di taglia 2. Le specifiche sono 40 ± 5 Il carattere monitorato dalla
carta è distribuito secondo una legge gaussiana. Stimare l’indice di capacità del processo
potenziale e quello reale. Quanto miglioramento ci sarebbe nel processo se la media
fosse centrata sul target? Calcolare l’indice Cpk e confrontarlo con l’indice Cp.
Soluzioni
1.
a) Si tratta di effettuare un’ANOVA ad un fattore. Dal box plot
si evince che le medie non differiscono tra loro e che nel primo e secondo campione ci sono degli
outliers, che inducono a validare il modello con un’analisi dei residui.
Dalla tavola dell’ANOVA, infatti, l’ipotesi che le medie siano uguali non viene rigettata con un pvalue 0.917. La variabilità totale vale 8.03/29.
Usando la function multcompare si ha
c=
1.0000 2.0000 -0.6861 -0.0830 0.5201
1.0000 3.0000 -0.6951 -0.0920 0.5111
2.0000 3.0000 -0.6121 -0.0090 0.5941
u=
0.4180 0.1720
0.5010 0.1720
0.5100 0.1720
In tutti e tre gli intervalli di confidenza è incluso lo zero. La prima colonna della matrice u si
riferisce alle medie dei sottogruppi mentre la seconda colonna si riferisce all’errore standard della
media campionaria.
Per validare il modello, è necessario costruire la matrice dei residui, ossia
res =
-0.1380
0.1120
0.8120
-0.4080
0.7220
-0.2480
-0.3980
-0.2780
-0.2180
0.0420
-0.4310
1.0590
1.6790
-0.1410
-0.4010
-0.4710
-0.3810
-0.4910
-0.2210
-0.2010
0.1500
-0.1700
-0.0300
-0.1300
-0.4700
-0.3300
0.7400
0.0400
0.4800
-0.2800
concatenarli in un unico vettore
>> app=[];
>> for i=1:3 app=[app; res(:,i)]; end
ed effettuare il normplot
Dal normplot si evince che la popolazione da cui i dati provengono non è gaussiana. Effettuando il
test di Kolmogorov-Smirnov l’ipotesi di gaussianità non viene rigettata ma il p-value è 0.0686,
sufficientemente basso perché sia considerato significativo. Quindi deduciamo che la popolazione
non è gaussiana.
b) Il tempo di vita medio della batteria B1 risulta 0.4180=mean(batterie(:,1)). La funzione di
affidabilità è il complementare a 1 della funzione di guasto (cdfplot(batterie(:,1))
Per effettuare il grafico della funzione di affidabilità stimiamo la funzione di guasto con il metodo
median rank:
>> dati(:,1)=sort(batterie(:,1))
>> dati(:,2)=([1:1:10]-0.3)'./10.4;
>> aff(:,1)=1-dati(:,2);
>> stairs(dati(:,1),aff);
Per stimare la funzione densità di guasto, associamo al tempo 0 il valore della funzione di guasto
pari ad 1 e determiniamo il rapporto incrementale della funzione di guasto che associamo al dato
successivo. Il plot risulta
Per ottenere il grafico precedente, le istruzioni sono
>> dens(1)=dati(1,2)/dati(1,1);
>> for i=2:10
dens(i)=(dati(i,2)-dati(i-1,2))/(dati(i,1)-dati(i-1,1));
end
>> plot(dati(:,1),dens,'r*-')
>> title('Stima densità di guasto')
Non effettuiamo l’istogramma dei dati visto il numero esiguo di informazioni. Il grafico della
densità di guasto induce a ritenere che il campione proviene da una popolazione esponenziale.
Effettuiamo il probability plotting paper.
>> dati(:,3)=([1:1:10]'-0.3)./10.4;
>> y=log(1./(1-dati(:,3)));
>> plot(dati(:,1),y,'r*')
>> title('Probability plotting paper')
Effettuando il test di Kolmogorov-Smirnov, l’ipotesi nulla non è rigettata con un p-value pari a
0.9583 (quindi elevato):
>> ccf(:,1)=sort(batterie(:,1));
>> ccf(:,2)=expcdf(ccf(:,1), expfit(batterie(:,1)));
>> [h,pvalue,kstat,cv]=kstest(batterie(:,1),ccf,0.05,0)
c) E’ necessario confrontare i tassi di guasto delle tre batterie. Avendo la funzione di guasto della
prima batteria, il tasso di guasto si ottiene dividendo il vettore dens per il vettore aff. Costruiamo lo
stesso vettore per la seconda batteria e poi confrontiamo i grafici. Se uno dei due tassi è superiore
all’altro, la stessa relazione si manterrà per le funzioni di affidabilità, altrimenti non si potrà dire
nulla.
Dal grafico non c’è una funzione che domina l’altra e quindi concludiamo che non possiamo
stimare quale tra le 3 batterie è la più affidabile.
d) Si tratta di calcolare l’affidabilità condizionata R(1 + 0.50 |1) per la batteria B1. Siccome
abbiamo supposto che il tempo di vita della batteria ha legge esponenziale di parametro 0.41, la
funzione di affidabilità condizionata vale exp(−0.41*0.50) .
2.
La durata media delle scarpe vale 497.1538 per la vecchia linea e 504.0000 per la
nuova.Tuttavia la mediana per entrambi i campioni è 500, quindi non sembra ci siano grosse
differenze. Il campione relativo alla vecchia linea ha una variabilità leggermente più alta,
infatti le deviazioni standard valgono rispettivamente 33.7808 e 30.7436 anche se per
l’indice di curtosi la situazione è invertita. La stessa analisi si evince dai box-plots
Dal normplot relativo al primo campione, si evince che la popolazione da cui proviene non
può ritenersi gaussiana
Così come anche per il secondo normplot:
Le distribuzioni, tuttavia, sono piuttosto simmetriche poiché gli indici di asimmetria valgono
-0.7016 e 0.5582 rispettivamente. Per confrontare la tendenza centrale usiamo il
Wilkcoxon rank sum test. L’ipotesi che i rendimenti medi sono uguali non viene rigettata
con un p-value di 0.75.
3.
Avendo a disposizione l’escursione media, la stima della deviazione standard risulta essere
2.5/1.128= 2.21. Pertanto l’indice di capacità potenziale del processo risulta (45-35)/(6*
2.21) = 0.75. Quello reale risulta 2*1.880*2.5/(6*2.21)=0.70. Se la media fosse centrata sul
target ci sarebbe un miglioramento del 6%. L’indice Cpk risulta 0.75. Entrambi gli indici
hanno valore inferiore a 1 quindi il processo non è capace di produrre nei limiti di
tolleranza.