ERRORE

Transcript

ERRORE
ERRORE
L’errore assoluto ea rappresenta lo scarto fra il valore di una misura xi ed il suo valore
“vero” μ. Se questo scarto viene rapportato al valore “vero” si ottiene l’errore relativo
er = ea/μ che può anche essere espresso in termini percentuali er%= 100 (ea/μ).
L’errore assoluto può essere:
SISTEMATICO (DETERMINATO):
strumentale, metodologico, personale; costante o proporzionale. Può essere rivelato
mediante l’analisi di standard a composizione nota o l’analisi di un bianco, con
metodi analitici indipendenti.
CASUALE (INDETERMINATO):
come dice lo stesso nome, deriva dalle limitazioni naturali insite in una misura e, a
causa della sua stessa natura, non può essere completamente eliminato, ma, mediante
un approccio statistico, può esserne valutata l’entità.
ESATTEZZA: è una stima della vicinanza del risultato della misura al valore “vero”
della grandezza misurata.
PRECISIONE: è una stima della riproducibilità del risultato della misura.
Ripetibilità: indica la riproducibilità di un risultato con lo stesso metodo analitico,
all’interno dello stesso laboratorio e da parte dello stesso operatore.
Riproducibilità: indica la riproducibilità di un risultato con lo stesso metodo
analitico in laboratori diversi e/o con operatori diversi.
ACCURATEZZA: è una stima della precisione e dell’esattezza della misura
Si definisce media ( o valore medio) xm di N misure la loro media aritmetica, per cui
xm = (Σxi/N)
In una serie N di misure di una determinata grandezza, oltre al valor medio, si può
calcolare un altro parametro xc, definito come mediana, che rappresenta il valore
centrale nella distribuzione crescente delle N misure
xc = [xN/2 + x(N/2+1)]/2 (per N pari), cioè la media aritmetica della somma della
coppia centrale della distribuzione;
xc = x(N+1)/2 (per N dispari), cioè il valore centrale della distribuzione.
Essendo: xi - xm = scarto della misura iesima dal valore medio xm di N misure
(valutazione dello errore assoluto casuale che si può correlare alla precisione),
ed essendo pure: xm – μ = scarto del valore medio xm di N misure dal valore “vero”
(valutazione dell’errore assoluto sistematico che si può correlare all’esattezza),
se, in modo concettualmente estremamente semplificato, si sommano questi due
scarti, si ottiene xi – xm + xm – μ = xi –μ, cioè lo scarto della misura iesima dal
valore vero, ossia l’errore assoluto. L’errore assoluto è quindi la somma di due
contributi uno relativo all’esattezza e l’altro alla precisione e rappresenta una
valutazione complessiva dell’ACCURATEZZA della misura.
In una serie di misure ripetute della stessa grandezza, se esse si distribuiscono
normalmente, l’incertezza media di ogni singola misura è rappresentata dalla
deviazione standard σ. Si può dimostrare che:
σ = √Σi(xi - xm)2/N; e, per un numero limitato di misure, σ = √Σi(xi - xm)2/(N-1),
questa grandezza viene indicata con la lettera s, cioè s= √Σi(xi - xm)2/(N-1);
σ rappresenta la deviazione standard calcolata sull’insieme di misure N (che
rappresenta l’intera popolazione delle misure), mentre s rappresenta la deviazione
standard calcolata su un campione dell’insieme di misure; σ quindi è definita come
deviazione standard della popolazione, mentre s come deviazione standard
campionaria.
Si immagini adesso di rifare una serie di esperimenti, all’interno dei quali si facciano
un numero grande di misure e, per ciascuno di questi esperimenti, si calcoli il valore
medio xm. La distribuzione dei valor medi avrà una deviazione standard pari a σm,
nota come errore standard, che si può dimostrare essere σm = σ/√N .
L’errore standard quindi assumerà un valore sempre minore rispetto a σ
all’aumentare del numero di esperimenti.
Si supponga di avere una grandezza di valore x la cui misura è soggetta a n sorgenti
di errore indipendenti. Gli errori, piccoli, potranno essere positivi o negativi, ma, per
semplicità, si assumerà che siano di egual valore assoluto.
Se ad esempio ci fossero 10 sorgenti di errore di valore ε, l’intervallo della
distribuzione sarà compreso fra x ± 10ε ed il numero di valori sarà 20 + 1.
Si vuole sapere quale sarà la probabilità che rifacendo una misura si presenterà un
determinato valore compreso ovviamente nell’intervallo x ± 10ε.
Si può rispondere a questa domanda ricorrendo alla distribuzione binomiale:
per cui, dato un binomio (p + q)n, dove p e q rappresentano la probabilità che il
singolo errore possa assumere valori positivi o negativi (nel caso specifico varranno
ambedue 0.5 e ciò porterà ad una distribuzione simmetrica dei vari valori rispetto ad
x), la probabilità per ogni determinato valore sarà data dalla relazione:
n!
f = ------------- pk qn-k
k!(n – k)!
dove k è un intero il cui valore è compreso fra 0 ed n.
Esempio: quale sarà la probabilità di ottenere il valore x-4ε (e di conseguenza x+4ε,
visto che la distribuzione e simmetrica rispetto ad x)? Questo valore occupa il 4° posto
nella distribuzione per cui k=3(7), n=10, p=q=0.5
10!
10·9·8·
7
3
f = -------- · 0,5 ·0,5 = -------------- = 120·9.765625·10-4 = 0.117 (11.7%).
3!·7!
3·2·1
Il medesimo risultato si sarebbe potuto ottenere dal triangolo di Tartaglia riportato
sotto, utilizzando la 11a riga (11 valori per n da 0 a 10) che identifica i coefficienti
della distribuzione con esponente n=10, considerando che i valori suddetti (x-4ε e
x+4ε) corrispondono rispettivamente al 4° e all’ 8° coefficiente della riga e dividendo
questi ultimi per la somma di tutti i coefficienti della stessa riga (cioè 1024); infatti
120/1024 = 0.117 (11.7%).
1
1
1
1
2
1
1
1
1
1
1
1
1
1
1
8
9
36
3
3
4
6
5
15
21
28
84
10
20
35
56
1
4
10
6
7
1
5
1
15
35
70
1
6
21
56
1
7
28
126 126 84
1
8
36
1
9
1
10 45 120 210 252 210 120 45 10
1
11 55 165 330 462 462 330 165 55 11
1
12 66 220 495 792 924 792 495 220 66 12
1
Nel grafico in basso, sono riportati i valori di questa distribuzione sotto forma di
istogramma. Il grafico assume ovviamente valori discreti perché la distribuzione
binomiale non è una funzione continua. Se si cerca una funzione continua che sia in
buon accordo con i dati riportati, si troverà che la funzione di Gauss fitta (orrore!) in
maniera sempre più soddisfacente la distribuzione binomiale al crescere di n.
Frequenza percentuale
25
20
15
10
5
0
-10
exp-(x-μ)2/2σ2
y = ------------------ ;
σ√2π
-8 -6 -4 -2
0
2
4
6
8
10
Distanza da X posto uguale a 0 in unità di errore
ponendo
x-μ/σ = z,
exp-z2/2
si ottiene y = -----------σ√2π
L’area sottesa sotto un dato intervallo, quindi, rappresenta la probabilità che una misura
cada nell’ intervallo prescelto; in particolare, l’area compresa entro ±σ, ±2σ, ±3σ rispetto
al valor medio, che nella funzione in z diventano ±1, ±2, ±3 [infatti z=(x-μ)/σ→per x=μ–
σ, z=(μ–σ-μ)/σ = -1; per x=μ+σ, z=(μ+σ-μ)/σ = -1] corrispondono a probabilità del 68.3,
95.4, 99.7%, rispettivamente.
μ+σ
area =∫
μ-σ
+1
exp-(x-μ)2/2σ2
exp-z2/2
-------------------- dx ; poichè dx =σdz, si ottiene area =∫ ---------- dz
σ√2π
√2π
-1
Se le misure di una grandezza x sono soggette soltanto ad errori casuali e seguono una
distribuzione normale, allora la loro distribuzione limite é la funzione di Gauss centrata
sul valore vero μ e con larghezza σ. La larghezza σ è il limite di confidenza del 68 %,
cioè vi è il 68 % di probabilità che una misura cada entro una distanza σ dal valore vero
μ. In pratica, nè μ nè σ sono noti; si conoscono invece gli N valori di x misurati, la cui
media aritmetica xm costituisce la migliore stima del valore vero μ ed s la stima di σ.
Se si misura una grandezza x parecchie volte, avendo escluso la presenza di errori
sistematici, allora la migliore stima per x è la media xm e sm = s/√N la migliore misura
della sua incertezza. Quindi si dovrebbe concludere che
(valore di x) = xm ± sm intendendo che, dalle osservazioni fatte, ci si attende che il 68% di
qualunque insieme di misure successive di x, fatte con lo stesso metodo e seguendo la
stessa metodologia, cada nell’intervallo xm ± sm.
Se s è una buona approssimazione di σ (di solito ciò avviene per N sufficientemente
grande) si possono fare a priori delle previsioni che il valore vero della nostra
grandezza rientri in un intervallo prescelto cioè che μ = xm ± z σ/√N.
Per z = 2 ci sarà una probabilità superiore al 95% (95.4%) che il valore vero rientri
nell’intervallo suddetto (intervallo di fiducia I.F.) o che ci sarà un’incertezza inferiore
al 5% (4.6%) che il valore vero sia esterno a questo intervallo.
Esempio: la determinazione del piombo in un campione ripetuta 7 volte mediante AAS
ha dato i seguenti risultati espressi in μg/L (ppb): 1108, 1122, 1075, 1099, 1115, 1083,
1110. Calcolare: xm, s, l’intervallo di fiducia al 95% (z = 1.96). xm = 1110,3; s = 16.8;
IF95% → 1110.3 ± 1.96 · 16.8/√6 = 1110.3 ± 13.4.
Quando però s non è una buona approssimazione di σ (spesso a causa di un numero
limitato di misure) allora bisogna tenere conto di ciò sostituendo al posto di z
nell’espressione per il calcolo dell’ I.F. il parametro statistico t, chiamato t di Student
che può essere ricavato da apposite tabelle.
Nell’esempio precedente, se il valore trovato per s non è una buona stima di σ
(considerando pure il numero limitato di misure), al posto di z = 1.96, bisogna sostituire
il valore di t corrispondente alla 6a riga (7-1) della 4a colonna (95%), cioè 2.45. Il
calcolo precedente diventerà così: IF95% → 1110.3 ± 2.45 · 16.8/√6 = 1110.3 ± 16.8.
Quando si sono raccolti una serie di valori della stessa grandezza mediante misure
ripetute, può sorgere il dubbio che uno di questi dati non sia significativo perchè il
valore assunto è apparentemente molto diverso dagli altri. Si può ricorrere ad un
semplice test statistico, chiamato test di Dixon o Q test.
Il test si svolge ordinando in valore crescente i dati trovati e confrontando il quoziente
Q, ottenuto dividendo la differenza in valore assoluto fra il dato sospetto e quello a lui
immediatamente adiacente per la differenza fra i valori estremi della distribuzione, con
il valore Qcritico riportato nella tabella corrispondente al numero di dati e al limite di
fiducia scelto. Il dato verrà scartato se il Q ottenuto come sopra descritto risulterà
maggiore del Qcritico riportato nella tabella.
Esempio. Il titolo di un acido determinato volumetricamente ha dato i seguenti risultati
espressi in mol/litro: 0.105, 0.111, 0.112, 0.103, 0,109, 0.118. Valutare con il limite di
fiducia del 95% se il valore 0.118 possa essere scartato. I valori estremi sono 0.118 e
0.103 la cui differenza è 0.015; il valore adiacente a 0.118 è 0.112 e la loro differenza é
0.006; il quoziente pertanto sarà Q = 0.006/0.015 = 0.4. Questo valore va confrontato
con quello riportato all’intersezione della riga con il numero di osservazioni 6 (i 6 dati
sperimentali) con la colonna con il limite di fiducia 95%. Il valore riportato è 0.625 che
è maggiore di 0.4, per cui il valore 0.118, nell’ambito del limite di fiducia prescelto,
appartiene alla popolazione costituita dall’insieme degli altri dati, quindi non deve
essere scartato.