dispensa teoria degli errori

Transcript

Chimica Fisica Industriale Modulo A
Elaborazione dei Dati Sperimentali
Teoria degli errori
Laboratorio di Chimica Fisica
Teoria degli errori
MISURA DIRETTA DI UNA GRANDEZZA FISICA
Errori di misura, migliore stima e incertezza
La misura diretta di una grandezza fisica richiede:

la definizione della grandezza in esame;

la definizione di una opportuna unità di misura;

la determinazione del valore della grandezza come rapporto tra la
stessa e l‟unità di misura scelta.
Una volta eseguite le prime due operazioni, la misura consiste quindi
nell‟effettuare la determinazione del valore della grandezza in esame tramite un
opportuno strumento di misura; in questa operazione vengono sicuramente commessi
“errori” di tipo sistematico ed “errori” di tipo accidentale:
Errori sistematici:
comportano incertezze sempre nello stesso senso (eccesso o
difetto); ad esempio: cordella metrica allungata  errore sempre
in difetto.
Si eliminano (o, meglio, si riducono) utilizzando uno strumento di
misura opportunamente tarato.
Errori accidentali:
sono di tipo casuale, quindi comportano incertezze di segno e
valore variabili. A differenza dei precedenti possono venire ridotti
ripetendo più volte la misura (vedi oltre).
La misura di una grandezza fisica X non fornisce quindi un valore numerico, bensì
un intervallo, detto di confidenza, esprimibile come:
X = x  x ( unità di misura)
dove:
(ad esempio: V = 56.4  0.1 ml)
x rappresenta la migliore stima della grandezza X;
x rappresenta l‟incertezza stimata di x (x > 0). Tale incertezza definisce
normalmente l‟intervallo in cui il valore “vero” si trova con buona probabilità
e non con certezza assoluta (vedi oltre).
67
Teoria degli errori
(vedi oltre).
L‟incertezza x dipende, in generale, da entrambi i fattori sopra esposti, per cui sarà
ottenibile, essendo i due tipi di errori indipendenti, come combinazione statistica di un
(x)sist e di un (x)accid , secondo la relazione:
2
2
x   x  sist   x  accid
Per comprendere il significato dei due contributi consideriamo il seguente esempio.
Supponiamo di voler determinare la tensione di vapore di un liquido ad una certa
temperatura; per fare ciò misuriamo, con un manometro a colonna di mercurio, la
pressione di un sistema costituito da un liquido in equilibrio con il proprio vapore ad
una prefissata temperatura. Per fissare la temperatura del sistema utilizziamo un
termostato, il quale è costituito da un recipiente termicamente isolato (per ridurre gli
scambi di calore con l‟esterno) contenente un fluido (in genere acqua), da una unità
riscaldante (una resistenza elettrica che genera calore per effetto Joule), da una unità
raffreddante (un sistema frigorifero o, più semplicemente, una serpentina attraversata da
acqua fredda), e da un sistema di controllo della temperatura. Quando la temperatura
che si vuole raggiungere nel sistema, e quindi nel termostato (temperatura che viene
impostata nel sistema di controllo), è più elevata di quella del bagno termostatico, il
sistema di controllo agisce facendo passare corrente attraverso la resistenza. In tal modo
la temperatura del bagno termostatico sale, e quando raggiunge, o meglio supera di una
certa quantità, il valore impostato, il sistema di controllo disinserisce il riscaldamento e
mette in funzione il circuito di raffreddamento; in realtà, risulta spesso più conveniente,
da un punto di vista costruttivo, mantenere sempre in funzione il sistema di
raffreddamento e far funzionare a intermittenza il solo sistema riscaldante. In ogni caso,
tali operazioni comportano una oscillazione della temperatura del bagno nell‟intorno
del valore fissato, e l‟ampiezza di tali oscillazioni dipende dalle caratteristiche del
sistema di controllo. La qualità del termostato sarà quindi tanto più elevata quanto più
ristretta sarà l‟oscillazione della temperatura a regime; si possono costruire, ad esempio,
termostati a 1C, a 1/10C e a 1/100C.
Per misurare la pressione del sistema utilizziamo invece un manometro a mercurio,
e rileviamo l‟altezza della colonnina di tale fluido che equilibra la pressione dei vapori
68
Teoria degli errori
con cui è a contatto. Per misurare tale altezza possiamo disporre di una comune cordella
metrica, che permette in genere di rilevare lunghezze al decimo di millimetro, oppure di
sistemi di rilevazione un po‟ più sofisticati che permettono di rilevare, ad esempio, il
centesimo di millimetro.
Lo scopo finale della misura è quello di determinare il valore della tensione di
vapore in corrispondenza di un certo valore della temperatura, per cui dovremo stabilire
per entrambi la migliore stima e la relativa incertezza. Va osservato, inoltre, che poiché
il sistema non “risponde” in modo immediato alle inevitabili “oscillazioni” della
temperatura, il valore di pressione misurato in un certo istante non può essere associato
direttamente al valore di temperatura contemporaneamente rilevato, a meno che la
strumentazione non sia così poco sensibile da non permettere di evidenziare le
variazioni delle due grandezze. Vediamo la cosa più in dettaglio.
Utilizzando un termostato a 1/100C e rilevando la temperatura del sistema con un
termometro di sensibilità1 1/10C, le oscillazioni della temperatura non potranno essere
evidenziate (a meno che non derivino da altri fattori) in quanto esse si trovano
all‟interno dell‟intervallo di sensibilità del termometro utilizzato. In assenza di altri
fenomeni, nella determinazione della temperatura del sistema si può pensare quindi di
commettere essenzialmente un “errore sistematico”, in quanto questo non è eliminabile
con misure ripetute che fornirebbero sempre lo stesso valore numerico, e può essere
ridotto solamente utilizzando un termometro più sensibile. Tale incertezza è stimabile,
in assenza di indicazioni più specifiche circa le caratteristiche del termometro, come
metà della sensibilità del termometro stesso.
Se la temperatura del sistema rimane quindi compresa nell‟intervallo 0.05C,
possiamo scrivere (x)accid << (x)sist = (x)sens= 0.05C, per cui x  (x)sens = 0.05C e
quindi, ad esempio:

se la temperatura oscilla tra le due tacche 32.5 e 32.6C
t = 32.55  0.05C;

se la temperatura oscilla nell‟intorno della tacca 32.6C
1
Per sensibilità intendiamo la quantità minima rilevabile dallo strumento, e come tale può
dipendere dalla scala scelta. In pratica, negli strumenti analogici essa rappresenta la “distanza”
tra due tacche contigue della scala, mentre negli strumenti digitali rappresenta la differenza
minima rilevabile tra due numeri consecutivi che appaiono sul display (normalmente una unità in
corrispondenza della cifra meno significativa riportata). Poiché normalmente si parla di
sensibilità tanto più elevata quanto più piccola è la quantità minima rilevabile, più correttamente
la sensibilità andrebbe considerata come il reciproco di quest‟ultima.
69
Teoria degli errori
t = 32.60  0.05C.
In questo caso il risultato finale corrisponde a quello che si sarebbe ottenuto
effettuando una singola determinazione; la ripetizione delle misure è comunque servita
ad assicurare che le cause di tipo accidentale non sono significative, cosa che non si
sarebbe potuta stabilire con un‟unica lettura.
Supponiamo ora di disporre invece di un termostato a 1/10C e di un termometro a
1/100C; in questo caso si osserverà l‟oscillazione della temperatura del sistema in un
intervallo più ampio rispetto alla sensibilità del termometro. Per un singolo valore di
temperatura rilevato risulterà quindi (x)sens  (x)accid , per cui x  (x)accid.
L‟incertezza relativa alla determinazione della temperatura può però essere
opportunamente diminuita, a differenza del caso precedente, effettuando più misure e
mediandole, come vedremo più avanti; in ogni caso, non sarà comunque possibile
ridurre l‟incertezza globale al di sotto di quella definita dalla sensibilità dello strumento
utilizzato.
Analoghe considerazioni possono essere applicate alla determinazione della
pressione, in relazione all‟entità delle oscillazioni della stessa ed alla sensibilità dello
strumento di misura utilizzato. Va inoltre considerato che la determinazione della
pressione richiede la conoscenza della densità del mercurio e della accelerazione di
gravità del laboratorio, nonché delle relative incertezze, e l‟applicazione della teoria
della propagazione degli errori, come sarà più avanti analizzato.
Cifre significative
Una volta condotte le misure, è necessario riportare con il corretto numero di cifre
complessive, dette cifre significative, sia la migliore stima di X che la relativa
incertezza x. Poiché x rappresenta una stima dell‟incertezza, si usa riportare:
 per l‟incertezza x solamente una cifra significativa se la prima cifra diversa da
zero è  3, con possibilità di riportare due cifre significative negli altri casi.
 per la migliore stima x le cifre “corrispondenti” a quella/e di x.
Avvertenze:

è necessario arrotondare i valori determinati in base al numero di cifre
significative;

è opportuno usare la stessa potenza di 10 per x e x ;
70

Teoria degli errori
se le migliori stime devono essere utilizzate in successivi calcoli, è
necessario impiegare più cifre di quelle significative (almeno una in più)
per evitare errori di arrotondamento, ed arrotondare poi il risultato finale in
base al relativo errore, calcolato mediante propagazione (vedi oltre).
Esempi:
non corretto
corretto
27.6  3
28  3
27.62  3.3
28  3
84.682  1.04
84.7  1.0
32.476  0.037
32.48  0.04
48.123  0.18
48.12  0.18
268.4  24
268  24
0.07864  0.00253
0.0786  0.0025 o meglio (7.86  0.25)10-2
Vediamo alcune definizioni:

Incertezza assoluta (errore assoluto): x

Incertezza relativa (errore relativo): x /|x | (adimensionale)

Incertezza relativa percentuale: 100 x /|x | (adimensionale)

Accuratezza: è un indice dell‟incertezza globale della misura; più piccola è
l‟incertezza relativa, più accurata è la misura. L‟elevata accuratezza implica
quindi piccoli errori sia sistematici che accidentali. Non deve essere confusa
con la precisione, anche se spesso i due termini vengono usati come
sinonimi.

Precisione: è un indice legato alla riproducibilità della misura. Una misura è
molto precisa quando i risultati che si ottengono ripetendola più volte sono
molto vicini tra loro, e quindi al valore medio; questo implica che gli errori
casuali siano di piccola entità. La precisione è legata alla deviazione
standard (vedi oltre), e risulta elevata se quest‟ultima è bassa.
Si può dire, per concludere, che una misura molto accurata è necessariamente
molto precisa, mentre una misura molto precisa può essere poco accurata per effetto di
elevati errori sistematici.
71
Teoria degli errori
Determinazioni singole e ripetute
Sulla base di quanto analizzato in un precedente esempio, allo scopo di determinare
il valore dell‟incertezza più significativa per la grandezza in esame è opportuno
effettuare più determinazioni sperimentali, e poi definire l‟intervallo x  x effettuando
una corretta analisi dei dati ottenuti. Se il numero di determinazioni è sufficientemente
elevato, questa analisi è essenzialmente basata su considerazioni di tipo statistico; se, al
contrario, è possibile effettuare una sola misurazione (come ad esempio nella
determinazione, in tempi successivi, della concentrazione di una specie chimica durante
il decorso di una reazione), la determinazione dell‟incertezza risulta alquanto delicata e
finisce spesso col basarsi solamente sul valore della sensibilità dello strumento
utilizzato, con la conseguente possibilità di ottenere un valore sottostimato.
Consideriamo a tale riguardo il seguente esempio.
L‟incertezza relativa alla concentrazione di una soluzione preparata sciogliendo
una quantità pesata di soluto in un solvente, e portando poi a volume in un matraccio
tarato, dipende, come sarà più avanti esposto nella teoria della propagazione degli
errori, dalle incertezze legate alla determinazione della massa e del volume. Le normali
bilance analitiche hanno in genere sensibilità di 0.1 mg, ma ciò non significa che
l‟incertezza che si commette nella pesata sia di tale entità, indipendentemente dalla
quantità pesata. A volte, infatti, l‟incertezza che accompagna la determinazione dipende
dalla scala scelta, ed in tal caso il costruttore riporta la precisione delle varie scale,
espressa in percentuale. Ad esempio, se si pesano 1.2368 g e nella scala utilizzata la
precisione è  0.1%, si deve scrivere m = 1.2368  0.0012 g, mentre se la precisione è
 1% si deve scrivere m = 1.237  0.012 g, avendo calcolato le incertezze come 0.1 e
1% del valore pesato, rispettivamente, ed avendo opportunamente arrotondato le
incertezze stesse e, di conseguenza, la migliore stima della pesata effettuata.
In questo caso, l‟incertezza che accompagna la singola determinazione della massa
si basa quindi non sul valore della sensibilità della bilancia, che “risente” comunque di
una variazione della massa di 0.1 mg in qualunque scala utilizzata, ma su quello della
precisione data dal costruttore. Poiché questa incertezza è caratteristica dello strumento
utilizzato, non può essere eliminata ripetendo più volte la misura; per ridurla è
72
Teoria degli errori
necessario usare una bilancia con una precisione maggiore nella scala adatta alla
determinazione della massa in questione.
D‟altro canto, ripetendo più volte la misura dello stesso campione si possono
ritrovare, come spesso accade, valori leggermente diversi per effetto di cause di tipo
accidentale, legate ad esempio allo spostamento dell‟azzeramento della bilancia, ad
errori di lettura (parallasse) nelle bilance con scala analogica, a “rumori” esterni che
influenzano l‟equilibrio della bilancia stessa, ecc.. Se le differenze tra i valori trovati
risultano piccole rispetto all‟incertezza calcolata sulla base della precisione della scala
utilizzata, allora le oscillazioni osservate sono in pratica prive di significato, in quanto
tutti i valori numerici, opportunamente arrotondati, risultano coincidenti; in questo caso
non ha quindi senso ripetere più volte la misura. Se, al contrario, tali oscillazioni
risultano maggiori dell‟incertezza calcolata sopra, è necessario tenerne conto sulla base
di opportune considerazioni di tipo statistico (come riportato più avanti), ed è quindi
utile ripetere più volte la determinazione della massa se si vuole ridurre il valore
dell‟incertezza.
Si deve inoltre osservare che nella definizione della quantità di sostanza pesata
possono entrare in gioco anche altri fattori, come ad esempio il grado di purezza della
sostanza stessa; se nel flacone che la contiene è indicata una purezza compresa tra il 90
ed il 96%, non ha senso ripetere più volte la misura per avere molte cifre significative,
in quanto si può al massimo ritenere che la quantità di sostanza che interessa è il
93  3% della massa pesata.
Al contrario di quanto può essere effettuato nella determinazione di una massa
mediante pesata, la determinazione del volume di una soluzione preparata in un
matraccio è unica, per cui non possono essere fatte considerazioni di tipo statistico; in
questo caso vanno opportunamente vagliate tutte le possibili fonti di imprecisione, sia
di tipo sistematico che accidentale.
Normalmente la vetreria tarata riporta il valore della tolleranza, che in pratica ne
esprime il grado di taratura, e che può essere interpretata come la più piccola
imprecisione che accompagna il valore del volume della vetreria stessa.
Ad esempio, il volume di un matraccio che riporta la dicitura 50 ml a 20C,
tolleranza 0.07 ml, può essere considerato come V = 50.00  0.07 ml. L‟incertezza
globale del volume dipende però anche da altre cause, quali la mancata termostatazione
73
Teoria degli errori
del matraccio e della soluzione alla temperatura indicata, e l‟errore di “lettura” che si
commette quando si porta a volume.
La prima incertezza può essere indicativamente stimata sulla base del valore del
coefficiente di dilatazione termica della soluzione (spesso simile a quello del solvente),
tenendo conto che la temperatura di laboratorio è in genere di pochi gradi inferiore o
superiore a 20C; l‟errore che si commette quando si porta a volume può essere valutato
invece stimando la distanza menisco della soluzione-tacca del matraccio e l‟area del
collo del matraccio stesso. È importante osservare che tali incertezze sono stimate e
vanno quindi determinate in modo abbastanza grossolano, evitando l‟uso di molte cifre
nei calcoli.
L‟incertezza finale sul volume dipenderà naturalmente dalla combinazione delle
singole incertezze determinate, e andrà effettuata sulla base di quanto sarà più avanti
esposto nella teoria della propagazione degli errori.
Sulla base degli esempi riportati risulta quindi evidente che per alcune grandezze è
possibile effettuare una sola determinazione, mentre per altre può essere inutile o, al
contrario, indispensabile, effettuarne più di una. In quest‟ultimo caso il dato finale è
ottenuto sulla base di opportune considerazioni di tipo statistico, come verrà indicato
nel prossimo paragrafo.
DISTRIBUZIONE GAUSSIANA O NORMALE DELLE MISURE
Supponiamo di effettuare un numero elevato N di misure sperimentali di una
grandezza X utilizzando uno strumento di sensibilità sufficientemente elevata in modo
da poter evidenziare le oscillazioni delle misure dovute a cause accidentali. Tali misure
risulteranno distribuite in un intervallo più o meno ampio, e per N sufficientemente
elevato molti valori (la maggior parte) verranno letti più volte. Riportando in grafico i
valori ottenuti in ascissa e, in ordinata, il numero di volte che un dato valore è stato
ottenuto, si ottiene un istogramma con andamento a massimo centrato nell‟intorno di un
certo valore. Per N tale andamento è descrivibile statisticamente mediante la
relazione di Gauss:

 
f x   1  2 exp  x  xc 2 2 2
74

Teoria degli errori
4

3
= 0.1
f(x)
xc = 2
2

1
 = 0.2
xc
0
xc 
1
x c
2
x
3
Figura 1. Andamento della funzione di distribuzione gaussiana per due
differenti valori di .
dove:

xc rappresenta il centro della Gaussiana;

 è legata all‟ampiezza della curva (vedi Figura 1);

f(x) rappresenta la probabilità (normalizzata) di rilevare una misura
nell‟intervallo compreso tra x e x + dx, ed è massima in corrispondenza di xc ,
che rappresenta la migliore stima di X (vedi Figura 1).
Le probabilità di rilevare una misura all‟interno ed all‟esterno dell‟intervallo
xc  r  xc  r
(ricavabili mediante opportuna integrazione della funzione) sono
riportate nella tabella:
r
Pinterna (%)
Pesterna (%)
0.674
50
50
1
68
32
2
95.4
4.6
3
99.7
0.3
75
Teoria degli errori
4
99.99
0.01
L‟intervallo di confidenza a cui si fa normalmente riferimento è quello con il 68%
di probabilità, definito dalla relazione
X = xc   ; negli intervalli xc  2 e xc  3
tale probabilità sale, rispettivamente, al 95.4 e 99.7%.
Nasce quindi il problema di come determinare xc e  sulla base delle misure
sperimentali; la teoria statistica dimostra che date N misure sperimentali x1, x2, x3, ... ,
xN, si ha che:
N
 xi
a) la migliore stima di X, xc, è pari al valore medio delle xi , xm: x m  i 1
N
N
 xi  xm 2
b) la migliore stima di  è x, nota come deviazione standard2:  x 
i 1
N 1
per cui l‟intervallo di confidenza della X (con il 68% di probabilità) verrà espresso
come:
X = xm  x
È importante osservare che l‟incertezza espressa dalla x diminuisce all‟aumentare
di N, in quanto dipende solamente dalla presenza di errori casuali; non si deve tuttavia
dimenticare che l‟incertezza complessiva è legata, come già detto, alla precisione dello
strumento impiegato.
Inoltre la deviazione standard non deve essere confusa con l‟errore della media. La
deviazione standard definisce un intervallo di confidenza per la misura, mentre l‟errore
della media è dato dalla deviazione standard diviso la radice quadrata del numero delle
misure:
 xm 
X
N
Media pesata
Al denominatore compare N  1 anziché N in quanto gli N valori xi hanno già fornito un
dato, e cioè il valore medio xm.
2
76
Teoria degli errori
Nella media precedentemente considerata ogni misura contribuisce con lo stesso
peso alla definizione del valore medio, e ciò è corretto se le N determinazioni x1, x2, ... ,
xN sono soggette ciascuna alla stessa incertezza (cioè allo stesso x), come normalmente
accade quando si effettuano più misure con lo stesso strumento. Al contrario, se questi
dati sono soggetti a incertezze differenti (x1, x2, ... , xN), è corretto effettuare una
media “pesata” o “ponderale”; ciò può avere significato, in particolare, quando ciascun
valore xi è stato ottenuto a sua volta da un insieme di determinazioni
La
media
“pesata” è espressa dalla relazione:
N
xm 
w x
i
i 1
N
w
i
con
w i  1 xi
2
“peso” di ogni singola xi
i
i 1
mentre la deviazione standard (significativa per N  10) è calcolabile mediante la
relazione:
1
x 
 wi
L‟errore della media è sempre calcolato mediante la relazione:
 xm 
X
N
Eliminazione di alcuni dati utilizzati nel calcolo della media
Un valore utilizzato nel calcolo della media può essere scartato se sufficientemente
lontano dal valore medio trovato, tenendo conto del significato statistico delle misure.
Ad esempio, la probabilità di trovare un valore sperimentale al di fuori
dell‟intervallo xm  2x è di circa il 5%, e scende allo 0.3% se si considera l‟intervallo
xm  3x. Ciò significa che con 100 punti sperimentali è probabile che circa 5 punti
cadano al di fuori del primo intervallo, e che nessuno si trovi al di fuori del secondo;
con 10-20 punti ci si attende al massimo un punto nell‟intervallo più stretto. Questo
permette di scartare quindi, nelle normali condizioni operative, i punti per i quali
77
Teoria degli errori
|xi  xm|  2 o 3 volte x ; una volta scartati questi punti è necessario, ovviamente,
ricalcolare i valori di xm e di x .
Determinazione del valore medio con pochi dati sperimentali
Le relazioni sopra riportate sono di tipo statistico e risultano quindi valide se
applicate ad un numero sufficientemente elevato di dati sperimentali; si può ritenere
corretto applicarle quando si hanno a disposizione almeno una decina di punti
sperimentali. In caso contrario, si considera sempre come migliore stima di X il valore
medio, ma per quanto riguarda l‟incertezza ci si deve accontentare di stime più
grossolane, e quindi più elevate rispetto all‟errore definito in base alla deviazione
standard.
In quest‟ultimo caso normalmente si considerano come incertezze:
per N  3
la semidispersione massima, definita come (xmax  xmin)/2
per 3 < N < 10
l‟errore medio, definito come
N
 | xi  x m |
N
i =1
DETERMINAZIONE INDIRETTA DI UNA GRANDEZZA FISICA
La determinazione della maggior parte delle grandezze fisiche non viene effettuata in
modo diretto (per impossibilità o per convenienza), ma in modo indiretto, utilizzando le
relazioni matematiche che legano tale grandezza ad altre misurabili direttamente o, a
loro volta, determinabili indirettamente. Ad esempio, la determinazione di una
concentrazione può essere fatta misurando direttamente una massa ed un volume;
analogamente la determinazione di una velocità richiede la misura di uno spazio e di un
tempo. Nasce quindi il problema di definire la migliore stima e l‟incertezza della
grandezza in esame, sulla base dei corrispondenti valori trovati per le grandezze
direttamente misurate. Consideriamo quindi la grandezza Y funzione di Q grandezze
distinte X1, X2, ... , XQ :

Y  F X 1 , X 2 ,..., X Q
78

Teoria degli errori
e supponiamo che per ognuna delle grandezze Xi sia nota la migliore stima xi e la
relativa incertezza xi :
X i  xi  xi
La teoria dimostra che la migliore stima (y) della grandezza Y è il valore da essa assunto
in corrispondenza delle migliori stime delle grandezze Xi :

y  F x1, x2 ,..., xQ

L‟incertezza della Y è legata al modo in cui le singole incertezze delle Xi si combinano,
sommandosi o sottraendosi. Secondo la teoria della propagazione degli errori,
applicabile se le incertezze delle Xi sono percentualmente piccole (xi /|xi | al massimo
pari a qualche unità percentuale), si possono considerare due situazioni limite.
(1) Se le incertezze xi sono tutte indipendenti tra loro, per stimare l‟incertezza della Y
si utilizza la seguente relazione:
 F
 y   
i 1  X i
Q
2
 2
 xi

Tale metodo di determinazione va applicato, come detto, quando le incertezze
relative alle grandezze Xi sono casuali e quindi possono sia sommarsi che
parzialmente compensarsi. (2) Se, al contrario, ci sono motivi per ritenere che le
incertezze xi possano prevalentemente sommarsi (ad esempio se gli errori stimati
sulle grandezze sono per la maggior parte di tipo sistematico piuttosto che casuale),
allora è più corretto considerare come incertezza della Y l‟errore limite propagato,
definito come:
Q
F
xi

X
i
i 1
y  
79
Teoria degli errori
Tale valore risulta ovviamente maggiore di quello definito al punto 1 (o al massimo
uguale ad esso).
Per esempio, se Y è l‟area di un rettangolo e X1 e X2 sono i due lati, si deve considerare:
(a) l‟errore limite nel caso in cui i due lati vengano misurati con la stessa cordella
metrica e le relative incertezze siano preferenzialmente dovute a cause sistematiche
(bassa sensibilità e/o non buona taratura della cordella metrica utilizzata) in quanto
i due errori saranno entrambi in difetto od entrambi in eccesso e quindi
necessariamente si sommeranno;
(b) l‟errore definito al punto 1 se gli errori relativi alla misura dei due lati sono
essenzialmente di tipo casuale (cordella metrica tarata e sufficientemente sensibile)
e quindi possono combinarsi sia sommandosi che compensandosi.
Qualora si combinino tra loro incertezze derivanti da poche misure, per cui
l‟incertezza è valutata come semidispersione massima, o relative a valori tabulati per i
quali l‟incertezza venga valutata solamente sulla base del numero di cifre riportate (vedi
oltre), è opportuno calcolare l‟incertezza della Y come errore limite.
Nel caso in cui alcune delle grandezze Xi siano accompagnate da incertezze di
carattere statistico e le altre no, i relativi termini possono essere combinati sommando
in quadratura i primi e in valore assoluto i secondi. Si verifica spesso, comunque, che
l‟errore limite propagato risulta di poco superiore, in quanto alcuni termini della
sommatoria non pesano in modo significativo e, spesso, uno o due termini prevalgono
sugli altri; si deve inoltre considerare che l‟incertezza che ne deriva è comunque una
stima, e come tale deve essere arrotondata ad una o due cifre al massimo (secondo
quanto già visto in precedenza), e che poi andrà arrotondato in modo opportuno anche il
valore di y ottenuto3. Vediamo alcuni esempi:
(1) Y  X1  X 2
y  x1  x2
 y  x12  x22
Y  X1  X 2
y  x1  x2
 y  x12  x22
N.B.: in entrambi i casi si esegue una somma degli errori assoluti (in valore assoluto
oppure in quadratura).
3
A tale riguardo è opportuno ricordare come nei calcoli effettuati per la determinazione della migliore stima delle
grandezze sia necessario utilizzare più cifre di quelle significative, mentre, al contrario, nel calcolo della propagazione
delle incertezze è conveniente utilizzarne il minimo indispensabile e trascurare i termini poco significativi.
80
Teoria degli errori
y  Kx
(2) Y  KX
y | y |  x | x |
(K = 0)
X e Y hanno lo stesso errore relativo
y | y | | n | x | x |
(3) Y  KX n
Ad esempio:
Y K X
y | y | 1 2x x
Y K X
y | y | x x
y
(4) Y  KX1 X 2
Errore relativo moltiplicato per |n|.
| y|

y
Y  KX 1 X 2
| y|
x1
| x1 |


x1
| x1 |
y
x 2
2
 x   x 
  1    2 
| y|
 x1   x2 
| x2 |

come nel caso Y  KX
y
x 2
2
2
 x   x 
  1    2 
| y|
 x1   x2 
| x2 |
2
N.B.: in entrambi i casi si esegue una somma degli errori relativi (in valore assoluto
oppure in quadratura).
(5) Y  K ln CX 
 y | K |
x
| x|
N.B.: l‟errore assoluto su Y è proporzionale all‟errore relativo su X.
y
Y  K exp CX 
| y|
| C | x
N.B.: l‟errore relativo su Y è proporzionale all‟errore assoluto su X.
Y  X1ln CX 2 
esempio: k1 
k 
ln b
t 
2
y  ln Cx2 x1 
ln b
(metodo di Guggenheim)
t
t 
1
b
b  t
oppure
poiché
t
t
x1
x2
x2
k
k
k
k

t
t

b
b  ln b
2

 1  
 1  
  t t    b  ln b b
 
 


è in genere trascurabile, risulta
81
k
k

b
b  ln b
2
Teoria degli errori
(6) Se Y è espressa come prodotto di più termini, si ricava facilmente una relazione tra
le incertezze relative. Infatti, se
Q
n
n
n
n
Y  KX 1 1 X 2 2 ...X QQ   X i i
passando ai logaritmi si ha:
i 1
Q
ln Y  ln K   ni ln X i
i 1
dalla quale, differenziando e sommando opportunamente, si ottengono:
y
x i
  ni
| y | i 1
xi
y
 x 
   ni i 
| y|
xi 
i 1 
Q
e
Q
2
che forniscono facilmente l‟errore relativo sulla Y come somma, “pesata” mediante
gli esponenti, degli errori relativi sulle Xi . Da tale espressione si vede facilmente
come i termini soggetti ad incertezze relative basse possano essere trascurati
rispetto agli altri; normalmente solo pochi termini (spesso uno o due soltanto)
contribuiscono alla definizione dell‟incertezza relativa della Y.
(7) A differenza del caso precedente, nel caso in cui si abbia la somma di più termini
“complessi”, occorre calcolare i differenziali; ad esempio, se:
Y
AB AC

C
B
si ottiene:
2
2
 b c    a ac    ab a  
 y     a     2  b     2   c 
b 
 c b    c b    c
82
2
Teoria degli errori
Si noti che nel secondo e nel terzo termine della somma i due contributi hanno
segno opposto, mentre nel primo termine hanno lo stesso segno; per tale motivo, i
due contributi dovuti alle incertezze derivanti da B e C si compensano, mentre
quelli derivanti dall‟incertezza di A si sommano. Questo deriva dal fatto che le
variabili B e C compaiono una volta al numeratore ed un‟altra al denominatore, per
cui, ad esempio, un errore in eccesso su B determina un contributo in eccesso per il
termine AB/C ed uno in difetto per AC/B.
È opportuno notare che non è corretto considerare l‟incertezza della Y come
somma delle incertezze complessive relative ai due termini AB/C e AC/B, cioè:
y 
        
2
ab c
2
ac b
perché calcolando le incertezze relative a questi separatamente, si ottiene,
raccogliendo i termini:
2
2
 b c    a ac    ab a  
 y     a     2  b    2   c 
b 
 c b    c b    c
2
che risulta maggiore del precedente.
Si può quindi concludere dicendo che l‟incertezza calcolata in più “stadi”,
utilizzando espressioni parziali, può risultare non corretta. A tale riguardo si
consideri anche il seguente esempio.
Si vuole calcolare l‟incertezza relativa alla determinazione della pressione
idrostatica P di una colonna di liquido di densità , avente altezza h, sottoposta
all‟accelerazione di gravità g, ricordando che:
pressione = forza peso/superficie di base della colonna: P = F/S
forza peso = massa  per accelerazione di gravità: F = mg
massa = densità  volume: m = V = Sh
Calcolando prima l‟incertezza di m mediante quelle di , S e h, poi quella di F
ed infine quella di P si otterrebbe:
83
P
P
2

Teoria degli errori
2
  
 S   g   h 
   2       
 S   g  h
  
2
2
mentre calcolandola direttamente sulla base dell‟equazione globale P = gh si
ottiene:
P
2
2
    g   h 
        
P
    g h
2
nella quale non compare il termine dipendente dall‟incertezza di S; infatti, la
pressione non dipende dalla superficie di base della colonna.
È opportuno quindi applicare la propagazione direttamente all‟equazione che
lega la grandezza incognita a quelle note; tuttavia, se la combinazione delle
espressioni intermedie non comporta semplificazioni di grandezze, i due metodi
risultano del tutto equivalenti.
Per quanto riguarda il calcolo dell‟errore propagato, si osservi che nella
determinazione del valore di alcune grandezze si fa uso di dati tabulati, i quali spesso
sono riportati nei manuali senza le corrispondenti incertezze ed in questo caso esse sono
implicitamente espresse dal numero di cifre significative. In assenza di indicazioni
specifiche, si conviene che il dato venga riportato in modo tale che l‟intervallo
d‟incertezza massimo (cioè quello in cui la probabilità di trovare il valore “vero” è
estremamente elevata) abbia un‟ampiezza corrispondente ad una unità della penultima
cifra significativa, cioè sia pari a  5 unità dell‟ultima cifra.
Molto spesso, però, riferendosi ai concetti statistici visti in precedenza, si preferisce
utilizzare un intervallo meno esteso, corrispondente a  1 unità sull‟ultima cifra,
considerando un intervallo di probabilità elevata ma non elevatissima, analogo a quello
definito dalla deviazione standard. I dati riportati nei manuali vengono normalmente
trattati in quest‟ultimo modo.
Nel calcolo dell‟errore propagato vanno infine considerate le costanti di tipo
matematico (quali , e, ...) e fisico (Faraday, costante universale dei gas R, ...).
84
Teoria degli errori
Le costanti del primo tipo sono normalmente note con un numero di cifre
significative estremamente elevato, per cui è sufficiente utilizzare tali costanti con un
numero opportuno di cifre significative, in modo che l‟incertezza che ne deriva sia
sicuramente trascurabile rispetto alle altre. Per far ciò, e per evitare nel contempo di
usare un numero di cifre eccessivamente elevato, è opportuno sceglierne un numero tale
per cui l‟incertezza che ne deriva sia uno o due ordini di grandezza al massimo più
piccola di quelle che derivano dai dati sperimentali. È su tale base che si è supposto,
negli esempi visti in precedenza, che K = 0 o C = 0, immaginando di usare, appunto,
un valore di K o di C con un opportuno numero di cifre significative.
Le costanti del secondo tipo sono, in sostanza, una via di mezzo tra quelle di tipo
matematico ed i dati tabulati. Se il numero di cifre significative di cui si dispone è
sufficientemente elevato, esse possono essere trattate come le costanti di tipo
matematico; in caso contrario, si deve tener conto del contributo della loro incertezza
sulla base di quanto sopra esposto per i dati fisici tabulati negli handbook.
85
Teoria degli errori
“FITTING” DI DATI SPERIMENTALI
In laboratorio si determinano spesso coppie di valori di due grandezze, X e Y, che
sono legate tra loro. A volte la forma dell‟equazione che lega X e Y è nota in quanto
ricavata su basi teoriche; altre volte la forma di questa equazione non è nota e si deve
cercare quindi una funzione relativamente semplice per descrivere il legame tra le due
grandezze. In quest‟ultimo caso si parla di “equazione empirica”, e molto spesso si
utilizza allo scopo una serie di potenze poiché essa è normalmente in grado di
rappresentare una qualsiasi funzione ordinaria con buona approssimazione.
Esprimiamo quindi una delle due grandezze in funzione dell‟altra (ad esempio Y in
funzione di X), mediante una funzione che conterrà una serie di parametri incogniti a0,
a1, a2, ... , aP :
Y  F  X ,a0 ,a1 ,a2 ,...,a P 
Definita quindi la forma della funzione F(X), partendo dalle N coppie di dati
sperimentali x1, y1; x2, y2; ....; xN, yN (misurati e/o ottenuti da altri dati), è necessario
ricavare i valori dei parametri contenuti nella funzione, e le relative incertezze.
L‟importanza di tutto ciò nasce dal fatto che dal valore di alcune di tali costanti è spesso
possibile ricavare quello di importanti grandezze fisiche.
Poiché i punti sperimentali non si trovano esattamente sulla curva cercata (se non
altro per effetto delle inevitabili incertezze sperimentali), è necessario determinare la
curva che meglio si accorda con il set di valori a disposizione. La teoria statistica
dimostra che la curva migliore, che fornisce i migliori valori dei parametri incogniti, è
quella per la quale risulta minima la somma dei quadrati delle distanze di (note come
“residuals”) tra i punti sperimentali ed i “corrispondenti” punti sulla curva cercata
(metodo dei minimi quadrati):
N
R   d i 2  funzione a0 , a1,..., a P 
2
i 1
86
Teoria degli errori
2
Fissato un set di N punti sperimentali e la forma della “curva” cercata, R sarà
funzione dei parametri sperimentali incogniti a0, a1, a2, ... , aP, e risulterà minima in
corrispondenza dei valori per i quali risulta:
R 2 R 2
R 2

...
0
a0 a1
a P
Resta quindi da chiarire quali siano i punti della curva “corrispondenti” a quelli
sperimentali; si possono considerare tre casi diversi, a seconda che le imprecisioni siano
da attribuire prevalentemente alla variabile Y, oppure alla variabile X, oppure siano tra
loro confrontabili.
Facendo riferimento ad un diagramma X-Y, nel primo caso il punto della curva che
corrisponde a quello sperimentale è quello in “verticale”, avente cioè lo stesso valore
della ascissa, xi , nel secondo caso è quello preso in “orizzontale”, avente lo stesso
valore della Y, yi , mentre nel terzo caso tale punto ha entrambe le coordinate diverse da
quelle sperimentali in quanto la distanza va presa con una certa inclinazione (vedi
Figura 2).
Analizzeremo più in dettaglio tali situazioni facendo riferimento al caso del
“fitting” con un polinomio di primo grado (regressione lineare).
87
Teoria degli errori
Y =a +
bX
Y
[(y i
a )/b , y i ]
(x i , y i )
(x i , a +
bx i )
(x i *, y i *)
X
Figura 2. Rappresentazione schematica di un punto sperimentale di coordinate (xi,
yi,) e delle distanze di questo dalla retta incognita, per i tre casi discussi
nel testo.
REGRESSIONE LINEARE
In tal caso la funzione cercata ha la forma:
Y  a  bX
Vediamo come si ottengono i valori di a e b e le relative incertezze nei tre casi
sopra considerati, supponendo (per ora) che tutti i valori sperimentali della X, e
analogamente tutti quelli della Y, siano soggetti alla stesso valore di incertezza, x e y,
rispettivamente (regressione non pesata).
Incertezza da attribuire prevalentemente alla variabile Y
Si realizza quando:
x  0 e y  0
88
Teoria degli errori
y
y
Y
x
x
X
Figura 3. Rappresentazione schematica dei punti sperimentali delle grandezze X e
Y, delle relative incertezze x e y, e delle variazioni complessive delle
grandezze stesse, x e y.
o meglio, essendo normalmente X e Y grandezze di tipo diverso, con differenti unità di
misura ed ordine di grandezza, quando:
y
y
x

x
dove x  xmax  xmin ey  ymax  ymin
(vedi Figura 3)
In pratica si applica qualora:
y
y
3
x
x
In tali condizioni si deve minimizzare la funzione di a e b:
R 2 R 2

0
a
b
N
R 2    yi  a  bxi 2
ponendo
i 1
Si ottiene così il seguente sistema di due equazioni in due incognite:
89
aN  b  x i 
y
a x  b x   x y
i
2
i
i
Teoria degli errori
i
i
che fornisce le due soluzioni:
xi2  yi   xi  xi yi
N  xi yi   xi  yi

a
;b 


dove   N  xi2   xi 
2
L‟incertezza che caratterizza i valori della Y espressi dalla funzione trovata, definiti
cioè dall‟espressione y = a + bx, non si ottiene mediante la propagazione degli errori
applicata a tale espressione (in quanto risulterebbe sovrastimata) ma dalla distanza
media dei punti sperimentali dalla retta trovata. A tale riguardo si considera la
deviazione standard, y , definita dalla relazione4:
y 
N
R2
   yi  a  bxi 2
N 2
i 1
 N  2
Le incertezze per i parametri a e b si determinano invece mediante la propagazione
degli errori applicata alle equazioni da cui sono stati ricavati tali punti; considerando
che le incertezze sono solamente relative alle yi , si ha:
 a   a  yi 2  y2
N
i 1
 b   b  yi 2  y2
N
i 1
dalle quali si ottengono le relazioni:
a  y
 xi2

e
b  y
N

90
Teoria degli errori
Attendibilità della retta ottenuta
Prima di analizzare l‟attendibilità del risultato ottenuto, è opportuno verificare se
qualche punto sperimentale deve essere scartato, in quanto troppo “lontano” dalla retta
trovata. Analogamente a quanto visto nel caso della media pesata, si può ritenere di
dover scartare un punto se la distanza di è superiore a due-tre volte la deviazione
standard della Y:
d i  yi  a  bxi   2 y
Naturalmente, dopo aver scartato un punto è necessario ricalcolare i parametri e le
deviazioni standard e vedere se si deve escludere un altro punto, e così via.
Fatto ciò, si analizza l‟attendibilità della retta ottenuta in base all‟accordo esistente
tra y
e l‟incertezza stimata sui dati sperimentali, y. A tale riguardo possiamo
considerare tre diverse situazioni:
(1) Se y  y [(1/3) y  y  3y] l‟accordo tra punti sperimentali e retta è buono, e
le incertezze su a, b e y sono a , b e y, rispettivamente.
(2) Se y  y [y  3y] i punti sperimentali sono mediamente più distanti dalla retta
di quanto valutato (y); si realizzano allora due possibilità:

se i punti deviano dalla retta in modo casuale, allora è stato
presumibilmente sottostimato il y (vedi Figura 4); in tal caso la retta
trovata si può considerare ancora buona, con le incertezze riportate nel caso
1;

se i punti deviano in modo sistematico (apparente “curvatura” dei punti)
allora l‟andamento lineare non è corretto (vedi Figura 5, linea continua); in
tal caso:
4
Al denominatore compare N  2 perché sono stati determinati i valori delle costanti a e b;
nel caso della media si ha invece, come già visto, N  1 poiché si determina solamente il valore
medio.
91

Teoria degli errori
se la funzione lineare ha basi teoriche, potrebbe non essere valida in tutto
l‟intervallo
sperimentale
considerato,
e
quindi
si
deve
ridurre
opportunamente l‟intervallo di applicabilità (vedi Figura 5, linea
tratteggiata);

se la funzione lineare è applicata empiricamente, allora non è adatta a
descrivere l‟andamento sperimentale e si deve passare ad analizzare un
polinomio di grado superiore, o anche una funzione di tipo diverso (vedi
oltre).
y

y
Y
X
Figura 5. Rappresentazione schematica dei punti sperimentali e delle rette
ottenute mediante regressione lineare (per y  x) considerando tutti
gli 8 punti (linea continua), oppure solamente i 5 punti più a sinistra
(linea tratteggiata). Sono inoltre riportate le deviazioni standard della Y
calcolate nei due casi.
92
Teoria degli errori
y
Y
X
Figura 4. Rappresentazione dei punti sperimentali e della retta ottenuta
mediante regressione lineare (per y  x) nel caso in cui la
deviazione standard y risulta elevata rispetto alle incertezze stimate
y.
(3) Se y  y [y  (1/3)y] i punti sperimentali sono mediamente più vicini alla
retta di quanto ci si dovrebbe attendere sulla base dell‟incertezza valutata sulle
Y; se si ritiene che y sia stato correttamente stimato, il “buon allineamento”
dei punti sperimentali potrebbe essere casuale, specialmente se N non è molto
elevato. In tal caso è più corretto considerare come incertezza della Y non il
valore y calcolato sopra ma il y stimato; di conseguenza, è necessario
ricalcolare, mediante tale valore, quello di a e b , cioè:
a y
y = y
 xi2
b   y

N

Incertezza da attribuire prevalentemente alla variabile X
In questo caso si ha:
y  0ex  0
o meglio
x
x

y
in pratica
y
93
x
x
3
y
y
Teoria degli errori
per cui si possono trattare i dati come nel caso precedente, scambiando tra loro X e Y in
quanto la relazione tra le due variabili resta lineare.
In alternativa, si può operare analogamente a quanto fatto in precedenza
minimizzando la funzione somma dei residui:
y a

R   x i  i
b 
i 1 
N
2
2
ottenendo così un sistema che risolto fornisce le due soluzioni:
y x y  x y
a
i
i
i
i

2
i
;
b
N  y i2 
 y 
2
i

dove  è ora espresso dalla relazione   N  x i y i   x i  y i
La deviazione standard relativa alla variabile X el‟incertezza sulle costanti a e b è
espressa da relazioni simili a quelle viste nel caso precedente, ed analoghe
considerazioni devono essere fatte per ciò che concerne sia l‟attendibilità della retta
trovata sulla base del confronto tra x e x , sia la definizione delle incertezze relative
ad X, a e b.
Incertezze confrontabili della X e della Y
Si ha:
x
x

y
y
per cui la distanza tra i punti e la retta va presa con una certa inclinazione, che è
appunto definita dai valori relativi di x/x e y/y.
2
Minimizzando anche in questo caso la funzione R si ottiene un sistema di due
equazioni nelle due incognite a e b, da cui si ricava l‟espressione:
94
Teoria degli errori
b1,2  Q  Q2   y x 
dove
2
2
  y 2



2   xi 
i
2
2
 x  
  y i    y  
  xi 
 N

 N

Q


2  xi  yi
2 x  
  xi yi 
N


2
2
ed il valore di b che viene scelto è quello che fornisce il valore di R più basso.
Tramite l‟altra equazione del sistema
aN  b  x i   y i
si ricava il corrispondente valore di a5.
Successivamente si possono ricavare i valori delle deviazioni standard per X e Y,
tramite le relazioni:
N
y 
 d 
N
i 1
2
yi

 y
i 1
i
 a  bx i 

1  b 2 x y 
 x  y
N
x 
 d 
N
i 1
xi
2
i

N  2
2
i 1
i
2

 a b
1 y x 
2

2
b2
e
N  2

  y b x y 
2
Per ciò che riguarda le deviazioni standard su a e b, mediante la teoria della
propagazione degli errori si può scrivere, tenendo conto che le incertezze ora riguardano
sia la X che la Y:
2
2
 a  2 N  a  2
a   
 x   
 y
i 1  x i 
i 1  y i 
N
e
5
2
2
 b  2 N  b  2
b   
 x   
 y
i 1  x i 
i 1  y i 
N
Si può facilmente verificare come tale caso si riconduca ai due precedenti qualora l‟incertezza della Y
prevalga in modo significativo su quella della X, o viceversa.
95
Teoria degli errori
Data la difficoltà che si incontra, rispetto ai due casi precedenti, nel ricavare le
relazioni analitiche finali, tali deviazioni vengono calcolate utilizzando gli incrementi
finiti, approssimando cioè le singole derivate parziali ai corrispondenti rapporti
incrementali, per cui per a, ad esempio, si avrà:

a  axi
a a x i


x i
x i
x i


a  ayi
a a y i


y i
y i
y i

dalle quali si ottiene:
a 

N
i 1
a x i

2
N

  a y i
i 1

2
dove i vari termini a rappresentano ciascuno la differenza tra il valore a ottenuto dalla
ennupla di coppie di valori x1, y1; x2, y2; ....; xN, yN, ed il valore ottenuto sostituendo ad
xi (o ad yi ) il valore xi  x (o yi  y).
Analogamente si procede per il calcolo di b.
Complessivamente il calcolo di a e di b va quindi effettuato una prima volta con la
ennupla di valori XY, e successivamente ripetuto 2N volte modificando via via un
singolo valore xi o yi per volta6.
Una volta calcolate le deviazioni standard si deve procedere al confronto tra x e
x e tra y e y allo scopo di verificare l‟attendibilità dell‟andamento lineare trovato, e
stabilire i valori delle incertezze su X, Y, a e b, analogamente a quanto visto in
precedenza.
Tuttavia X e Y sono in generale grandezze fisiche diverse con errori quadratici
medi diversi e questo metodo attribuisce lo stesso peso agli scarti su X e Y. Si
preferisce pertanto considerare affetta da errore soltanto una delle variabili, quella
6
In alternativa, si potrebbe pensare di effettuare tali calcoli sostituendo ad xi e ad yi i valori
xi  x e yi  y, rispettivamente, come pure valutare i a con entrambe le sostituzioni, mediando
i valori ottenuti. In ogni caso, poiché le incertezze delle xi e delle yi sono percentualmente
piccole, il risultato finale non sarebbe significativamente diverso.
96
Teoria degli errori
determinata in modo più „indiretto‟ che risente maggiormente di tutte le incertezze di
tutte le altre grandezze misurate direttamente.
Regressione lineare pesata
Qualora i valori sperimentali yi (e/o xi ) non siano soggetti ad un‟unica incertezze y
ma ad incertezze diverse y1, y2, ... , yN, non è corretto calcolare la retta di regressione
dando lo stesso peso a tutti i punti sperimentali; analogamente al caso esaminato per la
media ponderale, supponendo che gli errori prevalenti riguardino la variabile Y, si
ottiene:
a
2
 wi xi  wi yi   wi xi  wi xi yi
 wi  wi xi yi   wi xi  wi yi
;b 


dove wi  1 y i2 e    wi  wi xi2   wi xi 2
Le deviazioni standard su a e b risultano di conseguenza espresse dalle relazioni:
a 
w x
i

2
i
e
b 
w

i
dove
   w i  w i x i2    w i x i 
2
Poiché punti soggetti a maggiore incertezza potranno risultare mediamente più
lontani dalla retta di quelli con incertezza minore, si può ritenere opportuno scartare i
punti per i quali la distanza dalla retta è maggiore (almeno il doppio) del corrispondente
valore di y : saranno in sostanza da scartare i punti in corrispondenza dei quali la retta
risulta “lontana” dalle barre di errore riportate nel grafico.
97
Teoria degli errori
“FITTING” DI DATI SPERIMENTALI CON POLINOMI
A volte il legame tra le due grandezze X e Y risulta più complesso di quello
esprimibile mediante una funzione di primo grado, ma ci si può facilmente riportare ad
essa trasformando una relazione non lineare in una lineare cambiando opportunamente
le variabili; ad esempio:
Y  Aexp KX
può essere linearizzata considerando:
lnY  lnA  KX per cui lnY risulta lineare in X.
Y  KXn
può essere linearizzata considerando:
Y contro X n
se n è noto, oppure
lnY contro lnX
se n non è noto, essendo lnY  lnK  nlnX
Se la forma della funzione non permette una linearizzazione, è necessario
effettuare, analogamente a quanto esposto in precedenza, la derivazione delle equazioni
2
che forniscono i parametri cercati minimizzando il termine R ricavato espressamente
per il caso in esame.
Accade a volte che il legame tra le due grandezze X e Y non sia noto in maniera
esplicita, cioè che non si sia a conoscenza della forma della funzione che lega tali
grandezze. In questo caso si cerca di esprimere tale legame attraverso l‟uso di funzioni
relativamente semplici, il cui andamento sia simile a quello dei dati a disposizione.
In particolare, si cerca di utilizzare un polinomio di grado opportuno, esprimibile in
generale come:
Y  a0  a1 X  a2 X 2 ....a P X P
ricavando poi i valori dei parametri incogniti a0, a1, a2, ... che meglio esprimono
l‟accordo tra la funzione ed i valori delle N coppie di dati sperimentali; x1, y1; x2, y2; ....;
xN, yN.
98
Teoria degli errori
Per semplicità consideriamo solamente il caso in cui gli errori prevalenti siano
relativi alla variabile Y (cioè y/y > x/x), per cui si dovrà minimizzare la quantità R
2
definita dalla relazione:
N
 
2
R 2   yi  a0  a1xi  a2 xi2 ...
i 1
2
2
Ponendo quindi (R /a0) = (R /a1) = ... = 0 si ottiene il seguente sistema
formato da P + 1 equazioni in P + 1 incognite:
a0 N  a1  xi  a 2  xi2 ... a P  xiP   yi
a0  xi  a1  xi2  a 2  xi3 ... a P  xiP 1   xi yi
a0  xi2  a1  xi3  a 2  xi4 ... a P  xiP  2   xi2 yi
....................
a0  xiP  a1  xiP 1  a 2  xiP  2 ... a P  xi2 P   xiP yi
che fornisce le P  1 soluzioni:
a k  Dk D
per k  0, 1, 2, ..., P
dove D rappresenta il determinante della matrice formata dai coefficienti delle
equazioni del sistema e Dk il determinante della matrice ottenuta sostituendo la relativa
colonna dei coefficienti con quella dei termini noti.
La deviazione standard relativa alla Y è espressa dalla relazione:
y 
R2
N  P  1
Le incertezze relative ad a0, a1, a2, ... , aP, calcolate sulla base della propagazione
degli errori (considerando che le incertezze interessano solamente la Y) ed espresse
dalla relazione:
99
 ak 
N
 ak
i 1
Teoria degli errori
yi 2 yi2
sono complesse da ottenere analiticamente, per cui vengono valutate considerando la
derivata prima pari al rapporto incrementale, come già visto nel caso della regressione
lineare con errori significativi su entrambe le variabili:
ak ak  xi ak xi


xi
xi
xi
per cui
 ak 
N
 ak 2xi
i 1
I termini (ak )xi rappresentano, analogamente a quanto già visto, la differenza tra il
valore di ak ottenuto dalle migliori stime di X ed Y ed il corrispondente valore ottenuto
sostituendo ad xi il termine xi + xi. (vedere il caso precedentemente trattato). Tale
calcolo va eseguito, per ognuna delle P + 1 costanti ak, per tutti i valori di i da 1 ad N.
Determinazione del grado del polinomio
Nel caso in cui il metodo di “fitting” sopra esposto sia utilizzato in modo empirico,
il grado del polinomio, P, non è generalmente noto a priori. Esso viene ad essere
definito implicitamente dalla quantità di dati a disposizione e dalla loro incertezza, in
quanto non deve risultare né troppo basso né troppo elevato, onde evitare di ottenere
una espressione che sottostima, o al contrario sovrastima, i valori sperimentali
analizzati.
In pratica, conviene iniziare il calcolo con un polinomio di primo grado, cioè
effettuare una regressione lineare dei dati, e calcolare la deviazione standard della Y
(supposto che gli errori prevalenti siano quelli relativi a questa grandezza). Se tale
deviazione standard risulta confrontabile con l‟incertezza dei valori sperimentali della
Y, si può considerare la regressione lineare buona; se la deviazione standard risulta
invece maggiore dell‟incertezza sperimentale, allora si aumenta il grado del polinomio
e si effettua una regressione di tipo quadratico. Se la nuova deviazione standard risulta
sensibilmente inferiore alla precedente, allora la regressione quadratica è effettivamente
migliore.
Si procede, quindi, aumentando ogni volta di una unità il grado del polinomio, fino
a quando l‟ultima deviazione standard calcolata non risulta più sensibilmente inferiore
100
Teoria degli errori
alla precedente. In questo caso, infatti, l‟aumento del grado del polinomio non è più
significativo, in quanto la nuova funzione non rappresenta l‟andamento dei dati meglio
della precedente, e perciò ci si deve arrestare al grado inferiore. D‟altro canto, se le
incertezze sperimentali sui valori della Y sono state attentamente valutate, si dovrebbe
trovare, alla fine, un valore di deviazione standard paragonabile a quello delle
incertezze sperimentali.
In accordo con quanto detto, si verifica che difficilmente si effettuano regressioni
con polinomi di grado superiore al terzo, e che le regressioni quadratiche risultano
normalmente sufficienti, in particolare quando la variazione dei dati sperimentali risulta
contenuta in un intervallo relativamente piccolo.
Va inoltre osservato che per descrivere il legame tra due grandezze fisiche in modo
empirico, a volte può risultare più opportuno utilizzare funzioni contenenti termini di
grado negativo. Ad esempio, la variazione della capacità termica con la temperatura
può essere convenientemente espressa, per alcune sostanze, mediante un polinomio di
secondo grado:
C  A  BT  CT 2
Per altre sostanze, tuttavia, è più appropriato l‟uso di una espressione del tipo:
C  A  BT  CT 2
in quanto le deviazioni dalla linearità risultano meglio esprimibili mediante un termine
quadratico nel reciproco di T piuttosto che tramite un termine quadratico in T; per altre
sostanze ancora può risultare del resto più conveniente usare espressioni con potenze
diverse.
Per concludere, ricordiamo che l‟incertezza che accompagna i valori delle quantità
yi , determinabili mediante l‟espressione analitica trovata, sono espresse dalla
deviazione standard relativa alla grandezza Y, e non si ottengono applicando la
propagazione dell‟errore all‟espressione trovata.
101

dispensa teoria degli errori

Transcript

Documenti analoghi

relazione laboratorio

Misure in fisica

Lezione 4 Sistema azienda e subsistema org

ELEZIONI PRESIDENZIALI USA: IL GIORNO DOPO

L`Arborense. 17.1. Vincere il male

5 La pianificazione delle risorse finanziarie

La lunghezza del diametro di un CD è . Calcola la lunghezza della

il dubbio e la certezza. errori e inefficacia decisionale

Scheda tecnica