dispensa teoria degli errori
Transcript
dispensa teoria degli errori
Chimica Fisica Industriale Modulo A Elaborazione dei Dati Sperimentali Teoria degli errori Laboratorio di Chimica Fisica Teoria degli errori MISURA DIRETTA DI UNA GRANDEZZA FISICA Errori di misura, migliore stima e incertezza La misura diretta di una grandezza fisica richiede: la definizione della grandezza in esame; la definizione di una opportuna unità di misura; la determinazione del valore della grandezza come rapporto tra la stessa e l‟unità di misura scelta. Una volta eseguite le prime due operazioni, la misura consiste quindi nell‟effettuare la determinazione del valore della grandezza in esame tramite un opportuno strumento di misura; in questa operazione vengono sicuramente commessi “errori” di tipo sistematico ed “errori” di tipo accidentale: Errori sistematici: comportano incertezze sempre nello stesso senso (eccesso o difetto); ad esempio: cordella metrica allungata errore sempre in difetto. Si eliminano (o, meglio, si riducono) utilizzando uno strumento di misura opportunamente tarato. Errori accidentali: sono di tipo casuale, quindi comportano incertezze di segno e valore variabili. A differenza dei precedenti possono venire ridotti ripetendo più volte la misura (vedi oltre). La misura di una grandezza fisica X non fornisce quindi un valore numerico, bensì un intervallo, detto di confidenza, esprimibile come: X = x x ( unità di misura) dove: (ad esempio: V = 56.4 0.1 ml) x rappresenta la migliore stima della grandezza X; x rappresenta l‟incertezza stimata di x (x > 0). Tale incertezza definisce normalmente l‟intervallo in cui il valore “vero” si trova con buona probabilità e non con certezza assoluta (vedi oltre). 67 Laboratorio di Chimica Fisica Teoria degli errori (vedi oltre). L‟incertezza x dipende, in generale, da entrambi i fattori sopra esposti, per cui sarà ottenibile, essendo i due tipi di errori indipendenti, come combinazione statistica di un (x)sist e di un (x)accid , secondo la relazione: 2 2 x x sist x accid Per comprendere il significato dei due contributi consideriamo il seguente esempio. Supponiamo di voler determinare la tensione di vapore di un liquido ad una certa temperatura; per fare ciò misuriamo, con un manometro a colonna di mercurio, la pressione di un sistema costituito da un liquido in equilibrio con il proprio vapore ad una prefissata temperatura. Per fissare la temperatura del sistema utilizziamo un termostato, il quale è costituito da un recipiente termicamente isolato (per ridurre gli scambi di calore con l‟esterno) contenente un fluido (in genere acqua), da una unità riscaldante (una resistenza elettrica che genera calore per effetto Joule), da una unità raffreddante (un sistema frigorifero o, più semplicemente, una serpentina attraversata da acqua fredda), e da un sistema di controllo della temperatura. Quando la temperatura che si vuole raggiungere nel sistema, e quindi nel termostato (temperatura che viene impostata nel sistema di controllo), è più elevata di quella del bagno termostatico, il sistema di controllo agisce facendo passare corrente attraverso la resistenza. In tal modo la temperatura del bagno termostatico sale, e quando raggiunge, o meglio supera di una certa quantità, il valore impostato, il sistema di controllo disinserisce il riscaldamento e mette in funzione il circuito di raffreddamento; in realtà, risulta spesso più conveniente, da un punto di vista costruttivo, mantenere sempre in funzione il sistema di raffreddamento e far funzionare a intermittenza il solo sistema riscaldante. In ogni caso, tali operazioni comportano una oscillazione della temperatura del bagno nell‟intorno del valore fissato, e l‟ampiezza di tali oscillazioni dipende dalle caratteristiche del sistema di controllo. La qualità del termostato sarà quindi tanto più elevata quanto più ristretta sarà l‟oscillazione della temperatura a regime; si possono costruire, ad esempio, termostati a 1C, a 1/10C e a 1/100C. Per misurare la pressione del sistema utilizziamo invece un manometro a mercurio, e rileviamo l‟altezza della colonnina di tale fluido che equilibra la pressione dei vapori 68 Laboratorio di Chimica Fisica Teoria degli errori con cui è a contatto. Per misurare tale altezza possiamo disporre di una comune cordella metrica, che permette in genere di rilevare lunghezze al decimo di millimetro, oppure di sistemi di rilevazione un po‟ più sofisticati che permettono di rilevare, ad esempio, il centesimo di millimetro. Lo scopo finale della misura è quello di determinare il valore della tensione di vapore in corrispondenza di un certo valore della temperatura, per cui dovremo stabilire per entrambi la migliore stima e la relativa incertezza. Va osservato, inoltre, che poiché il sistema non “risponde” in modo immediato alle inevitabili “oscillazioni” della temperatura, il valore di pressione misurato in un certo istante non può essere associato direttamente al valore di temperatura contemporaneamente rilevato, a meno che la strumentazione non sia così poco sensibile da non permettere di evidenziare le variazioni delle due grandezze. Vediamo la cosa più in dettaglio. Utilizzando un termostato a 1/100C e rilevando la temperatura del sistema con un termometro di sensibilità1 1/10C, le oscillazioni della temperatura non potranno essere evidenziate (a meno che non derivino da altri fattori) in quanto esse si trovano all‟interno dell‟intervallo di sensibilità del termometro utilizzato. In assenza di altri fenomeni, nella determinazione della temperatura del sistema si può pensare quindi di commettere essenzialmente un “errore sistematico”, in quanto questo non è eliminabile con misure ripetute che fornirebbero sempre lo stesso valore numerico, e può essere ridotto solamente utilizzando un termometro più sensibile. Tale incertezza è stimabile, in assenza di indicazioni più specifiche circa le caratteristiche del termometro, come metà della sensibilità del termometro stesso. Se la temperatura del sistema rimane quindi compresa nell‟intervallo 0.05C, possiamo scrivere (x)accid << (x)sist = (x)sens= 0.05C, per cui x (x)sens = 0.05C e quindi, ad esempio: se la temperatura oscilla tra le due tacche 32.5 e 32.6C t = 32.55 0.05C; se la temperatura oscilla nell‟intorno della tacca 32.6C 1 Per sensibilità intendiamo la quantità minima rilevabile dallo strumento, e come tale può dipendere dalla scala scelta. In pratica, negli strumenti analogici essa rappresenta la “distanza” tra due tacche contigue della scala, mentre negli strumenti digitali rappresenta la differenza minima rilevabile tra due numeri consecutivi che appaiono sul display (normalmente una unità in corrispondenza della cifra meno significativa riportata). Poiché normalmente si parla di sensibilità tanto più elevata quanto più piccola è la quantità minima rilevabile, più correttamente la sensibilità andrebbe considerata come il reciproco di quest‟ultima. 69 Laboratorio di Chimica Fisica Teoria degli errori t = 32.60 0.05C. In questo caso il risultato finale corrisponde a quello che si sarebbe ottenuto effettuando una singola determinazione; la ripetizione delle misure è comunque servita ad assicurare che le cause di tipo accidentale non sono significative, cosa che non si sarebbe potuta stabilire con un‟unica lettura. Supponiamo ora di disporre invece di un termostato a 1/10C e di un termometro a 1/100C; in questo caso si osserverà l‟oscillazione della temperatura del sistema in un intervallo più ampio rispetto alla sensibilità del termometro. Per un singolo valore di temperatura rilevato risulterà quindi (x)sens (x)accid , per cui x (x)accid. L‟incertezza relativa alla determinazione della temperatura può però essere opportunamente diminuita, a differenza del caso precedente, effettuando più misure e mediandole, come vedremo più avanti; in ogni caso, non sarà comunque possibile ridurre l‟incertezza globale al di sotto di quella definita dalla sensibilità dello strumento utilizzato. Analoghe considerazioni possono essere applicate alla determinazione della pressione, in relazione all‟entità delle oscillazioni della stessa ed alla sensibilità dello strumento di misura utilizzato. Va inoltre considerato che la determinazione della pressione richiede la conoscenza della densità del mercurio e della accelerazione di gravità del laboratorio, nonché delle relative incertezze, e l‟applicazione della teoria della propagazione degli errori, come sarà più avanti analizzato. Cifre significative Una volta condotte le misure, è necessario riportare con il corretto numero di cifre complessive, dette cifre significative, sia la migliore stima di X che la relativa incertezza x. Poiché x rappresenta una stima dell‟incertezza, si usa riportare: per l‟incertezza x solamente una cifra significativa se la prima cifra diversa da zero è 3, con possibilità di riportare due cifre significative negli altri casi. per la migliore stima x le cifre “corrispondenti” a quella/e di x. Avvertenze: è necessario arrotondare i valori determinati in base al numero di cifre significative; è opportuno usare la stessa potenza di 10 per x e x ; 70 Laboratorio di Chimica Fisica Teoria degli errori se le migliori stime devono essere utilizzate in successivi calcoli, è necessario impiegare più cifre di quelle significative (almeno una in più) per evitare errori di arrotondamento, ed arrotondare poi il risultato finale in base al relativo errore, calcolato mediante propagazione (vedi oltre). Esempi: non corretto corretto 27.6 3 28 3 27.62 3.3 28 3 84.682 1.04 84.7 1.0 32.476 0.037 32.48 0.04 48.123 0.18 48.12 0.18 268.4 24 268 24 0.07864 0.00253 0.0786 0.0025 o meglio (7.86 0.25)10-2 Vediamo alcune definizioni: Incertezza assoluta (errore assoluto): x Incertezza relativa (errore relativo): x /|x | (adimensionale) Incertezza relativa percentuale: 100 x /|x | (adimensionale) Accuratezza: è un indice dell‟incertezza globale della misura; più piccola è l‟incertezza relativa, più accurata è la misura. L‟elevata accuratezza implica quindi piccoli errori sia sistematici che accidentali. Non deve essere confusa con la precisione, anche se spesso i due termini vengono usati come sinonimi. Precisione: è un indice legato alla riproducibilità della misura. Una misura è molto precisa quando i risultati che si ottengono ripetendola più volte sono molto vicini tra loro, e quindi al valore medio; questo implica che gli errori casuali siano di piccola entità. La precisione è legata alla deviazione standard (vedi oltre), e risulta elevata se quest‟ultima è bassa. Si può dire, per concludere, che una misura molto accurata è necessariamente molto precisa, mentre una misura molto precisa può essere poco accurata per effetto di elevati errori sistematici. 71 Laboratorio di Chimica Fisica Teoria degli errori Determinazioni singole e ripetute Sulla base di quanto analizzato in un precedente esempio, allo scopo di determinare il valore dell‟incertezza più significativa per la grandezza in esame è opportuno effettuare più determinazioni sperimentali, e poi definire l‟intervallo x x effettuando una corretta analisi dei dati ottenuti. Se il numero di determinazioni è sufficientemente elevato, questa analisi è essenzialmente basata su considerazioni di tipo statistico; se, al contrario, è possibile effettuare una sola misurazione (come ad esempio nella determinazione, in tempi successivi, della concentrazione di una specie chimica durante il decorso di una reazione), la determinazione dell‟incertezza risulta alquanto delicata e finisce spesso col basarsi solamente sul valore della sensibilità dello strumento utilizzato, con la conseguente possibilità di ottenere un valore sottostimato. Consideriamo a tale riguardo il seguente esempio. L‟incertezza relativa alla concentrazione di una soluzione preparata sciogliendo una quantità pesata di soluto in un solvente, e portando poi a volume in un matraccio tarato, dipende, come sarà più avanti esposto nella teoria della propagazione degli errori, dalle incertezze legate alla determinazione della massa e del volume. Le normali bilance analitiche hanno in genere sensibilità di 0.1 mg, ma ciò non significa che l‟incertezza che si commette nella pesata sia di tale entità, indipendentemente dalla quantità pesata. A volte, infatti, l‟incertezza che accompagna la determinazione dipende dalla scala scelta, ed in tal caso il costruttore riporta la precisione delle varie scale, espressa in percentuale. Ad esempio, se si pesano 1.2368 g e nella scala utilizzata la precisione è 0.1%, si deve scrivere m = 1.2368 0.0012 g, mentre se la precisione è 1% si deve scrivere m = 1.237 0.012 g, avendo calcolato le incertezze come 0.1 e 1% del valore pesato, rispettivamente, ed avendo opportunamente arrotondato le incertezze stesse e, di conseguenza, la migliore stima della pesata effettuata. In questo caso, l‟incertezza che accompagna la singola determinazione della massa si basa quindi non sul valore della sensibilità della bilancia, che “risente” comunque di una variazione della massa di 0.1 mg in qualunque scala utilizzata, ma su quello della precisione data dal costruttore. Poiché questa incertezza è caratteristica dello strumento utilizzato, non può essere eliminata ripetendo più volte la misura; per ridurla è 72 Laboratorio di Chimica Fisica Teoria degli errori necessario usare una bilancia con una precisione maggiore nella scala adatta alla determinazione della massa in questione. D‟altro canto, ripetendo più volte la misura dello stesso campione si possono ritrovare, come spesso accade, valori leggermente diversi per effetto di cause di tipo accidentale, legate ad esempio allo spostamento dell‟azzeramento della bilancia, ad errori di lettura (parallasse) nelle bilance con scala analogica, a “rumori” esterni che influenzano l‟equilibrio della bilancia stessa, ecc.. Se le differenze tra i valori trovati risultano piccole rispetto all‟incertezza calcolata sulla base della precisione della scala utilizzata, allora le oscillazioni osservate sono in pratica prive di significato, in quanto tutti i valori numerici, opportunamente arrotondati, risultano coincidenti; in questo caso non ha quindi senso ripetere più volte la misura. Se, al contrario, tali oscillazioni risultano maggiori dell‟incertezza calcolata sopra, è necessario tenerne conto sulla base di opportune considerazioni di tipo statistico (come riportato più avanti), ed è quindi utile ripetere più volte la determinazione della massa se si vuole ridurre il valore dell‟incertezza. Si deve inoltre osservare che nella definizione della quantità di sostanza pesata possono entrare in gioco anche altri fattori, come ad esempio il grado di purezza della sostanza stessa; se nel flacone che la contiene è indicata una purezza compresa tra il 90 ed il 96%, non ha senso ripetere più volte la misura per avere molte cifre significative, in quanto si può al massimo ritenere che la quantità di sostanza che interessa è il 93 3% della massa pesata. Al contrario di quanto può essere effettuato nella determinazione di una massa mediante pesata, la determinazione del volume di una soluzione preparata in un matraccio è unica, per cui non possono essere fatte considerazioni di tipo statistico; in questo caso vanno opportunamente vagliate tutte le possibili fonti di imprecisione, sia di tipo sistematico che accidentale. Normalmente la vetreria tarata riporta il valore della tolleranza, che in pratica ne esprime il grado di taratura, e che può essere interpretata come la più piccola imprecisione che accompagna il valore del volume della vetreria stessa. Ad esempio, il volume di un matraccio che riporta la dicitura 50 ml a 20C, tolleranza 0.07 ml, può essere considerato come V = 50.00 0.07 ml. L‟incertezza globale del volume dipende però anche da altre cause, quali la mancata termostatazione 73 Laboratorio di Chimica Fisica Teoria degli errori del matraccio e della soluzione alla temperatura indicata, e l‟errore di “lettura” che si commette quando si porta a volume. La prima incertezza può essere indicativamente stimata sulla base del valore del coefficiente di dilatazione termica della soluzione (spesso simile a quello del solvente), tenendo conto che la temperatura di laboratorio è in genere di pochi gradi inferiore o superiore a 20C; l‟errore che si commette quando si porta a volume può essere valutato invece stimando la distanza menisco della soluzione-tacca del matraccio e l‟area del collo del matraccio stesso. È importante osservare che tali incertezze sono stimate e vanno quindi determinate in modo abbastanza grossolano, evitando l‟uso di molte cifre nei calcoli. L‟incertezza finale sul volume dipenderà naturalmente dalla combinazione delle singole incertezze determinate, e andrà effettuata sulla base di quanto sarà più avanti esposto nella teoria della propagazione degli errori. Sulla base degli esempi riportati risulta quindi evidente che per alcune grandezze è possibile effettuare una sola determinazione, mentre per altre può essere inutile o, al contrario, indispensabile, effettuarne più di una. In quest‟ultimo caso il dato finale è ottenuto sulla base di opportune considerazioni di tipo statistico, come verrà indicato nel prossimo paragrafo. DISTRIBUZIONE GAUSSIANA O NORMALE DELLE MISURE Supponiamo di effettuare un numero elevato N di misure sperimentali di una grandezza X utilizzando uno strumento di sensibilità sufficientemente elevata in modo da poter evidenziare le oscillazioni delle misure dovute a cause accidentali. Tali misure risulteranno distribuite in un intervallo più o meno ampio, e per N sufficientemente elevato molti valori (la maggior parte) verranno letti più volte. Riportando in grafico i valori ottenuti in ascissa e, in ordinata, il numero di volte che un dato valore è stato ottenuto, si ottiene un istogramma con andamento a massimo centrato nell‟intorno di un certo valore. Per N tale andamento è descrivibile statisticamente mediante la relazione di Gauss: f x 1 2 exp x xc 2 2 2 74 Laboratorio di Chimica Fisica Teoria degli errori 4 3 = 0.1 f(x) xc = 2 2 1 = 0.2 xc 0 xc 1 x c 2 x 3 Figura 1. Andamento della funzione di distribuzione gaussiana per due differenti valori di . dove: xc rappresenta il centro della Gaussiana; è legata all‟ampiezza della curva (vedi Figura 1); f(x) rappresenta la probabilità (normalizzata) di rilevare una misura nell‟intervallo compreso tra x e x + dx, ed è massima in corrispondenza di xc , che rappresenta la migliore stima di X (vedi Figura 1). Le probabilità di rilevare una misura all‟interno ed all‟esterno dell‟intervallo xc r xc r (ricavabili mediante opportuna integrazione della funzione) sono riportate nella tabella: r Pinterna (%) Pesterna (%) 0.674 50 50 1 68 32 2 95.4 4.6 3 99.7 0.3 75 Laboratorio di Chimica Fisica Teoria degli errori 4 99.99 0.01 L‟intervallo di confidenza a cui si fa normalmente riferimento è quello con il 68% di probabilità, definito dalla relazione X = xc ; negli intervalli xc 2 e xc 3 tale probabilità sale, rispettivamente, al 95.4 e 99.7%. Nasce quindi il problema di come determinare xc e sulla base delle misure sperimentali; la teoria statistica dimostra che date N misure sperimentali x1, x2, x3, ... , xN, si ha che: N xi a) la migliore stima di X, xc, è pari al valore medio delle xi , xm: x m i 1 N N xi xm 2 b) la migliore stima di è x, nota come deviazione standard2: x i 1 N 1 per cui l‟intervallo di confidenza della X (con il 68% di probabilità) verrà espresso come: X = xm x È importante osservare che l‟incertezza espressa dalla x diminuisce all‟aumentare di N, in quanto dipende solamente dalla presenza di errori casuali; non si deve tuttavia dimenticare che l‟incertezza complessiva è legata, come già detto, alla precisione dello strumento impiegato. Inoltre la deviazione standard non deve essere confusa con l‟errore della media. La deviazione standard definisce un intervallo di confidenza per la misura, mentre l‟errore della media è dato dalla deviazione standard diviso la radice quadrata del numero delle misure: xm X N Media pesata Al denominatore compare N 1 anziché N in quanto gli N valori xi hanno già fornito un dato, e cioè il valore medio xm. 2 76 Laboratorio di Chimica Fisica Teoria degli errori Nella media precedentemente considerata ogni misura contribuisce con lo stesso peso alla definizione del valore medio, e ciò è corretto se le N determinazioni x1, x2, ... , xN sono soggette ciascuna alla stessa incertezza (cioè allo stesso x), come normalmente accade quando si effettuano più misure con lo stesso strumento. Al contrario, se questi dati sono soggetti a incertezze differenti (x1, x2, ... , xN), è corretto effettuare una media “pesata” o “ponderale”; ciò può avere significato, in particolare, quando ciascun valore xi è stato ottenuto a sua volta da un insieme di determinazioni La media “pesata” è espressa dalla relazione: N xm w x i i 1 N w i con w i 1 xi 2 “peso” di ogni singola xi i i 1 mentre la deviazione standard (significativa per N 10) è calcolabile mediante la relazione: 1 x wi L‟errore della media è sempre calcolato mediante la relazione: xm X N Eliminazione di alcuni dati utilizzati nel calcolo della media Un valore utilizzato nel calcolo della media può essere scartato se sufficientemente lontano dal valore medio trovato, tenendo conto del significato statistico delle misure. Ad esempio, la probabilità di trovare un valore sperimentale al di fuori dell‟intervallo xm 2x è di circa il 5%, e scende allo 0.3% se si considera l‟intervallo xm 3x. Ciò significa che con 100 punti sperimentali è probabile che circa 5 punti cadano al di fuori del primo intervallo, e che nessuno si trovi al di fuori del secondo; con 10-20 punti ci si attende al massimo un punto nell‟intervallo più stretto. Questo permette di scartare quindi, nelle normali condizioni operative, i punti per i quali 77 Laboratorio di Chimica Fisica Teoria degli errori |xi xm| 2 o 3 volte x ; una volta scartati questi punti è necessario, ovviamente, ricalcolare i valori di xm e di x . Determinazione del valore medio con pochi dati sperimentali Le relazioni sopra riportate sono di tipo statistico e risultano quindi valide se applicate ad un numero sufficientemente elevato di dati sperimentali; si può ritenere corretto applicarle quando si hanno a disposizione almeno una decina di punti sperimentali. In caso contrario, si considera sempre come migliore stima di X il valore medio, ma per quanto riguarda l‟incertezza ci si deve accontentare di stime più grossolane, e quindi più elevate rispetto all‟errore definito in base alla deviazione standard. In quest‟ultimo caso normalmente si considerano come incertezze: per N 3 la semidispersione massima, definita come (xmax xmin)/2 per 3 < N < 10 l‟errore medio, definito come N | xi x m | N i =1 DETERMINAZIONE INDIRETTA DI UNA GRANDEZZA FISICA La determinazione della maggior parte delle grandezze fisiche non viene effettuata in modo diretto (per impossibilità o per convenienza), ma in modo indiretto, utilizzando le relazioni matematiche che legano tale grandezza ad altre misurabili direttamente o, a loro volta, determinabili indirettamente. Ad esempio, la determinazione di una concentrazione può essere fatta misurando direttamente una massa ed un volume; analogamente la determinazione di una velocità richiede la misura di uno spazio e di un tempo. Nasce quindi il problema di definire la migliore stima e l‟incertezza della grandezza in esame, sulla base dei corrispondenti valori trovati per le grandezze direttamente misurate. Consideriamo quindi la grandezza Y funzione di Q grandezze distinte X1, X2, ... , XQ : Y F X 1 , X 2 ,..., X Q 78 Laboratorio di Chimica Fisica Teoria degli errori e supponiamo che per ognuna delle grandezze Xi sia nota la migliore stima xi e la relativa incertezza xi : X i xi xi La teoria dimostra che la migliore stima (y) della grandezza Y è il valore da essa assunto in corrispondenza delle migliori stime delle grandezze Xi : y F x1, x2 ,..., xQ L‟incertezza della Y è legata al modo in cui le singole incertezze delle Xi si combinano, sommandosi o sottraendosi. Secondo la teoria della propagazione degli errori, applicabile se le incertezze delle Xi sono percentualmente piccole (xi /|xi | al massimo pari a qualche unità percentuale), si possono considerare due situazioni limite. (1) Se le incertezze xi sono tutte indipendenti tra loro, per stimare l‟incertezza della Y si utilizza la seguente relazione: F y i 1 X i Q 2 2 xi Tale metodo di determinazione va applicato, come detto, quando le incertezze relative alle grandezze Xi sono casuali e quindi possono sia sommarsi che parzialmente compensarsi. (2) Se, al contrario, ci sono motivi per ritenere che le incertezze xi possano prevalentemente sommarsi (ad esempio se gli errori stimati sulle grandezze sono per la maggior parte di tipo sistematico piuttosto che casuale), allora è più corretto considerare come incertezza della Y l‟errore limite propagato, definito come: Q F xi X i i 1 y 79 Laboratorio di Chimica Fisica Teoria degli errori Tale valore risulta ovviamente maggiore di quello definito al punto 1 (o al massimo uguale ad esso). Per esempio, se Y è l‟area di un rettangolo e X1 e X2 sono i due lati, si deve considerare: (a) l‟errore limite nel caso in cui i due lati vengano misurati con la stessa cordella metrica e le relative incertezze siano preferenzialmente dovute a cause sistematiche (bassa sensibilità e/o non buona taratura della cordella metrica utilizzata) in quanto i due errori saranno entrambi in difetto od entrambi in eccesso e quindi necessariamente si sommeranno; (b) l‟errore definito al punto 1 se gli errori relativi alla misura dei due lati sono essenzialmente di tipo casuale (cordella metrica tarata e sufficientemente sensibile) e quindi possono combinarsi sia sommandosi che compensandosi. Qualora si combinino tra loro incertezze derivanti da poche misure, per cui l‟incertezza è valutata come semidispersione massima, o relative a valori tabulati per i quali l‟incertezza venga valutata solamente sulla base del numero di cifre riportate (vedi oltre), è opportuno calcolare l‟incertezza della Y come errore limite. Nel caso in cui alcune delle grandezze Xi siano accompagnate da incertezze di carattere statistico e le altre no, i relativi termini possono essere combinati sommando in quadratura i primi e in valore assoluto i secondi. Si verifica spesso, comunque, che l‟errore limite propagato risulta di poco superiore, in quanto alcuni termini della sommatoria non pesano in modo significativo e, spesso, uno o due termini prevalgono sugli altri; si deve inoltre considerare che l‟incertezza che ne deriva è comunque una stima, e come tale deve essere arrotondata ad una o due cifre al massimo (secondo quanto già visto in precedenza), e che poi andrà arrotondato in modo opportuno anche il valore di y ottenuto3. Vediamo alcuni esempi: (1) Y X1 X 2 y x1 x2 y x12 x22 Y X1 X 2 y x1 x2 y x12 x22 N.B.: in entrambi i casi si esegue una somma degli errori assoluti (in valore assoluto oppure in quadratura). 3 A tale riguardo è opportuno ricordare come nei calcoli effettuati per la determinazione della migliore stima delle grandezze sia necessario utilizzare più cifre di quelle significative, mentre, al contrario, nel calcolo della propagazione delle incertezze è conveniente utilizzarne il minimo indispensabile e trascurare i termini poco significativi. 80 Laboratorio di Chimica Fisica Teoria degli errori y Kx (2) Y KX y | y | x | x | (K = 0) X e Y hanno lo stesso errore relativo y | y | | n | x | x | (3) Y KX n Ad esempio: Y K X y | y | 1 2x x Y K X y | y | x x y (4) Y KX1 X 2 Errore relativo moltiplicato per |n|. | y| y Y KX 1 X 2 | y| x1 | x1 | x1 | x1 | y x 2 2 x x 1 2 | y| x1 x2 | x2 | come nel caso Y KX y x 2 2 2 x x 1 2 | y| x1 x2 | x2 | 2 N.B.: in entrambi i casi si esegue una somma degli errori relativi (in valore assoluto oppure in quadratura). (5) Y K ln CX y | K | x | x| N.B.: l‟errore assoluto su Y è proporzionale all‟errore relativo su X. y Y K exp CX | y| | C | x N.B.: l‟errore relativo su Y è proporzionale all‟errore assoluto su X. Y X1ln CX 2 esempio: k1 k ln b t 2 y ln Cx2 x1 ln b (metodo di Guggenheim) t t 1 b b t oppure poiché t t x1 x2 x2 k k k k t t b b ln b 2 1 1 t t b ln b b è in genere trascurabile, risulta 81 k k b b ln b 2 Laboratorio di Chimica Fisica Teoria degli errori (6) Se Y è espressa come prodotto di più termini, si ricava facilmente una relazione tra le incertezze relative. Infatti, se Q n n n n Y KX 1 1 X 2 2 ...X QQ X i i passando ai logaritmi si ha: i 1 Q ln Y ln K ni ln X i i 1 dalla quale, differenziando e sommando opportunamente, si ottengono: y x i ni | y | i 1 xi y x ni i | y| xi i 1 Q e Q 2 che forniscono facilmente l‟errore relativo sulla Y come somma, “pesata” mediante gli esponenti, degli errori relativi sulle Xi . Da tale espressione si vede facilmente come i termini soggetti ad incertezze relative basse possano essere trascurati rispetto agli altri; normalmente solo pochi termini (spesso uno o due soltanto) contribuiscono alla definizione dell‟incertezza relativa della Y. (7) A differenza del caso precedente, nel caso in cui si abbia la somma di più termini “complessi”, occorre calcolare i differenziali; ad esempio, se: Y AB AC C B si ottiene: 2 2 b c a ac ab a y a 2 b 2 c b c b c b c 82 2 Laboratorio di Chimica Fisica Teoria degli errori Si noti che nel secondo e nel terzo termine della somma i due contributi hanno segno opposto, mentre nel primo termine hanno lo stesso segno; per tale motivo, i due contributi dovuti alle incertezze derivanti da B e C si compensano, mentre quelli derivanti dall‟incertezza di A si sommano. Questo deriva dal fatto che le variabili B e C compaiono una volta al numeratore ed un‟altra al denominatore, per cui, ad esempio, un errore in eccesso su B determina un contributo in eccesso per il termine AB/C ed uno in difetto per AC/B. È opportuno notare che non è corretto considerare l‟incertezza della Y come somma delle incertezze complessive relative ai due termini AB/C e AC/B, cioè: y 2 ab c 2 ac b perché calcolando le incertezze relative a questi separatamente, si ottiene, raccogliendo i termini: 2 2 b c a ac ab a y a 2 b 2 c b c b c b c 2 che risulta maggiore del precedente. Si può quindi concludere dicendo che l‟incertezza calcolata in più “stadi”, utilizzando espressioni parziali, può risultare non corretta. A tale riguardo si consideri anche il seguente esempio. Si vuole calcolare l‟incertezza relativa alla determinazione della pressione idrostatica P di una colonna di liquido di densità , avente altezza h, sottoposta all‟accelerazione di gravità g, ricordando che: pressione = forza peso/superficie di base della colonna: P = F/S forza peso = massa per accelerazione di gravità: F = mg massa = densità volume: m = V = Sh Calcolando prima l‟incertezza di m mediante quelle di , S e h, poi quella di F ed infine quella di P si otterrebbe: 83 Laboratorio di Chimica Fisica P P 2 Teoria degli errori 2 S g h 2 S g h 2 2 mentre calcolandola direttamente sulla base dell‟equazione globale P = gh si ottiene: P 2 2 g h P g h 2 nella quale non compare il termine dipendente dall‟incertezza di S; infatti, la pressione non dipende dalla superficie di base della colonna. È opportuno quindi applicare la propagazione direttamente all‟equazione che lega la grandezza incognita a quelle note; tuttavia, se la combinazione delle espressioni intermedie non comporta semplificazioni di grandezze, i due metodi risultano del tutto equivalenti. Per quanto riguarda il calcolo dell‟errore propagato, si osservi che nella determinazione del valore di alcune grandezze si fa uso di dati tabulati, i quali spesso sono riportati nei manuali senza le corrispondenti incertezze ed in questo caso esse sono implicitamente espresse dal numero di cifre significative. In assenza di indicazioni specifiche, si conviene che il dato venga riportato in modo tale che l‟intervallo d‟incertezza massimo (cioè quello in cui la probabilità di trovare il valore “vero” è estremamente elevata) abbia un‟ampiezza corrispondente ad una unità della penultima cifra significativa, cioè sia pari a 5 unità dell‟ultima cifra. Molto spesso, però, riferendosi ai concetti statistici visti in precedenza, si preferisce utilizzare un intervallo meno esteso, corrispondente a 1 unità sull‟ultima cifra, considerando un intervallo di probabilità elevata ma non elevatissima, analogo a quello definito dalla deviazione standard. I dati riportati nei manuali vengono normalmente trattati in quest‟ultimo modo. Nel calcolo dell‟errore propagato vanno infine considerate le costanti di tipo matematico (quali , e, ...) e fisico (Faraday, costante universale dei gas R, ...). 84 Laboratorio di Chimica Fisica Teoria degli errori Le costanti del primo tipo sono normalmente note con un numero di cifre significative estremamente elevato, per cui è sufficiente utilizzare tali costanti con un numero opportuno di cifre significative, in modo che l‟incertezza che ne deriva sia sicuramente trascurabile rispetto alle altre. Per far ciò, e per evitare nel contempo di usare un numero di cifre eccessivamente elevato, è opportuno sceglierne un numero tale per cui l‟incertezza che ne deriva sia uno o due ordini di grandezza al massimo più piccola di quelle che derivano dai dati sperimentali. È su tale base che si è supposto, negli esempi visti in precedenza, che K = 0 o C = 0, immaginando di usare, appunto, un valore di K o di C con un opportuno numero di cifre significative. Le costanti del secondo tipo sono, in sostanza, una via di mezzo tra quelle di tipo matematico ed i dati tabulati. Se il numero di cifre significative di cui si dispone è sufficientemente elevato, esse possono essere trattate come le costanti di tipo matematico; in caso contrario, si deve tener conto del contributo della loro incertezza sulla base di quanto sopra esposto per i dati fisici tabulati negli handbook. 85 Laboratorio di Chimica Fisica Teoria degli errori “FITTING” DI DATI SPERIMENTALI In laboratorio si determinano spesso coppie di valori di due grandezze, X e Y, che sono legate tra loro. A volte la forma dell‟equazione che lega X e Y è nota in quanto ricavata su basi teoriche; altre volte la forma di questa equazione non è nota e si deve cercare quindi una funzione relativamente semplice per descrivere il legame tra le due grandezze. In quest‟ultimo caso si parla di “equazione empirica”, e molto spesso si utilizza allo scopo una serie di potenze poiché essa è normalmente in grado di rappresentare una qualsiasi funzione ordinaria con buona approssimazione. Esprimiamo quindi una delle due grandezze in funzione dell‟altra (ad esempio Y in funzione di X), mediante una funzione che conterrà una serie di parametri incogniti a0, a1, a2, ... , aP : Y F X ,a0 ,a1 ,a2 ,...,a P Definita quindi la forma della funzione F(X), partendo dalle N coppie di dati sperimentali x1, y1; x2, y2; ....; xN, yN (misurati e/o ottenuti da altri dati), è necessario ricavare i valori dei parametri contenuti nella funzione, e le relative incertezze. L‟importanza di tutto ciò nasce dal fatto che dal valore di alcune di tali costanti è spesso possibile ricavare quello di importanti grandezze fisiche. Poiché i punti sperimentali non si trovano esattamente sulla curva cercata (se non altro per effetto delle inevitabili incertezze sperimentali), è necessario determinare la curva che meglio si accorda con il set di valori a disposizione. La teoria statistica dimostra che la curva migliore, che fornisce i migliori valori dei parametri incogniti, è quella per la quale risulta minima la somma dei quadrati delle distanze di (note come “residuals”) tra i punti sperimentali ed i “corrispondenti” punti sulla curva cercata (metodo dei minimi quadrati): N R d i 2 funzione a0 , a1,..., a P 2 i 1 86 Laboratorio di Chimica Fisica Teoria degli errori 2 Fissato un set di N punti sperimentali e la forma della “curva” cercata, R sarà funzione dei parametri sperimentali incogniti a0, a1, a2, ... , aP, e risulterà minima in corrispondenza dei valori per i quali risulta: R 2 R 2 R 2 ... 0 a0 a1 a P Resta quindi da chiarire quali siano i punti della curva “corrispondenti” a quelli sperimentali; si possono considerare tre casi diversi, a seconda che le imprecisioni siano da attribuire prevalentemente alla variabile Y, oppure alla variabile X, oppure siano tra loro confrontabili. Facendo riferimento ad un diagramma X-Y, nel primo caso il punto della curva che corrisponde a quello sperimentale è quello in “verticale”, avente cioè lo stesso valore della ascissa, xi , nel secondo caso è quello preso in “orizzontale”, avente lo stesso valore della Y, yi , mentre nel terzo caso tale punto ha entrambe le coordinate diverse da quelle sperimentali in quanto la distanza va presa con una certa inclinazione (vedi Figura 2). Analizzeremo più in dettaglio tali situazioni facendo riferimento al caso del “fitting” con un polinomio di primo grado (regressione lineare). 87 Laboratorio di Chimica Fisica Teoria degli errori Y =a + bX Y [(y i a )/b , y i ] (x i , y i ) (x i , a + bx i ) (x i *, y i *) X Figura 2. Rappresentazione schematica di un punto sperimentale di coordinate (xi, yi,) e delle distanze di questo dalla retta incognita, per i tre casi discussi nel testo. REGRESSIONE LINEARE In tal caso la funzione cercata ha la forma: Y a bX Vediamo come si ottengono i valori di a e b e le relative incertezze nei tre casi sopra considerati, supponendo (per ora) che tutti i valori sperimentali della X, e analogamente tutti quelli della Y, siano soggetti alla stesso valore di incertezza, x e y, rispettivamente (regressione non pesata). Incertezza da attribuire prevalentemente alla variabile Y Si realizza quando: x 0 e y 0 88 Laboratorio di Chimica Fisica Teoria degli errori y y Y x x X Figura 3. Rappresentazione schematica dei punti sperimentali delle grandezze X e Y, delle relative incertezze x e y, e delle variazioni complessive delle grandezze stesse, x e y. o meglio, essendo normalmente X e Y grandezze di tipo diverso, con differenti unità di misura ed ordine di grandezza, quando: y y x x dove x xmax xmin ey ymax ymin (vedi Figura 3) In pratica si applica qualora: y y 3 x x In tali condizioni si deve minimizzare la funzione di a e b: R 2 R 2 0 a b N R 2 yi a bxi 2 ponendo i 1 Si ottiene così il seguente sistema di due equazioni in due incognite: 89 Laboratorio di Chimica Fisica aN b x i y a x b x x y i 2 i i Teoria degli errori i i che fornisce le due soluzioni: xi2 yi xi xi yi N xi yi xi yi a ;b dove N xi2 xi 2 L‟incertezza che caratterizza i valori della Y espressi dalla funzione trovata, definiti cioè dall‟espressione y = a + bx, non si ottiene mediante la propagazione degli errori applicata a tale espressione (in quanto risulterebbe sovrastimata) ma dalla distanza media dei punti sperimentali dalla retta trovata. A tale riguardo si considera la deviazione standard, y , definita dalla relazione4: y N R2 yi a bxi 2 N 2 i 1 N 2 Le incertezze per i parametri a e b si determinano invece mediante la propagazione degli errori applicata alle equazioni da cui sono stati ricavati tali punti; considerando che le incertezze sono solamente relative alle yi , si ha: a a yi 2 y2 N i 1 b b yi 2 y2 N i 1 dalle quali si ottengono le relazioni: a y xi2 e b y N 90 Laboratorio di Chimica Fisica Teoria degli errori Attendibilità della retta ottenuta Prima di analizzare l‟attendibilità del risultato ottenuto, è opportuno verificare se qualche punto sperimentale deve essere scartato, in quanto troppo “lontano” dalla retta trovata. Analogamente a quanto visto nel caso della media pesata, si può ritenere di dover scartare un punto se la distanza di è superiore a due-tre volte la deviazione standard della Y: d i yi a bxi 2 y Naturalmente, dopo aver scartato un punto è necessario ricalcolare i parametri e le deviazioni standard e vedere se si deve escludere un altro punto, e così via. Fatto ciò, si analizza l‟attendibilità della retta ottenuta in base all‟accordo esistente tra y e l‟incertezza stimata sui dati sperimentali, y. A tale riguardo possiamo considerare tre diverse situazioni: (1) Se y y [(1/3) y y 3y] l‟accordo tra punti sperimentali e retta è buono, e le incertezze su a, b e y sono a , b e y, rispettivamente. (2) Se y y [y 3y] i punti sperimentali sono mediamente più distanti dalla retta di quanto valutato (y); si realizzano allora due possibilità: se i punti deviano dalla retta in modo casuale, allora è stato presumibilmente sottostimato il y (vedi Figura 4); in tal caso la retta trovata si può considerare ancora buona, con le incertezze riportate nel caso 1; se i punti deviano in modo sistematico (apparente “curvatura” dei punti) allora l‟andamento lineare non è corretto (vedi Figura 5, linea continua); in tal caso: 4 Al denominatore compare N 2 perché sono stati determinati i valori delle costanti a e b; nel caso della media si ha invece, come già visto, N 1 poiché si determina solamente il valore medio. 91 Laboratorio di Chimica Fisica Teoria degli errori se la funzione lineare ha basi teoriche, potrebbe non essere valida in tutto l‟intervallo sperimentale considerato, e quindi si deve ridurre opportunamente l‟intervallo di applicabilità (vedi Figura 5, linea tratteggiata); se la funzione lineare è applicata empiricamente, allora non è adatta a descrivere l‟andamento sperimentale e si deve passare ad analizzare un polinomio di grado superiore, o anche una funzione di tipo diverso (vedi oltre). y y Y X Figura 5. Rappresentazione schematica dei punti sperimentali e delle rette ottenute mediante regressione lineare (per y x) considerando tutti gli 8 punti (linea continua), oppure solamente i 5 punti più a sinistra (linea tratteggiata). Sono inoltre riportate le deviazioni standard della Y calcolate nei due casi. 92 Laboratorio di Chimica Fisica Teoria degli errori y Y X Figura 4. Rappresentazione dei punti sperimentali e della retta ottenuta mediante regressione lineare (per y x) nel caso in cui la deviazione standard y risulta elevata rispetto alle incertezze stimate y. (3) Se y y [y (1/3)y] i punti sperimentali sono mediamente più vicini alla retta di quanto ci si dovrebbe attendere sulla base dell‟incertezza valutata sulle Y; se si ritiene che y sia stato correttamente stimato, il “buon allineamento” dei punti sperimentali potrebbe essere casuale, specialmente se N non è molto elevato. In tal caso è più corretto considerare come incertezza della Y non il valore y calcolato sopra ma il y stimato; di conseguenza, è necessario ricalcolare, mediante tale valore, quello di a e b , cioè: a y y = y xi2 b y N Incertezza da attribuire prevalentemente alla variabile X In questo caso si ha: y 0ex 0 o meglio x x y in pratica y 93 x x 3 y y Laboratorio di Chimica Fisica Teoria degli errori per cui si possono trattare i dati come nel caso precedente, scambiando tra loro X e Y in quanto la relazione tra le due variabili resta lineare. In alternativa, si può operare analogamente a quanto fatto in precedenza minimizzando la funzione somma dei residui: y a R x i i b i 1 N 2 2 ottenendo così un sistema che risolto fornisce le due soluzioni: y x y x y a i i i i 2 i ; b N y i2 y 2 i dove è ora espresso dalla relazione N x i y i x i y i La deviazione standard relativa alla variabile X el‟incertezza sulle costanti a e b è espressa da relazioni simili a quelle viste nel caso precedente, ed analoghe considerazioni devono essere fatte per ciò che concerne sia l‟attendibilità della retta trovata sulla base del confronto tra x e x , sia la definizione delle incertezze relative ad X, a e b. Incertezze confrontabili della X e della Y Si ha: x x y y per cui la distanza tra i punti e la retta va presa con una certa inclinazione, che è appunto definita dai valori relativi di x/x e y/y. 2 Minimizzando anche in questo caso la funzione R si ottiene un sistema di due equazioni nelle due incognite a e b, da cui si ricava l‟espressione: 94 Laboratorio di Chimica Fisica Teoria degli errori b1,2 Q Q2 y x dove 2 2 y 2 2 xi i 2 2 x y i y xi N N Q 2 xi yi 2 x xi yi N 2 2 ed il valore di b che viene scelto è quello che fornisce il valore di R più basso. Tramite l‟altra equazione del sistema aN b x i y i si ricava il corrispondente valore di a5. Successivamente si possono ricavare i valori delle deviazioni standard per X e Y, tramite le relazioni: N y d N i 1 2 yi y i 1 i a bx i 1 b 2 x y x y N x d N i 1 xi 2 i N 2 2 i 1 i 2 a b 1 y x 2 2 b2 e N 2 y b x y 2 Per ciò che riguarda le deviazioni standard su a e b, mediante la teoria della propagazione degli errori si può scrivere, tenendo conto che le incertezze ora riguardano sia la X che la Y: 2 2 a 2 N a 2 a x y i 1 x i i 1 y i N e 5 2 2 b 2 N b 2 b x y i 1 x i i 1 y i N Si può facilmente verificare come tale caso si riconduca ai due precedenti qualora l‟incertezza della Y prevalga in modo significativo su quella della X, o viceversa. 95 Laboratorio di Chimica Fisica Teoria degli errori Data la difficoltà che si incontra, rispetto ai due casi precedenti, nel ricavare le relazioni analitiche finali, tali deviazioni vengono calcolate utilizzando gli incrementi finiti, approssimando cioè le singole derivate parziali ai corrispondenti rapporti incrementali, per cui per a, ad esempio, si avrà: a axi a a x i x i x i x i a ayi a a y i y i y i y i dalle quali si ottiene: a N i 1 a x i 2 N a y i i 1 2 dove i vari termini a rappresentano ciascuno la differenza tra il valore a ottenuto dalla ennupla di coppie di valori x1, y1; x2, y2; ....; xN, yN, ed il valore ottenuto sostituendo ad xi (o ad yi ) il valore xi x (o yi y). Analogamente si procede per il calcolo di b. Complessivamente il calcolo di a e di b va quindi effettuato una prima volta con la ennupla di valori XY, e successivamente ripetuto 2N volte modificando via via un singolo valore xi o yi per volta6. Una volta calcolate le deviazioni standard si deve procedere al confronto tra x e x e tra y e y allo scopo di verificare l‟attendibilità dell‟andamento lineare trovato, e stabilire i valori delle incertezze su X, Y, a e b, analogamente a quanto visto in precedenza. Tuttavia X e Y sono in generale grandezze fisiche diverse con errori quadratici medi diversi e questo metodo attribuisce lo stesso peso agli scarti su X e Y. Si preferisce pertanto considerare affetta da errore soltanto una delle variabili, quella 6 In alternativa, si potrebbe pensare di effettuare tali calcoli sostituendo ad xi e ad yi i valori xi x e yi y, rispettivamente, come pure valutare i a con entrambe le sostituzioni, mediando i valori ottenuti. In ogni caso, poiché le incertezze delle xi e delle yi sono percentualmente piccole, il risultato finale non sarebbe significativamente diverso. 96 Laboratorio di Chimica Fisica Teoria degli errori determinata in modo più „indiretto‟ che risente maggiormente di tutte le incertezze di tutte le altre grandezze misurate direttamente. Regressione lineare pesata Qualora i valori sperimentali yi (e/o xi ) non siano soggetti ad un‟unica incertezze y ma ad incertezze diverse y1, y2, ... , yN, non è corretto calcolare la retta di regressione dando lo stesso peso a tutti i punti sperimentali; analogamente al caso esaminato per la media ponderale, supponendo che gli errori prevalenti riguardino la variabile Y, si ottiene: a 2 wi xi wi yi wi xi wi xi yi wi wi xi yi wi xi wi yi ;b dove wi 1 y i2 e wi wi xi2 wi xi 2 Le deviazioni standard su a e b risultano di conseguenza espresse dalle relazioni: a w x i 2 i e b w i dove w i w i x i2 w i x i 2 Poiché punti soggetti a maggiore incertezza potranno risultare mediamente più lontani dalla retta di quelli con incertezza minore, si può ritenere opportuno scartare i punti per i quali la distanza dalla retta è maggiore (almeno il doppio) del corrispondente valore di y : saranno in sostanza da scartare i punti in corrispondenza dei quali la retta risulta “lontana” dalle barre di errore riportate nel grafico. 97 Laboratorio di Chimica Fisica Teoria degli errori “FITTING” DI DATI SPERIMENTALI CON POLINOMI A volte il legame tra le due grandezze X e Y risulta più complesso di quello esprimibile mediante una funzione di primo grado, ma ci si può facilmente riportare ad essa trasformando una relazione non lineare in una lineare cambiando opportunamente le variabili; ad esempio: Y Aexp KX può essere linearizzata considerando: lnY lnA KX per cui lnY risulta lineare in X. Y KXn può essere linearizzata considerando: Y contro X n se n è noto, oppure lnY contro lnX se n non è noto, essendo lnY lnK nlnX Se la forma della funzione non permette una linearizzazione, è necessario effettuare, analogamente a quanto esposto in precedenza, la derivazione delle equazioni 2 che forniscono i parametri cercati minimizzando il termine R ricavato espressamente per il caso in esame. Accade a volte che il legame tra le due grandezze X e Y non sia noto in maniera esplicita, cioè che non si sia a conoscenza della forma della funzione che lega tali grandezze. In questo caso si cerca di esprimere tale legame attraverso l‟uso di funzioni relativamente semplici, il cui andamento sia simile a quello dei dati a disposizione. In particolare, si cerca di utilizzare un polinomio di grado opportuno, esprimibile in generale come: Y a0 a1 X a2 X 2 ....a P X P ricavando poi i valori dei parametri incogniti a0, a1, a2, ... che meglio esprimono l‟accordo tra la funzione ed i valori delle N coppie di dati sperimentali; x1, y1; x2, y2; ....; xN, yN. 98 Laboratorio di Chimica Fisica Teoria degli errori Per semplicità consideriamo solamente il caso in cui gli errori prevalenti siano relativi alla variabile Y (cioè y/y > x/x), per cui si dovrà minimizzare la quantità R 2 definita dalla relazione: N 2 R 2 yi a0 a1xi a2 xi2 ... i 1 2 2 Ponendo quindi (R /a0) = (R /a1) = ... = 0 si ottiene il seguente sistema formato da P + 1 equazioni in P + 1 incognite: a0 N a1 xi a 2 xi2 ... a P xiP yi a0 xi a1 xi2 a 2 xi3 ... a P xiP 1 xi yi a0 xi2 a1 xi3 a 2 xi4 ... a P xiP 2 xi2 yi .................... a0 xiP a1 xiP 1 a 2 xiP 2 ... a P xi2 P xiP yi che fornisce le P 1 soluzioni: a k Dk D per k 0, 1, 2, ..., P dove D rappresenta il determinante della matrice formata dai coefficienti delle equazioni del sistema e Dk il determinante della matrice ottenuta sostituendo la relativa colonna dei coefficienti con quella dei termini noti. La deviazione standard relativa alla Y è espressa dalla relazione: y R2 N P 1 Le incertezze relative ad a0, a1, a2, ... , aP, calcolate sulla base della propagazione degli errori (considerando che le incertezze interessano solamente la Y) ed espresse dalla relazione: 99 Laboratorio di Chimica Fisica ak N ak i 1 Teoria degli errori yi 2 yi2 sono complesse da ottenere analiticamente, per cui vengono valutate considerando la derivata prima pari al rapporto incrementale, come già visto nel caso della regressione lineare con errori significativi su entrambe le variabili: ak ak xi ak xi xi xi xi per cui ak N ak 2xi i 1 I termini (ak )xi rappresentano, analogamente a quanto già visto, la differenza tra il valore di ak ottenuto dalle migliori stime di X ed Y ed il corrispondente valore ottenuto sostituendo ad xi il termine xi + xi. (vedere il caso precedentemente trattato). Tale calcolo va eseguito, per ognuna delle P + 1 costanti ak, per tutti i valori di i da 1 ad N. Determinazione del grado del polinomio Nel caso in cui il metodo di “fitting” sopra esposto sia utilizzato in modo empirico, il grado del polinomio, P, non è generalmente noto a priori. Esso viene ad essere definito implicitamente dalla quantità di dati a disposizione e dalla loro incertezza, in quanto non deve risultare né troppo basso né troppo elevato, onde evitare di ottenere una espressione che sottostima, o al contrario sovrastima, i valori sperimentali analizzati. In pratica, conviene iniziare il calcolo con un polinomio di primo grado, cioè effettuare una regressione lineare dei dati, e calcolare la deviazione standard della Y (supposto che gli errori prevalenti siano quelli relativi a questa grandezza). Se tale deviazione standard risulta confrontabile con l‟incertezza dei valori sperimentali della Y, si può considerare la regressione lineare buona; se la deviazione standard risulta invece maggiore dell‟incertezza sperimentale, allora si aumenta il grado del polinomio e si effettua una regressione di tipo quadratico. Se la nuova deviazione standard risulta sensibilmente inferiore alla precedente, allora la regressione quadratica è effettivamente migliore. Si procede, quindi, aumentando ogni volta di una unità il grado del polinomio, fino a quando l‟ultima deviazione standard calcolata non risulta più sensibilmente inferiore 100 Laboratorio di Chimica Fisica Teoria degli errori alla precedente. In questo caso, infatti, l‟aumento del grado del polinomio non è più significativo, in quanto la nuova funzione non rappresenta l‟andamento dei dati meglio della precedente, e perciò ci si deve arrestare al grado inferiore. D‟altro canto, se le incertezze sperimentali sui valori della Y sono state attentamente valutate, si dovrebbe trovare, alla fine, un valore di deviazione standard paragonabile a quello delle incertezze sperimentali. In accordo con quanto detto, si verifica che difficilmente si effettuano regressioni con polinomi di grado superiore al terzo, e che le regressioni quadratiche risultano normalmente sufficienti, in particolare quando la variazione dei dati sperimentali risulta contenuta in un intervallo relativamente piccolo. Va inoltre osservato che per descrivere il legame tra due grandezze fisiche in modo empirico, a volte può risultare più opportuno utilizzare funzioni contenenti termini di grado negativo. Ad esempio, la variazione della capacità termica con la temperatura può essere convenientemente espressa, per alcune sostanze, mediante un polinomio di secondo grado: C A BT CT 2 Per altre sostanze, tuttavia, è più appropriato l‟uso di una espressione del tipo: C A BT CT 2 in quanto le deviazioni dalla linearità risultano meglio esprimibili mediante un termine quadratico nel reciproco di T piuttosto che tramite un termine quadratico in T; per altre sostanze ancora può risultare del resto più conveniente usare espressioni con potenze diverse. Per concludere, ricordiamo che l‟incertezza che accompagna i valori delle quantità yi , determinabili mediante l‟espressione analitica trovata, sono espresse dalla deviazione standard relativa alla grandezza Y, e non si ottengono applicando la propagazione dell‟errore all‟espressione trovata. 101