Test del chi
Transcript
Test del chi
Capitolo 9 Test del χ2 (versione preliminare) Nel capitolo sulla stima dei parametri si è visto come ottenere i parametri di una funzione in modo da approssimare nel modo migliore i dati sperimentali. Tuttavia i metodi esposti (Minimi Quadrati e Massima Verosimiglianza) non danno alcuna indicazione su come la funzione ottenuta si adatta ai dati, ovvero non danno alcuna indicazione sulla “qualità” del fit. Uno dei modi più utilizzati per ottenere questo tipo di valutazione è il test del χ2 . Questo test, se sono soddisfatte alcune condizioni, permette di ottenere una valutazione probabilistica della “bontà del fit1 ” utilizzando la distribuzione di densità di probabilità del χ2 , già descritta nel paragrafo 5.9.6. Il test del χ2 ha due forme, una che si applica quando si prende in considerazione una dipendenza funzionale tra due grandezze e un’altra che si applica a risultati esprimibili con istogrammi. 9.1 Test del χ2 per relazioni funzionali Il test del χ2 è largamente utilizzato quando si vuole una valutazione della qualità del fit ottenuto da un insieme di dati sperimentali oppure quando si vuole verificae se una teoria (anche priva di parametri da determinare) è supportata o meno dai dati sperimentali. Consideriamo una grandezza fisica Y misurata in funzione di un’altra grandezza X e sia Y = g(X|Λ) la funzione che si intende adattare ai dati. Le misurazioni di Y siano effettuate in corrispondenza a N valori xi , (i = 1, . . . , N ), noti con incertezza trascurabile, e siano yi ± ui le misure ottenute con le loro incertezze. Supponiamo inoltre che le misure yi siano distribuite normalmente attorno al valore g(xi |Λ), valore teorico aspettato per la variabile yi con deviazione standard ui . La figura 9.1 esemplifica quanto esposto; le curve a campana attorno ai valori attesi delle y rappresentano le distribuzioni gaussiane ipotizzate delle grandezze riportate nell’asse dell ordinate. Con le ipotesi fatte la variabile zi = (yi − g(xi |Λ))/ui è una variabile aleatoria con distribuzione normale N (0, 1) e quindi la variabile definita dalla sommatoria delle zi2 N N X (yi − g(xi |Λ))2 X zi2 = χ2 (9.1) = 2 u i i=1 i=1 segue la distribuzione di probabilità del χ2 con un numero di gradi di libertà che è dato dal numero N dei punti sperimentali da cui si deve sottrarre il numero dei k parametri Λ : {λ1 , . . . , λk } eventualmente stimati nel calcolo del fit utilizzando gli stessi N punti 1 In inglese Goodness-of- fit alle volte abbreviato con l’acronimo GOF 96 CAPITOLO 9. TEST DEL χ2 (VERSIONE PRELIMINARE) 97 y y3 y2 y1 y4 x1 x2 x3 x x4 Figura 9.1: Test del χ2 per relazioni funzionali. I cerchi pieni rappresentano le misure sperimentali, i cerchi vuoti i valori attesi delle yi e le curve a campana sono le gaussiane che descrivono come si distribuiscono le yi attorno al valore atteso. Le barre di incertezza sulle yi non sono state riportate per evitare la sovrapposizione di simboli grafici che avrebbero reso più difficoltosa la comprensione del grafico. sperimentali. In conclusione il numero dei gradi di libertà della variabile χ2 è ν = N − k. Ad esempio supponiamo che la curva continua nella figura 9.1 sia una parabola: g(x|Λ) = λ1 + λ2 x + λ2 x2 e che tramite il fit dei 4 punti sperimentali avessimo determinato il valore dei tre parametri λ1 , λ2 , λ3 , la variabile χ2 ottenuta tramite la (9.1) ha 1 grado di libertà. Una volta calcolato il valore χ2o dell’espressione (9.1) e il numero di gradi di libertà, se la funzione g ipotizzata descrive correttamente i dati , possiamo calcolare la probabilità di ottenere casualmente un valore di χ2 maggiore di quello ottenuto χ2o con il seguente espressione: Z ∞ P (χ2 > χ2o ) = χ2o ′ fχ2 (χ2 ) dχ2 ′ (9.2) I valori dell’integrale (9.2) si ottengono tramite tabelle2 o con programmi di calcolo3 . Parlando qualitativamente ci aspettiamo che se la funzione g(x|Λ) descrive correttamente i dati, P (χ2 > χ2o ) sia abbastanza grande4 , e dell’ordine del 50%, mentre valori piccoli di tale probabilità ci dicono che, se la funzione g(x|Λ) descrivesse correttamente i dati, il valore trovato (χ2o ) sarebbe estremamente improbabile. Quindi se il valore di P (χ2 > χ2o ) è “piccolo” (convenzionalmente si prende come valore minimo il 5%, ma si parla sempre di probabilità e non di certezza) probabilmente la teoria, rappresentata dalla funzione (g(x|Λ)), non si adatta ai dati e quindi è da rigettare. 9.1.1 Il χ2 ridotto Notiamo che se la funzione g(X|Λ) descrive correttamente i dati, il valore atteso della variabile χ2 (9.1) è pari al numero di gradi di libertà ν cioè E[χ2 ] = ν. Per rendere il valore atteso del χ2 indipendente dal numero dei gradi di libertà è stato introdotto il χ2 ridotto 2 Vedi l’appendice D nella quale è tabulato il χ2 ridotto, ovvero χ̃2 = χ2 /ν. Per la definizione del χ2 ridotto vedi il prossimo paragrafo. 3 Tra i programmi per il calcolo dell’integrale (9.2) si può utilizzare EXCEL o il suo equivalente open source 4 Estremizzando, se i punti sperimentali coincidessero esattamente con i valori previsti avremo χ2o = 0 e quindi una probabilità pari a 1 di ottenere in un esperimento successivo un valore maggiore di χ2 . Tuttavia vedremo che anche valori troppo piccoli di χ2 sono indice di un problema nella valutazione della qualità del fit. Vedi il successivo Esempio 3 a pagina 99. CAPITOLO 9. TEST DEL χ2 (VERSIONE PRELIMINARE) 102 Figura 9.6: Istogramma delle misure del periodo di un pendolo. Sono rappresentati due assi: in alto i valori del periodo in secondi, in basso la corrispondente variabile z = (T − T )/s. I numeri sotto il bin indicano l’estremo inferiore del bin. segue la distribuzione del χ2 con ν = n−1 gradi di libertà. Il numero dei gradi di libertà è pari al numero dei bin in cui sono stati raggruppati i dati sperimentali meno uno. La diminuzione di una unità dei gradi di libertà è giustificata dalla osservazione che il numero totale degli eventi (N ) è fissato e quindi il contenuto dell’ultimo bin è determinato del contenuto di tutti gli altri. Ovviamente se la distribuzione con la quale confrontiamo i dati avesse k parametri stimati da una procedura di fit allora il numero dei gradi di libertà della variabile χ2 sarebbe ν = n − k − 1. Esempio su dati reali. La misurazione del periodo T di un pendolo fisico è eseguita con un apparto provvisto di un interruttore ottico collegato ad un cronometro la cui risoluzione è 10 µs. Sono acquisti 198 valori del periodo e l’istogramma dei valori è mostrato in figura 9.6. Media e deviazione standard dei valori acquisiti sono T = 1.51196 s e s = 0.00012 s. Ci chiediamo se la distribuzione dei valori ottenuti è compatibile con una distribuzione normale con valore medio e deviazione standard ottenuti dai valori calcolati. Come prima operazione trasformiamo le grandezze Ti misurate, nelle corrispondenti variabili normalizzate zi con la relazione: Ti − T zi = (9.5) s Il nuovo asse è rappresentato al di sotto di quello originale nella figura 9.6. Il passo successivo è calcolare per ogni bin il contenuto di eventi aspettato, che nell’ipotesi fatta della distribuzione normale, è: Ei = N Z zi+1 zi 1 N zi 2 √ e−t /2 dt = erfc √1 2 2π 2 − erfc zi1+1 √ 2 (9.6) dove erfc(x) è la funzione complementare degli errori (vedi pagina 59). Esaminando la tabella 9.3 si nota che alcuni bin hanno un contenuto inferiore a 5 per cui, per applicare in modo corretto il test del χ2 di Pearson, devono essere accorpati fino a raggiungere una numerosità maggiore di 5. Allo scopo i valori attesi dei primi 5 e degli ultimi 3 bin sono stati sommati tra loro e confrontati con la somma dei corrispondenti valori CAPITOLO 9. TEST DEL χ2 (VERSIONE PRELIMINARE) 103 Tabella 9.3: Tabella per l’esecuzione del test di χ2 di Pearson sui dati del periodo di oscillazione di un pendolo fisico. Nella colonna dei valori attesi (Ei ) i numeri in corsivo si riferiscono ai dati accorpati come spiegato nel testo Ti (s) 1.5114 1.5115 1.5116 1.5117 1.5118 1.5119 1.512 1.5121 1.5122 1.5123 1.5124 zi -4.578 -3.758 -2.938 -2.118 -1.298 -0.478 0.343 1.163 1.983 2.803 3.623 Oi 1 0 0 1 13 47 66 46 20 2 2 Ei − − − − 19.2 43.4 62.9 48.2 24.2 − − (Oi − Ei )2 /Ei 0.936 0.296 0.156 0.101 0.002 χ2 = 2.06 osservati (vedi la tabella 9.3). In queste condizioni si ottiene χ2 = 2.08 Il numero dei gradi di libertà è ν = 2 (5 bin, 2 parametri stimati dai dati) con la probabilità P (χ2 > 2.08) = 0.36. Questo valore conferma l’ipotesi di normalità della distribuzione dei periodi del pendolo su cui sono state effettuate le misurazioni, almeno per misure di T che distano meno di due deviazioni standard dalla media.