Il punto di vista di Anirban: randommizzazione, bootstrap e Sherlock
Transcript
Il punto di vista di Anirban: randommizzazione, bootstrap e Sherlock
Il punto di vista di Anirban Randomizzazione, Bootstrap e Sherlock Holmes IMS Bulletin, Vol. 42(5) Potrebbe anche essere un esercizio di frivolezza, ma vedo un collegamento tra Sherlock Holmes e il bootstrap (tecnica di ricampionamento). E' l’inferenza randomizzata. Un esempio standard, spesso portato in una classe di statistica, è il seguente: se una moneta è lanciata 20 volte, usando un test UMP (uniformemente più potente) si conclude che la moneta è equa - con un errore del 5% - quando si osservano 10 ± 3 teste; si conclude che la moneta non è equa se si osservano meno di 6 teste o più di 14 teste. E se si osservano esattamente 6 teste o esattamente 14 teste? La decisione è lasciata alla simulazione del lancio di una moneta che produce testa il 39,2% delle volte. Quando si è di fronte a un dilemma, lasciate che a risolvere il problema sia una macchina. Vi sembra una cosa un po’ pazza? Nonostante il prestigio della elegante e resistente teoria di Neyman- Pearson, che lo stesso Wald prese in considerazione nel suo libro del 1950, usando una tecnica di randomizzazione a valle della raccolta dati, i test randomizzati e gli intervalli di confidenza sono stati accolti con un celato disprezzo e una scrollata di spalle. Anche il più fedele sostenitore delle decisioni ottimizzate scappa di fronte a questa tecnica (vedi discussioni di Basu, 1980, JASA). C'è una sola eccezione celebre, appunto il bootstrap, ed in misura minore, il test di permutazione di Pitman. Non è mia intenzione criticare o malignare su un metodo largamente utilizzato. Ma, poiché il metodo di Monte Carlo del bootstrap non è altro che un metodo di stima per una distribuzione – o dei suoi funzionali, il metodo inferenziale basato sul bootstrap altro non è che una macchina randomizzata. Cosa è una macchina randomizzata? Una macchina che fornisce risposte diverse alla stessa domanda e con gli stessi dati, se questa domanda le viene posta in momenti diversi. A volte le risposte sono sostanzialmente diverse. Ma questo non ha scalfito neanche di un briciolo la popolarità del bootstrap (Efron e Tibshirani , 1993 CRC Press; Edgington , 1995 CRC Press) . Cito una piccola parte di un esempio. Considerate il solito scenario di un campione casuale iid, e prendete in considerazione la media in valore assoluto della distanza dalla mediana dei dati, ossia 1 = | − | Se esiste il momento del secondo ordine, √ − | − | è asintoticamente normale, con la mediana della popolazione. Se la popolazione ha una distribuzione assolutamente continua, la moderna teoria dei processi empirici può essere usata per ottenere in maniera rigorosa la varianza asintotica. Se la distribuzione è quella di Laplace, di parametri e , anche √ è asintoticamente normale (standard). Mentre il classico percentile di un intervallo di confidenza (CLT) al 95% è ± 1.95996 ≈ ± 1.96, con la tecnica del bootstrap i percentili costruiti su 15 ricampionamenti variano tra 1.651 e 2.030 con una media di 1.845. I 15 ricampionamenti sono stati eseguiti con n = 35, e una dataset fissato ottenuto per simulazione, utilizzando ciascuno dei cinque valori di B tre volte, B = 600 , 750 , 900 , 1000, 1200 [la scelta di B è discussa in Sala (1986 , AoS) , Horowitz (1994, Joe), Shao e Tu (1995 , Springer)]. In 13 dei 15 casi, l'intervallo di bootstrap è stato più piccolo di quello CLT, e per due volte, sostanzialmente identico. Vorrei essere corretto, ma non sono sicuro che in pratica si ripeta lo stesso bootstrap (anche se con la stessa B), e le diverse randomizzazioni opportunamente ricombinate. Non abbiamo spazio per scendere in ulteriori dettagli. La tecnica del jackknife può sicuramente tornare utile. Ciò nonostante, il bootstrap resta un metodo di successo per l’inferenza randomizzata. Permettetemi ora di raccontarvi una storia molto nota su Sherlock Holmes. E’ la storia dell’ Ultima avventura. Holmes è in fuga da Londra per sfuggire alla vendetta spietata del suo mortale nemico, il genio certificato del male nonché "Napoleone del crimine", il professor Moriarty Mi scuso con tutto il mondo perché il professore era un matematico, anzi era considerato un fenomeno nella sua facoltà. Eulero, a suo confronto, avrebbe chinato il capo per la vergogna. Holmes sale sul treno a Londra, con l'intenzione di scendere alla stazione terminale di Dover, e poi di prendere una nave per il continente. Il treno ha una fermata intermedia a Canterbury. Appena il treno lascia la stazione Victoria, Holmes vede Moriarty sul binario, e suppone che Moriarty sa che Holmes è su quel treno. Moriarty può sicuramente trovare un mezzo di trasporto veloce per incontrare Holmes a Dover. Anticipando questa mossa, Holmes potrebbe scendere a Canterbury. Ma da scaltro matematico quale è , Moriarty anticiperà la mossa di Holmes e a sua volta penserà di raggiungerlo a Canterbury. Ora, Holmes, che, come è noto, è a sua volta molto astuto, sicuramente penserà che Moriarty pensa di anticipare ciò che Holmes vorrebbe fare, e così via. Sicché abbiamo due personalità forti, avversarie in un problema di decisione: dove scendere? Philip Stark ha fatto notare che la scena siciliana in La storia fantastica è formalmente equivalente al gioco Holmes - Moriarty. C'è una eccellente letteratura su questo esempio affascinante. Cito Morgenstern (1935, New York University Press), Clayton (1986, discussione di Diaconis e Freedman , 1986 , AOS) , Eichberger (1995 , GEB) , Caso (2000 , AMM) e Koppl e Rosser (2002 , SCE). Il problema Holmes - Moriarty può essere visto come un problema di decisione, con una funzione di perdita. Ciascuna delle azioni nonrandomizzate di Holmes, = scendere a Canterbury , = scendere a Dover, è ricevibile e minimax. Data l'infinita catena di ragionamenti - "Io credo che tu credi che io credo che ... " - ciascuno pensa, nascono paradossi legati all'autoreferenzialità del ragionamento e non si perviene ad una conclusione. Qui sembrano avere senso solo delle decisioni prese a caso! Se la perdita di Holmes, ossia trovarsi nella stessa stazione con Moriarty, è L, questa è pari a zero se Holmes scende a Canterbury mentre Moriarty procede allegramente fino Dover, ed è invece cL , con c < 1, se Moriarty scende a Canterbury mentre Holmes continua fino a Dover. Quindi la strategia randomizzata ottimale di Holmes è p + (1 - p) mentre quella di Moriarty di (1-p) + p , dove p = (1 – c)/(2 –c) , e in questo caso, il gioco è in stallo nel senso di von Neumann. E una situazione di stallo è ragionevole in una battaglia tra due giganti uguali. Le storie di Sherlock Holmes sono tali monumenti della letteratura di prim'ordine, senza eguali, che conosco intenditori che non affrontano dei viaggi lontano da casa senza Holmes nella loro valigia. Come in un bambino che ride, una rosa, una sinfonia di Mozart, un tramonto sul mare, le gocce di pioggia sulla finestra, o un bel teorema, in Holmes un uomo può trovare conforto. Sir Conan Doyle ha scelto 19 tra le storie dedicate a Holmes: l’ultima avventura è in tale elenco, l’uomo che danza è decisamente di sapore statistico. Romanzare tutto ciò può apparire bizzarro, ma la serie TV inglese Sherlock Holmes è a sua volta un meraviglioso intrattenimento. (traduzione di E. Di Nardo)