universit`a degli studi di lecce
Transcript
universit`a degli studi di lecce
UNIVERSITÀ DEGLI STUDI DI LECCE FACOLTÀ DI SCIENZE MM. FF. NN. Corso di Laurea in Fisica TESI DI LAUREA Studio della discriminazione γ/adroni nell’esperimento ARGO-YBJ Relatore: Dott. Ivan DE MITRI Laureando: Francesco SALAMIDA Anno Accademico 2001-2002 ii Sal, dobbiamo andare e non fermarci mai finché non arriviamo. Per andare dove, amico ? Non lo so, ma dobbiamo andare. Jack Kerouac - Sulla Strada iv Indice Introduzione vii 1 Astronomia dei raggi γ di alta energia 1.1 Principali fenomeni di produzione dei raggi γ 1.1.1 Pulsar . . . . . . . . . . . . . . . . . 1.1.2 Resti di Supernovae (SNR) . . . . . . 1.1.3 Nubi Molecolari . . . . . . . . . . . . 1.1.4 Nuclei Galattici Attivi (AGN) . . . . 1.1.5 Gamma Ray Burst (GRB) . . . . . . 1.2 Tecniche sperimentali della γ astronomia alle 1.2.1 Rivelatori satellitari . . . . . . . . . . 1.2.2 Rivelatori ground-based . . . . . . . . . . . . . . . . 1 4 4 6 7 8 11 12 13 16 . . . . . . . . . . 23 25 27 27 28 32 34 34 36 37 39 . . . . 43 43 44 45 46 di alta energia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . alte energie . . . . . . . . . . . . . . . . . . . . 2 L’esperimento ARGO-YBJ 2.1 Obiettivi dell’esperimento . . . . . . . . . . . . . . 2.2 L’apparato . . . . . . . . . . . . . . . . . . . . . . . 2.2.1 La struttura . . . . . . . . . . . . . . . . . . 2.2.2 Le camere ad elettrodi piani resistivi (RPC) 2.3 Sensibilitá di ARGO alla γ astronomia . . . . . . . 2.3.1 Osservazione della Crab . . . . . . . . . . . 2.3.2 SNR . . . . . . . . . . . . . . . . . . . . . . 2.3.3 Nubi molecolari . . . . . . . . . . . . . . . . 2.3.4 Sorgenti extragalattiche (AGN) . . . . . . . 2.3.5 GRB . . . . . . . . . . . . . . . . . . . . . . 3 Studio degli sciami atmosferici ed analisi 3.1 Sciami atmosferici . . . . . . . . . . . . . 3.1.1 Sciami elettromagnetici . . . . . . 3.1.2 Sciami adronici . . . . . . . . . . 3.2 Modelli analitici . . . . . . . . . . . . . . v . . . . . . . . . . multiscala . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vi Indice . . . . . . . . . 48 50 51 53 54 55 57 59 59 . . . . . . 61 62 64 64 66 71 76 5 Discriminazione γ/h per mezzo di una rete neurale artificiale 5.1 Le reti neurali . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.1.1 Neuroni . . . . . . . . . . . . . . . . . . . . . . . . . . 5.1.2 Topologia . . . . . . . . . . . . . . . . . . . . . . . . . 5.1.3 Addestramento . . . . . . . . . . . . . . . . . . . . . . 5.2 Analisi degli eventi di ARGO tramite ANN . . . . . . . . . . . 5.2.1 SNNS (Stuttgart Neural Network Simulator) . . . . . . 5.2.2 Topologia utilizzata . . . . . . . . . . . . . . . . . . . . 5.2.3 Procedura di addestramento della rete . . . . . . . . . 5.3 Analisi dei risultati . . . . . . . . . . . . . . . . . . . . . . . . 5.4 Aumento della sensibilitá del rivelatore . . . . . . . . . . . . . 79 81 83 84 86 88 88 88 89 93 96 Conclusioni 99 3.3 3.4 3.5 3.2.1 Modello di Heitler . . . . . . . . . . . . . . . . 3.2.2 Equazioni di trasporto . . . . . . . . . . . . . Simulazioni Monte Carlo . . . . . . . . . . . . . . . . Analisi multiscala . . . . . . . . . . . . . . . . . . . . 3.4.1 Analisi multifrattale standard . . . . . . . . . 3.4.2 Approccio differenziale all’analisi multifrattale 3.4.3 Analisi di wavelet . . . . . . . . . . . . . . . . 3.4.4 Sistemi a piú dimensioni . . . . . . . . . . . . Skewness . . . . . . . . . . . . . . . . . . . . . . . . . 4 Simulazione degli eventi ed analisi multiscala 4.1 Simulazione degli sciami . . . . . . . . . . . . 4.2 Analisi multiscala . . . . . . . . . . . . . . . . 4.2.1 Schematizzazione dell’apparato . . . . 4.2.2 Analisi del singolo evento . . . . . . . . 4.2.3 Andamenti di τ (q) e β(q) . . . . . . . 4.3 Studio della simmetria dell’immagine . . . . . A Algoritmi di addestramento A.1 BackPropagation . . . . . A.2 QuickProp . . . . . . . . . A.3 RProp . . . . . . . . . . . Bibliografia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . di una rete neurale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 . 101 . 102 . 103 105 Introduzione La fisica dei raggi cosmici si propone di studiare i fenomeni che avvengono nell’Universo attraverso l’esame delle proprietá delle particelle che arrivano sulla Terra. Un mezzo molto importante per studiare tali fenomeni é fornito dalla astronomia γ, ovvero dalla osservazione dei fotoni di energia superiore a ∼ 1 M eV . Infatti, i raggi γ, a differenza delle particelle cariche, non vengono deviati dai campi magnetici presenti nell’Universo e, in quanto tali, forniscono chiare indicazioni sulla posizione dei siti di produzione dei raggi cosmici e sui meccanismi di accelerazione. Le prime osservazioni sono state effettuate con telescopi montati su satellite; se, peró, si vogliono rivelare fotoni con energia superiore ai 100 GeV , i satelliti non sono adatti in quanto con l’aumentare dell’energia diminuisce il flusso di fotoni associato. Sembra, dunque, necessario utilizzare dispositivi sperimentali molto estesi collocati al suolo; inoltre, se si vuole evitare un eccessivo assorbimento della radiazione da parte dell’atmosfera ed abbassare la soglia energetica, tali apparati vanno collocati ad una quota superiore ai 4000 m. In questo tipo di ottica si pone l’esperimento ARGO-YBJ nell’ambito della cui collaborazione é stata svolta questa tesi. ARGO é frutto di un progetto italo-cinese ed é in fase di costruzione presso il laboratorio di raggi cosmici situato a Yanbajing (Lhasa, Tibet, Repubblica Popolare Cinese). Esso é un dispositivo a copertura totale d’area posto ad una quota di ∼ 4300 m e sará formato da 1848 RPC con una superficie totale di ∼ 6000 m2 . Questa configurazione permetterá di essere sensibili a fotoni primari di energia compresa tra ∼ 100 GeV e ∼ 50 T eV . Il principale problema di un esperimento ground-based quale ARGO deriva dal fatto che le particelle primarie, interagendo con l’atmosfera, producono sciami di particelle secondarie che si distribuiscono al suolo su aree dell’ordine di alcuni km2 . Per fare astronomia γ é necessario distinguere tra gli sciami aventi come particella primaria un fotone e gli eventi di fondo (sciami atmosferici iniziati da adroni). Poiché il flusso dei raggi γ é φγ ∼ 10−3 − 10−4 φC.R , il problema non risulta per nulla banale. A questo scopo viii Introduzione é importante che l’apparato sperimentale sia dotato di una sensibilitá molto grande, ossia che sia capace di distinguere tra segnale (raggi γ) e fondo (raggi cosmici) andando a cercare eccessi di eventi in una data porzione di cielo. Questa caratteristica dipende dalla risoluzione angolare dell’apparato che viene direttamente influenzata dalla risoluzione temporale dei rivelatori utilizzati (vedi capitolo 1). La reiezione del fondo puó essere ulteriormente aumentata cercando di separare gli eventi generati da γ e quelli da protone classificandoli in base alle differenze intrinseche nelle immagini degli sciami viste da ARGO. Negli esperimenti che misurano la luce Čerenkov prodotta dagli sciami atmosferici, tale classificazione viene tipicamente fatta, con ottimi risultati, studiando la forma dell’immagine dello sciame rivelato. In tal modo si ottiene, come si spiegherá in seguito, un aumento della sensibilitá e la conseguente riduzione del tempo di presa dati necessario a vedere una determinata sorgente. Poiché i rivelatori a copertura totale come ARGO sono di nuova generazione, non esiste una tecnica consolidata di classificazione degli sciami che permetta di discriminare il tipo di primario. L’obiettivo di questa tesi é quello di supplire a questa mancanza studiando le caratteristiche dell’immagine degli sciami attraverso delle simulazioni che riproducano la risposta di ARGO ai due differenti tipi di primario. A tale scopo si utilizzerá una tecnica mai usata per uno studio di questo tipo, cioé l’analisi multifrattale e di wavelet. Il vantaggio di tali tecniche é di non richiedere alcuna ricostruzione dell’evento; inoltre, questo tipo di analisi puó essere facilmente estendibile ad altri apparati a copertura totale d’area. In particolare, nel capitolo 1 si fará una rassegna sui principali fenomeni legati alla produzione di raggi γ con uno sguardo alle tecniche sperimentali fino ad oggi impiegate per questo tipo di studi. Nel capitolo 2 si descriverá l’esperimento ARGO-YBJ e si esploreranno le sue capacitá in relazione alla γ astronomia. Il capitolo 3 tratterá brevemente i modelli di sviluppo degli sciami nell’atmosfera introducendo la necessitá di utilizzo delle simulazioni Monte Carlo come metodo di indagine privilegiata; inoltre, vi verranno introdotte le variabili utilizzate per l’analisi multiscala. Il quarto capitolo sará interamente dedicato alla descrizione delle simulazioni effettuate ed al tentativo di caratterizzare il tipo di primario dei vari eventi attraverso lo studio degli andamenti dei momenti multifrattali, del momento di wavelet e di altri parametri. L’ultimo capitolo riguarderá la descrizione della rete neurale utilizzata per aumentare il potere di separazione tra sciami da fotone e da protone; vi verrano, inoltre, descritte le implicazioni sull’esperimento ARGOYBJ dovute ai risultati trovati. Infine, nell’appendice A sono brevemente descritti gli algoritmi di addestramento delle reti neurali artificiali da noi utilizzati. Capitolo 1 Astronomia dei raggi γ di alta energia La radiazione cosmica incidente sull’atmosfera é principalmente composta da protoni (∼ 90 %), particelle α (∼ 9 %) e altri nuclei pesanti (∼ 1 %), inoltre è presente una piccola frazione di elettroni (e/p ' 1%) e fotoni (γ/p ' 0.1 %). L’abbondanza e la tipologia degli elementi presenti nei raggi cosmici varia, durante il cammino dalla sorgente alla Terra, a causa delle interazioni con il mezzo interstellare. Elementi quali idrogeno, elio, ferro e carbonio sono detti primari perchè prodotti in grande quantità direttamente nelle sorgenti, altri come ad esempio boro, potassio, titanio e vanadio sono detti secondari in quanto prodotti per spallazione da raggi cosmici primari. Anche se i meccanismi e i siti di produzione dei raggi cosmici sono ancora oggi questioni non completamente chiuse, è chiaro che la parte piú consistente di essi proviene da regioni della nostra Galassia lontane dal Sistema Solare e solo una piccola frazione dal Sole, mentre la componente di alta energia potrebbe avere un’origine extragalattica. Lo spettro energetico differenziale osservato dei raggi cosmici può essere rappresentato in modo soddisfacente da una legge a potenza: N (E)dE = N0 · E −γ dE (1.1) dove E > 1 GeV per nucleone e 2.5 . γ . 3.0 e γ é detto indice spettrale. Al primo tratto dello spettro (vedi figura 1.1), fino a 1015 eV, corrisponde un γ ' 2.7, tra i 1015 eV e i 1016 eV si nota un cambiamento nella pendenza noto come il “ginocchio” con γ ∼ 3.0. Il ginocchio coincide con una forte riduzione del flusso che, a quelle energie, è dell’ordine di una particella per 2 Astronomia dei raggi γ di alta energia Figura 1.1: Spettro energetico dei raggi cosmici per E > 1 GeV m2 all’ anno. Questo fatto comporta difficoltà sperimentali quali i lunghi tempi di presa dati e le grandi dimensioni dei rilevatori necessari ad ottenere una statistica significativa. Nell’ultima parte dello spettro a ∼ 1019 eV vi è la zona nota come “caviglia” caratterizzata da un flusso di 1 particella per km 2 all’ anno ed un valore di γ ∼ 2.5, anche se la scarsitá di dati non permette una chiara valutazione dell’ indice spettrale in questa regione. Il raggio di curvatura di una particella carica di carica Ze che si muove in pc 1 un campo magnetico uniforme B é dato da ρ = ( Ze ) · Bc . Data la presenza del campo magnetico galattico con B ∼ 3 µG si ha che la direzione di arrivo osservata per particelle cariche non puó essere un indicazione sincera della posizione di una sorgente. Al contrario, i raggi γ, essendo neutri, conservano l’informazione sulla loro provenienza, quindi, sebbene i fotoni rappresentino una percentuale minima della radiazione cosmica, il loro studio fornisce informazioni su: • Sorgenti dei raggi cosmici. • Meccanismi di accelerazione. • Effetti di propagazione nel mezzo interstellare ed intergalattico. 3 Dal punto di vista sperimentale, lo studio dei raggi γ richiede l’uso di diversi tipi di apparati di rivelazione per problemi legati alla diminuzione del flusso con il crescere dell’energia. Per questo convenzionalmente il range energetico viene suddiviso in intervalli (vedi tabella 1.1) associati alla particolare tecnica di rivelazione ivi utilizzata. Questa classificazione non ha nessuna attinenza con i meccanismi di produzione; infatti, la maggior parte delle sorgenti ha uno spettro di emissione molto esteso, per cui lo studio di un particolare oggetto richiede la combinazione di dati provenienti da apparati differenti. Al fine di avere una visione globale del problema che si vuole affrontare, nel resto di questo capitolo verranno trattati i principali fenomeni legati alla produzione dei raggi γ di alta energia e le tecniche utilizzate per la loro rivelazione. RANGE NOMENCLATURA ENERGETICO TECNICA DI PIATTAFORMA DI RIVELAZIONE OSSERVAZIONE 0.51-10 MeV Low(LE) Scintillatori Satellite 10-30MeV Medium(ME) Telescopi Compton Satellite 30MeV-10GeV High(HE) Calorimetri Satellite 100GeV-100TeV VeryHigh(VHE) Čerenkov, Air Superficie Shower Arrays 100TeV-100PeV UltraHigh(UHE) Air Shower Superficie Arrays 100PeV-100EeV ExtremelyHigh Air Shower (EHE) Arrays Superficie Tabella 1.1: Suddivisione dei raggi γ sulla base del tipo di apparato usato per rivelarli. 4 1.1 Astronomia dei raggi γ di alta energia Principali fenomeni di produzione dei raggi γ di alta energia 1.1.1 Pulsar Le Pulsars sono stelle di neutroni magnetizzate che ruotano con un periodo che va da pochi millisecondi a qualche secondo generando un campo magnetico molto intenso (∼ 1012 G). Sono gli oggetti stabili piú densi dell’Universo infatti la loro massa massima é ∼ 3 M con un raggio di ∼ 10 km[45]. L’esperimento EGRET[48] (posto sul satellite Compton gamma Ray Observatory lanciato nel 1991) ha rivelato che solo 6 delle 550 RadioPulsar note sono sorgenti di raggi γ (vedi Tab.1.2). Le misure compiute finora mostrano che l’emissione pulsata di gamma sia limitata a regioni al di sotto dei 102 GeV. Secondo gli attuali modelli teorici[19], il campo magnetico rotante genera un campo elettrico abbastanza forte da rimuovere gli elettroni dalla superficie della stella formando un plasma che circonda la stella. Al di sotto di un valore del raggio per cui la velocitá del plasma é inferiore a quella della luce vi é la regione nota come “light cylinder”; oltre tale regione inizia quella detta di “Pulsar wind”. Questa regione termina con uno shock al cui esterno vi é una regione nebulare(il disegno schematico di una Pulsar é riportato in figura 1.2). All’interno del light cylinder le linee di campo magnetico, a cui le particelle cariche sono legate, sono chiuse e quindi non vi émissione di particelle. Viceversa all’esterno del light cylinder, dove le linee di campo sono aperte, le particelle possono essere accelerate ed espulse D(kpc) Lγ (erg·s−1 ) Pulsar B(G) γ Crab 3.8·1012 2.0 3.9·1034 2.15 Vela 3.4·1012 0.5 1.7·1034 1.70 PSR B1704-44 3.1·1012 1.8 2.6·1034 1.72 PSR B1951+32 4.9·1011 2.5 1.4·1034 1.74 Geminga 1.6·1011 0.25 2.3·1033 1.50 PSR B1055-52 1.1·1012 1.5 9.3·1033 1.18 Tabella 1.2: Le 6 Pulsar rivelate da EGRET come sorgenti di raggi γ. L γ é la luminositá nell’emissione, B é il campo magnetico, D é la distanza delle Pulsar dalla Terra e γ l’indice spettrale 1.1.1 Pulsar 5 Figura 1.2: Rappresentazione schematica di una Pulsar. Il light cylinder é il cerchio fuori dalla magnetosfera. Nella zona denominata “Nebula” vi é un plasma di coppie e+ e− dalla stella. Tali regioni si formano ai poli magnetici ed in prossimitá del light cylinder e sono le responsabili dell’emissione pulsata di raggi γ. Per quanto riguarda l’emissione continua di raggi γ, i risultati di EGRET mostrano che solo due delle sei Pulsar in esame sono responsabili di γ nella regione del TeV: Crab e PSR B170-44 che sono un particolare tipo di Pulsar, detta “Plerion”1 . Della Crab si sa con certezza che é una sorgente di VHE γ fino a ∼15 TeV, ma l’intensitá assoluta e la pendenza dello spettro non sono ben definite; una misura di questi parametri é necessaria per la scelta definitiva di un modello che spieghi l’emissione continua. Secondo il modello SSC (Synchrotron Self-Compton) di deJager e Harding [10] gli elettroni e i positroni vengono accelerati ad alte energie ed entrano nella regione nebulare dove, spiraleggiando attorno alle linee di campo magnetico, emettono radiazione di sincrotrone. In seguito, questi elettroni accelerano altri fotoni presenti nella regione circostante attraverso la diffusione Compton inversa fino ad energie dell’ordine del T eV . 1 Una Plerion é un residuo di supernova con una stella di neutroni al suo interno. 6 Astronomia dei raggi γ di alta energia 1.1.2 Resti di Supernovae (SNR) Una supernova é un oggetto che si forma in seguito all’esplosione di una stella. La luminositá dell’oggetto decresce esponenzialmente nel tempo ed esso puó collassare in una stella di neutroni. Il 90% dell’energia rilasciata (∼ 1051 erg) viene dissipata in energia cinetica del guscio della stella che si espande ad una velocitá V ∼ 104 km s−1 nel mezzo interstellare; gli effetti di questa espansione restano visibili per circa 103 − 104 anni dopo l’esplosione e prendono il nome di “resti di supernovae” (SNR Supernova Renmants). Sebbene non vi siano prove certe, gli SNR sembrano essere una delle poche sorgenti galattiche in grado di accelerare i raggi cosmici fino a energie di ∼ 100 T eV . Il modello proposto é quello di accelerazione statistica di Fermi[14]. Un oggetto di questo tipo é composto da tre zone: • una regione interna costituita da gas caldo di particelle accelerate, • una regione a ridosso dell’onda d’urto su cui la materia espulsa preme, • una regione antistante all’onda in cui le particelle accelerate comprimono il mezzo interstellare. In seguito alla propagazione dell’onda d’urto dovuta all’esplosione della stella, le particelle del mezzo interstellare, attraversando il fronte dello Figura 1.3: Spettro di emissione dei fotoni VHE della nebulosa Crab misurato da vari apparati sperimentali. La linea continua rappresente il flusso teorizzato dal modello di deJager e Harding 1.1.3 Nubi Molecolari 7 shock, possono essere accelerate secondo il meccanismo di Fermi al primo ordine[29]. La particella accelerata puó essere nuovamente raggiunta dallo shock attraversarlo e ripetere il processo[6, 42]. Ció che rende straordinario questo modello é la possibilitá di predire l’andamento a potenza dello spettro dei raggi cosmici solo attraverso considerazioni sulle densitá delle tre regioni del SNR e del mezzo interstellare. L’energia massima che le particelle possono raggiungere dipende dal tempo trascorso all’interno della regione di accelerazione e, quindi, dalla probabilitá di fuga della particella che é direttamente correlata con la densitá dell’oggetto. La riduzione della densitá del SNR dovuta alla sua espansione fa si che il meccanismo risulti efficiente per ∼ 1000 anni, fatto che si traduce in un energia massima delle particelle accelerate di ∼ 100 TeV[17]. I raggi γ vengono prodotti dai raggi cosmici attraverso due fenomeni: i) bremsstrahlung o diffusione Compton inversa degli elettroni sui fotoni del fondo della radiazione galattica e dei campi di radiazione della SNR stessa. ii) decadimento dei π 0 prodotti dalle interazioni dei nuclei con il gas della SNR. Due esempi di SNR nell’emisfero Nord sono: γCigni e IC433. Questi due oggetti hanno permesso di misurare l’indice spettrale dando un buon accordo con il modello teorico[18]. Recentemente, invece, CANGAROO ha rivelato un’emissione gamma ad energie del TeV in SN1006 fatto che rappresenta una chiara conferma della possibilitá di accelerare particelle ad E ∼TeV nelle SNR. 1.1.3 Nubi Molecolari Le nubi molecolari sono solitamente situate nelle vicinanze di regioni con una intensa attivitá stellare o formazione di stelle di massa elevata. L’emissione γ da nubi molecolari é dovuta essenzialmente alle interazioni tra elettroni e protoni cosmici con la materia (bremsstralung ed interazioni nucleone-nucleone)ed in misura minore alle interazioni degli elettroni con fotoni di bassa energia. Di particolare importanza é l’osservazione di raggi γ con energie superiori ai 100 GeV in quanto fornisce un’evidenza della presenza di protoni di alta energia all’interno delle nubi e, quindi, di sorgenti associate alla regione centrale delle stesse. La rivelazione di emissione gamma proveniente da nubi molecolari puó essere usata per lo studio della densitá dei raggi cosmici e delle proprietá del mezzo interstellare. Il flusso aspettato dei fotoni da una regione localizzata del cielo é: φγ ∼ A · N (HI ) + 2 · A · N (H2 ) (1.2) 8 Astronomia dei raggi γ di alta energia Regioni M(105 M ) D(kpc) Regioni M(105 M ) D(kpc) Taurus 0.3 0.14 ρ Ophiucus 0.3 0.16 Lupus 0.3 0.17 Aquila Rift 1.5 0.2 Lindblad Ring 1.6 0.3 Cloud B 0.4 0.3 Vul Rif 0.8 0.4 Cepheus 1.9 0.45 Cloud A 0.4 0.5 Cloud C 0.3 0.5 Orion A 1.6 0.5 Orion B 1.7 0.5 Cygnus Rif 8.6 0.7 Cygnus OB7 7.5 0.8 Tabella 1.3: Alcune nubi molecolari situate entro 1 kpc dalla Terra. M é la massa delle nubi molecolari espressa in unita di 10 5 masse solari M e D la distanza in kpc. dove A é l’emissivitá dei raggi gamma attraverso l’idrogeno atomico, N(HI ) e N(H2 ) sono le densitá dell’idrogeno atomico e molecolare. Quindi, nota la densitá della materia interstellare entro la nube da misure nell’infrarosso e nel radio, si ricavano anche le densitá di HI e H2 da cui si ottiene (vedi equazione 1.2) la densitá dei raggi cosmici nella nube. 1.1.4 Nuclei Galattici Attivi (AGN) Gli AGN non sono altro che regioni centrali di alcune galassie (∼ 1%) in cui hanno luogo fenomeni di straordinaria violenza a cui é associata l’emissione di raggi cosmici e radiazione elettromagnetica. Dagli AGN rivelati sperimentalmente si é trovato che: i) Sono tutti oggetti appartenenti alla classe blazar2 contenente oggetti quali BL Lacs e quasar altamente polarizzate. ii) Lo spettro dei fotoni fino a 10 TeV é ben rappresentato da una legge a potenza dN = A · E −γ dE (1.3) con un indice spettrale γ ' 2.5[34]. iii) Molti AGN mostrano variabilitá nella banda γ su intervalli temporali di giorni o mesi indicando che le sorgenti sono poco estese. 2 Le blazar sono sorgenti radio extragalattiche la cui direzione di emissione é rivolta verso la Terra 1.1.4 Nuclei Galattici Attivi (AGN) 9 Figura 1.4: Riproduzione schematica di un AGN secondo il modello unificato di Begelman Un problema che si incontra spesso nello studio di questi oggetti é il proliferare di diversi tipi di AGN3 , cosı́, nel 1984, é stata proposta teoria unificata[5]. In queso modello gli AGN sono costituiti principalmente da quattro regioni: a) la regione centrale contenente un “buco nero supermassivo” con massa M ∼ (107 − 1010 ) M e raggio di Schwarzschild rS ∼ 0.001pc. b) Un sottile “disco di accrescimento” circondato da uno spesso anello di materia che giace sul piano equatoriale. c) Due “jets di particelle relativistiche” posti in posizione perpendicolare al disco di accrescimento. d) Vi sono, poi, nuvole di materia[5, 39] che circondano la regione centrale, responsabili della presenza di linee di emissione nello spettro osservato. In questo modello il motore centrale é alimentato dal disco di accrescimento attraverso la variazione dell’energia potenziale gravitazionale della materia che precipita nel buco nero. Il 10% circa della massa a riposo assorbita dal buco nero viene riemessa sotto forma di radiazione[16, 45]. Gli AGN emettono radiazione su tutto lo spettro elettromagnetico dalle onde 3 quasars, Seyfert galaxies, (tipo I e II), radio-quiet e radio-loud galaxies, Blazars, BL Lacs, etc. 10 Astronomia dei raggi γ di alta energia radio ai raggi γ nel range del TeV. Dal disco di accrescimento viene emessa radiazione infrarossa e raggi X, mentre dai jets provengono raggi γ e onde radio. Una menzione particolare spetta agli AGN di tipo BL Lacs4 : essi si distinguono grazie all’assenza di linee di emissione. A tale fatto, peró, non si é ancora data una spiegazione. In generale, si é d’accordo nell’affermare, invece, che i fotoni nel range del T eV , provenienti dagli AGN, siano prodotti nei jets, mentre non si é ancora certi sui meccanismi responsabili delle emissioni. I due tipi di modelli che cercano di dare una spiegazione sono: • Modelli basati sulla diffusione Compton inversa[28] detti “leptonici”. • Modelli PIC (“proton-initiated cascade”)[41, 32] detti “adronici”. Nel modello base di tipo leptonico, gli elettroni sono accelerati nei jets e, attraverso la diffusione Compton inversa, portano i fotoni ad alte energie. Si possono comunque avere diverse varianti del modello a seconda del punto del jet in cui é posta la sorgente dei fotoni e quello in cui avviene l’accelerazione. Nel modello “Synchroton Self-Compton”[33] gli elettroni emettono radiazione di sincrotrone e sono essi stessi la sorgente dei fotoni; nel modello “external Compton” i fotoni non vengono prodotti per radiazione di sincrotone e la sorgente é posta fuori dal jet[11][46]. Infine, nei modelli “non omogenei” l’emissione a diverse energie é localizzata in diverse regioni del jet. In tutti questi modelli le perdite di energia limitano l’energia massima dei raggi γ a ∼10 TeV[41, 30] Nei modelli adronici, i protoni vengono bruscamente accelerati fino ad energie ∼1010 GeV e, quindi, interagiscono con i fotoni del fondo circostante producendo pioni neutri o carichi (vedi eq.1.4), dando inizio ad una cascata elettromagnetica. p + γ → ∆+ → p + π 0 o n + π + π 0 → γγ π + → µ+ νµ (1.4) É chiaro dunque che, se il modello di produzione fosse prevalentemente di tipo adronico, quello che dovrebbe potersi osservare sarebbe un flusso di neutrini[21] di alta energia associato al flusso di raggi γ. Come nei modelli leptonici, i fotoni possono provenire da una fonte esterna (E-PIC) o dalla radiazione di sincrotone degli elettroni generati dalla cascata (S-PIC). Poiché gli elettroni sono piú leggeri dei protoni, vengono accelerati e raffredati 4 oggetti appartenenti a questa classe di AGN sono ad esempio Mrk421 e Mrk501 identificate dall’ esperimento WHIPPLE 1.1.5 Gamma Ray Burst (GRB) 11 in modo repentino, quindi un’attivitá caratterizzata da “flares” rapidi (tempi inferiori ai 10-15 minuti) favorisce il modello a elettroni[23], ma il rapido raffreddamento rende difficile accelerare gli elettroni ad energie molto alte. L’energia massima raggiungibile dipende dal campo magnetico anche se in questo schema i raggi γ di energie superiori ai 10-20 TeV sembrano favorire il modello a protoni. Maggiori informazioni e verifiche potrebbero venire da osservazioni continue su lunghi periodi di tempo. Ció che si sa, infatti, viene prevalentemente dal telescopio WHIPPLE il cui tempo di presa dati copre intervalli temporali di circa tre ore ciascuno. 1.1.5 Gamma Ray Burst (GRB) Ulteriori possibile fonte di fotoni di alta energia sono i cosiddetti bursts di raggi γ: essi sono emissioni di radiazione γ di breve durata (10−3 ÷ 103 )s e di energia compresa tra qualche KeV e poche decine di M eV e flusso associato di ∼ 10−6 ÷ 10−3 erg · cm2 . A circa 25 anni dalla scoperta, la loro origine é ancora misteriosa; inoltre, non essendo nota la loro distanza, si ha una incertezza nella determinazione della luminositá intrinseca di ∼ 10 ordini di grandezza. Le caratteristiche sperimentali note vengono dalle indagini dell’esperimento BATSE e sono: • i GRB con energia compresa tra 20 keV e 2 M eV sono stati rivelati al ritmo di circa uno al giorno; • per ognuno dei burst non é stata trovata una controparte nel campo ottico, infrarosso o radio; • la distribuzione dei GRB é isotropa; • i profili temporali non mostrano caratteristiche comuni nei diversi GRB; • lo spettro energetico é altamente variabile nel tempo e presenta dei picchi ad energie 100 KeV . Ad energie di poche centinaia di keV lo spettro dei fotoni puó essere approssimato con una legge a potenza troncata da un esponenziale E −α exp(−E/E0 ), mentre ad energie maggiori (fino ad 1 M eV ) lo spettro é descritto da una legge a potenza con un indice spettrale che varia tra 1.6 e 2.8 ed un flusso di 1 ÷ 10 fotoni(E > 1 M eV )/cm2 · s. Tra i tanti modelli che tentano di descrivere il comportamento fisico di questi oggetti, soltanto due sono in accordo con il vincolo che la luminositá sia copresa tra 1028 e 1051 erg e che il burst di fotoni si esaurisca in un tempo 12 Astronomia dei raggi γ di alta energia consistente con la durata osservata(10−3 ÷ 103 )s. Il primo pone le sorgenti di GRB nell’alone galattico presupponendo il verificarsi di esplosioni sulla superficie di stelle di neutroni. Tale ipotesi, peró, é stata scartata grazie ai cataloghi di eventi compilati da BATSE[12] che hanno permesso di stabilire l’isotropia delle emissioni dovute ai GRB. Il secondo, invece, ipotizza l’esistenza di sorgenti a distanze cosmologiche e, per spiegare l’enorme luminositá, considera eventi catrastofici come collisioni tra stelle di neutroni. Una distribuzione su scala cosmologica dei GRB spiegherebbe anche l’isotropia osservata. Tale meccanismo, dunque, sembra quello piú probabile. Poiché l’energia rilasciata in questo processo é ∼ 1054 erg, l’energia convertita in fotoni é circa 10−4 ÷ 10−3 volte di quella totale. Il numero di galassie a spirale all’interno del volume campionato da BATSE é dell’ordine di 109 , la frequenza rivelata di ∼ 103 GRB per anno implica un evento per galassia ogni 106 anni che risulta in accordo con la stima di collisioni in sistemi binari di pulsar. 1.2 Tecniche sperimentali della γ astronomia alle alte energie Le tecniche utilizzate nella γ astronomia alle alte energie sono dettate da tre importanti questioni. I) L’atmosfera terrestre é opaca ai fotoni di alta energia; al livello del mare, il suo spessore é di 1030 g/cm2 corrispondente a 28 lunghezze di radiazione5 . Ne consegue che la probabilitá per un fotone verticale di alta energia di raggiungere il suolo senza interagire é praticamente nulla. La situazione resta simile anche spostandoci a quote piú alte. Se vogliamo rivelare i primari, dobbiamo, dunque, andare direttamente al disopra dell’atmosfera utilizzando satelliti o palloni sonda. II) Il flusso di raggi γ di alta energia é molto basso e decresce rapidamente con l’energia; ad esempio, se consideriamo “Vela”, che é la sorgente di raggi γ piú intensa del cielo, essa ha un flusso al di sopra dei 100 MeV di 1.3 × 10−5 fotoni/cm2 /s ed un flusso differenziale dd N ' E −1.89 [26]. E Questo significa che, al disopra di certe energie, avremmo bisogno di 5 La lunghezza di radiazione X0 é definita come la distanza dopo la quale l’energia di un elettrone si riduce di un fattore 1 e per bremsstralung. 1.2.1 Rivelatori satellitari 13 mandare in orbita apparati molto estesi6 , fatto improponibile dal punto di vista tecnologico ed economico. Ció rende fondamentale l’utilizzo di rivelatori al suolo con una soglia energetica Eγ & 10 − 100 GeV . III) Il flusso dei raggi cosmici carichi é molto piú grande di quello dei raggi γ, inoltre essi vengono deviati dai campi magnetici presenti nel mezzo interstellare cosı́ devono essere considerati come un fondo isotropo. Il flusso differenziale di raggi cosmici da protoni misurato tra 100 GeV e ∼ 400 T eV é: dN = (9.2 ± 2.4) × 10−2 E −2.76 m−2 s−1 sr −1 T eV −1 dE (1.5) con E in T eV [7]. Se si considera che il flusso φγ ∼ (10−3 − 10−4 )φC.R , si capisce come la reiezione del fondo isotropo sia “fondamentale” per fare astronomia gamma. 1.2.1 Rivelatori satellitari I rivelatori satellitari utilizzano camere traccianti per determinare la direzione di arrivo dei fotoni dopo che essi sono stati convertiti in coppie e+ e− , mentre l’energia viene misurata da un calorimetro. Un contatore di particelle cariche viene solitamente posto in anti coincidenza con l’apparato per reiettare il fondo. La risoluzione angolare dell’apparato é molto importante ai fini dell’identificazione delle sorgenti di fotoni ed alla riduzione degli effetti dovuti al fondo. Essa deve essere almeno migliore dell’angolo tra il fotone entrante nel rivelatore e la coppia e+ e− uscente. Questo angolo é il risultato di due contributi, il primo viene dalla differenza angolare intrinseca nella produzione della coppia e il secondo é l’angolo di scattering multiplo nel materiale convertitore. Tipicamente nella produzione di coppie si ha che: me c 2 E pp θrms ≈ · ln (1.6) E me c 2 dove E é l’energia tra il fotone uscente e l’elettrone (o positrone) della coppia prodotta. Mentre nello scattering multiplo: 1/2 20 L ms (1.7) θrms ≈ · pβ LR 6 Ad esempio un rivelatore di ∼ 1000cm2 posto su satellite rivelerebbe , da Vela, circa un fotone al minuto sopra i 100 MeV ed un fotone ogni due ore soopra i 10 GeV. 14 Astronomia dei raggi γ di alta energia dove p é il momento dell’elettrone (o positrone) in M eV /c2 , β é la velocitá della particella in unitá c, L é il cammino della particella nel materiale convertitore e LR é la lunghezza di radiazione del materiale convertitore. ms pp Solitamente θrms > θrms : ció significa che la risoluzione puó essere ridotta utilizzando uno strato convertitore piú sottile, o meglio, usando tanti strati sottili per tenere alta l’efficienza preservando una buona risoluzione angolare. Un fotone produce una cascata elettromagnetica che si sviluppa nel calorimetro permettendo una misura della lunghezza totale della traccia della cascata che é proporzionale all’energia del primario. La risoluzione energetica aumenta con l’energia stessa fino a che la percentuale di particelle della cascata emesse fuori dal calorimetro non diventa grande. Un ulteriore importante parametro del detector é l’area efficace, definita come l’area fisica del rivelatore convoluta con l’efficienza di rivelazione dei raggi γ. Se un rivelatore é esposto ad un flusso di fotoni φ(E)f otoni/m2 /s da una sorgente puntiforme per un tempo T rivelando N eventi, l’area efficace é definita come: Aef f (E) = N φ(E)T (1.8) Il piú sensibile telescopio per la γ astronomia HE é stato EGRET (per le prestazioni vedi tabella 1.4) montato sul CGRO (Compton Gamma-Ray Observatory)[48]. EGRET era costituito da una “spark chamber” con strati di tantalio per convertire i fotoni seguita da un’altra camera con piani maggiormente spaziati per misurare la direzione della coppia e+ e− . L’energia del fotone veniva misurata in un calorimetro a base di N aI(T l) spesso 8 lunghezze di radiazione. Un contatore a scintillazione veniva utilizzato come “time of flight system” per assicurare che le particelle stessero attraversando il calorimetro verso il basso ed un contatore posto in anticoincidenza aveva il compito di eliminare gli eventi da particella carica. Poiché il gas utilizzato RISOLUZIONE RISOLUZIONE ENERGETICA ANGOLARE (FWHM) (FWHM) 100 M eV 26% 5.5◦ 930 cm2 500 M eV 20% 2.0◦ 1570 cm2 1 GeV 19% 1.2◦ 1300 cm2 10 GeV 26% 0.4◦ 690 cm2 ENERGIA DEI AREA FOTONI EFFICACE Tabella 1.4: Prestazioni del telescopio satellitare EGRET 1.2.1 Rivelatori satellitari 15 nelle camere a scintilla va consumandosi, EGRET aveva un tempo di misura limitato. Per ovviare a ció sono in fase di sviluppo nuovi rivelatori su satellite che avranno la possibilitá di fare osservazioni a lungo termine con una risoluzione angolare elevata e un’ area efficace piú ampia dei precedenti. Un esempio é GLAST (Gamma-ray Large-Area Space Telescope) che si spera possa essere messo in orbita entro il 2005. Esso é composto da uno schermo per le particelle cariche, un tracciatore/convertitore di gamma fatto da sottili fogli di materiale ad alto Z spaziati da rivelatori a strip di silicio, e da un calorimetro a base di CsI (vedi figura 1.5). Il suo campo di vista sará di ∼ 2πsr , permettendogli quindi di monitorare una larga porzione di cielo alla volta, e la sua sensibilitá alle sorgenti 100 volte migliore di EGRET. I Figura 1.5: Disegno schematico di GLAST (Gamma-ray Large-Area Space Telescope). miglioramenti con GLAST saranno: • Un rivelatore a guscio per ridurre la diminuzione dell’area efficace alle alte energie dovuta alla fuoriuscita delle particelle dal calorimetro. • L’utilizzo di rivelatori strip di silicio, aumentará di un fattore 10 la risoluzione sulla posizione rispetto alle camere a scintilla, inoltre, non darà tempi morti e non richiederá l’impiego di gas. • L’eliminazione del “time of flight system” in quanto l’utilizzo delle strip di silicio insieme a sofisticati algoritmi di “pattern-recognition” determinará la direzione del momento della coppia e+ e− . Ció 16 Astronomia dei raggi γ di alta energia comporterá un aumento del campo di vista ed un miglioramento nella risposta dello strumento alle basse energie7 . • Il calorimetro rivelatori a base di CsI(T l) spessi 10 lunghezze di radiazione con in uscita rivelatori a stato solido. Questa struttura garantirá una migliore risoluzione energetica e di posizione e migliorerá la discriminazione del fondo. 1.2.2 Rivelatori ground-based L’abbassamento della soglia energetica dei fotoni rivelati fino a valori di Eγ . 10 GeV , in modo da sovrapporsi alle zone in cui operano i rivelatori satellitari, necessita dell’utilizzo di rivelatori di grandi dimensioni. I raggi γ attraversando l’atmosfera interagiscono con le molecole d’aria dando origine a cascate “elettromagnetiche”, le caratteristiche del primario vengono rivelate a partire dalle proprietá di questi sciami. I rivelatori utilizzati sono di due tipi: 1) Rivelatori Čerenkov. 2) Rivelatori di particelle secondarie (“EAS arrays”). Questi apparati misurano gli eccessi nel numero di eventi provenienti da una data direzione. In questo genere di misure un eccesso di eventi viene associato ad una sorgente di raggi γ se é maggiore delle fluttuazioni statistiche del fondo isotropo dei raggi cosmici. Cosı́ definiamo come sensibilitá di un apparato ground-based alle sorgenti γ: Nγ S=√ NB (1.9) dove Nγ ed NB sono rispettivamente il numero di sciami da fotone e il numero degli eventi di fondo rivelati dall’apparato in una data direzione. Rivelatori Čerenkov L’emissione di luce Čerenkov avviene quando una particella carica si muove in un mezzo con un β ≥ n1 (dove n = n(λ) é l’indice di rifrazione del mezzo attraversato) ad un angolo θČ = arccos n1 . La luce viene emessa durante tutto lo sviluppo dello sciame da parte di quasi tutte le particelle cariche secondo: 1 dN ∝ (1.10) dλ λ 7 Le particelle di bassa energia non attraversano tutto il rivelatore e non fanno scattare il sistema di “time of flight” che funziona da trigger. 1.2.2 Rivelatori ground-based 17 con λ lunghezza d’onda della luce emessa. I telescopi Čerenkov, nelle versioni piú semplificate comprendono un collettore di luce (solitamente uno specchio parabolico) con un rivelatore di luce posto sul piano focale. La luce Čerenkov prodotta dalle particelle cariche nello sciame incide sulla Terra concentrata in un disco il cui raggio é legato all’angolo di emissione della luce, e la cui intensitá é proporzionale in prima approssimazione all’energia del primario. Le tecniche utilizzate per la rivelazione di luce Čerenkov sono principalmente di due tipi: I) IACT(Imaging Atmospheric Čerenkov Telescope). Questa tecnica é quella piú largamente utilizzata oggi e consiste nell’ottenere un immagine bidimensionale della luce Čerenkov utilizzando una camera a pixel posta sul piano focale del riflettore. La camera registra una immagine dello sciame le cui caratteristiche sono direttamente legate allo sviluppo longitudinale e trasversale dello stesso. Se uno sciame si sviluppa lungo l’asse ottico del telescopio la sua immagine sará concentrata nel centro della camera, mentre se l’asse dello sciame é parallelo all’asse ottico, ma traslato, l’immagine sará ellittica con l’asse maggiore rivolto verso il centro della camera. Se l’asse dello sciame non é parallelo all’asse ottico del telescopio l’immagine é ellittica, ma il prolungamento dell’asse maggiore dell’ellisse non interseca il centro della camera. Le immagini inoltre differiscono a seconda delle caratteristiche del primario (vedi figura 1.6), infatti gli sciami da gamma producono una immagine ellittica e compatta, mentre quelli adronici una irregolare e orientata casualmente nel piano focale. Attraverso algoritmi di processamento delle immagini e ricostruzione della direzione, si ottiene una reiezione del fondo che si aggiunge a quella ottenuta grazie ad una buona risoluzione angolare. Un esempio di ció é l’esperimento Apparato N◦ riflettori N◦ PMT Campo (◦ ) σ θ (◦ ) Emin (GeV ) CANGAROO 2 256 3.0 0.18 1000 CAT 1 600 4.8 0.1 250 HEGRA-CT 6 271 4.6 0.1 500 TACTIC 4 349 2.8 - - WHIPPLE 1 151 3.5 0.1 500 Tabella 1.5: Caratteristiche principali di alcuni apparati Imaging Čerenkov (IACT). 18 Astronomia dei raggi γ di alta energia Apparato Area (m2 ) N◦ elementi Campo (◦ ) Emin (GeV) ASGAT 280 × 190 18 2.3 250 THEMISTOCLE 280 × 190 7 (× 7 PMT) 3.0 150 Tabella 1.6: Caratteristiche principali di due apparati fast timing. WHIPPLE in cui l’utilizzo di numerosi fotomoltiplicatori (vedi tabella 1.5) ha permesso di raggiungere una notevole risoluzione angolare (0.1◦ ÷ 0.2◦ ) e di sfruttare le piccole differenze di natura topologica presenti nelle immagini raggiungendo una percentuale di reiezione del fondo del 99.7%. II) ACT(Atmospheric Čerenkov Telescope). In questo tipo di apparato singoli fototubi sono distribuiti a decine di metri l’uno dall’altro fino a coprire superfici dell’ordine di 20000 m2 ÷ 40000 m2 . Generalmente questi apparati sono accoppiati ad array di rivelatori di particelle cariche che servono a ricostruire il “core”8 dello sciame e l’angolo di incidenza rispetto alla verticale. Questo tipo di apparati é stato il primo ad essere utilizzato, due esempi sono gli esperimenti ASGAT e THEMISTOCLE che peró ricostruiscono la direzione di arrivo dello sciame eseguendo un fit temporale del fronte della radiazione Čerenkov incidente. Con un array di fototubi siamo in grado di misurare distribuzione laterale della luce Čerenkov e l’andamento temporale dell’impulso informazioni dalle quali é possibile ricavare rispettivamente l’energia del primario e lo sviluppo longitudinale dello sciame. É importante notare che tali apparati non permettono l’utilizzo di nessun criterio di discriminazione tra gamma e adroni basato sullo studio dell’immagine. In conclusione, i rivelatori Čerenkov pur avendo un elevata risoluzione angolare, e nel caso degli IACT anche un ottimo fattore di reiezione del fondo, hanno dei limiti: • Il basso duty cycle9 : apparati di questo tipo possono eseguire misure solo in notti serene e prive di Luna, questo riduce il tempo di utilizzo effettivo a circa il 10% del tempo di vita del telescopio. Se poi si pensa che le sorgenti da osservare devono trovarsi ad un certo angolo sopra l’orizzonte, tale tempo si riduce ulteriormente. 8 Il core é definito come il punto di intersezione tra l’asse dello sciame ed il piano dell’apparato 9 É la percentuale di tempo effettivo in cui l’apparato puó effettuare misure. 1.2.2 Rivelatori ground-based 19 Figura 1.6: Sviluppo di uno sciame verticale da 1 TeV iniziato da protone (a destra) e da γ a sinistra. Le parti superiori visualizzano gli sviluppi degli sciami nell’atmosfera, mentre quelle inferiori le immagini viste dal telescopio Čerenkov. • La scarsa accettanza angolare: il field of view di questi rivelatori é ∼ 3◦ e quindi l’osservazione é limitata ad una sola sorgente alla volta. Questo fatto esclude la possibilitá di monitorare ampie porzioni di cielo e riduce quindi la capacitá di scoperta di nuove sorgenti e di misurare flussi diffusi o flussi provenienti da sorgenti estese. EAS arrays Questa tecnica consiste nel distribuire molti rivelatori su superfici di circa 104 ÷105 m2 , in grado di rivelare il passaggio del fronte dello sciame prodotto da un primario che interagisce nella parte superiore dell’atmosfera. Il costo di un rivelatore a copertura totale d’area di dimensioni cosı́ estese sarebbe proibitivo, quindi si utilizzano un certo numero di rivelatori di particelle cariche (tra 50 e 1000) distribuiti ad intervalli sulla superficie da coprire. 20 Astronomia dei raggi γ di alta energia Tipicamente ogni scintillatore ha un’area di ∼ 1 m2 e le prestazioni possono essere migliorate ponendo, su ogni scintillatore, uno strato di piombo spesso una lunghezza di radiazione per convertire i fotoni ed aumentare cosı́ il numero di particelle cariche rivelate[27, 2]. La direzione del primario viene ricostruita misurando i tempi relativi in cui ogni contatore dell’array viene attraversato dal fronte dello sciame. La risoluzione angolare dipende sia dalle proprietá dell’apparato che da quelle degli sciami in esame, una buona risoluzione angolare puó essere ottenuta facendo un fit del fronte dello sciame tenendo conto che tale fronte é curvato in base alla posizione del core[2]. Le risoluzioni angolari tipiche per un dato sciame sono approssimativamente date da: σt σθ ∝ √ (1.11) ρ dove σθ é la risoluzione angolare prevista, ρ é la densitá di rivelatori indipendenti nell’apparato e σt é l’ampiezza temporale del segnale misurata da ogni rivelatore. La risoluzione angolare di tali apparati puó essere misurata in diversi modi, il piú efficace é quello di misurare la forma dell’ombra della Luna o del Sole[9]. L’energia di soglia dell’apparato dipende dalla quota a cui il rivelatore é posto e dal numero minimo di contatori che devono essere accesi per ricostruire uno sciame. Questo puó essere fatto in principio anche con tre rivelatori, ma se vogliamo ottenere una misura molto accurata dobbiamo richiedere che ve ne siano accesi almeno 10, comunque, poiché il numero di particelle che arrivano al suolo fluttua molto anche se consideriamo sciami aventi stesso primario, l’energia di soglia non risulta mai ben definita. Come conseguenza un EAS array puó riuscire a rivelare eventi di bassa energia iniziati a bassa quota e non riuscire a rivelare sciami di alta energia iniziati ad alta quota. Inoltre, assegnata l’energia del primario, la dimensione dello sciame al suolo diminuisce all’aumentare dell’angolo di arrivo rispetto allo zenit e varia seconda del tipo di primario. La risposta in energia di un EAS array é ben descritta dall’area efficace, che in questo tipo di apparati dipende dalla probabilitá che uno sciame di energia E accenda l’apparato, essa é inoltre funzione dell’angolo di arrivo dello sciame e del tipo di primario. Una buona sensibilitá dell’apparato puó essere raggiunta rigettando il fondo utilizzando la risoluzione angolare dell’apparato, o con tecniche basate sulla misura del diverso contenuto di muoni nello sciame10 . In definitiva peró, i vantaggi derivanti dall’utilizzo di questi apparati sono: 10 In uno sciame fotonico il contenuto di muoni risulta di molto inferiore a quello di uno sciame adronico, infatti, per energie dello sciame di ∼ 100 T eV , Nµ (γ)/Nµ (h) ∼ 5% e decresce notevolmente ad energie minori. 1.2.2 Rivelatori ground-based 21 Soglia Quota N◦ stazioni µ Det. Area Area (TeV) (g·cm2 ) × area (m2 ) (104 m2 ) (104 m2 ) CASA-MIA 70 870 1089 × 1.5 2550 23 CYGNUS-I 50 800 108 × 0.8 110 2.2 EAS-TOP 100 800 29 × 10 300 10 HEGRA 40 800 257 × 1.0 270 4 SPASE 50 700 24 × 1.0 - 0.6 Gruppo Tabella 1.7: Caratteristiche dei principali apparati di sciame • Grande accettanza angolare, sono cioé in grado di osservare tutto il cielo sovrastante. • Hanno un tempo di presa dati che é in pratica uguale al tempo di vita dell’apparato. In tabella 1.7 vengono riportate le caratteristiche dei principali esperimenti che utilizzano apparati di sciame. Allo scopo di diminuire la soglia energetica in modo da fare misure nel range di lavoro dei satelliti, si stanno sviluppando apparati detti ”full-coverage” la cui peculiaritá stá nel fatto di avere l’area su cui si estendono coperta da rivelatori per piú del 50% del totale. I due soli progetti al mondo che sviluppano questa tecnica sono ARGO-YBJ (di cui si parlerá ampiamente in seguito) e MILAGRO. MILAGRO é posto a 2500m sul livello del mare e si occuperá di studiare sciami indotti da primari nel range energetico 100 GeV ÷ 100 T eV mediante l’utilizzo di rivelatori di luce Čerenkov, prodotta in acqua dallo sciame. L’apparato é costituito da 790 fotomoltiplicatori posti in una piscina coperta di 5000m2 e sono disposti su tre strati diversi. • Il primo strato é composto da 450 fototubi rivolti verso l’alto e spaziati tra loro di 3 m. Osservano i primi 2m d’acqua e misurano il tempo di arrivo del fronte dello sciame con una risoluzione angolare di ∼ 1.5◦ . • Il secondo strato consta di 170 fototubi, rivolti verso l’alto e spaziati come i precedenti ad una profonditá di 6.5m usato per fare misure di tipo calorimetrico. • Al terzo ed ultimo strato appartengono i restanti 170 fototubi rivolti verso il basso a 7m di profonditá, questo strato é otticamente isolato dai precedenti e dovrebbe studiare la componente muonica degli sciami permettendo una certa discriminazione tra gamma e adroni. 22 Astronomia dei raggi γ di alta energia In definitiva, la scelta verso cui si propende é quella di un dispositivo a copertura totale d’area posto ad alta quota. In questo tipo di ottica la discriminazione tra gamma e adroni, dovuta al puntamento, non é sufficiente. Bisogna ricorrere dunque a metodi alternativi come lo studio delle caratteristiche intrinseche degli sciami al fine di caratterizzare i diversi tipi di primario ed estrarre il segnale (raggi gamma) dal fondo. Capitolo 2 L’esperimento ARGO-YBJ L o studio dei raggi γ VHE (ossia tra 100 GeV e 100 T eV ) necessita di un’osservazione continua del cielo, in modo da poter studiare sorgenti la cui posizione non é nota. Si se considera come esempio la nebulosa Crab, il flusso misurato dei fotoni VHE da essa provenienti é dato da φ ' 3.2 × 10−11 E −2.5 cm−2 s−1 T eV −1 (vedi figura 1.3). É quindi importante utilizzare un apparato con un’area attiva molto grande (almeno ∼ 103 m2 ) per poter acquisire un campione di dati statisticamente significativo in un tempo di misura ragionevolmente basso. I raggi γ che entrano nell’atmosfera interagiscono con le molecole d’aria generando coppie e+ e− che, a loro volta, danno origine a fotoni attraverso processi di bremsstrahlung e diffusione Compton. I fotoni prodotti si convertono nuovamente in coppie elettrone-positrone ed il processo si ripete dando origine ad uno sciame elettromagnetico. Le dimensioni dello sciame aumentano fino a che l’energia media delle particelle prodotte non é pari all’energia critica (Ec ∼ 80 M eV ). A questo valore dell’energia il processo di perdita di energia per ionizzazione diventa dominante su quello di produzione delle particelle, per cui il processo di moltiplicazione si arresta e la grandezza dello sciame comincia a diminuire. Per individuare i parametri importanti nella costruzione di un apparato viene utilizzata una figura di merito, detta “rapporto segnale-rumore e puó essere scritta come : p Rγ Q Aef f T signal ∝ (2.1) noise σθ i cui vari parametri sono definiti in Tabella 2.1. 24 L’esperimento ARGO-YBJ Parametro Unitá Definizione Aef f m2 Area efficace dell’apparato T s Tempo di esposizione σθ ◦ Risoluzione angolare Rγ - efficienza relativa del trigger γ/adroni Q - fattore di discriminazione γ/adroni Tabella 2.1: Definizione dei parametri della figura di merito L’area efficace Aef f indica la superficie equivalente sulla quale uno sciame che vi cade viene sicuramente rivelato. Essa, in generale, risulta essere una funzione dell’energia e del tipo di primario considerato in quanto gli sciami da gamma e da protoni hanno una differente distribuzione radiale delle particelle. Essa viene stimata attraverso delle simulazioni considerando l’area di generazione Ag usando l’espressione: Aef f (E, θ) = n(E, θ) · Ag N (2.2) dove, nel caso di eventi con il core all’interno dell’area di generazione, N é il numero totale di eventi e n(E, θ) é il numero di eventi che soddisfa alla condizione di trigger. Un rivelatore a terra vede la cascata molto tardi, rispetto al tempo di massimo sviluppo, con una diminuzione del numero di particelle pari ad un ordine di grandezza. Questa situazione risulta migliore a quote > 4000 m. Infatti, con l’aumentare della quota si ha l’aumento della probabilitá di trigger dell’apparato e, quindi, un conseguente miglioramento della capacitá intrinseca di separare i gamma dagli adroni nonché una diminuzione della soglia energetica. Poiché la frequenza di arrivo dei raggi gamma é molto piccola rispetto a quella dei raggi cosmici prodotti da adroni, la reiezione del fondo adronico é importante per il successo dell’apparato. L’efficienza della tecnica utilizzata per discriminare il fondo adronico dipende dalla risoluzione angolare dell’apparato e da un fattore di qualitá Q aggiuntivo definito come : εγ Q= p (2.3) 1 − εp dove εγ e εp sono le efficienze di identificazione relative a sciami iniziati da gamma e da adroni (vedi capitolo 4). Questo parametro é molto importante ai fini dell’estrazione del segnale dal 2.1 Obiettivi dell’esperimento 25 fondo; negli esperimenti con i telescopi Čerenkov vengono utilizzate tecniche di analisi dell’immagine dello sciame basate sui parametri di Hillas[13], che permettono di trovare valori di Q ∼ 2. Gli sciami raggiungono il suolo come un sottile disco approssimativamente del diametro di 100 m, al primo ordine tale disco puó essere approssimato con un piano definito dal tempo di arrivo del fronte dello sciame, mentre la direzione della particella primaria viene considerata coincidente con la direzione ortogonale a tale piano. Si puó quindi capire come l’accuratezza nella rivelazione della direzione di arrivo sia strettamente legata alla precisione ed al numero di misure dei tempi di arrivo relativi delle particelle dello sciame (vedi formula 1.11). Un apparato ideale per studiare i raggi γ VHE deve avere i seguenti requisiti: • grande area efficace (Aeff ); • alta quota (> 4000 m); • alta densitá delle unitá di rivelazione; • ottima risoluzione temporale (∼ 1 ns); • ciclo di funzionamento ∼ 100%; • capacitá di ricostruzione dell’immagine dello sciame. É dunque importante che il rivelatore sia posto ad un’altezza elevata se vogliamo abbassare la soglia energetica; infatti, a 2500 m si possono rivelare sciami con una energia di soglia minima di ∼ 1 T eV , mentre a 4500 m la soglia scende a ∼ 100 GeV . In quest’ottica si pone l’esperimento ARGO-YBJ (Astrophisical Radiation Ground-based Observatory), posto presso il Yanbajing High Altitude Cosmic Ray Laboratory ad un’altitudine di 4300 m sul livello del mare in Tibet (Repubblica Popolare Cinese ). L’elevata quota ed un’area di rivelatori a copertura totale di 5300 m2 consentiranno la rivelazione di sciami iniziati da fotoni di energia compresa tra 10 GeV e 500 T eV . 2.1 Obiettivi dell’esperimento Gli obiettivi che l’esperimento ARGO YBJ si propone riguardano sia l’ambito dell’astronomia γ sia lo studio dei raggi cosmici in generale: • Studio di sorgenti puntiformi di raggi γ. Fornendo un monitoraggio continuo del cielo con una soglia energetica di ∼ 100GeV permette anche lo studio di sorgenti galattiche ed extragalattiche non note. 26 L’esperimento ARGO-YBJ • Osservazione di sorgenti estese o diffuse quali radiazione galattica diffusa, SNR e nubi molecolari a energie ≥ 100GeV . • Fisica dei GRB. Attraverso misure nel range energetico del GeV ÷ T eV si potrá stabilire con maggiore accuratezza la scala delle distanze dei GRB. • Fisica del Sole e dell’Eliosfera, osservazione dei flares di raggi γ e di neutroni di alte energie, il monitoraggio continuo dei campi magnetici interplanetari e di quelli associati alla attivitá solare e della loro influenza sulla direzione di arrivo dei raggi cosmici (con E > 10GeV ). • Studio dello spettro dei protoni primari nel range energetico 10 T eV ÷ 200 T eV . • Studio del rapporto p̄/p. Misure significative di p̄ nella regione del T eV non possono essere effettuate con palloni sonda o satelliti a causa dei bassi flussi e del fatto che i magneti montati su questi apparati non consentono una identificazione precisa della carica. Nel caso di ARGO il flusso dei p̄ e p viene misurato attraverso l’osservazione dell’ombra della Luna[9]. L’ottima risoluzione angolare dell’apparato (∼ 0.4◦ ) permetterá di misurare il rapporto p̄/p a energie da 300 GeV a ∼ 1 T eV riuscendo anche a discriminare tra modelli di produzione galattica dei p̄ e modelli in cui é prevista una origine extragalattica. • Studio delle proprietá degli sciami atmosferici. Poiché il rivelatore fornisce una immagine con una definizione spazio-temporale molto dettagliata del fronte dello sciame, é possibile analizzare in dettaglio le proprietá di sviluppo in prossimitá dell’asse degli sciami. 2.2 L’apparato 2.2 L’apparato 2.2.1 La struttura 27 Il detector dell’esperimento ARGO-YBJ[4], il cui disegno schematico viene mostrato in figura 2.1, é un dispositivo a copertura d’area totale di dimensioni ' 78 × 74 m2 costituito da un singolo strato di camere ad elettrodi piani resistivi RPC(Resistive Plate Chamber). La parte centrale del rivelatore é cicondata da un anello di RPC ( vedi figura 2.1) in modo da aumentare l’area attiva fino a 100 × 100 m2 permettendo la ricostruzione anche degli sciami con il core fuori dalla parte centrale dell’apparato. 111 m 74 m 99 m 78 m Figura 2.1: Vista dall’alto del rivelatore ARGO-YBJ. I rettangoli rappresentano i CLUSTER. Il rivelatore é costituito da 130 CLUSTER nella parte centrale e 24 nell’anello esterno per un totale di 1848 RPC Gli elementi base del rivelatore sono degli RPC di superficie 125 × 280 cm2 . Ogni RPC é collocato in un involucro piú grande di 282 × 128 × 5 cm3 che racchiude anche le strip di pick-up e l’elettronica di “front-end”. L’insieme di 12 camere forma una unitá logica detta CLUSTER (vedi figura 2.2) dalle dimensioni di 5.7 × 7.9 m2 . Gli RPC sono coperti da uno strato di piombo spesso 0.5 cm, la cui presenza permette la conversione di fotoni in coppie e+ e− e l’assorbimento degli elettroni di bassa energia che peggiorano la risoluzione temporale dell’apparato. Ponendo invece sul rivelatore uno strato di piombo 28 L’esperimento ARGO-YBJ Pad Front−End 7 2 125 cm 3 4 5 6 10 11 12 280 cm Strip LOCAL STATION 8 9 Figura 2.2: Disegno schematico di un CLUSTER, esso é formato da 12 RPC, ciascun RPC da 10 PAD ed ogni PAD é composta da 8 strip di lettura del segnale. di spessore di ∼ 0.5 cm il 90% delle particelle prodotte arriva entro 4 ns dall’arrivo della prima. 2.2.2 Le camere ad elettrodi piani resistivi (RPC) Caratteristiche generali La scelta di utilizzare gli RPC nell’esperimento ARGO-YBJ é stata dettata dalla ottima risoluzione temporale che essi garantiscono (' 1 ns) e dalla possibilitá di poterli assemblare in ampie strutture con costi inferiori e prestazioni superiori rispetto ai comuni scintillatori. Gli RPC sono rivelatori il cui elemento sensibile é uno strato di gas a pressione atmosferica1 posto all’interno di un campo elettrico uniforme (∼ 3.6 kV /mm alla quota di Yanbajing, mentre sarebbe ∼ 4.5 kV /mm al livello del mare) generato da due elettrodi piani paralleli. Gli elettrodi sono fatti da due lastre di Bakelite (una resina fenolica) spesse 4 mm la cui costante dielettrica é ε ' 6 · ε0 e con una resistivitá molto elevata (∼ 1011±1 Ω · cm). Sulla superficie interna della bakelite viene applicato uno strato di olio di lino atto a livellare eventuali imperfezioni dovute ai metodi di produzione delle lastre. Tali imperfezioni possono infatti fungere da punte ed essere causa di scariche spurie all’interno del rivelatore aumentando il rumore di fondo dell’apparato. 1 In realtá, la pressione del gas risulta leggermente superiore a quella atmosferica. 2.2.2 Le camere ad elettrodi piani resistivi (RPC) 29 Sulla superficie esterna viene apposto un sottile strato di grafite che connette l’apparato al generatore di alta tensione e tende a rendere uniforme la differenza di potenziale applicata ai capi delle lastre. Gli elettrodi sono fatti di bakelite in modo da ridurre al minimo il tempo morto del rivelatore; se, infatti, fossero di materiale conduttore, l’RPC si comporterebbe come un condensatore piano. L’intero rivelatore avrebbe quindi un tempo morto pari al tempo di scarica del condensatore τ = RC, con C pari alla capacitá del condensatore ed R pari alla resistenza interna del generatore di alta tensione. L’utilizzo di elettrodi resistivi permette di considerare il rivelatore come composto da tanti piccoli condensatori indipendenti connessi da resistenze elevate. Si trova dunque che il tempo morto della singola celletta del rivelatore é pari a ∼ 250 ns. Per limitare l’estensione di queste zone morte, cercando quindi di ottenere una localizzazione delle zone di ionizzazione , si utilizza una miscela di gas composta da Argon (Ar) 15%, Tetrafluoretano (C2 H2 F4 ) 75% e Iso-butano (C4 H10 ) 10%. L’argon é la parte attiva del rivelatore in quanto serve a favorire la ionizzazione del gas al passaggio della particella; l’isobutano é utile a favorire l’assorbimento dei fotoni ultravioletti; il fluoro, essendo molto elettronegativo, tende a sottrarre elettroni restringendo le regioni in cui avviene la scarica. Il risultato finale é quello di avere una scarica la cui durata temporale é ' 10 ns. Come si puó notare, vi é una notevole differenza tra il tempo morto “locale” (250 ns) e la durata della scarica (10 ns): ció fa in modo che durante la scarica gli elettrodi possano essere considerati a tutti gli effetti come perfettamente isolanti. Il tempo di salita del segnale é infatti di 1 ÷ 3 ns, mentre il tempo di discesa decresce al crescere della percentuale di tetrafluoretano presente nella miscela di gas nell’RPC. Il segnale decresce linearmente a causa della raccolta degli elettroni sull’anodo e dovrebbe avere una forma triangolare. In realtá, poiché nè il campo elettrico nè la mobilitá2 delle cariche restano costanti, si assume che la forma della corrente possa essere descritta da un esponenziale. Il tempo necessario alla formazione dello streamer3 ha una fluttuazione che incide sulla risoluzione temporale dell’RPC, risoluzione che é dell’ordine di 1 ns e migliora al crescere della tensione di lavoro. 2 Ció é dovuto alla presenza, nella miscela, di un gas, quale il tetrafluoretano, molto elettronegativo. 3 La condizione per la formazione dello streamer é stabilita dal criterio di Meek: il numero di elettroni generati nella valanga deve essere ∼ 5 · 108 . 30 L’esperimento ARGO-YBJ Fe 0.3 mm FOAM 50 mm Fe 0.3 mm Pb 0.5 cm Fe 0.3 mm Front−End Card Connector 8+8 pin Al 1 mm FOAM 20 mm Al 1 mm FOAM 3 mm STRIP 3mm RPC 6 mm Al 1 mm FOAM 30 mm Al 1 mm CONCRETE FLOOR Figura 2.3: Stratigrafia del rivelatore Gli RPC di ARGO Come giá detto, gli RPC di ARGO sono rivelatori di 280 × 125 cm2 , ciascun RPC é posto in un contenitore di 282 × 128 × 5 cm3 insieme con l’elettronica di front-end e le strip di pick-up. I due elettrodi sono fatti da lastre di bakelite spesse 2mm tra cui vi sono inseriti dei dischetti di materiale isolante (PVC) di circa 1 cm2 posti a 10 cm l’uno dall’altro per conferire soliditá alla struttura e uniformare la spaziatura tra gli elettrodi. A causa dell’aria rarefatta (il tappeto é posto a 4300 m sul livello del mare), la pressione di lavoro degli RPC é di 0.6 atm e si é scelto di utilizzare una miscela di gas composta da Argon al 15%, Tetrafluoretano al 75%, e Iso-butano al 10%. Al di sotto della camera ( vedi figure 2.3, 2.4 ) vi sono due grandi elettrodi per la lettura del segnale, detti “BIG PADs”, costituiti da un foglio di rame di 140 × 125cm2 ; sotto il piano di lettura della BIG PAD é incollato un foglio di materiale isolante (PET) spesso 200 µm , mentre un altro foglio di PET, dello stesso spessore, isola il piano della BIG PAD dal piano inferiore rivestito di grafite. Sopra alla camera vi sono le strisce di lettura (80 per ogni RPC). Gli elettrodi di lettura sono in rame e sono costituiti da strisce lunghe 62 cm e larghe 6.7 cm poste a distanza di 3 mm l’una dall’altra. La massa delle strisce é realizzata con un foglio di alluminio separato dalle strip attraverso uno strato di poliestere spesso 3 mm in modo da ottenere una linea di trasmissione 2.2.2 Le camere ad elettrodi piani resistivi (RPC) Foam 15 mm Strip RPC (Gas) Big Pad 31 Foam 15 mm 125 cm Elettronica 280 cm Figura 2.4: Sezione del rivelatore, vista laterale e superiore con un’impedenza caratteristica di 11 Ω e una velocitá di trasmissione di ∼ 2 · 108 m/s. Le strisce sono organizzate a gruppi di 8 in PAD di superficie 56 × 62 cm2 , e sono connesse ad una elettronica basata su un chip discriminatore a 8 canali. Ogni canale é costituito da un amplificatore di tensione connesso ad un comparatore a soglia variabile. Posizionata al centro di ogni CLUSTER vi é la “LOCAL Station” (vedi Fig.2.2) dedicata alla acquisizione delle informazioni provenienti da queste camere (in totale 120 × 8 strips) ed é costituita da quattro Schede di Processamento del Segnale (SPC) e da una Scheda di Controllo e Comunicazione (CCC). Ognuna delle quattro schede SPC é utilizzata per la raccolta e la gestione delle informazioni generate in tre camere, mentre la scheda CCC ricava la molteplicitá di un cluster e manda tutti i dati ( informazione sul tempo e sulla strip) alla “Central Station. La Central Station non é altro che un insieme di “crates” VME posti nel centro dell’apparato e connessi ad una sala di controllo. Essa realizza il trigger e memorizza i dati utilizzando degli appositi moduli VME; il trigger é basato sulla molteplicitá delle PAD nei CLUSTER. Le molteplicitá Mi di ogni 0 PAD vengono confrontate con tre valori di soglia M1,2,3 , poi, il numero di CLUSTER MT OT i che soddisfa a queste condizioni viene confrontato con un 00 secondo gruppo di valori di soglia M1,2,3 . Quando la condizione di trigger é realizzata viene inviato un segnale dalla Central Station alla Local Station per produrre uno stop ai TDC e trasferire i dati. Tutta questa operazione avviene in un intervallo di tempo di 2 µs. La presenza di questa larga finestra 32 L’esperimento ARGO-YBJ M i,1 M’1 M i,1 Mi M i,1 M’1 M TOT1 i=1,N M"1 6 bits M i,1 M’i,1 M i,1 i=1,N M TOT2 i=1,N L O G I C A M"2 D E L N = numero di CLUSTER M i,1 M TOT3 i=1,N M i,1 i=1,N M TOT4 M"3 M"4 T R I G G E R Figura 2.5: Logica del Trigger temporale genera un numero di eventi spuri con una frequenza (misurata a Yanbajing) di ∼ 400 Hz per PAD, i quali possono essere facilmente eliminati durante l’analisi “off-line” dei dati acquisiti. 2.3 Sensibilitá di ARGO alla γ astronomia La capacitá di ARGO nel rivelare sorgenti di raggi γ dipende dalla intensitá dello spettro e dalla estensione angolare della sorgente stessa. La sensibilitá S si ottiene confrontando il numero totale di fotoni Nγ attesi dalla sorgente entro un angolo solido ∆Ω centrato sulla sorgente stessa, con quelli dei raggi cosmici NB nella stesso intervallo angolare. Definendo la sensibilitá S come il rapporto tra il segnale in funzione del numero di PAD ∆Np e l’errore statistico che si commette sulla stima del fondo, si ha: Nγ (∆Np ) = S(∆Np ) = p NB (∆Np ) R Aγ (E)Jγ (E)dE · ξγ (∆Ω) · T (d) · f (δ) E1 ef f qR ·Q p A (E)J (E)dE · ∆Ω(∆N ) · T (d) · f (δ) B p E1 ef f (2.4) dove Jγ (E) e JB (E) sono gli spettri energetici dei fotoni e del fondo mentre Aγef f (E) e Apef f (E) sono le aree efficaci corrispondenti al numero di PAD fissato (calcolate secondo la eq.2.2). Iltermine ξγ (∆Ω) = 0.70 é la frazione di sciami prodotti da γ entro un angolo 2.3 Sensibilitá di ARGO alla γ astronomia 33 Figura 2.6: Andamento della Ψ(70%) in funzione delle PAD accese, con e senza strato di piombo solido ∆Ω = 2π(1 − cos θ); se la sorgente é puntiforme θ coincide con Ψ(70), cioé l’angolo attorno alla direzione della sorgente che contiene il 70% del segnale p (direttamente legata alla σθ ). Nel caso, invece, di sorgenti estese θ = (Ψ(70))2 + (∆θ)2 con ∆θ regione angolare del cielo interessata. T (d) é il tempo effettivo di presa dati in giorni, f (δ) indica per quanto tempo al giorno viene osservata la sorgente ad angoli inferiori a 40◦ rispetto allo zenit, mentre Q é il fattore di discriminazione tra sciami iniziati da γ e quelli aventi come primario un adrone. Nel calcolo della sensibilitá la scelta di ∆Np permette di selezionare la regione energetica piú appropriata per l’osservazione di una data sorgente; ad esempio, se vogliamo effettuare delle osservazioni nella regione ' 100 − 200 GeV , dobbiamo considerare un ∆Np = 20 ÷ 50. Nel caso di f (δ) esso é stato calcolato per ogni sorgente con declinazione 60 < δ < 0 e puó variare da 6 ÷ 7 ore per sorgenti verticali (|δ − λ| ≤ 10◦ con λ = 30◦ latitudine di Yanbajing) fino a 2 ÷ 3 ore per sorgenti a 30◦ . Questi criteri possono essere applicati alle sorgenti trattate nel primo capitolo. 34 2.3.1 L’esperimento ARGO-YBJ Osservazione della Crab Il flusso dell’emissione non pulsata di raggi γ dalla Crab puó essere osservato selezionando eventi di alta molteplicitá (> 30 PAD accese). Nella tabella Eth (TeV) Trigger σ Fmin (Crab units) 0.6-0.7 Nhit >30 4.3 1.2 0.8-0.9 Nhit >50 6.7 0.7 1.5 Nhit >100 8.6 0.6 2.0 Nhit >150 9.0 0.6 2.5 Nhit >200 9.6 0.5 3.5-4 Nhit >300 9.0 0.6 Tabella 2.2: Numero di sigma ottenibili in un anno di presa dati della Crab per diversi valori della molteplicitá di PAD. E th é l’energia di soglia corrispondente al numero di PAD minimo selezionato, F min é il flusso minimo osservabile in un anno a 5σ. 2.2 viene riportato il numero di sigma ottenibili in un anno di presa dati attraverso la selezione di eventi con un numero di PAD accese superiore ad un certo valore. Viene, inoltre, riportato il flusso minimo osservabile Fmin in un anno a 5σ. Se si considera un numero di PAD superiore a 30, si riescono ad ottenere 4.3σ in un anno di presa dati con il solo puntamento della sorgente. In sostanza, quindi, con un fattore di discriminazione adroni gamma, si potrebbero raggiungere risultati notevolmente migliori sia in termini di tempi di osservazione sia in termini di flusso minimo osservabile Fmin . 2.3.2 SNR I resti di Supernova non sono sorgenti puntiformi bensı́ hanno un diametro che oscilla tra ∼ 0.4◦ e 3.2◦ che é confrontabile con la risoluzione angolare di ARGO. Gli SNR che possono essere osservati alle latitudini di Yanbajing sono circa 30 e solo 6 di questi sono sorgenti di raggi γ rivelate da EGRET (vedi Tabella 2.3). Partendo dai flussi misurati da EGRET a 100 M eV di energia di soglia, é possibile calcolare il flusso dei fotoni atteso nella regione GeV ÷ T eV attraverso l’utilizzo del modello di Drury[1], Naito e Takahara[38]. É stata cosı́ stimata la sensibilitá di ARGO a fotoni di energia tra 100 GeV e 700 GeV p selezionando eventi con (20÷50) e (50÷150) PAD accese e ponendo θ = (ψ(70))2 + (∆θ)2 con ψ(70) scelto in base al numero di PAD. I risultati sono riportati in Figura 2.7 dove le curve rappresentano il flusso minimo a 2.3.2 SNR 35 100 M eV (Φγ (> 100 M eV )) necessario per rivelare sorgenti a 5σ in funzione di θ con un flusso di fotoni con spettro ∼ E −1.3 e ∼ E −1.4 , in due differenti configurazioni. Gli SNRs W44 e γ-Cygni dovrebbero essere visibili da ARGO Figura 2.7: Il flusso minimo Φγ (> 100 M eV ) necessario per rivelare sorgenti a 5σ in funzione di θ apertura angolare attorno alla direzione. Le curve trattaggiate rappresentano la sensibilitá di un apparato di 14400 m 2 in un anno di osservazione mentre quelle continue sono riferite ad un apparato di 3600 m 2 in due anni di presa dati. La sensibilitá di ARGO (∼ 5700 m 2 ) si ottiene scalando di un fattore 1.6 quella dell’apparato da 3600 m2 . I quadratini neri rappresentano i valori del flusso misurati da EGRET nel caso di SNR. Estensione Φγ (> 100 MeV) /10−7 cm2 s−1 SNR δ (◦ ) W63 +45 20 1.3 γCygni +40 14 1.0 13.4 IC443 +22 36 0.8 4.3 W44 +01 18 0.5 7.4 W51 +14 00 0.4 2.0 Monoceros +06 30 3.0 2.2 Angolare (gradi) 1.5 Tabella 2.3: SNRs rivelati da EGRET. δ (◦ ) é la declinazione delle sorgenti e 2 −1 −7 Φγ (> 100 M eV ) /10 cm s é il flusso integrale a 100 M eV di soglia 36 L’esperimento ARGO-YBJ anche nel caso in cui lo spettro dovesse essere piú ripido di ∼ E −1.4 fino a 700 GeV , mentre IC443 dovrebbe essere parzialmente osservabile a patto che il suo spettro energetico sia abbastanza piatto (∼ E −1.3 ). A parte le incertezze derivanti dalle estrapolazioni dal modello, sia per quello che riguarda l’indice spettrale che il taglio nel valore dell’energia queste curve danno una chiara previsione sulla possibilitá di rivelare fotoni da SNRs. Poiché piú del 70% del segnale é dovuto a fotoni con energie inferiori ai 500 GeV , ARGO potrebbe essere sensibile anche a uno spettro energetico con un taglio attorno a queste energie. 2.3.3 Nubi molecolari La maggior parte delle nubi molecolari citate in tabella 1.3 sono osservabili alle latitudini di Yanbajing. Tra queste ve ne sono alcune situate nel piano galattico come Vul Rift e Gygn Rift ed altre poste fuori da tale piano come Taurus e Per OB2. É stata rivelata da EGRET emissione γ da Ophiucus e Orion fino a 10 GeV , ma non ci sono dati ad energie piú alte neanche da altre sorgenti. Inoltre, la natura diffusa delle emissioni rende difficile l’osservazione di queste sorgenti utilizzando telescopi Čerenkov. ARGO rappresenta quindi un’occasione Figura 2.8: Φγ ( 100 M eV ) necessario a rivelare sorgenti a 5σ in due anni, in funzione dell’estensione angolare per un apparato di 3600 m 2 . Il flusso rivelato da ARGO si ottiene scalando di un fattore 1.6 quello mostrato. le curve si riferiscono ad un’emissione di fotoni con spettro E −2.1 , E −2.3 , E −2.5 fino a 700 GeV . 2.3.4 Sorgenti extragalattiche (AGN) 37 unica per studiare tali emissioni ad energie superiori molte centinaia di GeV dall’intervallo in cui ha operato EGRET. Lo spettro dei fotoni rivelato da EGRET segue una legge a potenza ∼ E −2.1 ; estrapolando a 100 GeV si ottiene che il flusso in questione risulta al di sopra della sensibilitá di ARGO. La sensibilitá di ARGO per le emissioni diffuse é ottenuta selezionando eventi che accendono 11 ÷ 20 PAD. Nella figura 2.8 é rappresentata la sensibilitá a 5σ in due anni di presa dati, in termini del flusso a 100 M eV Φγ ( 100 M eV ) e della dimensione angolare della sorgente per tre indici spettrali differenti(x = 2.1, 2.3, 2.5). 2.3.4 Sorgenti extragalattiche (AGN) La forma dello spettro degli AGN, ad energie del T eV , dipende sia dall’energia massima che i primari possono raggiungere sia dalle loro interazioni con i fotoni del fondo di radiazione cosmica; di conseguenza, la pendenza varia molto e non é semplice fare delle previsioni. Per ottenere una Figura 2.9: Il flusso minimo a 100 M eV di soglia, Φ γ (> 100 M eV ) necessario per rivelare sorgenti a 5σ in un anno in funzione dell’indice spettrale. La linea continua rappresenta il risultato per un apparato di 14400 m 2 , mentre quella tratteggiata é riferita ad un apparato di 3600 m2 ; il valore per ARGO si ottiene scalando di un fattore 1.6 il valore riferito all’apparato da 3600 m 2 . I punti rappresentano 19 sorgenti osservate da EGRET e visibili a Yanbajing con θ < 30 ◦ ; con i cerchi sono indicate le sorgenti con redshift z < 0.5, con i quadratini 0.5 < z < 1, con le croci z > 1. 38 L’esperimento ARGO-YBJ Figura 2.10: Spettro calcolato dei fotoni di Mrk421 e 3C454. stima della sensibilitá di ARGO nel rivelare fotoni provenienti da AGN, in un anno di presa dati e con un segnale di 5σ superiore al fondo, é indispensabile calcolare il flusso medio di una sorgente con spettro E −γ che si estende fino a 700 GeV , e selezionando poi eventi con 20 ÷ 150 PAD accese. I risultati sono mostrati in Figura 2.9, nella quale il flusso integrale ad energie maggiori di 100 M eV é espresso in funzione dell’indice spettrale. Vi sono, inoltre, rappresentate 19 sorgenti visibili a Yanbajing, con θ < 30◦ , che potrebbero essere rivelate da ARGO assumendo una estensione del loro spettro fino a 500 GeV senza effetti di assorbimento. Per ricavare informazioni sulla sensibilitá di ARGO nel rivelare sorgenti il cui spettro di emissione é determinato dall’assorbimento dovuto alla radiazione infrarossa di fondo, si prendono in esame gli spettri di Mrk 421 e3C454. Mrk 421 (z = 0.031) é stato rivelato sia da EGRET che da WHIPPLE; quindi, combinando i risultati delle loro misure si ottiene l’andamento dello spettro 1.02 · 10−4 · E −2.06 f otoni · cm−2 s−1 T eV −1 fino a ∼ 2 T eV . Lo spettro di 3C454 (z = 0.86) é invece dominato, al di sopra dei 100 GeV , da effetti di assorbimento. rk 421 Il rapporto dei due flussi integrali Φ3C454 (> E)/ΦM (> E) é circa 4.4 a γ γ 10 GeV , ma scende a solo 0.2 a 400 GeV (vedi figura 2.10). In tal modo, 3C454, pur essendo una sorgente AGN molto luminosa per EGRET, risulta molto debole ad energie ∼ 400 GeV (ad esempio per WHIPPLE). Una stima della sensibilitá di ARGO é ottenuta selezionando eventi nelle direzioni delle sorgenti richiedendo che siano accese 20 ÷ 50 PAD. La sorgente 3C454 é rivelata ad un livello di 5σ in circa 40 giorni di 2.3.5 GRB 39 osservazione, mentre la rivelazione di Mrk 421 richiede cica 3 mesi di presa dati. Nella figura 2.11 viene mostrata, infine, la capacitá di ARGO nel seguire variazioni nel flusso dei blazar, dove la frequenza dei fotoni é espressa in funzione del tempo di osservazione T . Per misurare una variazione del segnale con una sensibilitá di 3.5σ é necessario un aumento pari al flusso della Crab in 5 giorni corrispondente ad un aumento del flusso di Mrk 421 di ∼ 3 volte. Tali valori sono inferiori all’aumento misurato da WHIPPLE tra il 14 e il 15 Maggio 1994; quindi, ARGO dovrebbe essere in grado di osservare tali variazioni senza alcun problema. 2.3.5 GRB Lo studio dei GRB di energia E > 10 GeV viene realizzato con la tecnica di “singola particella” (SP) nel caso di GRB con E < 50 GeV , o con la tecnica di “bassa molteplicitá” (LM) nel caso di energie piú alte. • La tecnica di “singola particella” consiste nel registrare tutte le particelle secondarie con un energia superiore ad una certa Esoglia . Molti degli eventi sono dovuti a µ ed elettroni generati in sciami da primari di bassa energia. In questo schema un GRB é rivelabile se le particelle secondarie dovute alle interazioni di raggi γ con l’atmosfera producono, in un breve lasso di tempo, un segnale con un’ampiezza Figura 2.11: Frequenza minima di conteggio dei fotoni i funzione del tempo di osservazione T per riuscire a rivelare variazioni del flusso di blazar a 3.5σ con ARGO. 40 L’esperimento ARGO-YBJ superiore alle fluttuazioni statistiche del fondo. Il limite di questa tecnica sta nel fatto di non poter misurare né la direzione né l’energia dei primari. Dati un GRB con spettro energetico dNγ /dE (fotoni per unitá di area e di energia) e l’angolo θ, il numero di eventi rivelati si puó scrivere, tenendo conto della 2.2, come: Z dNγ · ne (E, θ) · dE (2.5) NSP = Ad · fg · cos θ dE dove fg é un fattore di guadagno dovuto alla conversione dei fotoni nello strato di piombo (fg ∼ 1.1). Il segnale risulta quindi osservabile se il numero di particelle √ rivelabili é maggiore delle fluttuazioni statistiche del fondo NB = Ad · B · ∆t, con B frequenza di conteggio del fondo e ∆t durata del GRB. Se vogliamo che il segnale sia 4 deviazioni standard maggiore delle fluttuazioni, si ottiene, per un GRB della durata ∆t = 1 s, un valore di NSP > 1.2 · 104 . • La tecnica di “bassa molteplicitá” consiste, invece, nel rivelare gli sciami richiedendo che ognuno colpisca almeno 6 PAD. Usando questo metodo, l’area effettiva Aef f per rivelare primari da γ o da protoni é di 2-3 ordini di grandezza inferiore a quella di “particella singola” a causa del numero maggiore di particelle richiesto per soddisfare le condizioni di “trigger”. Inoltre, la possibilitá di ricostruire il fronte dello sciame riduce il fondo. La risoluzione angolare per primari con E ∼ 10 GeV é r ∼ 5◦ [3]. Se utilizziamo lo spettro dei protoni primari ricavato da Honda[25] il numero di eventi di fondo con direzione di arrivo in un cono di apertura r ∼ 5◦ eθ = 20◦ é BLM ∼ 160 s−1 ed il numero di eventi da GRB rivelato da ARGO é: Z dNγ NLM = 0.7 · Aef f · · dE (2.6) dE Se richiediamo che il segnale sia superiore al fondo di 4 deviazioni standard, il numero NLM di eventi da GRB in un tempo ∆t = 1 s e con θ = 20◦ deve essere ∼ 50. Supportati dalle misure fatte da EGRET, assumiamo che lo spettro dei fotoni provenienti da un GRB al momento di interagire con l’atmosfera sia dN = k · E −α fotoni al m2 e si estenda senza cambiamenti fino ad una dE energia Emax superiore a 10 GeV con un indice spettrale (tra 30 M eV e 10 GeV ) α = 1.95 ± 0.25[12]. Per valutare la sensibilitá di ARGO si studia il flusso di energia minimo tra 1 GeV ed Emax necessario ad osservare un GRB, assumendo che lo spettro si estenda con una pendenza costante fino 2.3.5 GRB 41 Figura 2.12: Flusso di energia minimo tra 1 GeV e 1 T eV osservabile con ARGOYBJ in funzione dell’energia massima dello spettro E max usando la tecnica LM (linea continua) e la tecnica SP (linea tratteggiata). I punti rappresentano le misure fatte da EGRET estrapolate a 100 GeV . oltre Emax . In figura 2.12 é mostrato il flusso minimo Fmin in funzione di Emax nell’intervallo tra 10 GeV ed 1 T eV adoperando le due suddette tecniche. Le curve sono riferite ad un GRB della durata ∆t = 1 s con indice spettrale α = 2.0 e con il vincolo che il segnale sia almeno 4 deviazioni standard maggiore delle fluttuazioni del fondo. Come si puó osservare, la sensibilitá aumenta con Emax e la dipendenza é piú marcata per la tecnica LM che per quella SP. Ció sta ad indicare che la tecnica SP é piú valida se lo spettro energetico ha un taglio per valori di Emax relativamente bassi (Emax < 50 GeV ). Adottando entrambi i metodi, ARGO potrebbe rivelare GRBs con un flusso di energia in un intervallo tra 1 GeV e 1 T eV di 10−6 ÷ 10−5 erg · cm−2 con un indice spettrale α ∼ 2. Confrontando poi il valore con le misure di EGRET, estrapolate a 100 GeV (i punti neri in figura 2.12), si vede che la maggior parte di queste hanno un flusso di energia che le rende potenzialmente rivelabili da ARGO. 42 L’esperimento ARGO-YBJ Capitolo 3 Studio degli sciami atmosferici ed analisi multiscala T utti i raggi cosmici, interagendo con gli strati alti dell’atmosfera, producono sciami di particelle secondarie, delle quali alcune giungono al suolo. Il funzionamento degli apparati ground based consiste nell’osservare il fronte dello sciame e nel ricavare informazioni sui diversi parametri associati alle caretteristiche della particella primaria. Per fare ció, bisogna conoscere in dettaglio sia il meccanismo di sviluppo degli sciami atmosferici sia la risposta dell’apparato. La risposta dell’apparato puó essere conosciuta solo attraverso una simulazione delle condizioni sperimentali in cui lo specifico esperimento lavora. La tecnica utilizzata per lo studio degli sciami e dell’apparato é quella delle simulazioni Monte Carlo, dalle quali si cerca di estrarre un insieme di parametri sensibile al tipo di studio che si vuole fare. In questo capitolo si illustrerá l’impiego, del tutto originale, di tecniche di analisi dell’immagine e di variabili fino ad oggi esclusivamente impiegate in esperimenti con telescopi Ćerenkov. Tali possibilitá sono dovute essenzialmente all’alta granularitá e risoluzione temporale di ARGO che permettono di fare dell’imaging. 3.1 Sciami atmosferici L’atmosfera terrestre agisce, rispetto alle particelle primarie, sia come bersaglio che come calorimetro. Se vogliamo quindi caratterizzare il tipo 44 Studio degli sciami atmosferici ed analisi multiscala di primario é necessario conoscere i tipi di interazione che sia esso quanto le particelle secondarie possono avere con l’atmosfera in base alla loro energia e natura. Ad esempio, la composizione di uno sciame é fortemente caratterizzata dalla natura del primario, cosı́ tanto che si possono rivelare delle differenze topologiche nell’immagine ricostruita al suolo. Queste sostanziali differenze dipendono dal fatto che negli sciami indotti da γ e in quelli da adroni il tipo di interazioni coinvolte é differente. 3.1.1 Sciami elettromagnetici Sono definiti “sciami elettromagnetici” tutti gli sciami in cui i processi coinvolti sono di tipo puramente elettromagnetico. Essi hanno come particella primaria elettroni, positroni, fotoni o muoni di alta energia. I processi principali che contribuiscono allo sviluppo della cascata elettromagnetica sono: 1) produzione di coppie γ + nucleo −→ e+ + e− + nucleo0 (3.1) e− + nucleo −→ γ + e− + nucleo0 e+ + nucleo −→ γ + e+ + nucleo0 (3.2) 2) bremsstrahlung 3) perdita di energia per ionizzazione I primi due processi sono quelli che determinano la moltiplicazione delle particelle (vedi figura 3.1), mentre il terzo limita lo sviluppo dello sciame. Ad esempio, se consideriamo un fotone da 1 GeV , il processo dominante, nelle interazione con gli atomi d’aria, risulta quello della creazione di coppie e+ e− che si dividono l’energia iniziale del fotone. Queste particelle secondarie hanno, in media, energia sufficente per interagire con l’atmosfera per bremsstrahlung. Si ha, cosı́, la produzione di un elettrone (o positrone) di energia piú bassa e di un fotone che ha una energia dello stesso ordine di grandezza del leptone di partenza. Se il fotone ha energia abbastanza elevata come supposto, questi processi si ripetono a catena fino a quando le particelle prodotte non raggiungono l’energia critica Ec che per un elettrone é di 80 M eV al livello del mare a 20◦ C. L’energia critica EC é definita come l’energia al di sotto della quale la perdita di energia per ionizzazione risulta maggiore di quella per produzione di particelle (bremsstrahlung). 3.1.2 Sciami adronici 45 Figura 3.1: Diagrammi di Feynmann dei principali processi di produzione di particelle in sciami elettromagnetici, la presenza del nucleo assicura la conservazione del quadrimpulso. 3.1.2 Sciami adronici Gli sciami iniziati da adroni vengono tipicamente chiamati “sciami adronici”. Se si considera ad esempio un protone di energia E0 che incide su un nucleo di ossigeno o di azoto, esso uscirá dalla interazione con una energia (1 − K)(E0 + MN ), e la restante frazione K dell’energia sará convertita in particelle secondarie (per lo piú pioni, ma anche kaoni ed altre particelle). La frazione K, detta fattore di inelasticitá dell’urto, é definita come: K= E0 − E 0 E0 + M N (3.3) dove E0 é l’energia del nucleone incidente, E 0 la sua energia dopo l’urto e MN la massa del nucleone bersaglio. Poiché il tempo di decadimento dei pioni carichi é τπ± = 2.6 · 10−8 s, accade che solo pochi di essi decadono in volo prima di collidere con altri nuclei, mentre i pioni neutri (τπ0 = 8.4 · 10−17 s) decadono rapidamente secondo: π 0 −→ γγ (3.4) Il nucleone, i pioni carichi e le altre particelle, che possono avere delle interazioni forti con i nuclei atmosferici, producono adroni secondari: questa catena dá origine alla componente adronica dello sciame. I pioni carichi che non interagiscono con l’atmosfera, soprattutto quelli di bassa energia, decadono attraverso: π + −→ µ+ + νµ π − −→ µ− + ν̄µ (3.5) Inoltre, un altro contributo al numero di µ prodotti deriva da decadimenti analoghi (vedi processi 3.5) dei kaoni carichi, il 5% alle basse energie, l’8% 46 Studio degli sciami atmosferici ed analisi multiscala Figura 3.2: Schematizzazione dello sviluppo di uno sciame atmosferico iniziato da un protone. con Eµ = 100 GeV fino ad un massimo del 27% per energie piú alte. I muoni cosı́ prodotti risultano piú penetranti in quanto la probabilitá di perdere tutta la loro energia per ionizzazione o quella di decadere é molto piccola per muoni di energie superiori al GeV [24] e vanno a formare la componente hard dello sciame adronico. I fotoni prodotti dal decadimento dei π 0 e delle particelle η originano delle sottocascate elettromagnetiche danno origine alla cosiddetta componente soft dello sciame. 3.2 Modelli analitici La modellizzazione matematica dello sviluppo di uno sciame atmosferico risulta molto complicata in quanto esso é il frutto delle proprietá delle interazioni adroniche ed elettromagnetiche nonché delle proprietá di trasporto delle particelle secondarie nell’atmosfera. I valori delle sezioni d’urto adroniche ad alte energie non sono noti sperimentalmente e devono essere valutati attraverso modelli teorici o estrapolati dalle misure agli acceleratori. Si hanno, prció, delle grosse indeterminazioni nei modelli di 3.2 Modelli analitici 47 sviluppo degli sciami. Nei modelli va tenuto conto del fatto che i processi che generano le cascate sono di natura statistica, dunque, le sole informazioni che si possono ottenere riguardano l’andamento medio delle grandezze caratterizzanti lo sciame. Inoltre, i primari che generano le particelle osservate sulla Terra sono particelle relativistiche e, quindi, a causa del boost di Lorentz cui sono sottoposte, lo sviluppo dello sciame avviene in avanti rispetto alla direzione di incidenza del primario. Nel linguaggio della fisica degli sciami atmosferici, si é soliti esprimere le lunghezze di interazione o di decadimento in unitá di spessore di massa (lunghezza per densitá del mezzo). Poiché la distanza percorsa nell’atmosfera é un parametro molto importante nella modellizzazione, bisogna conoscere bene le sue caratteristiche. Solitamente si assume che essa sia composta da un unico tipo di atomi con numero atomico medio < A >∼ 14 e che la sua densitá sia una funzione esponenziale dell’altitudine h (vedi figura 3.3). Inoltre, lo spessore verticale dell’aria é legato al profilo di densitá dell’atmosfera dalla relazione: Xv = Z ∞ ρ(h0 )dh0 h dove Xv puó essere pensato come la proiezione dell’asse dello sciame lungo la verticale ed é espresso in g/cm2 , mentre ρ(h0 ) é la densitá dell’atmosfera. É conveniente misurare le distanze in unitá di libero cammino medio λj (E) Figura 3.3: Densitá dell’atmosfera in funzione della quota. 48 Studio degli sciami atmosferici ed analisi multiscala della particella di tipo j che si considera: tj (E) = 3.2.1 X λj (E) Modello di Heitler Il modello di Heitler dá una visione qualitativa dello sviluppo longitudinale degli sciami elettromagnetici. Si considera uno sciame iniziato da un γ di energia E0 e si fanno alcune ipotesi: a. Si assume che, ad alte energie, le sezioni d’urto dei processi che entrano in gioco siano indipendenti dal tipo di particella considerata. b. Si trascura la perdita di energia per ionizzazione ad energie superiori all’energia critica Ec e si suppone che, per E < Ec , l’energia sia persa solo attraverso processi anelastici. c. Si considera un valore dell’energia critica per i fotoni uguale a Ec . Per E > Ec si considera solo il processo di produzione di coppie mentre per E < Ec si suppone perdita di energia solo per diffusione Compton. d. La lunghezza di radiazione riferita agli e± si pone uguale al libero cammino medio dei fotoni. Tale valore viene indicato da Xrad ed é usato per esprimere la profonditá di penetrazione dello sciame in unitá t: t= X Xrad e. Ogni e± con un valore dell’energia maggiore di Ec cede metá della sua energia ad un fotone di bremsstrahlung dopo aver percorso una distanza Xrad . f. Ogni fotone con energia E > Ec produce una coppia e+ e− dopo aver viaggiato per una lunghezza di radiazione; a ciascuna delle due particelle create spetta esattamente metá dell’energia del γ che le genera. Come si puó osservare dalla figura 3.4, il numero di particelle presenti ad una profonditá t cresce esponenzialmente con la profonditá stessa. Infatti: N (t) = 2t = et ln 2 (3.6) 3.2.1 Modello di Heitler 49 Possiamo inoltre valutare l’energia media che compete ad una particella alla profonditá t, E0 (3.7) 2t Ovviamente il numero di particelle é massimo in corrispondenza di E(t) = Ec . Invertendo la relazione 3.7, si ottiene la profonditá relativa al massimo sviluppo dello sciame: E(t) = ln(E0 /Ec ) , (3.8) ln 2 in piú si ricava che tmax cresce logaritmicamente con l’energia del primario e che il numero massimo di particelle é proporzionale ad E0 : tmax = t(Ec ) = Nmax = 2tmax = etmax ln 2 =⇒ Nmax = E0 Ec (3.9) L’improvviso arrestarsi della moltiplicazione delle particelle é dovuto alle semplificazioni adoperate nel modello; esistono, comunque, varianti piú raffinate di questo, in cui vi é l’aggiunta di termini che tengono conto della perdita di energia per ionizzazione e della diffusione Compton anche ad energie superiori a Ec [8]. In linea di principio, si puó anche pensare di applicare modelli di questo tipo agli sciami adronici, supponendo un nucleo di numero di massa A analogo ad A nucleoni indipendenti. Poiché, nel caso adronico, la distribuzione dei punti di interazione dipende dalla sezione d’urto anelastica σN −aria , allora il risultato dipende necessariamente dal particolare modello di interazione adronica usato. Ció che si ricava adoperando diversi modelli[47] é: Nmax = (1.1 ÷ 1.6)E0 (GeV ) e tmax ∝ ln(E0 ) (3.10) Figura 3.4: Rappresentazione dello sviluppo di uno sciame iniziato da un fotone di energia E0 secondo il modello di Heitler. 50 Studio degli sciami atmosferici ed analisi multiscala 3.2.2 Equazioni di trasporto Se vogliamo descrivere gli sciami in un modo piú dettagliato, possiamo risolvere le equazioni differenziali che descrivono le interazioni e le proprietá di trasporto nell’atmosfera delle particelle che compongono lo sciame. In una dimensione, la forma matriciale del sistema di equazioni differenziali accoppiate é[17]: 1 dNi (Ei , X) 1 Ni (Ei , X) (3.11) =− + dX λi (Ei ) di (Ei ) X Z Fji (Ei , Ej ) Nj (Ej ) + dEj Ei λj (Ej ) j dove gli indici corrono su tutti i tipi di particelle presenti nello sciame, mentre le grandezze nell’espressione 3.11 sono: • Ni (Ei , X) é il numero di particelle di tipo i ed energia Ei presenti a profonditá X, • λi (Ei ) e di (Ei ) sono le lunghezze di interazione e di decadimento in atmosfera della particella i−esima, con la complicazione di avere una somma pesata delle lunghezze associate a diversi processi nel caso che i canali possibili siano piú di uno. • Fji (Ei , Ej ) é definita come: Fji (Ei , Ej ) = Ei dni (Ei , Ej ) dEi (3.12) dove dni é il numero di particelle di tipo i prodotte in media nell’intervallo infinitesimo di energia dEi da una particella di tipo j avente energia Ej e viene da una somma pesata di tutti i processi che danno come risultto particelle di tipo i a partire da particelle di tipo j. Nelle equazioni 3.11, il primo termine tiene conto delle interazioni e dei decadimenti delle particelle di tipo i, mentre il secondo dei processi che hanno fra i prodotti queste particelle. Le condizioni al contorno dipendono ovviamente dalla natura del primario. La versione tridimensionale delle equazioni 3.11 dá una descrizione completa dello sviluppo dello sciame atmosferico. La soluzione analitica é estremamente complessa giá nel caso unidimensionale e richiede delle approssimazioni per essere risolta: • Si considerano solo i processi dominanti alle energie a cui siamo interessati. 3.3 Simulazioni Monte Carlo 51 • Si sostituiscono le lunghezze di decadimento ed interazione con un valor medio costante al variare del’energia • Si ricorre all’ipotesi di scaling di Feynman[40]: Fji (Ei , Ej ) ' Fji Ei Ej (3.13) Nel caso adronico, alle alte energie, esistono dei modelli che prevedono la violazione dello scaling; ció implica una maggiore rapiditá nello sviluppo dello sciame e, quindi, un tmax piú piccolo[47]. Per evitare questi problemi si ricerca la soluzione delle equazioni di trasporto per via numerica. 3.3 Simulazioni Monte Carlo Come giá detto, la descrizione per mezzo di modelli analitici degli sciami atmosferici risulta complicata in quanto abbiamo a che fare con processi statistici i cui dettagli non possono essere inclusi in espressioni analitiche. Quello che si puó fare é utilizzare delle simulazioni con tecniche Monte Carlo su di un campione di eventi statisticamente rilevante. Il programma piú largamente utilizzato a questo scopo (di cui si é fatto uso anche nell’ambito di questa tesi) é CORSIKA[22]. Per ciascuna particella nello sciame, viene generata casualmente la distanza percorsa secondo una distribuzione esponenziale decrescente che é risultato di due contributi: il primo derivante dalla probabilitá di interazione delle particelle, il secondo da quella di decadimento. Il primo termine indica la probabilitá di attraversare un tratto con spessore χ senza avere interazioni ed é dato da: 1 Pint (χ) = · e−χ/λint (3.14) λint dove χ = − ln(RNDM)·λint con 0 <RNDM> 1, mentre λint é il libero cammino medio definito come: P3 ni A i λint = P3i=1 i=1 ni σiint con Ai peso atomico e σiint = σiint (E) sezione d’urto, mentre ni rappresenta le frazioni dei nuclei che compongono l’aria1 . 1 si considera: n(N2 ) = 0.7848, n(O2 ) = 0.2105, n(Ar) = 0.0047. 52 Studio degli sciami atmosferici ed analisi multiscala Figura 3.5: Simulazione tridimensionale di uno sciame elettromagnetico ed uno adronico fatta da CORSIKA. Le distanze sono esprese in metri. Sul piano orizzontale é rappresentata la distribuzione dei fotoni Čerenkov prodotte dalle particelle dello sciame. I colori indicano i diversi tipi di particelle presenti. Il secondo termine descrive la probabilitá che una particella compia un percorso ` senza decadere ed é scritta come: 1 PD (`) = · e−`/`D (3.15) `D dove ` = − ln(RNDM)·`D con 0 <RNDM> 1 e `D = c · τ · γ · β. I due processi sono in competizione nel senso che una particella con un lungo tempo di vita ha una probabilitá di interagire piú alta e viceversa. Una delle incertezze maggiori deriva dal fatto che le sezioni d’urto adroniche ad alte energie non sono note da esperimenti agli acceleratori e vanno quindi ricavate estrapolando i dati sperimentali con una incertezza che deriva dall’utilizzo di un modello di interazione piuttosto che un altro. Gli altri ingredienti fondamentali per una corretta simulazione degli sciami atmosferici sono: • Densitá dell’atmosfera; • Campo magnetico terrestre che distorce la distribuzione delle particelle; • Perdita di energia delle particelle per ionizzazione; • Scattering mutiplo. Il risultato di questo approccio é un diagramma ad albero, la cui immagine tridimensionale é mostrata in figura 3.5. 3.4 Analisi multiscala 53 Si fa presente che questo tipo di studio é uno strumento fondamentale nella astronomia γ se si vogliono valutare le performance dei rivelatori; infatti, la calibrazione dell’apparato sperimentale non puó essere fatta, a differenza di quanto accade negli esperimenti agli acceleratori, attraverso sorgenti le cui caratteristiche sono perfettamente note. 3.4 Analisi multiscala Come si puó vedere dalla figura 3.5, vi sono delle sostanziali differenze tra gli sciami da fotone e quelli da protone dovute essenzialmente alle differenti interazioni coinvolte nello sviluppo nell’atmosfera. La presenza di sottocascate elettromagnetiche negli sciami adronici rende l’immagine sul rivelatore meno omogenea rispetto a quella data da uno sciame da γ. Tali considerazioni ci hanno indotto ad utilizzare un’analisi di tipo multiscala per ricavare informazioni sulle sottostrutture degli sciami al fine di evidenziare differenze tra eventi da fotoni e da adroni. Questa ipotesi deve essere testata attraverso delle simulazioni, ma potrebbe essere giustificata a priori se si pensa che la sezione dello sciame rivelata dall’apparato é data dalla sovrapposizione delle particelle di tutti i sottosciami generati nella cascata dando come risultato una immagine in cui le sottostrutture sono sovrapposte l’una all’altra. L’analisi dell’immagine a diverse scale dovrebbe far emergere queste differenze che, portando le informazioni del tipo di primario, dovrebbero permettere di distinguere tra sciami iniziati da gamma e da adroni. Ci teniamo a ribadire che questo tipo di studio é stato fatto solo in esperimenti con telescopi Čerenkov e mai con apparati di sciame come ARGO. Nei telescopi Čerenkov ció che viene osservato é la luce durante tutto lo sviluppo dello sciame, mentre ARGO ne vede solo una sezione. Ció potrebbe rendere piú sensibile ARGO in quanto le fluttuazioni presenti nell’immagine vengono maggiormente evidenziate. Si é deciso di utilizzare un tipo di analisi discreta in quanto l’immagine dello sciame fornitaci da ARGO puó essere pensata come una funzione bidimensionale definita su un reticolo; inoltre, tale scelta riduce il tempo di calcolo. La caratteristica nota come “self-similarity” si manifesta in tantissimi fenomeni naturali. Essa consiste nel fatto che se si osserva tale fenomeno sempre piú in dettaglio, si riscontra una struttura che si ripete uguale ad ogni scala di grandezza. Le strutture che mostrano un tale comportamento sono note come frattali e possono qualitativamente essere caratterizzate da un parametro noto come dimensione frattale. Queste caratteristiche sono osservate anche in funzioni di distribuzione associate a una qualche quantitá fisica. Alcuni esempi sono: la distribuzione spaziale dell’energia dissipata in fenomeni turbolenti o le fluttuazioni delle ampiezze delle funzioni d’onda elettroniche nella transizione conduttore-isolante in sistemi caotici. 54 Studio degli sciami atmosferici ed analisi multiscala Se nell’analisi di una distribuzione di tipo “self-similar” si ha bisogno di un numero infinito di dimensioni frattali[31], le distribuzioni corrispondenti prendono il nome di multifrattali e vengono analizzate con il cosiddetto “boxcounting method”. Un metodo alternativo é quello di caratterizzare le distribuzioni con l’analisi di wavelet, che puó essere considerata come una serie di rappresentazioni del segnale che esaminano la struttura a differenti scale di grandezza. In questo senso, il segnale che si esamina puó essere rappresentato attraverso un set completo di funzioni ognuna ortogonale all’altra alle diverse scale di osservazione. Il set di funzioni viene costruito attraverso la dilatazione e traslazione discreta di una wavelet madre. Questo approccio non é da ritenersi alternativo a quello classico, bensı́ complementare in casi in cui il comportamento multifrattale del campione non sia chiaro. Si puó infatti verificare che distribuzioni, che ad una analisi classica mostrano segni di comportamento multifrattale, se studiate con un analisi di wavelet risultano regolari. Accade anche il contrario, e cioé che un debole comportamento multifrattale, invisibile ad un’analisi classica venga “smascherato” da uno studio dei momenti di wavelet. 3.4.1 Analisi multifrattale standard Consideriamo un reticolo ipercubico d-dimensionale di lunghezza unitaria e assumiamo che la distribuzione da analizzare φ(~x) ≥ 0 sia definita in ogni punto ~x del reticolo. Suddividiamo il reticolo in celle non sovrapposte di dimensione ` e denotiamo la probabilitá totale all’interno di una cella centrata in ~x con: p(~x, `) = 0 P φ(~ x0 ) NT OT {~ x0 } 0 , {~x } = {x ≤ x ≤ x + ` − 1, (3.16) 0 y ≤ y ≤ y + ` − 1, . . . , z . . . }, ` ≥ 1 , dove NT OT é il contenuto totale del reticolo. Per il tipo di problemi a cui siamo interessati, le probabilitá all’interno delle celle hanno un andamento del tipo hp(~x, `)i ∼ `α quando ` → 1, da cui in principio si possono ricavare gli esponenti di scala α(> 0) detti esponenti di singolaritá[20]. La conoscenza di tutti gli esponenti α non é sufficiente a caratterizzare la misura; infatti, é necessario sapere quanto spesso un dato valore sia presente. Piú precisamente, dobbiamo studiare i sottoinsiemi della distribuzione N (α, `). Assumiamo che queste distribuzioni abbiano un andamento del tipo N (α, `) ∼ `−f (α) , quando ` → 1, e dove f (α) é la dimensione frattale del sottoinsieme considerato. Nel caso in cui vi siano infiniti valori di α che caratterizzano la misura, allora ci sono anche infiniti sottoinsiemi. In questo caso la distribuzione é detta 3.4.2 Approccio differenziale all’analisi multifrattale 55 multifrattale. Questo complesso comportamento si riflette sull’espressione dei momenti hpq (~x, `)i ∼ `qα(q) , dove q é un numero reale e α(q) é una funzione non lineare di q. Ció significa che per q 6= 1, α(q) 6= α e hpq (~x, `)i 6= hp(~x, `)iq (3.17) Al contrario, se vi é un solo valore di α che caratterizza la distribuzione, allora essa é regolare e si ha che hpq (~x, `)i ∼ hp(~x, `)iq (3.18) Per calcolare la dimensione frattale f (α) bisogna studiare l’andamento della funzione definita come: X hpq (~x, `)i ∼ `τ (q) , ` → 1, (3.19) Zq (`) = {~ x} dove {~x} = {0, `, 2`, . . . ; y = 0, `, 2`, . . . ; z . . . }. Gli esponenti τ (q) ci danno l’intera informazione richiesta per ricavare α e f (α). Sostituendo nell’equazione 3.19 l’andamento ipotizzato per hpq (~x, `)i si ottiene: X X X Zq (`) ∼ `qα(q) ∼ `qα(q) N (α, `) ∼ `qα(q) `−f (α) (3.20) {~ x} α α dove abbiamo sostituito la somma sulle coordinate delle celle ~x con la somma sugli α. L’espressione risultante puó essere risolta passando dalla sommatoria all’integrale su α. Il risultato é che α(q) = dτ /dq e f (α) = qα(q) − τ (q) [20], da cui f (α) é la trasformata di Legendre di τ (q). Per una misura regolare τ (q) risulta essere una funzione lineare di q, τ (q) = α0 (q − 1), con α0 = d dimensione del supporto della misura e f (α) = α = d. Se consideriamo invece una distribuzione multifrattale, τ (q) diventa una funzione non lineare di q dando come risultato un insieme di infiniti valori per α e f (α). Operativamente, data l’equazione 3.19, τ (q) verrá ricavato misurando la pendenza della retta che passa per i punti Zq (`) in scala bilogaritmica. Il metodo descritto per determinare α, ha comunque lo svantaggio di non essere sufficientemente accurato soprattutto nei casi in cui la distribuzione abbia un debole comportamento multifrattale o il comportamento multifrattale sia nascosto da un fondo uniforme. 3.4.2 Approccio differenziale all’analisi multifrattale Allo scopo di distinguere meglio i diversi comportamenti di una distribuzione, studiamo le proprietá di scala delle differenze tra le probabilitá di occupazione 56 Studio degli sciami atmosferici ed analisi multiscala delle celle vicine. Per semplicitá, consideriamo il caso unidimensionale e rimandiamo la generalizzazione al paragrafo 3.4.4. In analogia con l’equazione 3.19, analizziamo il comportamento di una nuova funzione: X Wq (`) = h|p(x, `) − p(x + `, `)|q i ∼ `β(q) , ` → 1, (3.21) {x} dove {x} = {0, 2`, 4`, . . . }. L’esponente di scala β(q) ha lo stesso ruolo di τ (q) nell’equazione 3.19. Per convenienza, in questa analisi consideriamo q ≥ 0, in quanto valori negativi di q (vedi [36]) portano solo delle complicazioni di cui nella nostra trattazione non abbiamo bisogno. Consideriamo ora il caso di una distribuzione con caratteristiche multifrattali. In questa situazione, ci si aspetta che la differenza |p(x, `) − p(x + `, `)| abbia anch’essa un comportamento multifrattale e che l’esponente β(q) sia una funzione non lineare di q. Prendiamo ora in esame un caso semplice in cui si abbia h|p(x, `) − p(x + `, `)|q i ∼ hpq (x, `) da cui β(q) = τ (q). Nel caso di trasformate di wavelet continue ció puó essere provato facendo delle opportune ipotesi[37]. In generale per delle distribuzioni standard ci aspettiamo che hp(x, `)i ∼ `α hc(x)i, ` → 1, (3.22) dove α assume un solo valore e c(x) > 0 é una funzione modulante. Dall’equazione 3.22 si ha che h|p(x, `) − p(x + `, `)|i ∼ `α h|c(x) − c(x + `)|i. Assumiamo ora (come nei casi di nostro interesse avviene) di avere un andamento h|c(x) − c(x + `)|i ∼ `H quando ` → 1, da cui h|p(x, `) − p(x + `, `)|i ∼ `α+H . (3.23) In questa espressione, H é un nuovo esponente che caratterizza la distribuzione. Poiché abbiamo assunto di avere a che fare con una distribuzione regolare si ha h|p(x, `) − p(x + `, `)|q i ∼ h|p(x, `) − p(x + `, `)|iq che utilizzando le equazioni 3.21 e 3.23 diventa X X `qα N (α, `) ∼ `qH Zq (`). Wq (`) = `qα `qH ∼ = `qH {x} (3.24) (3.25) α Per cui si ottiene: β(q) = τ (q) + Hq, che differisce da τ (q) per il termine addizionale Hq. (3.26) 3.4.3 Analisi di wavelet 57 Figura 3.6: Funzioni b(x, `) in funzione di x per ` = 1, 2, 4 (a sinistra in azzurro) e funzioni Haar-wavelets w(x, 2`) in funzione di x per 2` = 2, 4 (a destra in rosso). 3.4.3 Analisi di wavelet L’equazione 3.21 é strettamente legata all’analisi di wavelet di una funzione di distribuzione φ(~x). Per far vedere ció, consideriamo un reticolo unidimensionale e notiamo che le p(x, `) dell’equazione 3.16 possono essere ottenute dalla convoluzione Z p(x, `) = dx0 φ(x0 )b(x0 − x, `) (3.27) dove b(x, `) = 1 se 0 ≤ x < ` 0 altrove (3.28) Esempi di queste funzioni b(x, `) sono mostrate in figura 3.6 a sinistra; a destra vi sono, invece, le cosiddette Haar-wavelets, denotate con w(x, 1`) e definite come: 1 se 0 ≤ x < ` −1 se ` ≤ x < 2` w(x, `) = (3.29) 0 altrove 58 Studio degli sciami atmosferici ed analisi multiscala Figura 3.7: Espansione di una data funzione f (x) in: (a) funzioni b(x, `), dove f (x) = b(x − 1, 1) − (1/2)[b(x − 2, 1) + b(x − 3, 1)], e (b) Haar-wavelets w(x, 2`) dove f (x) = (1/2)[w(x, 4) − w(x, 2)]. Se calcoliamo la convoluzione della nostra distribuzione φ(x) con le w(x, 2`) otteniamo Z p(x, `) − p(x + `, `) = dx0 φ(x0 ) w(x0 − x, 2`) (3.30) Si vede, quindi, che le differenze tra le distribuzioni all’interno delle celle contigue di dimensione lineare `, introdotte nell’equazione 3.21, sono proprio i coefficienti dell’espansione in Haar-wavelets della funzione di distribuzione φ(x) che caratterizza la nostra misura: XX 1 φ(x) = [p(x0 , `) − p(x0 + `, `)] w(x − x0 , 2`), (3.31) 2` 0 `≥1 {x } dove {x0 } = {0, 2`, 4`, . . . }. Come si puó vedere dalla figura 3.6, le wavelets w(x, 2`) hanno la proprietá di essere ortogonali l’una all’altra solo all’interno di una assegnata scala di lunghezza. Questa proprietá delle wavelets si riflette nell’equazione 3.31, in cui le funzioni base w(x, 2`) forniscono una completa rappresentazione della funzione φ(x) a tutte le scale di osservazione `. In contrasto con le funzioni b(x, `), l’intera informazione sulla distribuzione φ(x) é contenuta giá alla piú piccola scala (` = 1). Infatti: X φ(x) = p(x0 , 1)b(x − x0 , 1), (3.32) {x0 } dove {x0 } = {0, 1, 2, . . . }. Le differenze tra i due tipi di espansione possono essere apprezzate in figura 3.7. Il risultato di questa trattazione é che la funzione “differenziale”, introdotta nell’equazione 3.21, ci fornisce un metodo alternativo per studiare il comportamento di una distribuzione al variare della scala di analisi nei casi in cui la classica analisi multifrattale fornisce un risultato ambiguo. 3.4.4 Sistemi a piú dimensioni 3.4.4 59 Sistemi a piú dimensioni L’analisi di wavelet descritta in precedenza puó essere estesa a reticoli ndimensionali. In due dimensioni vengono utilizzate tre funzioni discrete indicate schematicamente da: + − + − + + − + + − − − (3.33) (2) (1) (3) Queste portano a scrivere tre diverse funzioni di partizione Wq (`), i = 1, 2, 3, definite come: XX Wq(1) (`) = h|p(x, y, `) + p(x + `, y, `) {x} {y} −p(x, y + `, `) − p(x + `, y + `, `)|q i, Wq(2) (`) = XX {x} {y} h|p(x, y, `) − p(x + `, y, `) +p(x, y + `, `) − p(x + `, y + `, `)|q i, Wq(3) (`) = XX {x} {y} (3.34) (3.35) h|p(x, y, `) − p(x + `, y, `) −p(x, y + `, `) + p(x + `, y + `, `)|q i, (3.36) dove {x} = {0, 2`, 4`, . . . }, {y} = {0, 2`, 4`, . . . }. Queste funzioni avranno un i andamento del tipo Wqi ∼ `β (q) , quando ` → 1 ed in generale gli esponenti β i (q) saranno diversi. La generalizzazione dell’analisi di wavelet a sistemi tridimensionali é semplice, ma la caratterizzazione della distribuzione richiede l’uso di una base formata da sette wavelets diverse. 3.5 Skewness Dall’osservazione delle immagini di sciami simulati, cosı́ come li vede ARGO, si puó notare come una caratteristica degli sciami adronici, rispetto a quelli elettromagnetici, sia la mancanza di simmetria nella distribuzione delle pad accese nel rivelatore. L’idea é stata, dunque, di cercare un parametro che, data la nostra distribuzione bidimensionale, potesse quantificare questo tipo 60 Studio degli sciami atmosferici ed analisi multiscala di effetto. Tale variabile esiste, misura la mancanza di simmetria di una distribuzione unidimensionale, ed é chiamata “skewness”. Dato un set di misure X1 , X2 , . . . , XN , la skewness é definita come: SKW = PN Xi − X (N − 1) s3 i=1 3 (3.37) dove X é la media della distribuzione, s la deviazione standard ed N il numero di misure. La skewness di una distribuzione normale é nulla, come accade per una qualunque quantitá fisica la cui distribuzione é simmetrica rispetto ad un dato punto. Un valore negativo indica che la distribuzione ha una asimmetria sinistra, viceversa per valori positivi. Nel nostro caso, avendo a che fare con delle distribuzioni bidimensionali, avremo due valori della skewness, una per la distribuzione lungo l’asse x e l’altra lungo l’asse y. Qualitativamente per un singolo evento da fotone ci aspettiamo la presenza di una maggiore simmetria tra asse x ed y rispetto ad un evento da protone. Questo non dovrebbe essere vero per un grande numero di eventi, ma comunque si dovrebbe notare una maggiore fluttuazione intorno alla media per eventi da protone. Il comportamento dei parametri definiti in questo capitolo verrá testato nel prossimo per cercare di caratterizzare il tipo di primario da cui un determinato sciame é indotto. Questo sará fatto attraverso un programma, sviluppato nell’ambito di questo lavoro di tesi, che calcolerá esponenti multifrattali, di wavelet e skewness in riferimento ad un set di eventi simulati. Capitolo 4 Simulazione degli eventi ed analisi multiscala Come giá accennato, il problema principale che si incontra nel fare astronomia γ con apparati di superficie é la determinazione del tipo di primario e, quindi, la reiezione del fondo isotropo che proviene dalla componente adronica. Fino ad oggi, sono state sviluppate tecniche di discriminazione basate sulla rivelazione diretta dei muoni e degli adroni nello sciame e che, dunque, richiedono l’utilizzo di apparati appositi da affiancare al rivelatore. Negli esperimenti con telescopi Čerenkov, invece, vengono utilizzati i ben noti parametri di Hillas[13] che permettono una caratterizzazione molto efficace degli sciami. Attraverso di essi si cerca di parametrizzare la natura ellittica dell’immagine dello sciame vista da un telescopio Čerenkov. Inoltre, recentemente sono state utilizzate tecniche di analisi multifrattale e di wavelet come quelle applicate nell’ambito di questa tesi. Con queste tecniche, insieme ai parametri di Hillas, si riesce ad ottenere un fattore di discriminazione segnale-fondo Q ∼ 2[44]. Questi risultati sono dovuti sia all’alta definizione spazio-temporale con cui l’immagine viene registrata sia al campionamento dello sviluppo laterale dello sciame. L’idea utilizzata nel nostro studio é quella di sfruttare l’alta granularitá spazio-temporale di ARGO (vedi capitolo 2) per fare discriminazione γ/adroni attraverso l’analisi della sola componente dello sciame vista al suolo dal suddetto rivelatore. In questo capitolo si mostreranno i risultati delle simulazioni di sciami adronici ed elettromagnetici cosı́ come li vede ARGO, 62 Simulazione degli eventi ed analisi multiscala nonché gli andamenti delle variabili citate nel capitolo 3, per chiarire se, e come, possano aiutare la reiezione del fondo. 4.1 Simulazione degli sciami Per la simulazione degli sciami é stato utilizzato il programma CORSIKA[22] (COsmic Ray SImulation for KAscade), sviluppato originariamente per l’esperimento KASCADE. All’interno di CORSIKA, come modello di interazione adronica alle basse energie (∼ 100 GeV ), si é scelto di utilizzare GHEISHA[15] (Gamma Hadron Electron Interaction SHower code), mentre alle alte energie, é stato usato il modello QGSJET[43] (Quark Gluon String model with JETs). La struttura dell’apparato nonché la sua risposta agli sciami generati con CORSIKA sono state simulate utilizzando il programma ARGOG, basato sul codice GEANT. Per l’analisi dei dati simulati é stato usato MEDEA++1 . Poiché MEDEA++ é basato sul linguaggio di programmazione object oriented C++, nel corso di questo lavoro di tesi, sono stati sviluppati apposite classi di oggetti e relativi metodi che, integrati in MEDEA++, ci hanno permesso di calcolare le quantitá desiderate. Tutte le variabili ricavate ed i dati riguardanti la simulazione sono stati successivamente analizzati con ROOT, programma per l’analisi dati scritto in linguaggio di programmazione C++ e sviluppato al Cern. Primario Indice Emin (GeV) Emax (TeV) spettrale γ 2.5 30 100 protoni 2.7 30 100 Tabella 4.1: Parametri riguardanti gli sciami simulati. Sono stati generati ∼ 2.8 · 105 sciami iniziati da γ e ∼ 2.6 · 105 aventi come primario protoni in un intervallo energetico che varia tra 30 GeV e 100 T eV , con una inclinazione variabile tra 0 e 15 gradi rispetto alla verticale e con il core dello sciame nel centro geometrico di ARGO (vedi tabella 4.1 e figura 4.1). I gamma sono stati generati con uno spettro simile a quello dei fotoni provenienti dalla Crab, mentre per i protoni si é scelto lo spettro 1 Sia ARGOG che MEDEA++ sono programmi sviluppati appositamente dalla collaborazione per l’esperimento ARGO-YBJ. 4.1 Simulazione degli sciami 63 Figura 4.1: Andamento degli spettri energetici di γ (in alto) e protoni (in basso) generati con CORSIKA. Gli indici spettrali con cui gli spettri sono stati generati sono γ = 2.5 e γ = 2.7 per gamma e protoni rispettivamente. comunemente osservato (vedi tabella 4.1). Come é mostrato in figura 4.2, nota l’energia del primario, la separazione tra γ e protoni potrebbe essere fatta semplicemente attraverso un taglio sul numero di hit2 . Sperimentalmente ció non é possibile, poiché l’apparato non permette una misura dell’energia del primario ed é, quindi, indispensabile adoperare altre tecniche per distinguere tra sciami da fotone e sciami da adrone. Tale situazione implica necessariamente che l’analisi sui dati simulati e tutte le considerazioni che ne conseguono devono esser fatte a numero di hit fissato o, almeno, in finestre di molteplicitá. Attraverso l’impostazione di una soglia nel programma di simulazione di ARGO, tra gli eventi generati sono stati presi in considerazione solo quelli che accendevano piú di 10 pad nel rivelatore, poiché uno studio topologico sarebbe stato privo di senso su un immagine costituita da pochi punti. Per evitare che i risultati dell’analisi fossero influenzati dal fatto di aver a disposizione eventi generati in una finestra finita di energia, é stato fatto un ulteriore taglio agli estremi dello spettro di molteplicitá scartando sia gli eventi che accendevano un numero di pad < 50 che quelli con un numero di pad superiore a 6000. 2 Per numero di hit si intende il numero di pad accese dallo sciame nel rivelatore 64 Simulazione degli eventi ed analisi multiscala Figura 4.2: Andamento degli spettri di molteplicitá per gamma (linea continua) e protoni (linea tratteggiata) in due diversi intervalli di energia. 4.2 4.2.1 Analisi multiscala Schematizzazione dell’apparato Come giá detto precedentemente, l’immagine dello sciame fornita da ARGO puó essere riguardata come una distribuzione bidimensionale definita su di un reticolo. Ció permette di applicare ad essa le tecniche di analisi multiscala descritte nel capitolo 3. Una volta trascurato l’anello esterno del rivelatore, se consideriamo come unitá di misura dell’apparato le pad formate da 8 strip, il tappeto di rivelatori ha dimensioni (120 × 130)pad. L’analisi multiscala richiede di calcolare per diversi valori di ` (` é la dimensione della cella quadrata della griglia con cui dividiamo l’immagine) le variabili Wq e Zq . Per fare questo abbiamo bisogno di preservare la simmetria alle diverse scale di osservazione, per cui si é pensato di ridurre ARGO ad una matrice di dimensione variabile (2n × 2n )pad. A tale scopo, oltre all’anello esterno trascuriamo due righe di pad, una nella parte superiore ed una in quella inferiore. Inoltre, aggiungiamo ai bordi sinistro e destro rispettivamente due colonne di pad (vedi figura 4.3); naturalmente, queste 4 colonne sono fittizie e, come tali, risultano sempre vuote ai fini dell’analisi. In questo modo, la dimensione di massima risoluzione risulta pari a (128 × 128)pad. 4.2.1 Schematizzazione dell’apparato 65 Figura 4.3: Visualizzazione dello schema utilizzato per suddividere l’immagine dello sciame e calcolare i valori di Z q (`) e Wq (`). Come si vede viene sottratta una riga di pad in alto ed in basso e ne vengono aggiunte due colonne a destra e a sinistra. La suddivisione viene mostrata fino a valori di n = 4 corrispondente a ` = 8, mentre nell’analisi si é scesi fino ad ` = 2. 66 Simulazione degli eventi ed analisi multiscala La suddivisione massima della griglia corrisponde alla massima risoluzione con cui si puó analizzare l’immagine dello sciame ed al minimo valore di ` per cui si calcola il momento multifrattale Zq (`) e il momento di wavelet Wq (`). Facciamo presente che, poiché in ogni pad il numero di strip é 8 al livello di dettaglio massimo, il contenuto di ogni pad sará dato da un valore compreso tra 0 e 8. Inoltre si puó facilmente vedere che la relazione sussistente tra ` ed n é data da: `= 128 2n (4.1) Il procedimento utilizzato puó essere compreso osservando la figura 4.3 in cui viene rappresentata la suddivisione in celle fino al passo n = 4 di una distribuzione bidimensionale sul tappeto di RPC di ARGO-YBJ. 4.2.2 Analisi del singolo evento Il procedimento, implementato attraverso il codice C++, suddivide l’immagine e calcola Zq (`) e Wq (`) valutando il contenuto delle celle, in termini del numero di strip ivi accese, per ogni valore di q e per tutti i 6 valori di ` consentiti dalla 4.1 e compresi tra 64 e 2. Avendo a che fare con numeri molto piccoli, vengono, in realtá, calcolati il Log(Zq (Log`)) ed il LogWq (Log`). A questo punto, per ogni valore di q, vengono adattate le curve Log(Zq (Log`)) vs Log(`) e LogWq (Log`) vs Log(`) con una polinomiale di primo grado interpolando 5 dei 6 valori trovati. L’ultimo valore Zq (64) (ed anche Wq (64)) viene scartato perché ci aspettiamo che l’andamento dei momenti devii dal comportamento descritto dall’equazione 3.19 (3.21nel caso dell’analisi di wavelet) per valori di ` >> 1. La pendenza della retta risulta proprio essere il valore dell’esponente multifrattale τ (q) o di wavelet β i (q), a seconda del caso considerato. Dei tre valori di β i (q), derivanti dalle tre espressioni per i momenti di wavelet di una distribuzione bidimensionale (vedi equazioni 3.34, 3.35, 3.36), si é calcolato un solo valore che é la media dei tre. Si é optato per questa strada in quanto, per sciami con inclinazioni piccole, come quelli da noi analizzati, le distribuzioni sono pressocché simmetriche. Questa scelta non ha nulla di particolare se si pensa che gli sciami con inclinazioni qualsiasi possono essere ridotti al caso simmetrico effettuando l’analisi di wavelet ponendosi nel piano del fronte dello sciame. In alcuni eventi si é notato un discostamento dall’andamento lineare per alcuni valori di `; questo eccesso fa presupporre che quel particolare valore di ` sia direttamente collegato all’ordine di grandezza tipico delle sottostrutture dell’immagine associata all’evento. Questo rivela le potenzialitá del metodo che si é scelto di utilizzare. 4.2.2 Analisi del singolo evento 67 Figura 4.4: Immagine di uno sciame da γ con E = 7.9 T eV cosı́ come viene vista da ARGO-YBJ. 68 Simulazione degli eventi ed analisi multiscala Figura 4.5: Adattamento del Log(Wq (`)) medio e Zq (l) con una retta per valori di q = 4, 6, 8 nel caso di un evento da γ con E = 7.9 T eV . 4.2.2 Analisi del singolo evento 69 Figura 4.6: Immagine di uno sciame da protone con E = 7.4 T eV cosı́ come viene vista da ARGO-YBJ. 70 Simulazione degli eventi ed analisi multiscala Figura 4.7: Adattamento del Log(Wq (`)) medio e Zq (l) e con una retta per valori di q = 4, 6, 8 nel caso di un evento da protone con E = 7.4 T eV . 4.2.3 Andamenti di τ (q) e β(q) 4.2.3 71 Andamenti di τ (q) e β(q) Da quanto scritto nel capitolo 3, le informazioni sull’immagine e, dunque, sull’evento, sono contenute in τ (q) e β(q). Una interessante questione é la dipendenza dei parametri dall’indice q e, soprattutto, come la separazione tra γ e protoni viene influenzata dalla scelta di un particolare valore di q nel calcolo di τ e β. Precedentemente all’analisi del campione simulato, é stato effettuato uno studio di τ (q) e β(q) in riferimento ad una particolare finestra energetica (3 T eV ÷ 10 T eV ) per 7 diversi valori di q. Dalla figura 4.8, in cui Figura 4.8: Andamenti di τ (q) e β(q) al variare di q per sciami da γ e da protone in un intervallo di energia tra 3 T eV e 10 T eV . I valori riferiti ai protoni sono traslati sull’asse delle ascisse per evitare una sovrapposizione delle barre. 72 Simulazione degli eventi ed analisi multiscala sono mostrati i valori medi delle varie distribuzioni e le rispettive larghezze, si possono estrarre alcune considerazioni: • vi é una dipendenza lineare degli esponenti τ e β dal valore dell’ordine q. • la separazione tra gamma e protoni aumenta al crescere di q; • la larghezza delle distribuzioni cresce con q. Queste osservazioni (in perfetto accordo con quanto trovato in una analoga analisi fatta per l’esperimento HEGRA[44]), insieme all’aumento del tempo di processamento degli eventi al crescere di q, ci hanno indotto a effettuare un analisi solo per q = 4, 6, 8. La verifica dell’andamento degli esponenti é Figura 4.9: Andamento di β(q) medio al variare di q per sciami da γ e da protone in un intervallo di molteplicitá tra 500 hits e 800 hits. I valori riferiti ai protoni sono traslati sull’asse delle ascisse per evitare una sovrapposizione delle barre. stata fatta per i 3 valori di q suddetti in cinque diverse finestre di molteplicitá (nhitsmin <nhits< nhitsmax ) e viene mostrata nelle figure 4.10 e 4.9. Gli intervalli di molteplicitá scelti corrispondono a finestre di energia differenti per gli sciami da fotone e per quelli da protone I valori sono riportati in tabella 4.2, mentre gli spettri delle distribuzioni sono mostrati nel capitolo 5 in figura 5.1. Osservando poi le distribuzioni generali di β(q) e τ (q), per i γ e per i protoni in queste cinque finestre di molteplicitá (vedi figure 4.11 e 4.12), si nota che, per un numero di hits 50÷100, le distribuzioni sono sovrapposte. Ció sembra logico considerando che una immagine costituita da pochi punti risulta piú povera di sottostrutture. Con il crescere del numero di hits, la situazione migliora, ma non permette 4.2.3 Andamenti di τ (q) e β(q) 73 Figura 4.10: Andamento di τ (q) al variare di q per sciami da γ e da protone in un intervallo di molteplicitá tra 500 hits e 800 hits. I valori riferiti ai protoni sono traslati sull’asse delle ascisse per evitare una sovrapposizione delle barre. né di effettuare un taglio osservando direttamente le distribuzioni né, quindi, di effettuare una stima del parametro di qualitá Q. Questo fatto ci ha indotto ad utilizzare gli esponenti multifrattali τ (q) e di wavelet β(q) per addestrare una rete neurale allo scopo di esaltare le differenze esistenti tra gli sciami da gamma e da protone. In una scelta di questo tipo siamo stati incoraggiati dai risultati ottenuti con l’utilizzo delle reti neurali artificiali per lo studio di immagini in altri esperimenti, ad esempio HEGRA[44]. < Eγ > numero di < Ep > numero di eventi (TeV) eventi da γ (TeV) da protone 50 ÷ 100 0.5 6955 0.8 4160 100 ÷ 500 1.1 11902 1.7 7601 500 ÷ 800 2.9 2885 4.9 1951 800 ÷ 1500 4.6 3397 7.7 2770 1500 ÷ 6000 11.3 5145 18 3367 nhits Tabella 4.2: valori medi delle distribuzioni di energia per γ e protoni nei 5 intervalli di molteplicitá scelti per l’analisi. 74 Simulazione degli eventi ed analisi multiscala Figura 4.11: Distribuzioni dell’esponente multifrattale τ (q) per q = 6 nelle 5 finestre di molteplicitá selezionate. 4.2.3 Andamenti di τ (q) e β(q) 75 Figura 4.12: Distribuzioni dell’esponente di wavelet β(q) medio per q = 6 nelle 5 finestre di molteplicitá selezionate. 76 4.3 Simulazione degli eventi ed analisi multiscala Studio della simmetria dell’immagine Per sfruttare la presenza di disomogeneitá nella distribuzione degli hits nel caso di sciami da protone al fine di distinguerli da quelli da γ, si é calcolato l’andamento della skewness in riferimento ai nostri sciami simulati. Data una distribuzione unidimensionale lungo x, é stata definita: P ni x3i xcube = Pi (4.2) i ni dove ni non é altro che la molteplicitá di strip della pad del rivelatore di coordinata x. Si é optato per l’utilizzo di questa variabile in quanto, a differenza della skewness (vedi equazione 3.37), non richiede di conoscere x e, cioé, di ricostruire l’evento cercando il core dello sciame o, comunque, il suo baricentro. Tale scelta é stata fatta per limitare l’introduzione, nell’analisi, di possibili errori sistematici dovuti al metodo di ricostruzione dell’evento. Nel nostro caso abbiamo a che fare con una distribuzione bidimensionale; quindi, dopo aver valutato le distribuzioni di xcube e ycube riferite al campione di eventi simulati sia di γ che di protoni, si é considerata la distribuzione di xcube /ycube nelle cinque finestre di molteplicitá giá utilizzate nell’analisi multiscala. Come si puó vedere dalla figura 4.13, le distribuzioni sono centrate intorno al valore ' 1 sia per gli sciami da protone che per quelli da γ: questo fatto é spiegabile pensando che, mediamente, le distribuzioni sugli assi hanno la stessa simmetria (essendo gli sciami quasi verticali e posti al centro dell’apparato). Ció non é vero per gli eventi singoli: infatti, nel caso di sciami da protone, ci aspettiamo una maggiore deviazione dall’unitá del valore di xcube /ycube . Si nota, comunque, una sostanziale differenza tra i due tipi di primario. Infatti, nel caso di sciami iniziati da protone si notano maggiori fluttuazioni della distribuzione intorno alla media rispetto alla distribuzione riferita ai γ. Per discriminare γ e protoni si potrebbe, perció, mettere un taglio nel seguente modo: si considera una finestra intorno alla media delle distribuzioni, la percentuale di eventi ivi contenuti vengono considerati sciami da fotone con una contaminazione di eventi da protone pari alla frazione che ve ne cade all’interno.In tabella 4.3 sono riportate le stime del valore di Q, calcolato secondo la 2.3, in ognuna delle cinque finestre di molteplicitá considerate. I valori del fattore di discriminazione Q trovati con questa procedura sono relativamente bassi. Pertanto, si é deciso di utilizzare le informazioni su xcube /ycube insieme a quelle provenienti dall’analisi multiscala per addestrare una rete neurale. 4.3 Studio della simmetria dell’immagine 77 Figura 4.13: Distribuzioni del rapporto xcube /ycube in 5 finestre di molteplicitá riferite ad eventi simulati da γ (linea continua) e da protone (linea tratteggiata). 78 Simulazione degli eventi ed analisi multiscala Nel prossimo capitolo si introdurranno, quindi, i concetti base necessari per utilizzare le reti neurali come strumento di analisi. Le variabili fin qui studiate verranno impiegate come vettore di input per la rete allo scopo di esaltare le minime differenze presenti nelle distribuzioni. nhits xcube /ycube (min) xcube /ycube (max) Q 50 ÷ 100 0.67 1.39 1.22 100 ÷ 500 0.78 1.22 1.27 500 ÷ 800 0.82 1.07 1.31 800 ÷ 1500 0.85 1 1.30 1500 ÷ 6000 0.86 0.97 1.27 Tabella 4.3: Valori di Q calcolati in 5 finestre di molteplicitá effettuando un taglio direttamente sul valore di xcube /ycube . Capitolo 5 Discriminazione γ/h per mezzo di una rete neurale artificiale Nel capitolo precedente si é mostrato come la semplice analisi delle distribuzioni degli esponenti multiscala e del momento terzo non sia sufficente a discriminare tra sciami iniziati da γ e da protone. Tale situazione ci ha indotto a fare uso di una rete neurale artificiale (ANNArtificial Neural Network). Uno strumento di questo tipo si rivela di grandissima utilitá nei casi, come il nostro, in cui le differenze tra il segnale (raggi gamma) ed il fondo (raggi cosmici) sono molto piccole. L’utilizzo della rete neurale, opportunamente addestrata, dovrebbe dare informazioni sulla natura del primario e fornire dei risultati migliori per Q rispetto a quelli mostrati in tabella 4.3, migliorando, quindi, la sensibilitá di ARGO-YBJ. Un aumento della sensibilitá si traduce immediatamente in una diminuzione del tempo di presa dati necessario a vedere una sorgente con un certo numero di sigma superiore al fondo isotropo della radiazione cosmica. In questo capitolo si descriveranno il tipo di rete neurale utilizzata ed i risultati ottenibili con essa, ricavando un valore del fattore di discriminazione Q in ognuna delle 5 finestre di molteplicitá in cui é sta effettuata l’analisi multiscala. Ad ogni intervallo di molteplicitá corrisponde una distribuzione dell’energia (vedi figura 5.1) i cui i valori medi e larghezze corrispondenti vengono riportate in tabella 5.1. 80 Discriminazione γ/h per mezzo di una rete neurale artificiale Figura 5.1: Spettri energetici non normalizzati nei 5 intervalli di molteplicitá scelti per l’analisi. La linea in rosso é riferita a sciami da γ, mentre la linea in blu a sciami da protone. 5.1 Le reti neurali 81 Come si puó vedere i valori dell’energia media riferiti a sciami iniziati da fotoni sono, in ognuno degli intervalli di molteplicitá, piú bassi di quelli per sciami da protone. I dati sono riferiti a sciami simulati (vedi capitolo 4) i cui spettri seguono una legge a potenza ∝ E −γ con γ = 2.5 nel caso di sciami da fotoni e γ = 2.7 per sciami aventi come primario un protone. < Eγ > < RMSγ > < Ep > RMSp (TeV) (TeV) (TeV) (TeV) 50 ÷ 100 0.5 0.3 0.8 0.8 100 ÷ 500 1.1 0.8 1.8 1.5 500 ÷ 800 2.9 1.4 4.9 2.9 800 ÷ 1500 4.6 2 7.6 4.3 1500 ÷ 6000 11.3 6.2 18.4 11.3 nhits Tabella 5.1: valori medi delle distribuzioni di energia per γ e protoni nei 5 intervalli di molteplicitá scelti per l’analisi. 5.1 Le reti neurali Nel caso di questa analisi il problema della discriminazione γ/p é riconducibile ad un problema di riconoscimento delle immagini in cui i dati da analizzare sono affetti da grosse fluttuazioni (vedi capitolo 4) e le caratteristiche delle immagini sono note attraverso un insieme discreto di esempi (i singoli eventi). Questioni di questo tipo vengono solitamente risolte attraverso l’uso delle reti neurali. Recentemente sono state utilizzate per l’analisi dati in molti esperimenti di fisica delle alte energie. In particolare, sono state impiegate per la discriminazione γ/adroni nell’esperimento HEGRA[44] adoperando come input gli esponenti multiscala relativi alle immagini degli sciami. Bisogna tener presente, comunque, che le informazioni di partenza sono totalmente diverse rispetto a quelle date da ARGO-YBJ. Ció che l’esperienza altrui insegna é che il calcolo effettuato dalle reti neurali fornisce maggiori prestazioni rispetto all’applicazione di tagli effettuati con tecniche tradizionali. Il cervello umano é costituito da ∼ 1011 cellule che prendono il nome di neuroni, collegati da connessioni di intensitá variabile wij dette sinapsi. 82 Discriminazione γ/h per mezzo di una rete neurale artificiale Figura 5.2: Schematizzazione di una piccola parte di una rete neurale biologica. I dentriti danno l’input neti al neurone, se questo raggiunge uno stato di attivazione ai manda un output oi alla sua connessione. Attraverso le sinapsi i capi della connessione sono legati con forza w ij ai dentriti del neurone vicino. La freccia in alto nella figura indica il verso del flusso di informazioni. Un neurone riceve degli stimoli in entrata (neti ) dai suoi dentriti; la somma di questi impulsi produce un potenziale elettrochimico. Se questo potenziale eccede una certa soglia, il neurone si attiva (stato ai ) dando in uscita un segnale oi che si propaga attraverso i neuriti e viene trasmesso agli altri neuroni dalle sinapsi (vedi figura 5.2). La sinapsi determina le intensitá wij con cui ogni dentrite é legato al neurite (e quindi al neurone). L’intensitá delle sinapsi é aumentata dall’attivazione ripetuta di uno dei due neuroni da parte dell’altro. Questa struttura permette al cervello, sebbene le connessioni siano lente1 , di risolvere problemi fuori dalla portata dei tradizionali calcolatori. Inoltre, il processo di apprendimento puó essere approssimato come un adattamento delle sinapsi agli stimoli esterni; in pratica, si ha una continua riconfigurazione dell’architettura del cervello. L’idea é quella di cercare di risolvere determinati problemi effettuando delle simulazioni dei processi cognitivi cerebrali. La differenza fondamentale con i calcolatori tradizionali é una distribuzione in parallelo del calcolo su piú processori (quelli che nel cervello sono i neuroni). Ció conferisce alle reti neurali artificiali delle proprietá: • possibilitá di un “mapping” non lineare; 1 Si pensi che la velocitá di trasmissione tra un neurone e l’altro é ∼ 10−3 s contro i ∼ 10−9 s di un transistor 5.1.1 Neuroni 83 • le funzioni risultanti dal “mapping” sono differenziabili; • capacitá di apprendere da esempi e generalizzare (estrapolare ed interpolare) a partire da essi; • stabilitá nella risposta rispetto alle fluttuazionui dei dati sperimentali. Grosse fluttuazioni nei dati di input non precludono, dunque, la possibilitá di un’ottima risposta della rete, rendendola uno strumento fondamentale a trattare problemi in cui vi siano difficoltá legate a rumore di fondo o fluttuazioni statistiche. 5.1.1 Neuroni Le reti neurali sono, in perfetta analogia con i corrispettivi biologici, composte dai neuroni e dalle connessioni tra essi (che simulano le sinapsi). Lo stato del neurone é descritto da tre quantitá: • La soglia Θj applicata all’input • L’attivazione aj (tensione di eccitazione), che viene calcolata attraverso la funzione di attivazione fact a partire dall’input netj ed é definita da: aj (t + δt) = fact (Θj , aj (t), netj (t)), (5.1) dove δt corrisponde ad un ciclo di aggiornamento dei neuroni. Se, come spesso accade, il calcolo di aj é indipendente dal valore dell’attivazione precedente, la formula 5.1 diventa: aj = fact (Θ, netj ). (5.2) • L’output (corrispondente al segnale che viaggia nel neurite), che si ricava a partire dal valore di aj associato al neurone j-esimo attraverso la funzione di output fout secondo: oj = fout (aj ), (5.3) La funzione di propagazione, che calcola l’input del neurone j-esimo dato l’output oi dell’unitá precedente e i pesi wij delle connessioni, é data da: netj = X i wij oi (5.4) 84 Discriminazione γ/h per mezzo di una rete neurale artificiale Figura 5.3: Modello di una rete neurale replicata da una rete biologica, i dentriti, le sinapsi e i neuriti sono schematizzati da connessioni pesate. Nel caso in cui si scelga come funzione di output fout l’identitá (nelle applicazioni piú comuni si fa solitamente cosı́), si ha: oj = fout (aj ) ≡ aj ⇒ netj = X wij aj (5.5) i In generale, la funzione di attivazione é una funzione non lineare. Questa caratteristica é essenziale se vogliamo che la rete apprenda un mapping non lineare. In letteratura esiste un vasto elenco di funzioni di attivazione a seconda del problema che si vuole risolvere. La piú semplice é la funzione a gradino di Heavsyde: −1 se net < 0 (5.6) θ(net) = +1 se net ≥ 0 Questa funzione é priva di una soglia Θ e riproduce il comportamento dei neuroni cerebrali. Una classe di funzioni spesso utilizzate nella simulazione di reti neurali é quella delle sigmoidi, di cui fa parte la funzione di attivazione logistica2 scelta nel nostro caso. Essa é data da: fact (net, Θ) = 5.1.2 1 1+ e−(net−Θ) (5.7) Topologia La topologia della rete é definita dalle connessioni fra i neuroni e dei neuroni con l’esterno. In base al loro rapporto con il mondo esterno, i neuroni possono essere suddivisi in tre tipi: 2 Come si puó vedere dall’espressione 5.7 questa é strettamente legata alla funzione di Fermi; infatti, fact () = fF ermi (−) = 1 − fact () 5.1.2 Topologia 85 • neuroni di input: hanno solo le sinapsi in uscita e ricevono le informazioni dall’esterno. • neuroni di output: inviano le informazioni all’esterno (memoria). • neuroni hidden: hanno sinapsi sia in uscita che in entrata, ma non hanno scambi di informazioni con l’esterno. Figura 5.4: Rappresentazione schematica di: (a) rete feedforward generica, (b) rete feedforward a strati completamente connessa I possibili modi di connessione tra i neuroni danno origine a differenti tipi di reti. In questa trattazione ci limiteremo a parlare solo delle reti feedforward a strati completamente connesse, da noi utilizzate. Le reti feedforward sono quelle che non contengono ricorrenze nelle connessioni, cioé sinapsi che facciano tornare indietro nel percorso connettivo; il calcolo termina dopo un numero finito di passi andando da un neurone di input ad uno di output. Le reti a strati sono una sottocategoria di queste, in cui i neuroni vengono raggruppati in sottoinsiemi detti “layers” ed i neuroni di un determinato layer possono avere connessioni solo con neuroni appartenenti a layers diversi. L’espressione “completamente connesse” sta ad indicare che ciascun neurone di un layer é connesso a tutti i neuroni del layer successivo (vedi figura 5.4). 86 Discriminazione γ/h per mezzo di una rete neurale artificiale 5.1.3 Addestramento Fissate le funzioni di attivazione e di output dei neuroni insieme con la topologia della rete, le uniche cose che restano da assegnare sono gli n pesi, dove n é il numero totale di connessioni nella rete. Tutta l’informazione sulla rete é data dal valore che tali pesi assumono. Addestrare la rete significa, appunto, stabilire i valori da assegnare ai pesi affinché la rete effettui il mapping voluto: F : RNi −→ RNo (5.8) dove RNi (RNo ) é lo spazio Ni -dimensionale ( No -dimensionale) in cui sono definiti i vettori di input (output). Per quanto riguarda l’andamento di F , se esso é noto a priori, si parla di rete preprogrammata. Nei casi comuni si ha a disposizione un set di vettori di input ed uno di vettori di output e, quindi, in principio la funzione di mapping é nota per un insieme di punti finito e la sua forma dipende dai pesi che si assegnano alle connessioni. Da questo punto di vista, il problema di addestrare la rete si riconduce a trovare il vettore n-dimensionale dei pesi wij che determina il miglior fit dei punti noti. La situazione é complicata dal fatto che solitamente i dati a disposizione sono affetti da errori e fluttuazioni e la funzione di mapping non é necessariamente lineare. Assegnato un set di esempi p, composto da un vettore di input ed uno di output, ed inizializzati i pesi ad un valore casuale, si definisce per ogni pattern3 p il vettore No -dimensionale degli errori come la differenza tra l’output effettivo della rete op e l’output atteso tp : ep = op − t p (5.9) Una misura scalare della differenza tra output effettivo e atteso é data dalla somma degli errori al quadrato: ξp = 1X 1 (op (i) − tp (i))2 = eTp ep 2 i 2 (5.10) dove op (i) e tp (i) sono le componenti i-esime dei vettori di output reale ed output atteso. L’errore globale E sull’intera procedura di training é dato, invece, dalla somma degli errori sul singolo pattern: E= 3 X p 1 ξp = T r{E T E} 2 (5.11) Per pattern si intende l’insieme di esempi, con output noto, su cui la rete viene addestrata. 5.1.3 Addestramento 87 dove E é la matrice avente come colonne i vettori ep . Lo scopo della procedura di assegnazione dei pesi si riduce, dunque, a trovare il minimo della curva n-dimensionale definita nello spazio dei pesi e data dalla 5.11. In teoria, quindi, sono applicabili tutti i metodi di minimizzazione di funzioni; tuttavia, dobbiamo tener presente che va evitato l’impiego di algoritmi complessi che aumentano il tempo di calcolo. Inoltre, se vogliamo che la rete sia capace di funzionare in modo efficiente su dati diversi da quelli usati per l’addestramento, bisogna fermare l’apprendimento prima che i valori dei pesi diventino dipendenti dalle fluttuazioni presenti negli esempi. Per fare ció, si usa il metodo del “cross validation”, in cui si utilizza un ulteriore set di dati detto di validazione. Ad ogni passo del processo di minimizzazione, una volta assegnati i nuovi pesi, si calcola l’errore sul set di validazione. Se nei dati vi é la presenza di fluttuazioni, si osserva, dopo un certo numero di cicli di minimizzazione, un aumento di questo errore. In tal caso, l’apprendimento viene interrotto in corrispondenza del minimo di questo errore. Una reiterazione ulteriore del processo di apprendimento porterebbe la rete in “overtraining”, cioé alla perdita della capacitá di generalizzare. Volendo schematizzare l’intera procedura di apprendimento, possiamo suddividerla in quattro fasi: I) inizializzazione casuale dei valori dei pesi, cioé si sceglie in modo casuale il punto della superficie d’errore 5.11 da cui iniziare la minimizzazione; II) applicazione dell’algoritmo di minimizzazione ad ogni pattern e calcolo della variazione ∆wp del vettore dei pesi tra un passo ed il successivo; P III) calcolo della somma delle variazione del vettore dei pesi ∆w = p ∆wp e assegnazione dei nuovi pesi wij (t + 1) = wij (t) + ∆wij (con k indice dell’iterazione); IV) calcolo dell’errore sul set di validazione che ferma il processo o lo reitera. L’applicazione dell’algoritmo di minimizzazione alle funzioni ξp e il successivo calcolo delle variazione non é sempre equivalente (dipende dall’algoritmo) alla minimizzazione della 5.11, ma viene comunque impiegata in quanto riduce i tempi di calcolo. La scelta dell’algoritmo di viene fatta sulla base dell’andamento della funzione d’errore E, se essa é nota; altrimenti, come nel nostro caso, sulla base di approssimazioni successive. Nel nostro caso sono stati testati tre diversi tipi di funzioni di aggiornamento dei pesi (vedi appendice A) valutando, dai risultati, quale fosse quello piú adatto alla risoluzione del problema. 88 Discriminazione γ/h per mezzo di una rete neurale artificiale 5.2 Analisi degli eventi di ARGO tramite ANN 5.2.1 SNNS (Stuttgart Neural Network Simulator) Per la simulazione delle reti neurali é stato utilizzato SNNS (Stuttgart Neural Network Simulator) funzionante su piattaforma Unix e sviluppato dall’Institute for Parallel and Distribuited High Performance Systems” (IPVR) presso l’Universitá di Stuttgart. Il vantaggio di SNNS é quello di essere uno strumento efficiente e flessibile per la simulazione e l’applicazione delle reti neurali. SNNS é costituito da 2 parti principali: 1) Il kernel del simulatore scritto in C; 2) l’interfaccia grafica X11R4 o X11R5. Il kernel opera sulla struttura interna delle reti ed esegue tutte le operazioni di apprendimento e memorizzazione. Esso puó essere utilizzato senza le altre parti come un programma in C integrato in altre applicazioni. SNNS supporta, inoltre, l’aggiunta di funzioni di attivazione definite dall’utente e procedure di apprendimento personalizzate introducibili come semplici programmi in C da integrare con il kernel. L’interfaccia grafica XGUI ( X Graphical User Interface) fornisce all’utente una rappresentazione bidimensionale o tridimensionale della rete e consente il monitoraggio ed il controllo delle procedure di apprendimento. In aggiunta, l’interfaccia bidimensionale é integrata ad un editor che puó essere utilizzato per creare, manipolare e visualizzare le reti. 5.2.2 Topologia utilizzata Una rete neurale é definita dalla sua topologia ovvero in base al numero, disposizione, tipo e connessioni dei neuroni. La rete che si é scelto di usare nel nostro caso é di tipo feedforward a strati completamente connessa formata da 8 neuroni di input, uno strato di 5 neuroni “nascosti” ed un solo neurone di output. Si é arrivati a questa struttura valutando i risultati raggiunti con diverse topologie (anche con piú strati di neuroni “hidden”) e tenendo presente che, aumentando il numero di neuroni, aumenta la dimensione dello spazio in cui é definita la funzione degli errori da minimizzare. Nel nostro caso, tenendo conto delle connessioni e dei neuroni, la 5.11 é una funzione a 85 variabili. L’input della rete neurale é, quindi, un vettore ip a 8 dimensioni i cui elementi, per ogni singolo evento, sono: 5.2.3 Procedura di addestramento della rete 89 Figura 5.5: Componenti di SNNS: simulation kernel, interfaccia grafica xgui, batchman e compilatore snns2c • il numero di hit dell’evento (nhit); • il rapporto xcube /ycube . • gli esponenti multifrattali τ (4), τ (6), τ (8); • gli esponenti di wavelet β(4), β(6), β(8). Come giá detto in precedenza, l’osservabile nel caso di ARGO non é l’energia, ma il numero di hit; perció, si é scelto di utilizzarlo come ulteriore informazione per l’addestramento della rete. Inoltre, ribadiamo che, data la dipendenza lineare osservata di τ e i β da q, sarebbe stato inutile usare piú di 3 valori per ognuno dei 2 esponenti. Il vettore di output é invece ad una sola dimensione ed é definito come: 1 per i γ op = (5.12) 0 per i protoni 5.2.3 Procedura di addestramento della rete I pesi vengono variati in fase di addestramento allo scopo di trovare una funzione che faccia un mapping degli eventi (incogniti) in modo esatto. Come funzione di attivazione dei neuroni é stata scelta la funzione logistica data dalla 5.7 con soglia Θ = 1. 90 Discriminazione γ/h per mezzo di una rete neurale artificiale Figura 5.6: Finestra di SNNS in cui é possibile vedere la topologia della rete con tutte le connessioni, in questo caso vi é rappresentata la risposta della rete, dopo l’addestramento, per un evento da γ. Le diverse colorazioni dei neuroni indicano il diverso stato di attivazione. Per l’apprendimento é stato usato l’algoritmo RProp (vedi appendice A), questo metodo di minimizzazione locale é in assoluto quello a piú rapida convergenza. In tabella 5.2 vengono riportate le caratteristiche della rete insieme con i valori dei parametri utilizzati per addestrarla. Il parametro α é detto “weight-decay” e determina la relazione tra Topologia della rete 8−4−1 Valore iniziale di ∆ij 0.6 Valore limite dell’aggiornamento ∆ij 50.0 Weight-decay α 3.0 η− 0.5 η+ 1.2 Pesi iniziali (presi casualmente) [−0.1, 0.1] Tabella 5.2: Parametri della rete neurale. 5.2.3 Procedura di addestramento della rete 91 l’errore dell’output della rete e la riduzione dei pesi nella procedura di minimizzazione. L’addestramento della rete é stato effettuato separatamente nelle 5 finestre di molteplicitá definite nel capitolo 4 in quanto si vogliono ottenere differenti valori del parametro di discriminazione Q nei diversi intervalli. Innanzitutto, si é cercato di valutare quanti cicli di addestramento fossero sufficienti per considerare terminata la procedura di apprendimento. In figura 5.7 vengono mostrate sia la frazione di γ riconosciuti sia quella di contaminazione dei protoni, per la stessa rete, in funzione del numero di cicli di addestramento. Per fare ció si é fissato un taglio sul valore di output della rete pari a Cout = 0.7. Dopo circa 2000 cicli di addestramento i 2 valori raggiungono un plateau, anche se si notano delle oscillazioni intorno al punto di equilibrio. La scelta finale é stata di effettuare 5000 cicli di addestramento tenendo conto che anche il valore dell’errore globale E (dato da 5.11) non cambiava apprezzabilmente all’aumentare del numero di cicli. L’ampiezza delle oscillazioni nei valori trovati, visibile in figura 5.7, potrebbe essere utilizzata Figura 5.7: Frazione di sciami da γ (quadratini) riconosciuti e contaminazione di protoni (triangolini) con un taglio sull’output della rete neurale C out = 0.7. Dopo ∼ 2000 cicli di addestramento il valore inizia ad oscillare intorno ad un valore stabile. La figura in questione si riferisce ad eventi nella finestra compresa tra 500 hits e 800 hits. 92 Discriminazione γ/h per mezzo di una rete neurale artificiale per cercare di dare una stima dell’errore che si commette nel valutare il parametro Q. Poiché le incertezze sui due termini potrebbero essere correlate, una valutazione dell’errore su Q, fatta in questo modo, potrebbe essere errata; si é preferito, quindi, utilizzare un altro metodo. Si é addestrata la rete piú volte usando lo stesso set di eventi e lo stesso numero di cicli di apprendimento (5000). Analizzando le varie reti su lo stesso campione di dati, si é ricavato il valore di Q medio ed il relativo errore. Ricordiamo che Q, definito dall’equazione 2.3, é dato dal rapporto tra la frazione di gamma riconosciuti εγ e la radice quadrata della frazione di contaminazione da protoni (1 − εp ). La scelta del valore di Cout é stata fatta in modo da selezionare quello che massimizzava il valor medio di Q corrispondente (vedi figura 5.8). Dalla diversitá nei valori trovati nelle stesse condizioni, si é stimata l’entitá dell’indeterminazione su Q, ottenendo errori relativi compresi tra il 2.4% e il 10% (vedi tabella 5.4). Nel seguito dell’analisi ci si riferirá a tale stima ogni volta che si parlerá di errore su Q. Figura 5.8: Valori di Q, della frazione di gamma riconosciuti ε γ e della frazione di contaminazione da protoni (1 − εp ) in riferimento ad eventi nell’intervallo di molteplicitá compreso tra 500 hits e 800 hits. Analoghi andamenti si ottengono per gli altri intervalli di molteplicitá. 5.3 Analisi dei risultati 93 intervallo di molteplicitá eventi di training eventi di training (nhit) (γ) (p) 50 ÷ 100 6655 3860 100 ÷ 500 11602 7301 500 ÷ 800 2585 1651 500 ÷ 1500 3097 1970 1500 ÷ 6000 4845 3067 Tabella 5.3: Suddivisione degli eventi da γ utilizzati per addestrare le reti nelle diverse finestre di molteplicitá. 5.3 Analisi dei risultati Come giá detto, si sono suddivisi gli sciami simulati in 5 finestre di molteplicitá e, con le quantitá calcolate nel capitolo 4, si sono addestrate 5 diverse reti, aventi la stessa topologia. Questo é servito ad ottimizzare la risposta della rete nell’intervallo di molteplicitá desiderato. Nella tabella 5.3 viene riportato il numero di eventi usato per addestrare la rete nei cinque intervalli. Non sono stati utilizzati tutti gli eventi a disposizione, in quanto una parte é servita come set di validazione per la rete. Gli eventi di validazione servono a controllare la risposta della rete, dopo un certo numero di cicli su eventi non di “training”, ed eventualmente fermare l’addestramento se l’errore sull’output, riferito a tale set, risulta inferiore ad una certa soglia. Questo é necessario per evitare un irrigidimento della risposta della rete dovuta alle troppe iterazioni sul set di addestramento con una conseguente perdita della sua capacitá di generalizzare. Per questa procedura sono stati utilizzati 100 eventi da γ e 100 da protone in ogni intervallo di molteplicitá; con essi SNNS controllava la risposta delle reti ogni 10 epoche di addestramento. Dopo averle addestrate, le reti sono state testate su pacchetti da 400 eventi (200 sciami da γ e 200 da protone) diversi da quelli usati per la procedura di apprendimento e validazione (i risultati delle procedure di test sono mostrati in figura 5.9). Un modulo scritto in C++ é servito a calcolare il valore di Q massimo, l’errore ad esso associato ed il valore di Cout in ognuna delle 5 finestre di molteplicitá secondo i criteri illustrati nel paragrafo precedente. Come si puó vedere in tabella 5.4 il valore massimo di Q si ottiene nella finestra di molteplicitá 500 ÷ 800 hits, corrispondente ad una energia media dei γ di ∼3 T eV , dove le immagini degli sciami sono ricche di dettagli. Analizzando la 94 Discriminazione γ/h per mezzo di una rete neurale artificiale Figura 5.9: Output della rete Cout nelle cinque finestre di molteplicitá per sciami iniziati da γ (linea continua) e per sciami da protone (linea tratteggiata). 5.3 Analisi dei risultati 95 nhits < Eγ > Cout < εγ > < εp > <Q> 50 ÷ 100 0.5 T eV 0.71 0.82 ± 0.01 0.58 ± 0.01 1.28 ± 0.01 100 ÷ 500 1.1 T eV 0.67 0.81 ± 0.02 0.67 ± 0.02 1.42 ± 0.02 500 ÷ 800 2.9 T eV 0.87 0.66 ± 0.04 0.89 ± 0.01 2.01 ± 0.10 800 ÷ 1500 4.6 T eV 0.83 0.78 ± 0.04 0.80 ± 0.02 1.78 ± 0.07 1500 ÷ 6000 11.3 T eV 0.83 0.79 ± 0.04 0.80 ± 0.02 1.78 ± 0.06 Tabella 5.4: Schema riassuntivo dei valori dei tagli sull’output C out , delle efficienze di riconoscimento < εγ > e < εp > e del parametro di discriminazione < Q > nelle 5 finestre di molteplicitá selezionate. situazione nei 2 intervalli di molteplicitá piú alti, si osserva un abbassamento del valore di Q che é giustificato se si considera che l’aumento della densitá di particelle rende difficile isolare le sottostrutture presenti nell’immagine degli sciami adronici e, quindi, separare il segnale dal fondo. Figura 5.10: Valore di Q in funzione dell’energia media < E γ > corrispondente ai 5 intervalli di molteplicitá studiati. Le barre d’errore sull’asse delle x sono le larghezze delle distriduzioni di energia dei fotoni nella corrispondente finestra di molteplicitá. 96 Discriminazione γ/h per mezzo di una rete neurale artificiale I risultati trovati con questa analisi sono analoghi a quelli ottenuti nell’ambito dell’esperimento HEGRA[44] nel quale in aggiunta all’analisi multiscala anche i parametri di Hillas. Ció é molto confortante se si considera che l’esperimento HEGRA utilizza un telescopio Čerenkov in grado di campionare uno sciame durante tutto il suo sviluppo in aria. ARGO, invece, vede una sola sezione dello sciame ma, grazie al metodo da noi trovato si riesce ad ovviare a ció ottenendo un fattore di reiezione del fondo molto alto. Nel prossimo paragrafo si mostrerá come un tale valore di Q possa influenzare positivamente lo studio di una data sorgente ed aumentare la capacitá dei scoperta di ARGO-YBJ. 5.4 Aumento della sensibilitá del rivelatore U fattore molto importante nella astronomia γ é la sensibilitá ad una data sorgente. Se si considera il numero di dati raccolti in una data direzione, la sensibilitá dell’apparato puó essere stimata, in prima approssimazione, dal rapporto tra il flusso dei gamma e le fluttuazioni del fondo, dato dagli sciami adronici. Con la nostra analisi e l’ausilio delle reti neurali siamo riusciti a sopprimere il fondo di un fattore (1 − εp ), mentre il segnale dato dagli sciami fotonici é attenuato di un fattore εγ . Il rapporto richiesto é quindi dato da: p nγ φγ εγ S'√ ∝p ·p · Aef f T np 1 − εp φp (5.13) dove T é il tempo per cui la sorgente viene osservata, Aef f é l’area efficace del rivelatore (vedi capitolo 2) e φγ e φp sono i flussi della sorgente e del fondo isotropo. Questo corrisponde a dire che: S(T, φγ , Q) ' S◦ · Q (5.14) dove S◦ = S(T, φγ , Q = 1). Con il nostro risultato Q ' 2 (vedi tabella 5.4) troviamo un valore della sensibilitá che é circa il doppio di quello che si ottiene con il solo puntamento della sorgente. Invertendo l’espressione 5.13, si trova che, fissata la sensibilitá con cui si vuol vedere una data sorgente, un aumento del fattore Q corrisponde ad una diminuzione del tempo di presa dati definito da: T (S, φγ , Q) ' 1 · T◦ Q2 (5.15) 5.4 Aumento della sensibilitá del rivelatore 97 con T◦ = T (S, φmin γ , Q = 1). Se si considera il valore Q = 2.01 che é il piú alto da noi ottenuto (vedi tabella 5.4), si trova una diminuzione del tempo di osservazione di un fattore ∼ 4, mentre con il peggiore dei risultati (Q = 1.28) si ottiene un tempo di osservazione T (1.28) ' 0.6 · T (1). Se, invece, fissiamo il valore della sensibilitá voluta ed il tempo di presa dati, dalla 5.13 si puó notare come un valore di Q superiore all’unitá comporti una diminuzione del flusso minimo osservabile: φmin γ (S, T, Q) = 1 · φ◦ (Q) Q (5.16) con φ◦ (Q) = φmin γ (S, T, Q = 1). Se si considera, ad esempio, la Crab, dalle stime della sensibilitá ottenute senza tenere conto del fattore di discriminazione Q, é stato calcolato che, per vederla con una sensibilitá di 5σ 5σ, é necessario un tempo di presa dati TCrab (Q = 1) ' 120 giorni, per eventi con Nh ≥ 100 (vedi tabella 2.2). Ció significa che, applicando la tecnica sviluppata nell’ambito di questa tesi, il tempo di presa dati necessario ad osservare la Crab con la stessa sensibilitá 5σ diventa TCrab (Q = 2) ' 30 giorni. In definitiva, l’utilizzo dell’analisi multiscala e del momento terzo, con l’ausilio delle reti neurali, abbassa il tempo di osservazione necessario a rivelare una sorgente di raggi γ aumentando notevolmente la possibilitá di scoperta di nuovi siti di emissione. 98 Discriminazione γ/h per mezzo di una rete neurale artificiale Conclusioni I risultati cui si é pervenuti nel capitolo 5 dimostrano che l’analisi delle immagini degli sciami, attraverso lo studio delle loro caratteristiche frattali e della forma che esse assumono, permette di individuare, con l’ausilio delle reti neurali, delle differenze intrinseche tra gli sciami iniziati da fotone e quelli aventi come particella primaria un adrone. Dalla sola analisi dell’immagine dello sciame fornita da ARGO, si sono ottenuti dei valori del parametro di qualitá Q (vedi tabella 5.4) confrontabili con quelli ricavati nell’ambito di esperimenti che utilizzano telescopi Čerenkov. In particolare, i risultati ottenuti nell’ambito di questa tesi sono confrontabili con quelli che vengono dall’analisi multifrattale e di wavelet applicate all’esperimento HEGRA[44]. Si puó capire l’importanza di un tale risultato se si pensa che HEGRA, utilizzando un telescopio Čerenkov, effettua un campionamento dello sciame lungo tutto il suo sviluppo, mentre ARGO ne vede solo una sezione. Se si considera la regione di energia intorno a ∼ 1 T eV , dove l’impiego delle tecniche descritte in questa tesi produce il miglior valore di Q ' 2, si hanno tre importantissime conseguenze se si tiene conto che: a. fissato il tempo di osservazione ed il flusso minimo che si vuole rivelare, si ha un aumento della sensibilitá S(Q) = Q · S(Q = 1); b. fissata la sensibilitá con cui si vuole osservare una sorgente ed il flusso mimimo che si vuol rivelare, si ottiene una diminuzione del tempo di presa dati necessario a ció T (Q) = Q12 · T (Q = 1); c. fissata la sensibilitá che si vuole ottenere ed il tempo di presa dati, il 1 min flusso minimo osservabile diventa φmin γ (Q) = Q · φγ (Q = 1). Si fa presente che, in questa tesi, la risposta della rete e dei 3 parametri suddetti é stata testata su sciami simulati posti al centro dell’apparato e aventi una direzione di arrivo con angolo compreso tra 0◦ e 15◦ . Sará quindi 100 Conclusioni necessario testare il metodo su sciami con maggiore inclinazione e diverse posizioni. In linea di principio, non vi é nessuna controindicazione ad estendere l’analisi a casi piú generali in quanto essa non richiede né la conoscenza del centro dello sciame né dell’angolo di impatto sul rivelatore. Sará, dunque, indispensabile in futuro generalizzare lo studio fin qui affrontato al fine di utilizzare questa tecnica per l’analisi dei dati reali che, nella configurazione finale dell’apparato, inizieranno ad arrivare nel 2005 quando la costruzione di ARGO-YBJ sará ultimata. Appendice A Algoritmi di addestramento di una rete neurale A.1 BackPropagation Il piú famoso algoritmo di apprendimento é il BackPropagation introdotto nel 1986 da Rumelhart e McClelland. La regola di aggiornamento dei pesi, anche detta “generalized delta-rule”, é data da: ∆wij = η δj oi δj dove: = 0 fj (netj )(tj − oj ) fj0 (netj ) P k δk wjk se l’unitá j é di tipo output se l’unitá j é di tipo hidden η é una costante detta fattore da apprendimento; δj é l’errore dell’unitá j-esima; tj é l’output teorico dell’unitá j-esima; oj é l’output dell’unitá i-esima (precedente alla j-esima); (A.1) 102 Appendice A fj0 é la derivata di f funzione di attivazione; i é l’indice riferito all’unitá precedente a quella corrente j con peso wij tra i e j; j é l’indice riferito all’unitá corrente; k é l’indice riferito all’unitá successiva a quella corrente j con peso wjk tra j e k. Nel caso in cui la funzione di output fout non sia l’identitá, la situazione é 0 0 piú complessa e si ha che f 0 ≡ fout · fact . Vi é, inoltre, un’altra variante dell’algoritmo detto BackpropMomentum in cui la regola di aggiornamento dei pesi é data da: ∆wij = ηδj oi + µ∆wij (t) δj = 0 fj (netj + c)(tj − oj ) fj0 (netj + c) P k δk wjk se l’unitá j é di tipo output (A.2) se l’unitá j é di tipo hidden dove µ e c sono due valori costanti detti rispettivamente momento e ”flat-spot elimination value”. A.2 QuickProp Questo algoritmo, ideato da Fahlman nel 1988, assume che la superficie degli errori possa essere localmente approssimata da una funzione quadratica. Ad ogni passo, l’algoritmo sposta i pesi dalla posizione corrente al minimo della forma quadratica. Dopo aver valutato il gradiente della funzione d’errore, i pesi vengono spostati verso il minimo della funzione secondo: ∆wij (t + 1) = − ∂e ∂wij ∂e ∂wij |t+1 ∆wij (t) ∂e |t+1 − ∂w |t ij (A.3) Nel caso in cui il denominatore della A.3 sia zero, per un dato peso, si pone lo spostamento uguale a zero. Rispetto ad altri algoritmi, il QuickProp ha una veloce convergenza in quanto permette rapidi spostamenti sulla superficie d’errore. Gli svantaggi derivano dal fatto che, invece di incontrare un minimo della forma quadratica, possiamo incorrere in un massimo. Quando ció accade puó essere utile utilizzare un altro algoritmo per evitare l’allontanamento dal minimo reale. Appendice A A.3 103 RProp RProp sta a significare Resilient Propagation ed é un metodo di minimizzazione locale. Il principio base dell’RProp é utilizzare, per ogni peso, un diverso valore dello spostamento. La dimensione della variazione dei pesi é determinata dal cosiddetto “update-value” ∆ij (t) secondo: ∂E (t) −∆ij (t) , se ∂wij > 0 ∂E (t) ∆wij (t) = <0 ∆ij (t) , se ∂w ij 0 , altrimenti (A.4) Il secondo passo é quello di determinare i nuovi valori ∆ij (t + 1) attraverso un processo noto come “sign-dependent adaptation. ∂E (t) ∂E (t+1) + >0 η ∆ij (t) , se ∂wij ∂wij (t) (t+1) ∂E ∂E ∆ij (t + 1) = (A.5) <0 η − ∆ij (t) , se ∂w ∂wij ij 0 , altrimenti dove 0 < η − < 1 < η + . In pratica, questa regola di adattamento funziona in tal modo: ogni volta che la derivata parziale del peso corrispondente wij cambia segno (il che sta ad indicare che l’ultimo aggiornamento é stato troppo grande e ci ha fatto oltrepassare il minimo), il valore di aggiornamento ∆ij (t) viene diminuito di un fattore η − ; se la derivata conserva il segno, il valore di aggiornamento viene, invece, accresciuto di un fattore η + per accelerare la convergenza nel minimo. Questo rende RProp in assoluto l’algoritmo di minimizzazione piú rapido. 104 Appendice A Bibliografia [1] Aharonian F., Drury L., Volk H., Astronomy and Astrophysics,285, 645, (1994). [2] Alexandreas D.E., Nucl. Instrum. Methods Phys. Res A, 311, 350. [3] ARGO Collaboration, Proposal of the ARGO experiment, (1996). [4] ARGO Collaboration, Addendum to the ARGO Proposal, (1998). [5] Begelman, M.C., R.D. Blandford, e M.J. Rees, Rev. Mod. Phys., 56, 255. [6] Bell A.R.,Mon. Not. Roy. Astron. Soc., 182 , 443, (1978). [7] Burnett T.H., Astrophy.J, 349, L25, (1990). [8] Carlson J.F. e Oppenheimer J.R., Physical Rev., 51, 1169, (1949). [9] Clark G.W., Physical Rev., 108, 450, (1957). [10] deJager O.C., A.K. Harding, Astrophy.J 396, 161, (1992). [11] Dermer C.D. e R. Schlickeiser, Astrophy.J 416, 458, (1993). [12] Dingus B. L., Catelli J. R., Schneid E. J., 25th ICRC Proc. 3, 30, (1997). [13] Fegan D.J., γ/hadron separation at TeV energies, J.Phys. G: Nucl. Part. Phys. 23, 1013-1060, (1997). [14] Fermi E.,Physical Rev., 1169, (1949). [15] Fesefeldt H., Report PITHA-85/02, RWTH Aachen, (1985). [16] Frank J., A. King e D. Raine, Accretion Power in Astrophisics, Cambridge University Press, Cambridge, (1992). [17] Gaisser T.K.,Cosmic Rays and particle physics., University Press, Cambridge (1990). 106 Bibliografia [18] Gaisser T.K., R.J. Protheroe, T. Stanev, Gamma-ray production in Supernova Remnants, Astr. Jou., 492, 219-227, (1998). [19] Goldreich P. e Julian W.H., Astrophys. J., 157, 839, (1969). [20] Halsey T.C., Jensen M.H., Kadanoff L.P, Procaccia I. e Shraiman B.I., Phys. Res A, 33, 1141, (1986). [21] Halzen F.,High-Energy Neutrino Astronomy: Science and first results, arXiv:astro-ph/0301143 v1, (2003). [22] Heck D. e Knapp J., Extensive Air Showers Simulation with CORSIKA: A User’s Guide v6.020, (1998) [23] Henri G., G. Pelletier, P.O. Petrucci e N. Renault, Astropart.Phys., (1999). [24] Hayakawa S. Cosmic ray physics Wiley Interscience, NY, (1969). [25] Honda M. et al., Physical Rev., D52, 4985, (1995). [26] Hermsen W., K.Bennett, J.B.G.M Bloemen, R. Buccheri, F.A. Jansen, A. Mastichiadis, H.A. Mayer-Hasselwander, M.E. Ozel, A.M.T. Pollock e A.W Strong, Astron. Astrophys., 175 141, (1987). [27] Linsley J.,20th International Cosmic Ray Conference, Nauka Moscow, Vol.2 p.442, 1987. [28] Levinson A. e R. Blandford, Jets in Extragalactic Radio Sources, H.J. Röser e K. Meisenheimer, New York (1991). [29] Longair M.S., High energy astrophysics, UniversityPress, Cambridge (1981). [30] Kirk J.G., A. Mastichiadis e W.Bednarek, Proceedings of the Heilderberg Workshop on Gamma-Ray Emitting AGN 1996, Max-Planck Institut Für Kernphysik, Heidelberg, (1997). [31] Mandelbrot B.B, J. Fluid Mech., 62, 331, (1974). [32] Manhnheim K., Astron.Astrophys., 269, 67, (1993). [33] Maraschi L., G. Ghisellini e A. Celotti, Astophys.J., 397, L5, 1992. [34] Meyer H. TeV gamma ray astronomy, Nucl.Phys.B, 70, 391-398, (1999). [35] Miller R.S., Westerhoff S., Conceptual design of a next generation all-sky γ-ray telescope operating at TeV energies, Astropart.Phys., 11, 379-393, (1996). Bibliografia 107 [36] Muzy J.F., Bacry E. e Arneodo A., J. Stat. Phys., 70, 635, (1993). [37] Muzy J.F., Bacry E. e Arneodo A., Phys. Rev. E, 47, 875, (1993). [38] Naito T. e Takahara, Astophys.J., 20, 477, (1994). [39] Padovani P., Very High Energy Phenomena in the Universe: Proceedings of the XXXII Rencontres de Moriond, Editions Frontieres, Gif-surYvette, France (1997). [40] Perkins D., Introduction to High Energy Physics. sec. ed., AddisonWesley, Massachussets, (1982). [41] Protheroe R.J., A. Mastichiadis e C.D. Dermer, Astropart.Phys., 1, 113, (1992). [42] Protheroe R.J., Origin and Propagation of the Highest Energy Cosmic Rays, arXiv:astro-ph/9612212v1. [43] Kalmykov N.N. e Ostapchenko S.S. e A.I. Pavlov, Nucl. Phys. B (Proc, Suppl.) 52B, 17, (1997). [44] Schäfer B.M., Hofmann W., Lampeitl H., Hemberger M., Particle identification by multifractal parameters in γ-astronomy with the HEGRA-Cherenkov-telescopes, Nucl. Instr. & Meth. in Phys. Res. A, 465, (2001). [45] Shapiro S.A., e S.A. Teukolsky, Black Holes, White Dwarfs, and Neutron Stars: The Physics of Compact Objects, Wiley , New York (1983). [46] Sikora M.C., M.C. Begelman e M.J. Rees, Astophys.J. 421, 153, (1994). [47] Sokolosky P., Introduction to Ultrahigh Energy Cosmic Ray Physics, Addison-Wesley, (1989). [48] Thompson, D. J., et al., Astrophys. J., Suppl. Ser.86, 629, (1993). 108 Ringraziamenti D esidero prima di tutto ringraziare il Dott. Ivan DE MITRI che, con la sua costante presenza e assoluta disponibilitá, ha reso questi ultimi otto mesi l’esperienza formativa piú importante della mia carriera universitaria. Desidero, inoltre, ringraziare tutto il gruppo 2 della sezione INFN di Lecce, in particolare la Dott.sa Carla BLEVE e il Dott. Daniele MARTELLO per i loro preziosi suggerimenti. Un particolare ringraziamento va alla mia famiglia e ad Ilaria (la mia splendida professoressa di italiano), le uniche persone che hanno avuto fiducia nelle mie capacitá nei momenti piú brutti della mia vita. Un grazie sincero va ai miei “amici di sempre”, agli amici della “Saletta Laureandi” e in particolare, a Martino (Leo), Gianfranco (Janfranc) e Karen per avermi fatto credere, con le loro parole, di essere un “genio”, anche quando mi sentivo Homer Simpson. Infine il mio pensiero non puó non rivolgersi all’Arma dei Carabinieri dalla quale ho imparato lo spirito di sacrificio che mi mancava.