universit`a degli studi di lecce

Transcript

UNIVERSITÀ DEGLI STUDI DI LECCE
FACOLTÀ DI SCIENZE MM. FF. NN.
Corso di Laurea in Fisica
TESI DI LAUREA
Studio della discriminazione γ/adroni
nell’esperimento ARGO-YBJ
Relatore:
Dott. Ivan DE MITRI
Laureando:
Francesco SALAMIDA
Anno Accademico 2001-2002
ii
Sal, dobbiamo andare e non fermarci mai finché non arriviamo.
Per andare dove, amico ?
Non lo so, ma dobbiamo andare.
Jack Kerouac - Sulla Strada
iv
Indice
Introduzione
vii
1 Astronomia dei raggi γ di alta energia
1.1 Principali fenomeni di produzione dei raggi γ
1.1.1 Pulsar . . . . . . . . . . . . . . . . .
1.1.2 Resti di Supernovae (SNR) . . . . . .
1.1.3 Nubi Molecolari . . . . . . . . . . . .
1.1.4 Nuclei Galattici Attivi (AGN) . . . .
1.1.5 Gamma Ray Burst (GRB) . . . . . .
1.2 Tecniche sperimentali della γ astronomia alle
1.2.1 Rivelatori satellitari . . . . . . . . . .
1.2.2 Rivelatori ground-based . . . . . . .
.
.
.
.
.
.
.
.
.
1
4
4
6
7
8
11
12
13
16
.
.
.
.
.
.
.
.
.
.
23
25
27
27
28
32
34
34
36
37
39
.
.
.
.
43
43
44
45
46
di alta energia
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
alte energie . .
. . . . . . . . .
. . . . . . . . .
2 L’esperimento ARGO-YBJ
2.1 Obiettivi dell’esperimento . . . . . . . . . . . . . .
2.2 L’apparato . . . . . . . . . . . . . . . . . . . . . . .
2.2.1 La struttura . . . . . . . . . . . . . . . . . .
2.2.2 Le camere ad elettrodi piani resistivi (RPC)
2.3 Sensibilitá di ARGO alla γ astronomia . . . . . . .
2.3.1 Osservazione della Crab . . . . . . . . . . .
2.3.2 SNR . . . . . . . . . . . . . . . . . . . . . .
2.3.3 Nubi molecolari . . . . . . . . . . . . . . . .
2.3.4 Sorgenti extragalattiche (AGN) . . . . . . .
2.3.5 GRB . . . . . . . . . . . . . . . . . . . . . .
3 Studio degli sciami atmosferici ed analisi
3.1 Sciami atmosferici . . . . . . . . . . . . .
3.1.1 Sciami elettromagnetici . . . . . .
3.1.2 Sciami adronici . . . . . . . . . .
3.2 Modelli analitici . . . . . . . . . . . . . .
v
.
.
.
.
.
.
.
.
.
.
multiscala
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
vi
Indice
.
.
.
.
.
.
.
.
.
48
50
51
53
54
55
57
59
59
.
.
.
.
.
.
61
62
64
64
66
71
76
5 Discriminazione γ/h per mezzo di una rete neurale artificiale
5.1 Le reti neurali . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.1.1 Neuroni . . . . . . . . . . . . . . . . . . . . . . . . . .
5.1.2 Topologia . . . . . . . . . . . . . . . . . . . . . . . . .
5.1.3 Addestramento . . . . . . . . . . . . . . . . . . . . . .
5.2 Analisi degli eventi di ARGO tramite ANN . . . . . . . . . . .
5.2.1 SNNS (Stuttgart Neural Network Simulator) . . . . . .
5.2.2 Topologia utilizzata . . . . . . . . . . . . . . . . . . . .
5.2.3 Procedura di addestramento della rete . . . . . . . . .
5.3 Analisi dei risultati . . . . . . . . . . . . . . . . . . . . . . . .
5.4 Aumento della sensibilitá del rivelatore . . . . . . . . . . . . .
79
81
83
84
86
88
88
88
89
93
96
Conclusioni
99
3.3
3.4
3.5
3.2.1 Modello di Heitler . . . . . . . . . . . . . . . .
3.2.2 Equazioni di trasporto . . . . . . . . . . . . .
Simulazioni Monte Carlo . . . . . . . . . . . . . . . .
Analisi multiscala . . . . . . . . . . . . . . . . . . . .
3.4.1 Analisi multifrattale standard . . . . . . . . .
3.4.2 Approccio differenziale all’analisi multifrattale
3.4.3 Analisi di wavelet . . . . . . . . . . . . . . . .
3.4.4 Sistemi a piú dimensioni . . . . . . . . . . . .
Skewness . . . . . . . . . . . . . . . . . . . . . . . . .
4 Simulazione degli eventi ed analisi multiscala
4.1 Simulazione degli sciami . . . . . . . . . . . .
4.2 Analisi multiscala . . . . . . . . . . . . . . . .
4.2.1 Schematizzazione dell’apparato . . . .
4.2.2 Analisi del singolo evento . . . . . . . .
4.2.3 Andamenti di τ (q) e β(q) . . . . . . .
4.3 Studio della simmetria dell’immagine . . . . .
A Algoritmi di addestramento
A.1 BackPropagation . . . . .
A.2 QuickProp . . . . . . . . .
A.3 RProp . . . . . . . . . . .
Bibliografia
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
di una rete neurale
. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
101
. 101
. 102
. 103
105
Introduzione
La fisica
dei raggi cosmici si propone di studiare i fenomeni che
avvengono nell’Universo attraverso l’esame delle proprietá delle particelle che
arrivano sulla Terra. Un mezzo molto importante per studiare tali fenomeni
é fornito dalla astronomia γ, ovvero dalla osservazione dei fotoni di energia
superiore a ∼ 1 M eV . Infatti, i raggi γ, a differenza delle particelle cariche,
non vengono deviati dai campi magnetici presenti nell’Universo e, in quanto
tali, forniscono chiare indicazioni sulla posizione dei siti di produzione dei
raggi cosmici e sui meccanismi di accelerazione.
Le prime osservazioni sono state effettuate con telescopi montati su satellite;
se, peró, si vogliono rivelare fotoni con energia superiore ai 100 GeV , i
satelliti non sono adatti in quanto con l’aumentare dell’energia diminuisce
il flusso di fotoni associato. Sembra, dunque, necessario utilizzare dispositivi
sperimentali molto estesi collocati al suolo; inoltre, se si vuole evitare un
eccessivo assorbimento della radiazione da parte dell’atmosfera ed abbassare
la soglia energetica, tali apparati vanno collocati ad una quota superiore
ai 4000 m. In questo tipo di ottica si pone l’esperimento ARGO-YBJ
nell’ambito della cui collaborazione é stata svolta questa tesi. ARGO é frutto
di un progetto italo-cinese ed é in fase di costruzione presso il laboratorio
di raggi cosmici situato a Yanbajing (Lhasa, Tibet, Repubblica Popolare
Cinese). Esso é un dispositivo a copertura totale d’area posto ad una quota
di ∼ 4300 m e sará formato da 1848 RPC con una superficie totale di
∼ 6000 m2 . Questa configurazione permetterá di essere sensibili a fotoni
primari di energia compresa tra ∼ 100 GeV e ∼ 50 T eV .
Il principale problema di un esperimento ground-based quale ARGO deriva
dal fatto che le particelle primarie, interagendo con l’atmosfera, producono
sciami di particelle secondarie che si distribuiscono al suolo su aree dell’ordine
di alcuni km2 . Per fare astronomia γ é necessario distinguere tra gli
sciami aventi come particella primaria un fotone e gli eventi di fondo
(sciami atmosferici iniziati da adroni). Poiché il flusso dei raggi γ é φγ ∼
10−3 − 10−4 φC.R , il problema non risulta per nulla banale. A questo scopo
viii
Introduzione
é importante che l’apparato sperimentale sia dotato di una sensibilitá molto
grande, ossia che sia capace di distinguere tra segnale (raggi γ) e fondo
(raggi cosmici) andando a cercare eccessi di eventi in una data porzione di
cielo. Questa caratteristica dipende dalla risoluzione angolare dell’apparato
che viene direttamente influenzata dalla risoluzione temporale dei rivelatori
utilizzati (vedi capitolo 1).
La reiezione del fondo puó essere ulteriormente aumentata cercando di
separare gli eventi generati da γ e quelli da protone classificandoli in base
alle differenze intrinseche nelle immagini degli sciami viste da ARGO. Negli
esperimenti che misurano la luce Čerenkov prodotta dagli sciami atmosferici,
tale classificazione viene tipicamente fatta, con ottimi risultati, studiando la
forma dell’immagine dello sciame rivelato. In tal modo si ottiene, come si
spiegherá in seguito, un aumento della sensibilitá e la conseguente riduzione
del tempo di presa dati necessario a vedere una determinata sorgente.
Poiché i rivelatori a copertura totale come ARGO sono di nuova generazione,
non esiste una tecnica consolidata di classificazione degli sciami che permetta
di discriminare il tipo di primario. L’obiettivo di questa tesi é quello di
supplire a questa mancanza studiando le caratteristiche dell’immagine degli
sciami attraverso delle simulazioni che riproducano la risposta di ARGO
ai due differenti tipi di primario. A tale scopo si utilizzerá una tecnica
mai usata per uno studio di questo tipo, cioé l’analisi multifrattale e di
wavelet. Il vantaggio di tali tecniche é di non richiedere alcuna ricostruzione
dell’evento; inoltre, questo tipo di analisi puó essere facilmente estendibile
ad altri apparati a copertura totale d’area.
In particolare, nel capitolo 1 si fará una rassegna sui principali fenomeni
legati alla produzione di raggi γ con uno sguardo alle tecniche sperimentali
fino ad oggi impiegate per questo tipo di studi. Nel capitolo 2 si descriverá
l’esperimento ARGO-YBJ e si esploreranno le sue capacitá in relazione alla
γ astronomia. Il capitolo 3 tratterá brevemente i modelli di sviluppo degli
sciami nell’atmosfera introducendo la necessitá di utilizzo delle simulazioni
Monte Carlo come metodo di indagine privilegiata; inoltre, vi verranno
introdotte le variabili utilizzate per l’analisi multiscala. Il quarto capitolo
sará interamente dedicato alla descrizione delle simulazioni effettuate ed al
tentativo di caratterizzare il tipo di primario dei vari eventi attraverso lo
studio degli andamenti dei momenti multifrattali, del momento di wavelet e di
altri parametri. L’ultimo capitolo riguarderá la descrizione della rete neurale
utilizzata per aumentare il potere di separazione tra sciami da fotone e da
protone; vi verrano, inoltre, descritte le implicazioni sull’esperimento ARGOYBJ dovute ai risultati trovati. Infine, nell’appendice A sono brevemente
descritti gli algoritmi di addestramento delle reti neurali artificiali da noi
utilizzati.
Capitolo 1
Astronomia dei raggi γ di alta
energia
La
radiazione cosmica incidente sull’atmosfera é principalmente
composta da protoni (∼ 90 %), particelle α (∼ 9 %) e altri nuclei pesanti (∼
1 %), inoltre è presente una piccola frazione di elettroni (e/p ' 1%) e fotoni
(γ/p ' 0.1 %). L’abbondanza e la tipologia degli elementi presenti nei raggi
cosmici varia, durante il cammino dalla sorgente alla Terra, a causa delle
interazioni con il mezzo interstellare. Elementi quali idrogeno, elio, ferro e
carbonio sono detti primari perchè prodotti in grande quantità direttamente
nelle sorgenti, altri come ad esempio boro, potassio, titanio e vanadio sono
detti secondari in quanto prodotti per spallazione da raggi cosmici primari.
Anche se i meccanismi e i siti di produzione dei raggi cosmici sono ancora
oggi questioni non completamente chiuse, è chiaro che la parte piú consistente
di essi proviene da regioni della nostra Galassia lontane dal Sistema Solare
e solo una piccola frazione dal Sole, mentre la componente di alta energia
potrebbe avere un’origine extragalattica.
Lo spettro energetico differenziale osservato dei raggi cosmici può essere
rappresentato in modo soddisfacente da una legge a potenza:
N (E)dE = N0 · E −γ dE
(1.1)
dove E > 1 GeV per nucleone e 2.5 . γ . 3.0 e γ é detto indice spettrale.
Al primo tratto dello spettro (vedi figura 1.1), fino a 1015 eV, corrisponde
un γ ' 2.7, tra i 1015 eV e i 1016 eV si nota un cambiamento nella pendenza
noto come il “ginocchio” con γ ∼ 3.0. Il ginocchio coincide con una forte
riduzione del flusso che, a quelle energie, è dell’ordine di una particella per
2
Astronomia dei raggi γ di alta energia
Figura 1.1: Spettro energetico dei raggi cosmici per E > 1 GeV
m2 all’ anno. Questo fatto comporta difficoltà sperimentali quali i lunghi
tempi di presa dati e le grandi dimensioni dei rilevatori necessari ad ottenere
una statistica significativa. Nell’ultima parte dello spettro a ∼ 1019 eV vi è la
zona nota come “caviglia” caratterizzata da un flusso di 1 particella per km 2
all’ anno ed un valore di γ ∼ 2.5, anche se la scarsitá di dati non permette
una chiara valutazione dell’ indice spettrale in questa regione.
Il raggio di curvatura di una particella carica di carica Ze che si muove in
pc
1
un campo magnetico uniforme B é dato da ρ = ( Ze
) · Bc
. Data la presenza
del campo magnetico galattico con B ∼ 3 µG si ha che la direzione di
arrivo osservata per particelle cariche non puó essere un indicazione sincera
della posizione di una sorgente. Al contrario, i raggi γ, essendo neutri,
conservano l’informazione sulla loro provenienza, quindi, sebbene i fotoni
rappresentino una percentuale minima della radiazione cosmica, il loro studio
fornisce informazioni su:
• Sorgenti dei raggi cosmici.
• Meccanismi di accelerazione.
• Effetti di propagazione nel mezzo interstellare ed intergalattico.
3
Dal punto di vista sperimentale, lo studio dei raggi γ richiede l’uso di diversi
tipi di apparati di rivelazione per problemi legati alla diminuzione del flusso
con il crescere dell’energia. Per questo convenzionalmente il range energetico
viene suddiviso in intervalli (vedi tabella 1.1) associati alla particolare tecnica
di rivelazione ivi utilizzata. Questa classificazione non ha nessuna attinenza
con i meccanismi di produzione; infatti, la maggior parte delle sorgenti ha
uno spettro di emissione molto esteso, per cui lo studio di un particolare
oggetto richiede la combinazione di dati provenienti da apparati differenti.
Al fine di avere una visione globale del problema che si vuole affrontare, nel
resto di questo capitolo verranno trattati i principali fenomeni legati alla
produzione dei raggi γ di alta energia e le tecniche utilizzate per la loro
rivelazione.
RANGE
NOMENCLATURA
ENERGETICO
TECNICA DI
PIATTAFORMA DI
RIVELAZIONE
OSSERVAZIONE
0.51-10 MeV
Low(LE)
Scintillatori
Satellite
10-30MeV
Medium(ME)
Telescopi Compton
Satellite
30MeV-10GeV
High(HE)
Calorimetri
Satellite
100GeV-100TeV
VeryHigh(VHE)
Čerenkov, Air
Superficie
Shower Arrays
100TeV-100PeV
UltraHigh(UHE)
Air Shower
Superficie
Arrays
100PeV-100EeV
ExtremelyHigh
Air Shower
(EHE)
Arrays
Superficie
Tabella 1.1: Suddivisione dei raggi γ sulla base del tipo di apparato usato per
rivelarli.
4
1.1
Principali fenomeni di produzione dei
raggi γ di alta energia
1.1.1
Pulsar
Le Pulsars sono stelle di neutroni magnetizzate che ruotano con un periodo
che va da pochi millisecondi a qualche secondo generando un campo
magnetico molto intenso (∼ 1012 G). Sono gli oggetti stabili piú densi
dell’Universo infatti la loro massa massima é ∼ 3 M con un raggio di
∼ 10 km[45].
L’esperimento EGRET[48] (posto sul satellite Compton gamma Ray
Observatory lanciato nel 1991) ha rivelato che solo 6 delle 550 RadioPulsar
note sono sorgenti di raggi γ (vedi Tab.1.2). Le misure compiute finora
mostrano che l’emissione pulsata di gamma sia limitata a regioni al di sotto
dei 102 GeV.
Secondo gli attuali modelli teorici[19], il campo magnetico rotante genera un
campo elettrico abbastanza forte da rimuovere gli elettroni dalla superficie
della stella formando un plasma che circonda la stella. Al di sotto di un
valore del raggio per cui la velocitá del plasma é inferiore a quella della
luce vi é la regione nota come “light cylinder”; oltre tale regione inizia
quella detta di “Pulsar wind”. Questa regione termina con uno shock al
cui esterno vi é una regione nebulare(il disegno schematico di una Pulsar
é riportato in figura 1.2). All’interno del light cylinder le linee di campo
magnetico, a cui le particelle cariche sono legate, sono chiuse e quindi non
vi émissione di particelle. Viceversa all’esterno del light cylinder, dove le
linee di campo sono aperte, le particelle possono essere accelerate ed espulse
D(kpc) Lγ (erg·s−1 )
Pulsar
B(G)
γ
Crab
3.8·1012
2.0
3.9·1034
2.15
Vela
3.4·1012
0.5
1.7·1034
1.70
PSR B1704-44
3.1·1012
1.8
2.6·1034
1.72
PSR B1951+32
4.9·1011
2.5
1.4·1034
1.74
Geminga
1.6·1011
0.25
2.3·1033
1.50
PSR B1055-52
1.1·1012
1.5
9.3·1033
1.18
Tabella 1.2: Le 6 Pulsar rivelate da EGRET come sorgenti di raggi γ. L γ é la
luminositá nell’emissione, B é il campo magnetico, D é la distanza delle Pulsar
dalla Terra e γ l’indice spettrale
1.1.1 Pulsar
5
Figura 1.2: Rappresentazione schematica di una Pulsar. Il light cylinder é il
cerchio fuori dalla magnetosfera. Nella zona denominata “Nebula” vi é un plasma
di coppie e+ e−
dalla stella. Tali regioni si formano ai poli magnetici ed in prossimitá
del light cylinder e sono le responsabili dell’emissione pulsata di raggi γ.
Per quanto riguarda l’emissione continua di raggi γ, i risultati di EGRET
mostrano che solo due delle sei Pulsar in esame sono responsabili di γ
nella regione del TeV: Crab e PSR B170-44 che sono un particolare tipo
di Pulsar, detta “Plerion”1 . Della Crab si sa con certezza che é una sorgente
di VHE γ fino a ∼15 TeV, ma l’intensitá assoluta e la pendenza dello spettro
non sono ben definite; una misura di questi parametri é necessaria per la
scelta definitiva di un modello che spieghi l’emissione continua. Secondo
il modello SSC (Synchrotron Self-Compton) di deJager e Harding [10] gli
elettroni e i positroni vengono accelerati ad alte energie ed entrano nella
regione nebulare dove, spiraleggiando attorno alle linee di campo magnetico,
emettono radiazione di sincrotrone. In seguito, questi elettroni accelerano
altri fotoni presenti nella regione circostante attraverso la diffusione Compton
inversa fino ad energie dell’ordine del T eV .
1
Una Plerion é un residuo di supernova con una stella di neutroni al suo interno.
6
1.1.2
Resti di Supernovae (SNR)
Una supernova é un oggetto che si forma in seguito all’esplosione di una
stella. La luminositá dell’oggetto decresce esponenzialmente nel tempo ed
esso puó collassare in una stella di neutroni. Il 90% dell’energia rilasciata
(∼ 1051 erg) viene dissipata in energia cinetica del guscio della stella che si
espande ad una velocitá V ∼ 104 km s−1 nel mezzo interstellare; gli effetti di
questa espansione restano visibili per circa 103 − 104 anni dopo l’esplosione
e prendono il nome di “resti di supernovae” (SNR Supernova Renmants).
Sebbene non vi siano prove certe, gli SNR sembrano essere una delle poche
sorgenti galattiche in grado di accelerare i raggi cosmici fino a energie di
∼ 100 T eV . Il modello proposto é quello di accelerazione statistica di
Fermi[14].
Un oggetto di questo tipo é composto da tre zone:
• una regione interna costituita da gas caldo di particelle accelerate,
• una regione a ridosso dell’onda d’urto su cui la materia espulsa preme,
• una regione antistante all’onda in cui le particelle accelerate
comprimono il mezzo interstellare.
In seguito alla propagazione dell’onda d’urto dovuta all’esplosione della
stella, le particelle del mezzo interstellare, attraversando il fronte dello
Figura 1.3: Spettro di emissione dei fotoni VHE della nebulosa Crab misurato da
vari apparati sperimentali. La linea continua rappresente il flusso teorizzato dal
modello di deJager e Harding
1.1.3 Nubi Molecolari
7
shock, possono essere accelerate secondo il meccanismo di Fermi al primo
ordine[29]. La particella accelerata puó essere nuovamente raggiunta dallo
shock attraversarlo e ripetere il processo[6, 42].
Ció che rende straordinario questo modello é la possibilitá di predire
l’andamento a potenza dello spettro dei raggi cosmici solo attraverso
considerazioni sulle densitá delle tre regioni del SNR e del mezzo interstellare.
L’energia massima che le particelle possono raggiungere dipende dal
tempo trascorso all’interno della regione di accelerazione e, quindi, dalla
probabilitá di fuga della particella che é direttamente correlata con la densitá
dell’oggetto. La riduzione della densitá del SNR dovuta alla sua espansione
fa si che il meccanismo risulti efficiente per ∼ 1000 anni, fatto che si traduce
in un energia massima delle particelle accelerate di ∼ 100 TeV[17]. I raggi γ
vengono prodotti dai raggi cosmici attraverso due fenomeni:
i) bremsstrahlung o diffusione Compton inversa degli elettroni sui fotoni
del fondo della radiazione galattica e dei campi di radiazione della SNR
stessa.
ii) decadimento dei π 0 prodotti dalle interazioni dei nuclei con il gas della
SNR.
Due esempi di SNR nell’emisfero Nord sono: γCigni e IC433. Questi due
oggetti hanno permesso di misurare l’indice spettrale dando un buon accordo
con il modello teorico[18].
Recentemente, invece, CANGAROO ha rivelato un’emissione gamma ad
energie del TeV in SN1006 fatto che rappresenta una chiara conferma della
possibilitá di accelerare particelle ad E ∼TeV nelle SNR.
1.1.3
Nubi Molecolari
Le nubi molecolari sono solitamente situate nelle vicinanze di regioni con una
intensa attivitá stellare o formazione di stelle di massa elevata.
L’emissione γ da nubi molecolari é dovuta essenzialmente alle interazioni
tra elettroni e protoni cosmici con la materia (bremsstralung ed interazioni
nucleone-nucleone)ed in misura minore alle interazioni degli elettroni con
fotoni di bassa energia. Di particolare importanza é l’osservazione di raggi
γ con energie superiori ai 100 GeV in quanto fornisce un’evidenza della
presenza di protoni di alta energia all’interno delle nubi e, quindi, di sorgenti
associate alla regione centrale delle stesse. La rivelazione di emissione gamma
proveniente da nubi molecolari puó essere usata per lo studio della densitá
dei raggi cosmici e delle proprietá del mezzo interstellare.
Il flusso aspettato dei fotoni da una regione localizzata del cielo é:
φγ ∼ A · N (HI ) + 2 · A · N (H2 )
(1.2)
8
Regioni
M(105 M ) D(kpc)
Regioni
M(105 M ) D(kpc)
Taurus
0.3
0.14
ρ Ophiucus
0.3
0.16
Lupus
0.3
0.17
Aquila Rift
1.5
0.2
Lindblad Ring
1.6
0.3
Cloud B
0.4
0.3
Vul Rif
0.8
0.4
Cepheus
1.9
0.45
Cloud A
0.4
0.5
Cloud C
0.3
0.5
Orion A
1.6
0.5
Orion B
1.7
0.5
Cygnus Rif
8.6
0.7
Cygnus OB7
7.5
0.8
Tabella 1.3: Alcune nubi molecolari situate entro 1 kpc dalla Terra. M é la massa
delle nubi molecolari espressa in unita di 10 5 masse solari M e D la distanza in
kpc.
dove A é l’emissivitá dei raggi gamma attraverso l’idrogeno atomico, N(HI )
e N(H2 ) sono le densitá dell’idrogeno atomico e molecolare.
Quindi, nota la densitá della materia interstellare entro la nube da misure
nell’infrarosso e nel radio, si ricavano anche le densitá di HI e H2 da cui si
ottiene (vedi equazione 1.2) la densitá dei raggi cosmici nella nube.
1.1.4
Nuclei Galattici Attivi (AGN)
Gli AGN non sono altro che regioni centrali di alcune galassie (∼ 1%)
in cui hanno luogo fenomeni di straordinaria violenza a cui é associata
l’emissione di raggi cosmici e radiazione elettromagnetica. Dagli AGN rivelati
sperimentalmente si é trovato che:
i) Sono tutti oggetti appartenenti alla classe blazar2 contenente oggetti
quali BL Lacs e quasar altamente polarizzate.
ii) Lo spettro dei fotoni fino a 10 TeV é ben rappresentato da una legge a
potenza
dN
= A · E −γ
dE
(1.3)
con un indice spettrale γ ' 2.5[34].
iii) Molti AGN mostrano variabilitá nella banda γ su intervalli temporali
di giorni o mesi indicando che le sorgenti sono poco estese.
2
Le blazar sono sorgenti radio extragalattiche la cui direzione di emissione é rivolta
verso la Terra
1.1.4 Nuclei Galattici Attivi (AGN)
9
Figura 1.4: Riproduzione schematica di un AGN secondo il modello unificato di
Begelman
Un problema che si incontra spesso nello studio di questi oggetti é il
proliferare di diversi tipi di AGN3 , cosı́, nel 1984, é stata proposta teoria
unificata[5]. In queso modello gli AGN sono costituiti principalmente da
quattro regioni:
a) la regione centrale contenente un “buco nero supermassivo” con massa
M ∼ (107 − 1010 ) M e raggio di Schwarzschild rS ∼ 0.001pc.
b) Un sottile “disco di accrescimento” circondato da uno spesso anello di
materia che giace sul piano equatoriale.
c) Due “jets di particelle relativistiche” posti in posizione perpendicolare
al disco di accrescimento.
d) Vi sono, poi, nuvole di materia[5, 39] che circondano la regione centrale,
responsabili della presenza di linee di emissione nello spettro osservato.
In questo modello il motore centrale é alimentato dal disco di accrescimento
attraverso la variazione dell’energia potenziale gravitazionale della materia
che precipita nel buco nero. Il 10% circa della massa a riposo assorbita dal
buco nero viene riemessa sotto forma di radiazione[16, 45].
Gli AGN emettono radiazione su tutto lo spettro elettromagnetico dalle onde
3
quasars, Seyfert galaxies, (tipo I e II), radio-quiet e radio-loud galaxies, Blazars, BL
Lacs, etc.
10
radio ai raggi γ nel range del TeV. Dal disco di accrescimento viene emessa
radiazione infrarossa e raggi X, mentre dai jets provengono raggi γ e onde
radio.
Una menzione particolare spetta agli AGN di tipo BL Lacs4 : essi si
distinguono grazie all’assenza di linee di emissione. A tale fatto, peró, non
si é ancora data una spiegazione. In generale, si é d’accordo nell’affermare,
invece, che i fotoni nel range del T eV , provenienti dagli AGN, siano prodotti
nei jets, mentre non si é ancora certi sui meccanismi responsabili delle
emissioni.
I due tipi di modelli che cercano di dare una spiegazione sono:
• Modelli basati sulla diffusione Compton inversa[28] detti “leptonici”.
• Modelli PIC (“proton-initiated cascade”)[41, 32] detti “adronici”.
Nel modello base di tipo leptonico, gli elettroni sono accelerati nei jets e,
attraverso la diffusione Compton inversa, portano i fotoni ad alte energie. Si
possono comunque avere diverse varianti del modello a seconda del punto del
jet in cui é posta la sorgente dei fotoni e quello in cui avviene l’accelerazione.
Nel modello “Synchroton Self-Compton”[33] gli elettroni emettono radiazione
di sincrotrone e sono essi stessi la sorgente dei fotoni; nel modello “external
Compton” i fotoni non vengono prodotti per radiazione di sincrotone e la
sorgente é posta fuori dal jet[11][46]. Infine, nei modelli “non omogenei”
l’emissione a diverse energie é localizzata in diverse regioni del jet.
In tutti questi modelli le perdite di energia limitano l’energia massima dei
raggi γ a ∼10 TeV[41, 30]
Nei modelli adronici, i protoni vengono bruscamente accelerati fino ad
energie ∼1010 GeV e, quindi, interagiscono con i fotoni del fondo circostante
producendo pioni neutri o carichi (vedi eq.1.4), dando inizio ad una cascata
elettromagnetica.
p + γ → ∆+ → p + π 0 o n + π +
π 0 → γγ
π + → µ+ νµ
(1.4)
É chiaro dunque che, se il modello di produzione fosse prevalentemente di
tipo adronico, quello che dovrebbe potersi osservare sarebbe un flusso di
neutrini[21] di alta energia associato al flusso di raggi γ. Come nei modelli
leptonici, i fotoni possono provenire da una fonte esterna (E-PIC) o dalla
radiazione di sincrotone degli elettroni generati dalla cascata (S-PIC).
Poiché gli elettroni sono piú leggeri dei protoni, vengono accelerati e raffredati
4
oggetti appartenenti a questa classe di AGN sono ad esempio Mrk421 e Mrk501
identificate dall’ esperimento WHIPPLE
1.1.5 Gamma Ray Burst (GRB)
11
in modo repentino, quindi un’attivitá caratterizzata da “flares” rapidi (tempi
inferiori ai 10-15 minuti) favorisce il modello a elettroni[23], ma il rapido
raffreddamento rende difficile accelerare gli elettroni ad energie molto alte.
L’energia massima raggiungibile dipende dal campo magnetico anche se in
questo schema i raggi γ di energie superiori ai 10-20 TeV sembrano favorire
il modello a protoni.
Maggiori informazioni e verifiche potrebbero venire da osservazioni continue
su lunghi periodi di tempo. Ció che si sa, infatti, viene prevalentemente dal
telescopio WHIPPLE il cui tempo di presa dati copre intervalli temporali di
circa tre ore ciascuno.
1.1.5
Gamma Ray Burst (GRB)
Ulteriori possibile fonte di fotoni di alta energia sono i cosiddetti bursts di
raggi γ: essi sono emissioni di radiazione γ di breve durata (10−3 ÷ 103 )s e di
energia compresa tra qualche KeV e poche decine di M eV e flusso associato
di ∼ 10−6 ÷ 10−3 erg · cm2 . A circa 25 anni dalla scoperta, la loro origine
é ancora misteriosa; inoltre, non essendo nota la loro distanza, si ha una
incertezza nella determinazione della luminositá intrinseca di ∼ 10 ordini di
grandezza.
Le caratteristiche sperimentali note vengono dalle indagini dell’esperimento
BATSE e sono:
• i GRB con energia compresa tra 20 keV e 2 M eV sono stati rivelati al
ritmo di circa uno al giorno;
• per ognuno dei burst non é stata trovata una controparte nel campo
ottico, infrarosso o radio;
• la distribuzione dei GRB é isotropa;
• i profili temporali non mostrano caratteristiche comuni nei diversi GRB;
• lo spettro energetico é altamente variabile nel tempo e presenta dei
picchi ad energie 100 KeV . Ad energie di poche centinaia di keV lo
spettro dei fotoni puó essere approssimato con una legge a potenza
troncata da un esponenziale E −α exp(−E/E0 ), mentre ad energie
maggiori (fino ad 1 M eV ) lo spettro é descritto da una legge a
potenza con un indice spettrale che varia tra 1.6 e 2.8 ed un flusso
di 1 ÷ 10 fotoni(E > 1 M eV )/cm2 · s.
Tra i tanti modelli che tentano di descrivere il comportamento fisico di questi
oggetti, soltanto due sono in accordo con il vincolo che la luminositá sia
copresa tra 1028 e 1051 erg e che il burst di fotoni si esaurisca in un tempo
12
consistente con la durata osservata(10−3 ÷ 103 )s. Il primo pone le sorgenti
di GRB nell’alone galattico presupponendo il verificarsi di esplosioni sulla
superficie di stelle di neutroni. Tale ipotesi, peró, é stata scartata grazie ai
cataloghi di eventi compilati da BATSE[12] che hanno permesso di stabilire
l’isotropia delle emissioni dovute ai GRB.
Il secondo, invece, ipotizza l’esistenza di sorgenti a distanze cosmologiche e,
per spiegare l’enorme luminositá, considera eventi catrastofici come collisioni
tra stelle di neutroni. Una distribuzione su scala cosmologica dei GRB
spiegherebbe anche l’isotropia osservata. Tale meccanismo, dunque, sembra
quello piú probabile.
Poiché l’energia rilasciata in questo processo é ∼ 1054 erg, l’energia convertita
in fotoni é circa 10−4 ÷ 10−3 volte di quella totale. Il numero di galassie a
spirale all’interno del volume campionato da BATSE é dell’ordine di 109 , la
frequenza rivelata di ∼ 103 GRB per anno implica un evento per galassia
ogni 106 anni che risulta in accordo con la stima di collisioni in sistemi binari
di pulsar.
1.2
Tecniche sperimentali della γ astronomia
alle alte energie
Le tecniche utilizzate nella γ astronomia alle alte energie sono dettate da tre
importanti questioni.
I) L’atmosfera terrestre é opaca ai fotoni di alta energia; al livello del
mare, il suo spessore é di 1030 g/cm2 corrispondente a 28 lunghezze
di radiazione5 . Ne consegue che la probabilitá per un fotone verticale
di alta energia di raggiungere il suolo senza interagire é praticamente
nulla. La situazione resta simile anche spostandoci a quote piú alte. Se
vogliamo rivelare i primari, dobbiamo, dunque, andare direttamente al
disopra dell’atmosfera utilizzando satelliti o palloni sonda.
II) Il flusso di raggi γ di alta energia é molto basso e decresce rapidamente
con l’energia; ad esempio, se consideriamo “Vela”, che é la sorgente di
raggi γ piú intensa del cielo, essa ha un flusso al di sopra dei 100 MeV
di 1.3 × 10−5 fotoni/cm2 /s ed un flusso differenziale dd N
' E −1.89 [26].
E
Questo significa che, al disopra di certe energie, avremmo bisogno di
5
La lunghezza di radiazione X0 é definita come la distanza dopo la quale l’energia di
un elettrone si riduce di un fattore
1
e
per bremsstralung.
1.2.1 Rivelatori satellitari
13
mandare in orbita apparati molto estesi6 , fatto improponibile dal punto
di vista tecnologico ed economico. Ció rende fondamentale l’utilizzo di
rivelatori al suolo con una soglia energetica Eγ & 10 − 100 GeV .
III) Il flusso dei raggi cosmici carichi é molto piú grande di quello dei raggi
γ, inoltre essi vengono deviati dai campi magnetici presenti nel mezzo
interstellare cosı́ devono essere considerati come un fondo isotropo. Il
flusso differenziale di raggi cosmici da protoni misurato tra 100 GeV e
∼ 400 T eV é:
dN
= (9.2 ± 2.4) × 10−2 E −2.76 m−2 s−1 sr −1 T eV −1
dE
(1.5)
con E in T eV [7]. Se si considera che il flusso φγ ∼ (10−3 − 10−4 )φC.R ,
si capisce come la reiezione del fondo isotropo sia “fondamentale” per
fare astronomia gamma.
1.2.1
Rivelatori satellitari
I rivelatori satellitari utilizzano camere traccianti per determinare la direzione
di arrivo dei fotoni dopo che essi sono stati convertiti in coppie e+ e− , mentre
l’energia viene misurata da un calorimetro. Un contatore di particelle cariche
viene solitamente posto in anti coincidenza con l’apparato per reiettare il
fondo.
La risoluzione angolare dell’apparato é molto importante ai fini
dell’identificazione delle sorgenti di fotoni ed alla riduzione degli effetti dovuti
al fondo. Essa deve essere almeno migliore dell’angolo tra il fotone entrante
nel rivelatore e la coppia e+ e− uscente. Questo angolo é il risultato di due
contributi, il primo viene dalla differenza angolare intrinseca nella produzione
della coppia e il secondo é l’angolo di scattering multiplo nel materiale
convertitore. Tipicamente nella produzione di coppie si ha che:
me c 2
E
pp
θrms ≈
· ln
(1.6)
E
me c 2
dove E é l’energia tra il fotone uscente e l’elettrone (o positrone) della coppia
prodotta.
Mentre nello scattering multiplo:
1/2
20
L
ms
(1.7)
θrms ≈
·
pβ
LR
6
Ad esempio un rivelatore di ∼ 1000cm2 posto su satellite rivelerebbe , da Vela, circa
un fotone al minuto sopra i 100 MeV ed un fotone ogni due ore soopra i 10 GeV.
14
dove p é il momento dell’elettrone (o positrone) in M eV /c2 , β é la velocitá
della particella in unitá c, L é il cammino della particella nel materiale
convertitore e LR é la lunghezza di radiazione del materiale convertitore.
ms
pp
Solitamente θrms
> θrms
: ció significa che la risoluzione puó essere ridotta
utilizzando uno strato convertitore piú sottile, o meglio, usando tanti strati
sottili per tenere alta l’efficienza preservando una buona risoluzione angolare.
Un fotone produce una cascata elettromagnetica che si sviluppa nel
calorimetro permettendo una misura della lunghezza totale della traccia
della cascata che é proporzionale all’energia del primario. La risoluzione
energetica aumenta con l’energia stessa fino a che la percentuale di particelle
della cascata emesse fuori dal calorimetro non diventa grande.
Un ulteriore importante parametro del detector é l’area efficace, definita come
l’area fisica del rivelatore convoluta con l’efficienza di rivelazione dei raggi
γ. Se un rivelatore é esposto ad un flusso di fotoni φ(E)f otoni/m2 /s da
una sorgente puntiforme per un tempo T rivelando N eventi, l’area efficace
é definita come:
Aef f (E) =
N
φ(E)T
(1.8)
Il piú sensibile telescopio per la γ astronomia HE é stato EGRET (per
le prestazioni vedi tabella 1.4) montato sul CGRO (Compton Gamma-Ray
Observatory)[48]. EGRET era costituito da una “spark chamber” con strati
di tantalio per convertire i fotoni seguita da un’altra camera con piani
maggiormente spaziati per misurare la direzione della coppia e+ e− . L’energia
del fotone veniva misurata in un calorimetro a base di N aI(T l) spesso 8
lunghezze di radiazione. Un contatore a scintillazione veniva utilizzato come
“time of flight system” per assicurare che le particelle stessero attraversando
il calorimetro verso il basso ed un contatore posto in anticoincidenza aveva
il compito di eliminare gli eventi da particella carica. Poiché il gas utilizzato
RISOLUZIONE
RISOLUZIONE
ENERGETICA
ANGOLARE
(FWHM)
(FWHM)
100 M eV
26%
5.5◦
930 cm2
500 M eV
20%
2.0◦
1570 cm2
1 GeV
19%
1.2◦
1300 cm2
10 GeV
26%
0.4◦
690 cm2
ENERGIA DEI
AREA
FOTONI
EFFICACE
Tabella 1.4: Prestazioni del telescopio satellitare EGRET
1.2.1 Rivelatori satellitari
15
nelle camere a scintilla va consumandosi, EGRET aveva un tempo di misura
limitato. Per ovviare a ció sono in fase di sviluppo nuovi rivelatori su
satellite che avranno la possibilitá di fare osservazioni a lungo termine con
una risoluzione angolare elevata e un’ area efficace piú ampia dei precedenti.
Un esempio é GLAST (Gamma-ray Large-Area Space Telescope) che si spera
possa essere messo in orbita entro il 2005. Esso é composto da uno schermo
per le particelle cariche, un tracciatore/convertitore di gamma fatto da sottili
fogli di materiale ad alto Z spaziati da rivelatori a strip di silicio, e da un
calorimetro a base di CsI (vedi figura 1.5). Il suo campo di vista sará di
∼ 2πsr , permettendogli quindi di monitorare una larga porzione di cielo
alla volta, e la sua sensibilitá alle sorgenti 100 volte migliore di EGRET. I
Figura 1.5:
Disegno schematico di GLAST (Gamma-ray Large-Area Space
Telescope).
miglioramenti con GLAST saranno:
• Un rivelatore a guscio per ridurre la diminuzione dell’area efficace alle
alte energie dovuta alla fuoriuscita delle particelle dal calorimetro.
• L’utilizzo di rivelatori strip di silicio, aumentará di un fattore 10 la
risoluzione sulla posizione rispetto alle camere a scintilla, inoltre, non
darà tempi morti e non richiederá l’impiego di gas.
• L’eliminazione del “time of flight system” in quanto l’utilizzo delle
strip di silicio insieme a sofisticati algoritmi di “pattern-recognition”
determinará la direzione del momento della coppia e+ e− .
Ció
16
comporterá un aumento del campo di vista ed un miglioramento nella
risposta dello strumento alle basse energie7 .
• Il calorimetro rivelatori a base di CsI(T l) spessi 10 lunghezze di
radiazione con in uscita rivelatori a stato solido. Questa struttura
garantirá una migliore risoluzione energetica e di posizione e migliorerá
la discriminazione del fondo.
1.2.2
Rivelatori ground-based
L’abbassamento della soglia energetica dei fotoni rivelati fino a valori di
Eγ . 10 GeV , in modo da sovrapporsi alle zone in cui operano i rivelatori
satellitari, necessita dell’utilizzo di rivelatori di grandi dimensioni.
I raggi γ attraversando l’atmosfera interagiscono con le molecole d’aria dando
origine a cascate “elettromagnetiche”, le caratteristiche del primario vengono
rivelate a partire dalle proprietá di questi sciami. I rivelatori utilizzati sono
di due tipi:
1) Rivelatori Čerenkov.
2) Rivelatori di particelle secondarie (“EAS arrays”).
Questi apparati misurano gli eccessi nel numero di eventi provenienti da una
data direzione. In questo genere di misure un eccesso di eventi viene associato
ad una sorgente di raggi γ se é maggiore delle fluttuazioni statistiche del fondo
isotropo dei raggi cosmici. Cosı́ definiamo come sensibilitá di un apparato
ground-based alle sorgenti γ:
Nγ
S=√
NB
(1.9)
dove Nγ ed NB sono rispettivamente il numero di sciami da fotone e il numero
degli eventi di fondo rivelati dall’apparato in una data direzione.
Rivelatori Čerenkov
L’emissione di luce Čerenkov avviene quando una particella carica si muove
in un mezzo con un β ≥ n1 (dove n = n(λ) é l’indice di rifrazione del mezzo
attraversato) ad un angolo θČ = arccos n1 . La luce viene emessa durante
tutto lo sviluppo dello sciame da parte di quasi tutte le particelle cariche
secondo:
1
dN
∝
(1.10)
dλ
λ
7
Le particelle di bassa energia non attraversano tutto il rivelatore e non fanno scattare
il sistema di “time of flight” che funziona da trigger.
1.2.2 Rivelatori ground-based
17
con λ lunghezza d’onda della luce emessa.
I telescopi Čerenkov, nelle versioni piú semplificate comprendono un
collettore di luce (solitamente uno specchio parabolico) con un rivelatore
di luce posto sul piano focale. La luce Čerenkov prodotta dalle particelle
cariche nello sciame incide sulla Terra concentrata in un disco il cui raggio é
legato all’angolo di emissione della luce, e la cui intensitá é proporzionale in
prima approssimazione all’energia del primario.
Le tecniche utilizzate per la rivelazione di luce Čerenkov sono principalmente
di due tipi:
I) IACT(Imaging Atmospheric Čerenkov Telescope). Questa tecnica
é quella piú largamente utilizzata oggi e consiste nell’ottenere un
immagine bidimensionale della luce Čerenkov utilizzando una camera
a pixel posta sul piano focale del riflettore. La camera registra una
immagine dello sciame le cui caratteristiche sono direttamente legate
allo sviluppo longitudinale e trasversale dello stesso. Se uno sciame
si sviluppa lungo l’asse ottico del telescopio la sua immagine sará
concentrata nel centro della camera, mentre se l’asse dello sciame é
parallelo all’asse ottico, ma traslato, l’immagine sará ellittica con l’asse
maggiore rivolto verso il centro della camera. Se l’asse dello sciame
non é parallelo all’asse ottico del telescopio l’immagine é ellittica, ma
il prolungamento dell’asse maggiore dell’ellisse non interseca il centro
della camera.
Le immagini inoltre differiscono a seconda delle caratteristiche del
primario (vedi figura 1.6), infatti gli sciami da gamma producono una
immagine ellittica e compatta, mentre quelli adronici una irregolare
e orientata casualmente nel piano focale. Attraverso algoritmi di
processamento delle immagini e ricostruzione della direzione, si ottiene
una reiezione del fondo che si aggiunge a quella ottenuta grazie ad
una buona risoluzione angolare. Un esempio di ció é l’esperimento
Apparato
N◦ riflettori
N◦ PMT Campo (◦ )
σ θ (◦ )
Emin (GeV )
CANGAROO
2
256
3.0
0.18
1000
CAT
1
600
4.8
0.1
250
HEGRA-CT
6
271
4.6
0.1
500
TACTIC
4
349
2.8
-
-
WHIPPLE
1
151
3.5
0.1
500
Tabella 1.5: Caratteristiche principali di alcuni apparati Imaging Čerenkov
(IACT).
18
Apparato
Area (m2 )
N◦ elementi
Campo (◦ ) Emin (GeV)
ASGAT
280 × 190
18
2.3
250
THEMISTOCLE
280 × 190
7 (× 7 PMT)
3.0
150
Tabella 1.6: Caratteristiche principali di due apparati fast timing.
WHIPPLE in cui l’utilizzo di numerosi fotomoltiplicatori (vedi tabella
1.5) ha permesso di raggiungere una notevole risoluzione angolare
(0.1◦ ÷ 0.2◦ ) e di sfruttare le piccole differenze di natura topologica
presenti nelle immagini raggiungendo una percentuale di reiezione del
fondo del 99.7%.
II) ACT(Atmospheric Čerenkov Telescope). In questo tipo di apparato
singoli fototubi sono distribuiti a decine di metri l’uno dall’altro fino a
coprire superfici dell’ordine di 20000 m2 ÷ 40000 m2 . Generalmente
questi apparati sono accoppiati ad array di rivelatori di particelle
cariche che servono a ricostruire il “core”8 dello sciame e l’angolo di
incidenza rispetto alla verticale. Questo tipo di apparati é stato il
primo ad essere utilizzato, due esempi sono gli esperimenti ASGAT e
THEMISTOCLE che peró ricostruiscono la direzione di arrivo dello
sciame eseguendo un fit temporale del fronte della radiazione Čerenkov
incidente. Con un array di fototubi siamo in grado di misurare
distribuzione laterale della luce Čerenkov e l’andamento temporale
dell’impulso informazioni dalle quali é possibile ricavare rispettivamente
l’energia del primario e lo sviluppo longitudinale dello sciame. É
importante notare che tali apparati non permettono l’utilizzo di nessun
criterio di discriminazione tra gamma e adroni basato sullo studio
dell’immagine.
In conclusione, i rivelatori Čerenkov pur avendo un elevata risoluzione
angolare, e nel caso degli IACT anche un ottimo fattore di reiezione del
fondo, hanno dei limiti:
• Il basso duty cycle9 : apparati di questo tipo possono eseguire misure
solo in notti serene e prive di Luna, questo riduce il tempo di utilizzo
effettivo a circa il 10% del tempo di vita del telescopio. Se poi si pensa
che le sorgenti da osservare devono trovarsi ad un certo angolo sopra
l’orizzonte, tale tempo si riduce ulteriormente.
8
Il core é definito come il punto di intersezione tra l’asse dello sciame ed il piano
dell’apparato
9
É la percentuale di tempo effettivo in cui l’apparato puó effettuare misure.
19
Figura 1.6: Sviluppo di uno sciame verticale da 1 TeV iniziato da protone (a
destra) e da γ a sinistra. Le parti superiori visualizzano gli sviluppi degli sciami
nell’atmosfera, mentre quelle inferiori le immagini viste dal telescopio Čerenkov.
• La scarsa accettanza angolare: il field of view di questi rivelatori é
∼ 3◦ e quindi l’osservazione é limitata ad una sola sorgente alla volta.
Questo fatto esclude la possibilitá di monitorare ampie porzioni di cielo
e riduce quindi la capacitá di scoperta di nuove sorgenti e di misurare
flussi diffusi o flussi provenienti da sorgenti estese.
EAS arrays
Questa tecnica consiste nel distribuire molti rivelatori su superfici di circa
104 ÷105 m2 , in grado di rivelare il passaggio del fronte dello sciame prodotto
da un primario che interagisce nella parte superiore dell’atmosfera. Il costo
di un rivelatore a copertura totale d’area di dimensioni cosı́ estese sarebbe
proibitivo, quindi si utilizzano un certo numero di rivelatori di particelle
cariche (tra 50 e 1000) distribuiti ad intervalli sulla superficie da coprire.
20
Tipicamente ogni scintillatore ha un’area di ∼ 1 m2 e le prestazioni possono
essere migliorate ponendo, su ogni scintillatore, uno strato di piombo spesso
una lunghezza di radiazione per convertire i fotoni ed aumentare cosı́ il
numero di particelle cariche rivelate[27, 2]. La direzione del primario viene
ricostruita misurando i tempi relativi in cui ogni contatore dell’array viene
attraversato dal fronte dello sciame. La risoluzione angolare dipende sia
dalle proprietá dell’apparato che da quelle degli sciami in esame, una buona
risoluzione angolare puó essere ottenuta facendo un fit del fronte dello sciame
tenendo conto che tale fronte é curvato in base alla posizione del core[2]. Le
risoluzioni angolari tipiche per un dato sciame sono approssimativamente
date da:
σt
σθ ∝ √
(1.11)
ρ
dove σθ é la risoluzione angolare prevista, ρ é la densitá di rivelatori
indipendenti nell’apparato e σt é l’ampiezza temporale del segnale misurata
da ogni rivelatore. La risoluzione angolare di tali apparati puó essere
misurata in diversi modi, il piú efficace é quello di misurare la forma
dell’ombra della Luna o del Sole[9].
L’energia di soglia dell’apparato dipende dalla quota a cui il rivelatore é posto
e dal numero minimo di contatori che devono essere accesi per ricostruire uno
sciame. Questo puó essere fatto in principio anche con tre rivelatori, ma se
vogliamo ottenere una misura molto accurata dobbiamo richiedere che ve ne
siano accesi almeno 10, comunque, poiché il numero di particelle che arrivano
al suolo fluttua molto anche se consideriamo sciami aventi stesso primario,
l’energia di soglia non risulta mai ben definita.
Come conseguenza un EAS array puó riuscire a rivelare eventi di bassa
energia iniziati a bassa quota e non riuscire a rivelare sciami di alta energia
iniziati ad alta quota. Inoltre, assegnata l’energia del primario, la dimensione
dello sciame al suolo diminuisce all’aumentare dell’angolo di arrivo rispetto
allo zenit e varia seconda del tipo di primario.
La risposta in energia di un EAS array é ben descritta dall’area efficace,
che in questo tipo di apparati dipende dalla probabilitá che uno sciame di
energia E accenda l’apparato, essa é inoltre funzione dell’angolo di arrivo
dello sciame e del tipo di primario.
Una buona sensibilitá dell’apparato puó essere raggiunta rigettando il fondo
utilizzando la risoluzione angolare dell’apparato, o con tecniche basate sulla
misura del diverso contenuto di muoni nello sciame10 .
In definitiva peró, i vantaggi derivanti dall’utilizzo di questi apparati sono:
10
In uno sciame fotonico il contenuto di muoni risulta di molto inferiore a quello di uno
sciame adronico, infatti, per energie dello sciame di ∼ 100 T eV , Nµ (γ)/Nµ (h) ∼ 5% e
decresce notevolmente ad energie minori.
21
Soglia
Quota
N◦ stazioni
µ Det. Area
Area
(TeV)
(g·cm2 )
× area (m2 )
(104 m2 )
(104 m2 )
CASA-MIA
70
870
1089 × 1.5
2550
23
CYGNUS-I
50
800
108 × 0.8
110
2.2
EAS-TOP
100
800
29 × 10
300
10
HEGRA
40
800
257 × 1.0
270
4
SPASE
50
700
24 × 1.0
-
0.6
Gruppo
Tabella 1.7: Caratteristiche dei principali apparati di sciame
• Grande accettanza angolare, sono cioé in grado di osservare tutto il
cielo sovrastante.
• Hanno un tempo di presa dati che é in pratica uguale al tempo di vita
dell’apparato.
In tabella 1.7 vengono riportate le caratteristiche dei principali esperimenti
che utilizzano apparati di sciame.
Allo scopo di diminuire la soglia energetica in modo da fare misure nel range
di lavoro dei satelliti, si stanno sviluppando apparati detti ”full-coverage”
la cui peculiaritá stá nel fatto di avere l’area su cui si estendono coperta
da rivelatori per piú del 50% del totale. I due soli progetti al mondo che
sviluppano questa tecnica sono ARGO-YBJ (di cui si parlerá ampiamente in
seguito) e MILAGRO.
MILAGRO é posto a 2500m sul livello del mare e si occuperá di studiare
sciami indotti da primari nel range energetico 100 GeV ÷ 100 T eV mediante
l’utilizzo di rivelatori di luce Čerenkov, prodotta in acqua dallo sciame.
L’apparato é costituito da 790 fotomoltiplicatori posti in una piscina coperta
di 5000m2 e sono disposti su tre strati diversi.
• Il primo strato é composto da 450 fototubi rivolti verso l’alto e spaziati
tra loro di 3 m. Osservano i primi 2m d’acqua e misurano il tempo di
arrivo del fronte dello sciame con una risoluzione angolare di ∼ 1.5◦ .
• Il secondo strato consta di 170 fototubi, rivolti verso l’alto e spaziati
come i precedenti ad una profonditá di 6.5m usato per fare misure di
tipo calorimetrico.
• Al terzo ed ultimo strato appartengono i restanti 170 fototubi rivolti
verso il basso a 7m di profonditá, questo strato é otticamente isolato
dai precedenti e dovrebbe studiare la componente muonica degli sciami
permettendo una certa discriminazione tra gamma e adroni.
22
In definitiva, la scelta verso cui si propende é quella di un dispositivo
a copertura totale d’area posto ad alta quota. In questo tipo di ottica
la discriminazione tra gamma e adroni, dovuta al puntamento, non é
sufficiente. Bisogna ricorrere dunque a metodi alternativi come lo studio
delle caratteristiche intrinseche degli sciami al fine di caratterizzare i diversi
tipi di primario ed estrarre il segnale (raggi gamma) dal fondo.
Capitolo 2
L’esperimento ARGO-YBJ
L
o studio dei raggi γ VHE (ossia tra 100 GeV e 100 T eV ) necessita di
un’osservazione continua del cielo, in modo da poter studiare sorgenti la cui
posizione non é nota.
Si se considera come esempio la nebulosa Crab, il flusso misurato dei fotoni
VHE da essa provenienti é dato da φ ' 3.2 × 10−11 E −2.5 cm−2 s−1 T eV −1
(vedi figura 1.3). É quindi importante utilizzare un apparato con un’area
attiva molto grande (almeno ∼ 103 m2 ) per poter acquisire un campione
di dati statisticamente significativo in un tempo di misura ragionevolmente
basso.
I raggi γ che entrano nell’atmosfera interagiscono con le molecole d’aria
generando coppie e+ e− che, a loro volta, danno origine a fotoni attraverso
processi di bremsstrahlung e diffusione Compton. I fotoni prodotti si
convertono nuovamente in coppie elettrone-positrone ed il processo si ripete
dando origine ad uno sciame elettromagnetico.
Le dimensioni dello sciame aumentano fino a che l’energia media delle
particelle prodotte non é pari all’energia critica (Ec ∼ 80 M eV ). A questo
valore dell’energia il processo di perdita di energia per ionizzazione diventa
dominante su quello di produzione delle particelle, per cui il processo di
moltiplicazione si arresta e la grandezza dello sciame comincia a diminuire.
Per individuare i parametri importanti nella costruzione di un apparato viene
utilizzata una figura di merito, detta “rapporto segnale-rumore e puó essere
scritta come :
p
Rγ Q Aef f T
signal
∝
(2.1)
noise
σθ
i cui vari parametri sono definiti in Tabella 2.1.
24
Parametro
Unitá
Definizione
Aef f
m2
Area efficace dell’apparato
T
s
Tempo di esposizione
σθ
◦
Risoluzione angolare
Rγ
-
efficienza relativa del trigger γ/adroni
Q
-
fattore di discriminazione γ/adroni
Tabella 2.1: Definizione dei parametri della figura di merito
L’area efficace Aef f indica la superficie equivalente sulla quale uno sciame
che vi cade viene sicuramente rivelato. Essa, in generale, risulta essere
una funzione dell’energia e del tipo di primario considerato in quanto gli
sciami da gamma e da protoni hanno una differente distribuzione radiale
delle particelle. Essa viene stimata attraverso delle simulazioni considerando
l’area di generazione Ag usando l’espressione:
Aef f (E, θ) =
n(E, θ)
· Ag
N
(2.2)
dove, nel caso di eventi con il core all’interno dell’area di generazione, N é
il numero totale di eventi e n(E, θ) é il numero di eventi che soddisfa alla
condizione di trigger.
Un rivelatore a terra vede la cascata molto tardi, rispetto al tempo di
massimo sviluppo, con una diminuzione del numero di particelle pari ad un
ordine di grandezza. Questa situazione risulta migliore a quote > 4000 m.
Infatti, con l’aumentare della quota si ha l’aumento della probabilitá di
trigger dell’apparato e, quindi, un conseguente miglioramento della capacitá
intrinseca di separare i gamma dagli adroni nonché una diminuzione della
soglia energetica.
Poiché la frequenza di arrivo dei raggi gamma é molto piccola rispetto
a quella dei raggi cosmici prodotti da adroni, la reiezione del fondo
adronico é importante per il successo dell’apparato. L’efficienza della
tecnica utilizzata per discriminare il fondo adronico dipende dalla risoluzione
angolare dell’apparato e da un fattore di qualitá Q aggiuntivo definito come
:
εγ
Q= p
(2.3)
1 − εp
dove εγ e εp sono le efficienze di identificazione relative a sciami iniziati da
gamma e da adroni (vedi capitolo 4).
Questo parametro é molto importante ai fini dell’estrazione del segnale dal
2.1 Obiettivi dell’esperimento
25
fondo; negli esperimenti con i telescopi Čerenkov vengono utilizzate tecniche
di analisi dell’immagine dello sciame basate sui parametri di Hillas[13], che
permettono di trovare valori di Q ∼ 2.
Gli sciami raggiungono il suolo come un sottile disco approssimativamente del
diametro di 100 m, al primo ordine tale disco puó essere approssimato con un
piano definito dal tempo di arrivo del fronte dello sciame, mentre la direzione
della particella primaria viene considerata coincidente con la direzione
ortogonale a tale piano. Si puó quindi capire come l’accuratezza nella
rivelazione della direzione di arrivo sia strettamente legata alla precisione ed
al numero di misure dei tempi di arrivo relativi delle particelle dello sciame
(vedi formula 1.11). Un apparato ideale per studiare i raggi γ VHE deve
avere i seguenti requisiti:
• grande area efficace (Aeff );
• alta quota (> 4000 m);
• alta densitá delle unitá di rivelazione;
• ottima risoluzione temporale (∼ 1 ns);
• ciclo di funzionamento ∼ 100%;
• capacitá di ricostruzione dell’immagine dello sciame.
É dunque importante che il rivelatore sia posto ad un’altezza elevata se
vogliamo abbassare la soglia energetica; infatti, a 2500 m si possono rivelare
sciami con una energia di soglia minima di ∼ 1 T eV , mentre a 4500 m la
soglia scende a ∼ 100 GeV .
In quest’ottica si pone l’esperimento ARGO-YBJ (Astrophisical
Radiation Ground-based Observatory), posto presso il Yanbajing High
Altitude Cosmic Ray Laboratory ad un’altitudine di 4300 m sul livello del
mare in Tibet (Repubblica Popolare Cinese ). L’elevata quota ed un’area di
rivelatori a copertura totale di 5300 m2 consentiranno la rivelazione di sciami
iniziati da fotoni di energia compresa tra 10 GeV e 500 T eV .
2.1
Obiettivi dell’esperimento
Gli obiettivi che l’esperimento ARGO YBJ si propone riguardano sia l’ambito
dell’astronomia γ sia lo studio dei raggi cosmici in generale:
• Studio di sorgenti puntiformi di raggi γ. Fornendo un monitoraggio
continuo del cielo con una soglia energetica di ∼ 100GeV permette
anche lo studio di sorgenti galattiche ed extragalattiche non note.
26
• Osservazione di sorgenti estese o diffuse quali radiazione galattica
diffusa, SNR e nubi molecolari a energie ≥ 100GeV .
• Fisica dei GRB. Attraverso misure nel range energetico del GeV ÷
T eV si potrá stabilire con maggiore accuratezza la scala delle distanze
dei GRB.
• Fisica del Sole e dell’Eliosfera, osservazione dei flares di raggi γ e di
neutroni di alte energie, il monitoraggio continuo dei campi magnetici
interplanetari e di quelli associati alla attivitá solare e della loro
influenza sulla direzione di arrivo dei raggi cosmici (con E > 10GeV ).
• Studio dello spettro dei protoni primari nel range energetico
10 T eV ÷ 200 T eV .
• Studio del rapporto p̄/p. Misure significative di p̄ nella regione del
T eV non possono essere effettuate con palloni sonda o satelliti a causa
dei bassi flussi e del fatto che i magneti montati su questi apparati non
consentono una identificazione precisa della carica. Nel caso di ARGO
il flusso dei p̄ e p viene misurato attraverso l’osservazione dell’ombra
della Luna[9]. L’ottima risoluzione angolare dell’apparato (∼ 0.4◦ )
permetterá di misurare il rapporto p̄/p a energie da 300 GeV a ∼ 1 T eV
riuscendo anche a discriminare tra modelli di produzione galattica dei
p̄ e modelli in cui é prevista una origine extragalattica.
• Studio delle proprietá degli sciami atmosferici. Poiché il rivelatore
fornisce una immagine con una definizione spazio-temporale molto
dettagliata del fronte dello sciame, é possibile analizzare in dettaglio le
proprietá di sviluppo in prossimitá dell’asse degli sciami.
2.2 L’apparato
2.2
L’apparato
2.2.1
La struttura
27
Il detector dell’esperimento ARGO-YBJ[4], il cui disegno schematico viene
mostrato in figura 2.1, é un dispositivo a copertura d’area totale di dimensioni
' 78 × 74 m2 costituito da un singolo strato di camere ad elettrodi piani
resistivi RPC(Resistive Plate Chamber). La parte centrale del rivelatore é
cicondata da un anello di RPC ( vedi figura 2.1) in modo da aumentare l’area
attiva fino a 100 × 100 m2 permettendo la ricostruzione anche degli sciami
con il core fuori dalla parte centrale dell’apparato.
111 m
74 m
99 m
78 m
Figura 2.1: Vista dall’alto del rivelatore ARGO-YBJ. I rettangoli rappresentano
i CLUSTER. Il rivelatore é costituito da 130 CLUSTER nella parte centrale e 24
nell’anello esterno per un totale di 1848 RPC
Gli elementi base del rivelatore sono degli RPC di superficie 125 × 280 cm2 .
Ogni RPC é collocato in un involucro piú grande di 282 × 128 × 5 cm3 che
racchiude anche le strip di pick-up e l’elettronica di “front-end”. L’insieme
di 12 camere forma una unitá logica detta CLUSTER (vedi figura 2.2) dalle
dimensioni di 5.7 × 7.9 m2 . Gli RPC sono coperti da uno strato di piombo
spesso 0.5 cm, la cui presenza permette la conversione di fotoni in coppie e+ e−
e l’assorbimento degli elettroni di bassa energia che peggiorano la risoluzione
temporale dell’apparato. Ponendo invece sul rivelatore uno strato di piombo
28
Pad Front−End
7
2
125 cm
3
4
5
6
10
11
12
280 cm
Strip
LOCAL
STATION
8
9
Figura 2.2: Disegno schematico di un CLUSTER, esso é formato da 12 RPC,
ciascun RPC da 10 PAD ed ogni PAD é composta da 8 strip di lettura del segnale.
di spessore di ∼ 0.5 cm il 90% delle particelle prodotte arriva entro 4 ns
dall’arrivo della prima.
2.2.2
Le camere ad elettrodi piani resistivi (RPC)
Caratteristiche generali
La scelta di utilizzare gli RPC nell’esperimento ARGO-YBJ é stata dettata
dalla ottima risoluzione temporale che essi garantiscono (' 1 ns) e dalla
possibilitá di poterli assemblare in ampie strutture con costi inferiori e
prestazioni superiori rispetto ai comuni scintillatori.
Gli RPC sono rivelatori il cui elemento sensibile é uno strato di gas a pressione
atmosferica1 posto all’interno di un campo elettrico uniforme (∼ 3.6 kV /mm
alla quota di Yanbajing, mentre sarebbe ∼ 4.5 kV /mm al livello del mare)
generato da due elettrodi piani paralleli. Gli elettrodi sono fatti da due lastre
di Bakelite (una resina fenolica) spesse 4 mm la cui costante dielettrica
é ε ' 6 · ε0 e con una resistivitá molto elevata (∼ 1011±1 Ω · cm). Sulla
superficie interna della bakelite viene applicato uno strato di olio di lino atto
a livellare eventuali imperfezioni dovute ai metodi di produzione delle lastre.
Tali imperfezioni possono infatti fungere da punte ed essere causa di scariche
spurie all’interno del rivelatore aumentando il rumore di fondo dell’apparato.
1
In realtá, la pressione del gas risulta leggermente superiore a quella atmosferica.
29
Sulla superficie esterna viene apposto un sottile strato di grafite che connette
l’apparato al generatore di alta tensione e tende a rendere uniforme la
differenza di potenziale applicata ai capi delle lastre.
Gli elettrodi sono fatti di bakelite in modo da ridurre al minimo il tempo
morto del rivelatore; se, infatti, fossero di materiale conduttore, l’RPC si
comporterebbe come un condensatore piano. L’intero rivelatore avrebbe
quindi un tempo morto pari al tempo di scarica del condensatore τ = RC,
con C pari alla capacitá del condensatore ed R pari alla resistenza interna
del generatore di alta tensione.
L’utilizzo di elettrodi resistivi permette di considerare il rivelatore come
composto da tanti piccoli condensatori indipendenti connessi da resistenze
elevate. Si trova dunque che il tempo morto della singola celletta del
rivelatore é pari a ∼ 250 ns.
Per limitare l’estensione di queste zone morte, cercando quindi di ottenere
una localizzazione delle zone di ionizzazione , si utilizza una miscela di gas
composta da Argon (Ar) 15%, Tetrafluoretano (C2 H2 F4 ) 75% e Iso-butano
(C4 H10 ) 10%. L’argon é la parte attiva del rivelatore in quanto serve a
favorire la ionizzazione del gas al passaggio della particella; l’isobutano é
utile a favorire l’assorbimento dei fotoni ultravioletti; il fluoro, essendo molto
elettronegativo, tende a sottrarre elettroni restringendo le regioni in cui
avviene la scarica. Il risultato finale é quello di avere una scarica la cui
durata temporale é ' 10 ns.
Come si puó notare, vi é una notevole differenza tra il tempo morto “locale”
(250 ns) e la durata della scarica (10 ns): ció fa in modo che durante
la scarica gli elettrodi possano essere considerati a tutti gli effetti come
perfettamente isolanti.
Il tempo di salita del segnale é infatti di 1 ÷ 3 ns, mentre il tempo di discesa
decresce al crescere della percentuale di tetrafluoretano presente nella miscela
di gas nell’RPC. Il segnale decresce linearmente a causa della raccolta degli
elettroni sull’anodo e dovrebbe avere una forma triangolare. In realtá, poiché
nè il campo elettrico nè la mobilitá2 delle cariche restano costanti, si assume
che la forma della corrente possa essere descritta da un esponenziale.
Il tempo necessario alla formazione dello streamer3 ha una fluttuazione che
incide sulla risoluzione temporale dell’RPC, risoluzione che é dell’ordine di
1 ns e migliora al crescere della tensione di lavoro.
2
Ció é dovuto alla presenza, nella miscela, di un gas, quale il tetrafluoretano, molto
elettronegativo.
3
La condizione per la formazione dello streamer é stabilita dal criterio di Meek: il
numero di elettroni generati nella valanga deve essere ∼ 5 · 108 .
30
Fe 0.3 mm
FOAM 50 mm
Fe 0.3 mm
Pb 0.5 cm
Fe 0.3 mm
Front−End Card
Connector 8+8 pin
Al 1 mm
FOAM 20 mm
Al 1 mm
FOAM 3 mm
STRIP 3mm
RPC 6 mm
Al 1 mm
FOAM 30 mm
Al 1 mm
CONCRETE FLOOR
Figura 2.3: Stratigrafia del rivelatore
Gli RPC di ARGO
Come giá detto, gli RPC di ARGO sono rivelatori di 280 × 125 cm2 , ciascun
RPC é posto in un contenitore di 282 × 128 × 5 cm3 insieme con l’elettronica
di front-end e le strip di pick-up. I due elettrodi sono fatti da lastre di
bakelite spesse 2mm tra cui vi sono inseriti dei dischetti di materiale isolante
(PVC) di circa 1 cm2 posti a 10 cm l’uno dall’altro per conferire soliditá
alla struttura e uniformare la spaziatura tra gli elettrodi. A causa dell’aria
rarefatta (il tappeto é posto a 4300 m sul livello del mare), la pressione di
lavoro degli RPC é di 0.6 atm e si é scelto di utilizzare una miscela di gas
composta da Argon al 15%, Tetrafluoretano al 75%, e Iso-butano al 10%. Al
di sotto della camera ( vedi figure 2.3, 2.4 ) vi sono due grandi elettrodi per
la lettura del segnale, detti “BIG PADs”, costituiti da un foglio di rame di
140 × 125cm2 ; sotto il piano di lettura della BIG PAD é incollato un foglio
di materiale isolante (PET) spesso 200 µm , mentre un altro foglio di PET,
dello stesso spessore, isola il piano della BIG PAD dal piano inferiore rivestito
di grafite.
Sopra alla camera vi sono le strisce di lettura (80 per ogni RPC). Gli elettrodi
di lettura sono in rame e sono costituiti da strisce lunghe 62 cm e larghe
6.7 cm poste a distanza di 3 mm l’una dall’altra. La massa delle strisce é
realizzata con un foglio di alluminio separato dalle strip attraverso uno strato
di poliestere spesso 3 mm in modo da ottenere una linea di trasmissione
Foam 15 mm
Strip
RPC (Gas)
Big Pad
31
Foam 15 mm
125 cm
Elettronica
280 cm
Figura 2.4: Sezione del rivelatore, vista laterale e superiore
con un’impedenza caratteristica di 11 Ω e una velocitá di trasmissione di
∼ 2 · 108 m/s.
Le strisce sono organizzate a gruppi di 8 in PAD di superficie 56 × 62 cm2 ,
e sono connesse ad una elettronica basata su un chip discriminatore a 8
canali. Ogni canale é costituito da un amplificatore di tensione connesso ad
un comparatore a soglia variabile.
Posizionata al centro di ogni CLUSTER vi é la “LOCAL Station” (vedi
Fig.2.2) dedicata alla acquisizione delle informazioni provenienti da queste
camere (in totale 120 × 8 strips) ed é costituita da quattro Schede
di Processamento del Segnale (SPC) e da una Scheda di Controllo e
Comunicazione (CCC). Ognuna delle quattro schede SPC é utilizzata per
la raccolta e la gestione delle informazioni generate in tre camere, mentre
la scheda CCC ricava la molteplicitá di un cluster e manda tutti i dati
( informazione sul tempo e sulla strip) alla “Central Station. La Central
Station non é altro che un insieme di “crates” VME posti nel centro
dell’apparato e connessi ad una sala di controllo. Essa realizza il trigger
e memorizza i dati utilizzando degli appositi moduli VME; il trigger é basato
sulla molteplicitá delle PAD nei CLUSTER. Le molteplicitá Mi di ogni
0
PAD vengono confrontate con tre valori di soglia M1,2,3 , poi, il numero di
CLUSTER MT OT i che soddisfa a queste condizioni viene confrontato con un
00
secondo gruppo di valori di soglia M1,2,3 . Quando la condizione di trigger é
realizzata viene inviato un segnale dalla Central Station alla Local Station
per produrre uno stop ai TDC e trasferire i dati. Tutta questa operazione
avviene in un intervallo di tempo di 2 µs. La presenza di questa larga finestra
32
M i,1 M’1
M i,1
Mi
M i,1 M’1
M TOT1
i=1,N
M"1
6 bits
M i,1 M’i,1
M i,1
i=1,N
M TOT2
i=1,N
L
O
G
I
C
A
M"2
D
E
L
N = numero di CLUSTER
M i,1
M TOT3
i=1,N
M i,1
i=1,N
M TOT4
M"3
M"4
T
R
I
G
G
E
R
Figura 2.5: Logica del Trigger
temporale genera un numero di eventi spuri con una frequenza (misurata a
Yanbajing) di ∼ 400 Hz per PAD, i quali possono essere facilmente eliminati
durante l’analisi “off-line” dei dati acquisiti.
2.3
Sensibilitá di ARGO alla γ astronomia
La capacitá di ARGO nel rivelare sorgenti di raggi γ dipende dalla intensitá
dello spettro e dalla estensione angolare della sorgente stessa. La sensibilitá
S si ottiene confrontando il numero totale di fotoni Nγ attesi dalla sorgente
entro un angolo solido ∆Ω centrato sulla sorgente stessa, con quelli dei raggi
cosmici NB nella stesso intervallo angolare.
Definendo la sensibilitá S come il rapporto tra il segnale in funzione del
numero di PAD ∆Np e l’errore statistico che si commette sulla stima del
fondo, si ha:
Nγ (∆Np )
=
S(∆Np ) = p
NB (∆Np )
R
Aγ (E)Jγ (E)dE · ξγ (∆Ω) · T (d) · f (δ)
E1 ef f
qR
·Q
p
A
(E)J
(E)dE
·
∆Ω(∆N
)
·
T
(d)
·
f
(δ)
B
p
E1 ef f
(2.4)
dove Jγ (E) e JB (E) sono gli spettri energetici dei fotoni e del fondo mentre
Aγef f (E) e Apef f (E) sono le aree efficaci corrispondenti al numero di PAD
fissato (calcolate secondo la eq.2.2).
Iltermine ξγ (∆Ω) = 0.70 é la frazione di sciami prodotti da γ entro un angolo
2.3 Sensibilitá di ARGO alla γ astronomia
33
Figura 2.6: Andamento della Ψ(70%) in funzione delle PAD accese, con e senza
strato di piombo
solido ∆Ω = 2π(1 − cos θ); se la sorgente é puntiforme θ coincide con Ψ(70),
cioé l’angolo attorno alla direzione della sorgente che contiene il 70% del
segnale
p (direttamente legata alla σθ ). Nel caso, invece, di sorgenti estese
θ = (Ψ(70))2 + (∆θ)2 con ∆θ regione angolare del cielo interessata. T (d)
é il tempo effettivo di presa dati in giorni, f (δ) indica per quanto tempo al
giorno viene osservata la sorgente ad angoli inferiori a 40◦ rispetto allo zenit,
mentre Q é il fattore di discriminazione tra sciami iniziati da γ e quelli aventi
come primario un adrone.
Nel calcolo della sensibilitá la scelta di ∆Np permette di selezionare la
regione energetica piú appropriata per l’osservazione di una data sorgente;
ad esempio, se vogliamo effettuare delle osservazioni nella regione ' 100 −
200 GeV , dobbiamo considerare un ∆Np = 20 ÷ 50.
Nel caso di f (δ) esso é stato calcolato per ogni sorgente con declinazione
60 < δ < 0 e puó variare da 6 ÷ 7 ore per sorgenti verticali (|δ − λ| ≤ 10◦ con
λ = 30◦ latitudine di Yanbajing) fino a 2 ÷ 3 ore per sorgenti a 30◦ . Questi
criteri possono essere applicati alle sorgenti trattate nel primo capitolo.
34
2.3.1
Osservazione della Crab
Il flusso dell’emissione non pulsata di raggi γ dalla Crab puó essere osservato
selezionando eventi di alta molteplicitá (> 30 PAD accese). Nella tabella
Eth (TeV)
Trigger
σ
Fmin (Crab units)
0.6-0.7
Nhit >30
4.3
1.2
0.8-0.9
Nhit >50
6.7
0.7
1.5
Nhit >100
8.6
0.6
2.0
Nhit >150
9.0
0.6
2.5
Nhit >200
9.6
0.5
3.5-4
Nhit >300
9.0
0.6
Tabella 2.2: Numero di sigma ottenibili in un anno di presa dati della Crab per
diversi valori della molteplicitá di PAD. E th é l’energia di soglia corrispondente
al numero di PAD minimo selezionato, F min é il flusso minimo osservabile in un
anno a 5σ.
2.2 viene riportato il numero di sigma ottenibili in un anno di presa dati
attraverso la selezione di eventi con un numero di PAD accese superiore ad
un certo valore. Viene, inoltre, riportato il flusso minimo osservabile Fmin in
un anno a 5σ. Se si considera un numero di PAD superiore a 30, si riescono ad
ottenere 4.3σ in un anno di presa dati con il solo puntamento della sorgente.
In sostanza, quindi, con un fattore di discriminazione adroni gamma, si
potrebbero raggiungere risultati notevolmente migliori sia in termini di tempi
di osservazione sia in termini di flusso minimo osservabile Fmin .
2.3.2
SNR
I resti di Supernova non sono sorgenti puntiformi bensı́ hanno un diametro
che oscilla tra ∼ 0.4◦ e 3.2◦ che é confrontabile con la risoluzione angolare
di ARGO. Gli SNR che possono essere osservati alle latitudini di Yanbajing
sono circa 30 e solo 6 di questi sono sorgenti di raggi γ rivelate da EGRET
(vedi Tabella 2.3). Partendo dai flussi misurati da EGRET a 100 M eV
di energia di soglia, é possibile calcolare il flusso dei fotoni atteso nella
regione GeV ÷ T eV attraverso l’utilizzo del modello di Drury[1], Naito e
Takahara[38].
É stata cosı́ stimata la sensibilitá di ARGO a fotoni di energia tra 100 GeV e
700 GeV
p selezionando eventi con (20÷50) e (50÷150) PAD accese e ponendo
θ = (ψ(70))2 + (∆θ)2 con ψ(70) scelto in base al numero di PAD. I risultati
sono riportati in Figura 2.7 dove le curve rappresentano il flusso minimo a
2.3.2 SNR
35
100 M eV (Φγ (> 100 M eV )) necessario per rivelare sorgenti a 5σ in funzione
di θ con un flusso di fotoni con spettro ∼ E −1.3 e ∼ E −1.4 , in due differenti
configurazioni. Gli SNRs W44 e γ-Cygni dovrebbero essere visibili da ARGO
Figura 2.7: Il flusso minimo Φγ (> 100 M eV ) necessario per rivelare sorgenti a
5σ in funzione di θ apertura angolare attorno alla direzione. Le curve trattaggiate
rappresentano la sensibilitá di un apparato di 14400 m 2 in un anno di osservazione
mentre quelle continue sono riferite ad un apparato di 3600 m 2 in due anni di presa
dati. La sensibilitá di ARGO (∼ 5700 m 2 ) si ottiene scalando di un fattore 1.6
quella dell’apparato da 3600 m2 . I quadratini neri rappresentano i valori del flusso
misurati da EGRET nel caso di SNR.
Estensione
Φγ (> 100 MeV) /10−7
cm2 s−1
SNR
δ (◦ )
W63
+45 20
1.3
γCygni
+40 14
1.0
13.4
IC443
+22 36
0.8
4.3
W44
+01 18
0.5
7.4
W51
+14 00
0.4
2.0
Monoceros
+06 30
3.0
2.2
Angolare (gradi)
1.5
Tabella 2.3: SNRs rivelati da EGRET. δ (◦ ) é la declinazione delle sorgenti e
2 −1
−7
Φγ (> 100 M eV ) /10
cm s
é il flusso integrale a 100 M eV di soglia
36
anche nel caso in cui lo spettro dovesse essere piú ripido di ∼ E −1.4 fino a
700 GeV , mentre IC443 dovrebbe essere parzialmente osservabile a patto che
il suo spettro energetico sia abbastanza piatto (∼ E −1.3 ).
A parte le incertezze derivanti dalle estrapolazioni dal modello, sia per quello
che riguarda l’indice spettrale che il taglio nel valore dell’energia queste curve
danno una chiara previsione sulla possibilitá di rivelare fotoni da SNRs.
Poiché piú del 70% del segnale é dovuto a fotoni con energie inferiori ai
500 GeV , ARGO potrebbe essere sensibile anche a uno spettro energetico
con un taglio attorno a queste energie.
2.3.3
Nubi molecolari
La maggior parte delle nubi molecolari citate in tabella 1.3 sono osservabili
alle latitudini di Yanbajing. Tra queste ve ne sono alcune situate nel piano
galattico come Vul Rift e Gygn Rift ed altre poste fuori da tale piano come
Taurus e Per OB2.
É stata rivelata da EGRET emissione γ da Ophiucus e Orion fino a 10 GeV ,
ma non ci sono dati ad energie piú alte neanche da altre sorgenti. Inoltre, la
natura diffusa delle emissioni rende difficile l’osservazione di queste sorgenti
utilizzando telescopi Čerenkov. ARGO rappresenta quindi un’occasione
Figura 2.8: Φγ ( 100 M eV ) necessario a rivelare sorgenti a 5σ in due anni, in
funzione dell’estensione angolare per un apparato di 3600 m 2 . Il flusso rivelato da
ARGO si ottiene scalando di un fattore 1.6 quello mostrato. le curve si riferiscono
ad un’emissione di fotoni con spettro E −2.1 , E −2.3 , E −2.5 fino a 700 GeV .
2.3.4 Sorgenti extragalattiche (AGN)
37
unica per studiare tali emissioni ad energie superiori molte centinaia di GeV
dall’intervallo in cui ha operato EGRET. Lo spettro dei fotoni rivelato da
EGRET segue una legge a potenza ∼ E −2.1 ; estrapolando a 100 GeV si
ottiene che il flusso in questione risulta al di sopra della sensibilitá di ARGO.
La sensibilitá di ARGO per le emissioni diffuse é ottenuta selezionando
eventi che accendono 11 ÷ 20 PAD. Nella figura 2.8 é rappresentata la
sensibilitá a 5σ in due anni di presa dati, in termini del flusso a 100 M eV
Φγ ( 100 M eV ) e della dimensione angolare della sorgente per tre indici
spettrali differenti(x = 2.1, 2.3, 2.5).
2.3.4
Sorgenti extragalattiche (AGN)
La forma dello spettro degli AGN, ad energie del T eV , dipende sia
dall’energia massima che i primari possono raggiungere sia dalle loro
interazioni con i fotoni del fondo di radiazione cosmica; di conseguenza, la
pendenza varia molto e non é semplice fare delle previsioni. Per ottenere una
Figura 2.9: Il flusso minimo a 100 M eV di soglia, Φ γ (> 100 M eV ) necessario per
rivelare sorgenti a 5σ in un anno in funzione dell’indice spettrale. La linea continua
rappresenta il risultato per un apparato di 14400 m 2 , mentre quella tratteggiata é
riferita ad un apparato di 3600 m2 ; il valore per ARGO si ottiene scalando di un
fattore 1.6 il valore riferito all’apparato da 3600 m 2 . I punti rappresentano 19
sorgenti osservate da EGRET e visibili a Yanbajing con θ < 30 ◦ ; con i cerchi sono
indicate le sorgenti con redshift z < 0.5, con i quadratini 0.5 < z < 1, con le croci
z > 1.
38
Figura 2.10: Spettro calcolato dei fotoni di Mrk421 e 3C454.
stima della sensibilitá di ARGO nel rivelare fotoni provenienti da AGN, in un
anno di presa dati e con un segnale di 5σ superiore al fondo, é indispensabile
calcolare il flusso medio di una sorgente con spettro E −γ che si estende fino
a 700 GeV , e selezionando poi eventi con 20 ÷ 150 PAD accese.
I risultati sono mostrati in Figura 2.9, nella quale il flusso integrale ad
energie maggiori di 100 M eV é espresso in funzione dell’indice spettrale.
Vi sono, inoltre, rappresentate 19 sorgenti visibili a Yanbajing, con θ < 30◦ ,
che potrebbero essere rivelate da ARGO assumendo una estensione del loro
spettro fino a 500 GeV senza effetti di assorbimento.
Per ricavare informazioni sulla sensibilitá di ARGO nel rivelare sorgenti il cui
spettro di emissione é determinato dall’assorbimento dovuto alla radiazione
infrarossa di fondo, si prendono in esame gli spettri di Mrk 421 e3C454. Mrk
421 (z = 0.031) é stato rivelato sia da EGRET che da WHIPPLE; quindi,
combinando i risultati delle loro misure si ottiene l’andamento dello spettro
1.02 · 10−4 · E −2.06 f otoni · cm−2 s−1 T eV −1 fino a ∼ 2 T eV . Lo spettro di
3C454 (z = 0.86) é invece dominato, al di sopra dei 100 GeV , da effetti di
assorbimento.
rk 421
Il rapporto dei due flussi integrali Φ3C454
(> E)/ΦM
(> E) é circa 4.4 a
γ
γ
10 GeV , ma scende a solo 0.2 a 400 GeV (vedi figura 2.10). In tal modo,
3C454, pur essendo una sorgente AGN molto luminosa per EGRET, risulta
molto debole ad energie ∼ 400 GeV (ad esempio per WHIPPLE). Una stima
della sensibilitá di ARGO é ottenuta selezionando eventi nelle direzioni delle
sorgenti richiedendo che siano accese 20 ÷ 50 PAD.
La sorgente 3C454 é rivelata ad un livello di 5σ in circa 40 giorni di
2.3.5 GRB
39
osservazione, mentre la rivelazione di Mrk 421 richiede cica 3 mesi di presa
dati. Nella figura 2.11 viene mostrata, infine, la capacitá di ARGO nel
seguire variazioni nel flusso dei blazar, dove la frequenza dei fotoni é espressa
in funzione del tempo di osservazione T . Per misurare una variazione del
segnale con una sensibilitá di 3.5σ é necessario un aumento pari al flusso
della Crab in 5 giorni corrispondente ad un aumento del flusso di Mrk 421 di
∼ 3 volte. Tali valori sono inferiori all’aumento misurato da WHIPPLE tra il
14 e il 15 Maggio 1994; quindi, ARGO dovrebbe essere in grado di osservare
tali variazioni senza alcun problema.
2.3.5
GRB
Lo studio dei GRB di energia E > 10 GeV viene realizzato con la tecnica di
“singola particella” (SP) nel caso di GRB con E < 50 GeV , o con la tecnica
di “bassa molteplicitá” (LM) nel caso di energie piú alte.
• La tecnica di “singola particella” consiste nel registrare tutte le
particelle secondarie con un energia superiore ad una certa Esoglia .
Molti degli eventi sono dovuti a µ ed elettroni generati in sciami da
primari di bassa energia. In questo schema un GRB é rivelabile se le
particelle secondarie dovute alle interazioni di raggi γ con l’atmosfera
producono, in un breve lasso di tempo, un segnale con un’ampiezza
Figura 2.11: Frequenza minima di conteggio dei fotoni i funzione del tempo di
osservazione T per riuscire a rivelare variazioni del flusso di blazar a 3.5σ con
ARGO.
40
superiore alle fluttuazioni statistiche del fondo. Il limite di questa
tecnica sta nel fatto di non poter misurare né la direzione né l’energia
dei primari.
Dati un GRB con spettro energetico dNγ /dE (fotoni per unitá di area
e di energia) e l’angolo θ, il numero di eventi rivelati si puó scrivere,
tenendo conto della 2.2, come:
Z
dNγ
· ne (E, θ) · dE
(2.5)
NSP = Ad · fg · cos θ
dE
dove fg é un fattore di guadagno dovuto alla conversione dei fotoni
nello strato di piombo (fg ∼ 1.1).
Il segnale risulta quindi osservabile se il numero di particelle
√ rivelabili
é maggiore delle fluttuazioni statistiche del fondo NB = Ad · B · ∆t,
con B frequenza di conteggio del fondo e ∆t durata del GRB.
Se vogliamo che il segnale sia 4 deviazioni standard maggiore delle
fluttuazioni, si ottiene, per un GRB della durata ∆t = 1 s, un valore
di NSP > 1.2 · 104 .
• La tecnica di “bassa molteplicitá” consiste, invece, nel rivelare gli sciami
richiedendo che ognuno colpisca almeno 6 PAD. Usando questo metodo,
l’area effettiva Aef f per rivelare primari da γ o da protoni é di 2-3
ordini di grandezza inferiore a quella di “particella singola” a causa
del numero maggiore di particelle richiesto per soddisfare le condizioni
di “trigger”. Inoltre, la possibilitá di ricostruire il fronte dello sciame
riduce il fondo. La risoluzione angolare per primari con E ∼ 10 GeV
é r ∼ 5◦ [3]. Se utilizziamo lo spettro dei protoni primari ricavato da
Honda[25] il numero di eventi di fondo con direzione di arrivo in un
cono di apertura r ∼ 5◦ eθ = 20◦ é BLM ∼ 160 s−1 ed il numero di
eventi da GRB rivelato da ARGO é:
Z
dNγ
NLM = 0.7 · Aef f ·
· dE
(2.6)
dE
Se richiediamo che il segnale sia superiore al fondo di 4 deviazioni
standard, il numero NLM di eventi da GRB in un tempo ∆t = 1 s
e con θ = 20◦ deve essere ∼ 50.
Supportati dalle misure fatte da EGRET, assumiamo che lo spettro dei
fotoni provenienti da un GRB al momento di interagire con l’atmosfera sia
dN
= k · E −α fotoni al m2 e si estenda senza cambiamenti fino ad una
dE
energia Emax superiore a 10 GeV con un indice spettrale (tra 30 M eV e
10 GeV ) α = 1.95 ± 0.25[12]. Per valutare la sensibilitá di ARGO si studia
il flusso di energia minimo tra 1 GeV ed Emax necessario ad osservare un
GRB, assumendo che lo spettro si estenda con una pendenza costante fino
2.3.5 GRB
41
Figura 2.12: Flusso di energia minimo tra 1 GeV e 1 T eV osservabile con ARGOYBJ in funzione dell’energia massima dello spettro E max usando la tecnica LM
(linea continua) e la tecnica SP (linea tratteggiata). I punti rappresentano le
misure fatte da EGRET estrapolate a 100 GeV .
oltre Emax . In figura 2.12 é mostrato il flusso minimo Fmin in funzione
di Emax nell’intervallo tra 10 GeV ed 1 T eV adoperando le due suddette
tecniche. Le curve sono riferite ad un GRB della durata ∆t = 1 s con indice
spettrale α = 2.0 e con il vincolo che il segnale sia almeno 4 deviazioni
standard maggiore delle fluttuazioni del fondo. Come si puó osservare, la
sensibilitá aumenta con Emax e la dipendenza é piú marcata per la tecnica
LM che per quella SP. Ció sta ad indicare che la tecnica SP é piú valida
se lo spettro energetico ha un taglio per valori di Emax relativamente bassi
(Emax < 50 GeV ).
Adottando entrambi i metodi, ARGO potrebbe rivelare GRBs con un flusso
di energia in un intervallo tra 1 GeV e 1 T eV di 10−6 ÷ 10−5 erg · cm−2
con un indice spettrale α ∼ 2. Confrontando poi il valore con le misure
di EGRET, estrapolate a 100 GeV (i punti neri in figura 2.12), si vede
che la maggior parte di queste hanno un flusso di energia che le rende
potenzialmente rivelabili da ARGO.
42
Capitolo 3
Studio degli sciami atmosferici
ed analisi multiscala
T
utti i raggi cosmici, interagendo con gli strati alti dell’atmosfera,
producono sciami di particelle secondarie, delle quali alcune giungono al
suolo. Il funzionamento degli apparati ground based consiste nell’osservare il
fronte dello sciame e nel ricavare informazioni sui diversi parametri associati
alle caretteristiche della particella primaria. Per fare ció, bisogna conoscere in
dettaglio sia il meccanismo di sviluppo degli sciami atmosferici sia la risposta
dell’apparato. La risposta dell’apparato puó essere conosciuta solo attraverso
una simulazione delle condizioni sperimentali in cui lo specifico esperimento
lavora. La tecnica utilizzata per lo studio degli sciami e dell’apparato é quella
delle simulazioni Monte Carlo, dalle quali si cerca di estrarre un insieme di
parametri sensibile al tipo di studio che si vuole fare.
In questo capitolo si illustrerá l’impiego, del tutto originale, di tecniche di
analisi dell’immagine e di variabili fino ad oggi esclusivamente impiegate
in esperimenti con telescopi Ćerenkov.
Tali possibilitá sono dovute
essenzialmente all’alta granularitá e risoluzione temporale di ARGO che
permettono di fare dell’imaging.
3.1
Sciami atmosferici
L’atmosfera terrestre agisce, rispetto alle particelle primarie, sia come
bersaglio che come calorimetro. Se vogliamo quindi caratterizzare il tipo
44
Studio degli sciami atmosferici ed analisi multiscala
di primario é necessario conoscere i tipi di interazione che sia esso quanto le
particelle secondarie possono avere con l’atmosfera in base alla loro energia
e natura.
Ad esempio, la composizione di uno sciame é fortemente caratterizzata
dalla natura del primario, cosı́ tanto che si possono rivelare delle differenze
topologiche nell’immagine ricostruita al suolo. Queste sostanziali differenze
dipendono dal fatto che negli sciami indotti da γ e in quelli da adroni il tipo
di interazioni coinvolte é differente.
3.1.1
Sciami elettromagnetici
Sono definiti “sciami elettromagnetici” tutti gli sciami in cui i
processi coinvolti sono di tipo puramente elettromagnetico. Essi hanno
come particella primaria elettroni, positroni, fotoni o muoni di alta
energia. I processi principali che contribuiscono allo sviluppo della cascata
elettromagnetica sono:
1) produzione di coppie
γ + nucleo −→ e+ + e− + nucleo0
(3.1)
e− + nucleo −→ γ + e− + nucleo0
e+ + nucleo −→ γ + e+ + nucleo0
(3.2)
2) bremsstrahlung
3) perdita di energia per ionizzazione
I primi due processi sono quelli che determinano la moltiplicazione
delle particelle (vedi figura 3.1), mentre il terzo limita lo sviluppo dello
sciame. Ad esempio, se consideriamo un fotone da 1 GeV , il processo
dominante, nelle interazione con gli atomi d’aria, risulta quello della creazione
di coppie e+ e− che si dividono l’energia iniziale del fotone. Queste particelle
secondarie hanno, in media, energia sufficente per interagire con l’atmosfera
per bremsstrahlung. Si ha, cosı́, la produzione di un elettrone (o positrone)
di energia piú bassa e di un fotone che ha una energia dello stesso ordine
di grandezza del leptone di partenza. Se il fotone ha energia abbastanza
elevata come supposto, questi processi si ripetono a catena fino a quando le
particelle prodotte non raggiungono l’energia critica Ec che per un elettrone
é di 80 M eV al livello del mare a 20◦ C. L’energia critica EC é definita come
l’energia al di sotto della quale la perdita di energia per ionizzazione risulta
maggiore di quella per produzione di particelle (bremsstrahlung).
3.1.2 Sciami adronici
45
Figura 3.1:
Diagrammi di Feynmann dei principali processi di produzione
di particelle in sciami elettromagnetici, la presenza del nucleo assicura la
conservazione del quadrimpulso.
3.1.2
Sciami adronici
Gli sciami iniziati da adroni vengono tipicamente chiamati “sciami
adronici”. Se si considera ad esempio un protone di energia E0 che incide su
un nucleo di ossigeno o di azoto, esso uscirá dalla interazione con una energia
(1 − K)(E0 + MN ), e la restante frazione K dell’energia sará convertita in
particelle secondarie (per lo piú pioni, ma anche kaoni ed altre particelle).
La frazione K, detta fattore di inelasticitá dell’urto, é definita come:
K=
E0 − E 0
E0 + M N
(3.3)
dove E0 é l’energia del nucleone incidente, E 0 la sua energia dopo l’urto e
MN la massa del nucleone bersaglio.
Poiché il tempo di decadimento dei pioni carichi é τπ± = 2.6 · 10−8 s, accade
che solo pochi di essi decadono in volo prima di collidere con altri nuclei,
mentre i pioni neutri (τπ0 = 8.4 · 10−17 s) decadono rapidamente secondo:
π 0 −→ γγ
(3.4)
Il nucleone, i pioni carichi e le altre particelle, che possono avere delle
interazioni forti con i nuclei atmosferici, producono adroni secondari: questa
catena dá origine alla componente adronica dello sciame. I pioni carichi
che non interagiscono con l’atmosfera, soprattutto quelli di bassa energia,
decadono attraverso:
π + −→ µ+ + νµ
π − −→ µ− + ν̄µ
(3.5)
Inoltre, un altro contributo al numero di µ prodotti deriva da decadimenti
analoghi (vedi processi 3.5) dei kaoni carichi, il 5% alle basse energie, l’8%
46
Figura 3.2: Schematizzazione dello sviluppo di uno sciame atmosferico iniziato da
un protone.
con Eµ = 100 GeV fino ad un massimo del 27% per energie piú alte. I muoni
cosı́ prodotti risultano piú penetranti in quanto la probabilitá di perdere
tutta la loro energia per ionizzazione o quella di decadere é molto piccola per
muoni di energie superiori al GeV [24] e vanno a formare la componente
hard dello sciame adronico.
I fotoni prodotti dal decadimento dei π 0 e delle particelle η originano delle
sottocascate elettromagnetiche danno origine alla cosiddetta componente
soft dello sciame.
3.2
Modelli analitici
La modellizzazione matematica dello sviluppo di uno sciame atmosferico
risulta molto complicata in quanto esso é il frutto delle proprietá
delle interazioni adroniche ed elettromagnetiche nonché delle proprietá di
trasporto delle particelle secondarie nell’atmosfera. I valori delle sezioni
d’urto adroniche ad alte energie non sono noti sperimentalmente e devono
essere valutati attraverso modelli teorici o estrapolati dalle misure agli
acceleratori. Si hanno, prció, delle grosse indeterminazioni nei modelli di
3.2 Modelli analitici
47
sviluppo degli sciami.
Nei modelli va tenuto conto del fatto che i processi che generano le cascate
sono di natura statistica, dunque, le sole informazioni che si possono ottenere
riguardano l’andamento medio delle grandezze caratterizzanti lo sciame.
Inoltre, i primari che generano le particelle osservate sulla Terra sono
particelle relativistiche e, quindi, a causa del boost di Lorentz cui sono
sottoposte, lo sviluppo dello sciame avviene in avanti rispetto alla direzione
di incidenza del primario.
Nel linguaggio della fisica degli sciami atmosferici, si é soliti esprimere le
lunghezze di interazione o di decadimento in unitá di spessore di massa
(lunghezza per densitá del mezzo).
Poiché la distanza percorsa nell’atmosfera é un parametro molto importante
nella modellizzazione, bisogna conoscere bene le sue caratteristiche.
Solitamente si assume che essa sia composta da un unico tipo di atomi con
numero atomico medio < A >∼ 14 e che la sua densitá sia una funzione
esponenziale dell’altitudine h (vedi figura 3.3).
Inoltre, lo spessore verticale dell’aria é legato al profilo di densitá
dell’atmosfera dalla relazione:
Xv =
Z
∞
ρ(h0 )dh0
h
dove Xv puó essere pensato come la proiezione dell’asse dello sciame lungo
la verticale ed é espresso in g/cm2 , mentre ρ(h0 ) é la densitá dell’atmosfera.
É conveniente misurare le distanze in unitá di libero cammino medio λj (E)
Figura 3.3: Densitá dell’atmosfera in funzione della quota.
48
della particella di tipo j che si considera:
tj (E) =
3.2.1
X
λj (E)
Modello di Heitler
Il modello di Heitler dá una visione qualitativa dello sviluppo longitudinale
degli sciami elettromagnetici. Si considera uno sciame iniziato da un γ di
energia E0 e si fanno alcune ipotesi:
a. Si assume che, ad alte energie, le sezioni d’urto dei processi che entrano
in gioco siano indipendenti dal tipo di particella considerata.
b. Si trascura la perdita di energia per ionizzazione ad energie superiori
all’energia critica Ec e si suppone che, per E < Ec , l’energia sia persa
solo attraverso processi anelastici.
c. Si considera un valore dell’energia critica per i fotoni uguale a Ec . Per
E > Ec si considera solo il processo di produzione di coppie mentre per
E < Ec si suppone perdita di energia solo per diffusione Compton.
d. La lunghezza di radiazione riferita agli e± si pone uguale al libero
cammino medio dei fotoni. Tale valore viene indicato da Xrad ed é
usato per esprimere la profonditá di penetrazione dello sciame in unitá
t:
t=
X
Xrad
e. Ogni e± con un valore dell’energia maggiore di Ec cede metá della sua
energia ad un fotone di bremsstrahlung dopo aver percorso una distanza
Xrad .
f. Ogni fotone con energia E > Ec produce una coppia e+ e− dopo
aver viaggiato per una lunghezza di radiazione; a ciascuna delle due
particelle create spetta esattamente metá dell’energia del γ che le
genera.
Come si puó osservare dalla figura 3.4, il numero di particelle presenti ad una
profonditá t cresce esponenzialmente con la profonditá stessa.
Infatti:
N (t) = 2t = et ln 2
(3.6)
3.2.1 Modello di Heitler
49
Possiamo inoltre valutare l’energia media che compete ad una particella alla
profonditá t,
E0
(3.7)
2t
Ovviamente il numero di particelle é massimo in corrispondenza di E(t) = Ec .
Invertendo la relazione 3.7, si ottiene la profonditá relativa al massimo
sviluppo dello sciame:
E(t) =
ln(E0 /Ec )
,
(3.8)
ln 2
in piú si ricava che tmax cresce logaritmicamente con l’energia del primario e
che il numero massimo di particelle é proporzionale ad E0 :
tmax = t(Ec ) =
Nmax = 2tmax = etmax ln 2 =⇒ Nmax =
E0
Ec
(3.9)
L’improvviso arrestarsi della moltiplicazione delle particelle é dovuto alle
semplificazioni adoperate nel modello; esistono, comunque, varianti piú
raffinate di questo, in cui vi é l’aggiunta di termini che tengono conto della
perdita di energia per ionizzazione e della diffusione Compton anche ad
energie superiori a Ec [8].
In linea di principio, si puó anche pensare di applicare modelli di questo tipo
agli sciami adronici, supponendo un nucleo di numero di massa A analogo
ad A nucleoni indipendenti. Poiché, nel caso adronico, la distribuzione dei
punti di interazione dipende dalla sezione d’urto anelastica σN −aria , allora
il risultato dipende necessariamente dal particolare modello di interazione
adronica usato. Ció che si ricava adoperando diversi modelli[47] é:
Nmax = (1.1 ÷ 1.6)E0 (GeV ) e tmax ∝ ln(E0 )
(3.10)
Figura 3.4: Rappresentazione dello sviluppo di uno sciame iniziato da un fotone
di energia E0 secondo il modello di Heitler.
50
3.2.2
Equazioni di trasporto
Se vogliamo descrivere gli sciami in un modo piú dettagliato, possiamo
risolvere le equazioni differenziali che descrivono le interazioni e le proprietá
di trasporto nell’atmosfera delle particelle che compongono lo sciame.
In una dimensione, la forma matriciale del sistema di equazioni differenziali
accoppiate é[17]:
1
dNi (Ei , X)
1
Ni (Ei , X)
(3.11)
=−
+
dX
λi (Ei ) di (Ei )
X Z Fji (Ei , Ej ) Nj (Ej )
+
dEj
Ei
λj (Ej )
j
dove gli indici corrono su tutti i tipi di particelle presenti nello sciame, mentre
le grandezze nell’espressione 3.11 sono:
• Ni (Ei , X) é il numero di particelle di tipo i ed energia Ei presenti a
profonditá X,
• λi (Ei ) e di (Ei ) sono le lunghezze di interazione e di decadimento in
atmosfera della particella i−esima, con la complicazione di avere una
somma pesata delle lunghezze associate a diversi processi nel caso che
i canali possibili siano piú di uno.
• Fji (Ei , Ej ) é definita come:
Fji (Ei , Ej ) = Ei
dni (Ei , Ej )
dEi
(3.12)
dove dni é il numero di particelle di tipo i prodotte in media
nell’intervallo infinitesimo di energia dEi da una particella di tipo j
avente energia Ej e viene da una somma pesata di tutti i processi che
danno come risultto particelle di tipo i a partire da particelle di tipo j.
Nelle equazioni 3.11, il primo termine tiene conto delle interazioni e dei
decadimenti delle particelle di tipo i, mentre il secondo dei processi che
hanno fra i prodotti queste particelle. Le condizioni al contorno dipendono
ovviamente dalla natura del primario.
La versione tridimensionale delle equazioni 3.11 dá una descrizione
completa dello sviluppo dello sciame atmosferico. La soluzione analitica
é estremamente complessa giá nel caso unidimensionale e richiede delle
approssimazioni per essere risolta:
• Si considerano solo i processi dominanti alle energie a cui siamo
interessati.
3.3 Simulazioni Monte Carlo
51
• Si sostituiscono le lunghezze di decadimento ed interazione con un valor
medio costante al variare del’energia
• Si ricorre all’ipotesi di scaling di Feynman[40]:
Fji (Ei , Ej ) ' Fji
Ei
Ej
(3.13)
Nel caso adronico, alle alte energie, esistono dei modelli che prevedono la
violazione dello scaling; ció implica una maggiore rapiditá nello sviluppo
dello sciame e, quindi, un tmax piú piccolo[47]. Per evitare questi problemi si
ricerca la soluzione delle equazioni di trasporto per via numerica.
3.3
Simulazioni Monte Carlo
Come giá detto, la descrizione per mezzo di modelli analitici degli sciami
atmosferici risulta complicata in quanto abbiamo a che fare con processi
statistici i cui dettagli non possono essere inclusi in espressioni analitiche.
Quello che si puó fare é utilizzare delle simulazioni con tecniche Monte Carlo
su di un campione di eventi statisticamente rilevante. Il programma piú
largamente utilizzato a questo scopo (di cui si é fatto uso anche nell’ambito
di questa tesi) é CORSIKA[22]. Per ciascuna particella nello sciame,
viene generata casualmente la distanza percorsa secondo una distribuzione
esponenziale decrescente che é risultato di due contributi: il primo derivante
dalla probabilitá di interazione delle particelle, il secondo da quella di
decadimento.
Il primo termine indica la probabilitá di attraversare un tratto con spessore
χ senza avere interazioni ed é dato da:
1
Pint (χ) =
· e−χ/λint
(3.14)
λint
dove χ = − ln(RNDM)·λint con 0 <RNDM> 1, mentre λint é il libero cammino
medio definito come:
P3
ni A i
λint = P3i=1
i=1 ni σiint
con Ai peso atomico e σiint = σiint (E) sezione d’urto, mentre ni rappresenta
le frazioni dei nuclei che compongono l’aria1 .
1
si considera: n(N2 ) = 0.7848, n(O2 ) = 0.2105, n(Ar) = 0.0047.
52
Figura 3.5: Simulazione tridimensionale di uno sciame elettromagnetico ed uno
adronico fatta da CORSIKA. Le distanze sono esprese in metri. Sul piano
orizzontale é rappresentata la distribuzione dei fotoni Čerenkov prodotte dalle
particelle dello sciame. I colori indicano i diversi tipi di particelle presenti.
Il secondo termine descrive la probabilitá che una particella compia un
percorso ` senza decadere ed é scritta come:
1
PD (`) =
· e−`/`D
(3.15)
`D
dove ` = − ln(RNDM)·`D con 0 <RNDM> 1 e `D = c · τ · γ · β. I due processi
sono in competizione nel senso che una particella con un lungo tempo di vita
ha una probabilitá di interagire piú alta e viceversa.
Una delle incertezze maggiori deriva dal fatto che le sezioni d’urto adroniche
ad alte energie non sono note da esperimenti agli acceleratori e vanno
quindi ricavate estrapolando i dati sperimentali con una incertezza che deriva
dall’utilizzo di un modello di interazione piuttosto che un altro. Gli altri
ingredienti fondamentali per una corretta simulazione degli sciami atmosferici
sono:
• Densitá dell’atmosfera;
• Campo magnetico terrestre che distorce la distribuzione delle particelle;
• Perdita di energia delle particelle per ionizzazione;
• Scattering mutiplo.
Il risultato di questo approccio é un diagramma ad albero, la cui immagine
tridimensionale é mostrata in figura 3.5.
3.4 Analisi multiscala
53
Si fa presente che questo tipo di studio é uno strumento fondamentale nella
astronomia γ se si vogliono valutare le performance dei rivelatori; infatti, la
calibrazione dell’apparato sperimentale non puó essere fatta, a differenza di
quanto accade negli esperimenti agli acceleratori, attraverso sorgenti le cui
caratteristiche sono perfettamente note.
3.4
Analisi multiscala
Come si puó vedere dalla figura 3.5, vi sono delle sostanziali differenze
tra gli sciami da fotone e quelli da protone dovute essenzialmente alle
differenti interazioni coinvolte nello sviluppo nell’atmosfera. La presenza
di sottocascate elettromagnetiche negli sciami adronici rende l’immagine
sul rivelatore meno omogenea rispetto a quella data da uno sciame da
γ. Tali considerazioni ci hanno indotto ad utilizzare un’analisi di tipo
multiscala per ricavare informazioni sulle sottostrutture degli sciami al fine
di evidenziare differenze tra eventi da fotoni e da adroni. Questa ipotesi deve
essere testata attraverso delle simulazioni, ma potrebbe essere giustificata a
priori se si pensa che la sezione dello sciame rivelata dall’apparato é data
dalla sovrapposizione delle particelle di tutti i sottosciami generati nella
cascata dando come risultato una immagine in cui le sottostrutture sono
sovrapposte l’una all’altra. L’analisi dell’immagine a diverse scale dovrebbe
far emergere queste differenze che, portando le informazioni del tipo di
primario, dovrebbero permettere di distinguere tra sciami iniziati da gamma
e da adroni. Ci teniamo a ribadire che questo tipo di studio é stato fatto solo
in esperimenti con telescopi Čerenkov e mai con apparati di sciame come
ARGO. Nei telescopi Čerenkov ció che viene osservato é la luce durante
tutto lo sviluppo dello sciame, mentre ARGO ne vede solo una sezione.
Ció potrebbe rendere piú sensibile ARGO in quanto le fluttuazioni presenti
nell’immagine vengono maggiormente evidenziate. Si é deciso di utilizzare un
tipo di analisi discreta in quanto l’immagine dello sciame fornitaci da ARGO
puó essere pensata come una funzione bidimensionale definita su un reticolo;
inoltre, tale scelta riduce il tempo di calcolo.
La caratteristica nota come “self-similarity” si manifesta in tantissimi
fenomeni naturali. Essa consiste nel fatto che se si osserva tale fenomeno
sempre piú in dettaglio, si riscontra una struttura che si ripete uguale ad
ogni scala di grandezza. Le strutture che mostrano un tale comportamento
sono note come frattali e possono qualitativamente essere caratterizzate da
un parametro noto come dimensione frattale. Queste caratteristiche sono
osservate anche in funzioni di distribuzione associate a una qualche quantitá
fisica. Alcuni esempi sono: la distribuzione spaziale dell’energia dissipata
in fenomeni turbolenti o le fluttuazioni delle ampiezze delle funzioni d’onda
elettroniche nella transizione conduttore-isolante in sistemi caotici.
54
Se nell’analisi di una distribuzione di tipo “self-similar” si ha bisogno di
un numero infinito di dimensioni frattali[31], le distribuzioni corrispondenti
prendono il nome di multifrattali e vengono analizzate con il cosiddetto “boxcounting method”.
Un metodo alternativo é quello di caratterizzare le distribuzioni con l’analisi
di wavelet, che puó essere considerata come una serie di rappresentazioni
del segnale che esaminano la struttura a differenti scale di grandezza. In
questo senso, il segnale che si esamina puó essere rappresentato attraverso
un set completo di funzioni ognuna ortogonale all’altra alle diverse scale
di osservazione. Il set di funzioni viene costruito attraverso la dilatazione
e traslazione discreta di una wavelet madre. Questo approccio non é da
ritenersi alternativo a quello classico, bensı́ complementare in casi in cui il
comportamento multifrattale del campione non sia chiaro. Si puó infatti
verificare che distribuzioni, che ad una analisi classica mostrano segni di
comportamento multifrattale, se studiate con un analisi di wavelet risultano
regolari. Accade anche il contrario, e cioé che un debole comportamento
multifrattale, invisibile ad un’analisi classica venga “smascherato” da uno
studio dei momenti di wavelet.
3.4.1
Analisi multifrattale standard
Consideriamo un reticolo ipercubico d-dimensionale di lunghezza unitaria e
assumiamo che la distribuzione da analizzare φ(~x) ≥ 0 sia definita in ogni
punto ~x del reticolo. Suddividiamo il reticolo in celle non sovrapposte di
dimensione ` e denotiamo la probabilitá totale all’interno di una cella centrata
in ~x con:
p(~x, `) =
0
P
φ(~
x0 )
NT OT
{~
x0 }
0
,
{~x } = {x ≤ x ≤ x + ` − 1,
(3.16)
0
y ≤ y ≤ y + ` − 1, . . . , z . . . }, ` ≥ 1 ,
dove NT OT é il contenuto totale del reticolo. Per il tipo di problemi a cui
siamo interessati, le probabilitá all’interno delle celle hanno un andamento
del tipo hp(~x, `)i ∼ `α quando ` → 1, da cui in principio si possono
ricavare gli esponenti di scala α(> 0) detti esponenti di singolaritá[20].
La conoscenza di tutti gli esponenti α non é sufficiente a caratterizzare la
misura; infatti, é necessario sapere quanto spesso un dato valore sia presente.
Piú precisamente, dobbiamo studiare i sottoinsiemi della distribuzione
N (α, `). Assumiamo che queste distribuzioni abbiano un andamento del tipo
N (α, `) ∼ `−f (α) , quando ` → 1, e dove f (α) é la dimensione frattale del
sottoinsieme considerato.
Nel caso in cui vi siano infiniti valori di α che caratterizzano la misura, allora
ci sono anche infiniti sottoinsiemi. In questo caso la distribuzione é detta
3.4.2 Approccio differenziale all’analisi multifrattale
55
multifrattale. Questo complesso comportamento si riflette sull’espressione
dei momenti hpq (~x, `)i ∼ `qα(q) , dove q é un numero reale e α(q) é una funzione
non lineare di q. Ció significa che per q 6= 1, α(q) 6= α e
hpq (~x, `)i 6= hp(~x, `)iq
(3.17)
Al contrario, se vi é un solo valore di α che caratterizza la distribuzione,
allora essa é regolare e si ha che
hpq (~x, `)i ∼ hp(~x, `)iq
(3.18)
Per calcolare la dimensione frattale f (α) bisogna studiare l’andamento della
funzione definita come:
X
hpq (~x, `)i ∼ `τ (q) , ` → 1,
(3.19)
Zq (`) =
{~
x}
dove {~x} = {0, `, 2`, . . . ; y = 0, `, 2`, . . . ; z . . . }.
Gli esponenti τ (q) ci danno l’intera informazione richiesta per ricavare α e
f (α). Sostituendo nell’equazione 3.19 l’andamento ipotizzato per hpq (~x, `)i
si ottiene:
X
X
X
Zq (`) ∼
`qα(q) ∼
`qα(q) N (α, `) ∼
`qα(q) `−f (α)
(3.20)
{~
x}
α
α
dove abbiamo sostituito la somma sulle coordinate delle celle ~x con la somma
sugli α. L’espressione risultante puó essere risolta passando dalla sommatoria
all’integrale su α. Il risultato é che α(q) = dτ /dq e f (α) = qα(q) − τ (q) [20],
da cui f (α) é la trasformata di Legendre di τ (q). Per una misura regolare
τ (q) risulta essere una funzione lineare di q, τ (q) = α0 (q − 1), con α0 = d
dimensione del supporto della misura e f (α) = α = d.
Se consideriamo invece una distribuzione multifrattale, τ (q) diventa una
funzione non lineare di q dando come risultato un insieme di infiniti valori
per α e f (α).
Operativamente, data l’equazione 3.19, τ (q) verrá ricavato misurando la
pendenza della retta che passa per i punti Zq (`) in scala bilogaritmica. Il
metodo descritto per determinare α, ha comunque lo svantaggio di non essere
sufficientemente accurato soprattutto nei casi in cui la distribuzione abbia
un debole comportamento multifrattale o il comportamento multifrattale sia
nascosto da un fondo uniforme.
3.4.2
Approccio differenziale all’analisi multifrattale
Allo scopo di distinguere meglio i diversi comportamenti di una distribuzione,
studiamo le proprietá di scala delle differenze tra le probabilitá di occupazione
56
delle celle vicine. Per semplicitá, consideriamo il caso unidimensionale e
rimandiamo la generalizzazione al paragrafo 3.4.4.
In analogia con l’equazione 3.19, analizziamo il comportamento di una nuova
funzione:
X
Wq (`) =
h|p(x, `) − p(x + `, `)|q i ∼ `β(q) , ` → 1,
(3.21)
{x}
dove {x} = {0, 2`, 4`, . . . }. L’esponente di scala β(q) ha lo stesso ruolo di τ (q)
nell’equazione 3.19. Per convenienza, in questa analisi consideriamo q ≥ 0,
in quanto valori negativi di q (vedi [36]) portano solo delle complicazioni di
cui nella nostra trattazione non abbiamo bisogno.
Consideriamo ora il caso di una distribuzione con caratteristiche multifrattali.
In questa situazione, ci si aspetta che la differenza |p(x, `) − p(x + `, `)|
abbia anch’essa un comportamento multifrattale e che l’esponente β(q) sia
una funzione non lineare di q. Prendiamo ora in esame un caso semplice
in cui si abbia h|p(x, `) − p(x + `, `)|q i ∼ hpq (x, `) da cui β(q) = τ (q).
Nel caso di trasformate di wavelet continue ció puó essere provato facendo
delle opportune ipotesi[37]. In generale per delle distribuzioni standard ci
aspettiamo che
hp(x, `)i ∼ `α hc(x)i, ` → 1,
(3.22)
dove α assume un solo valore e c(x) > 0 é una funzione modulante.
Dall’equazione 3.22 si ha che h|p(x, `) − p(x + `, `)|i ∼ `α h|c(x) − c(x + `)|i.
Assumiamo ora (come nei casi di nostro interesse avviene) di avere un
andamento h|c(x) − c(x + `)|i ∼ `H quando ` → 1, da cui
h|p(x, `) − p(x + `, `)|i ∼ `α+H .
(3.23)
In questa espressione, H é un nuovo esponente che caratterizza la
distribuzione.
Poiché abbiamo assunto di avere a che fare con una
distribuzione regolare si ha
h|p(x, `) − p(x + `, `)|q i ∼ h|p(x, `) − p(x + `, `)|iq
che utilizzando le equazioni 3.21 e 3.23 diventa
X
X
`qα N (α, `) ∼ `qH Zq (`).
Wq (`) =
`qα `qH ∼
= `qH
{x}
(3.24)
(3.25)
α
Per cui si ottiene:
β(q) = τ (q) + Hq,
che differisce da τ (q) per il termine addizionale Hq.
(3.26)
3.4.3 Analisi di wavelet
57
Figura 3.6: Funzioni b(x, `) in funzione di x per ` = 1, 2, 4 (a sinistra in azzurro)
e funzioni Haar-wavelets w(x, 2`) in funzione di x per 2` = 2, 4 (a destra in rosso).
3.4.3
Analisi di wavelet
L’equazione 3.21 é strettamente legata all’analisi di wavelet di una funzione
di distribuzione φ(~x).
Per far vedere ció, consideriamo un reticolo
unidimensionale e notiamo che le p(x, `) dell’equazione 3.16 possono essere
ottenute dalla convoluzione
Z
p(x, `) = dx0 φ(x0 )b(x0 − x, `)
(3.27)
dove
b(x, `) =
1 se 0 ≤ x < `
0
altrove
(3.28)
Esempi di queste funzioni b(x, `) sono mostrate in figura 3.6 a sinistra; a
destra vi sono, invece, le cosiddette Haar-wavelets, denotate con w(x, 1`) e
definite come:

 1 se 0 ≤ x < `
−1 se ` ≤ x < 2`
w(x, `) =
(3.29)

0
altrove
58
Figura 3.7: Espansione di una data funzione f (x) in: (a) funzioni b(x, `), dove
f (x) = b(x − 1, 1) − (1/2)[b(x − 2, 1) + b(x − 3, 1)], e (b) Haar-wavelets w(x, 2`)
dove f (x) = (1/2)[w(x, 4) − w(x, 2)].
Se calcoliamo la convoluzione della nostra distribuzione φ(x) con le w(x, 2`)
otteniamo
Z
p(x, `) − p(x + `, `) = dx0 φ(x0 ) w(x0 − x, 2`)
(3.30)
Si vede, quindi, che le differenze tra le distribuzioni all’interno delle celle
contigue di dimensione lineare `, introdotte nell’equazione 3.21, sono proprio
i coefficienti dell’espansione in Haar-wavelets della funzione di distribuzione
φ(x) che caratterizza la nostra misura:
XX 1
φ(x) =
[p(x0 , `) − p(x0 + `, `)] w(x − x0 , 2`),
(3.31)
2`
0
`≥1
{x }
dove {x0 } = {0, 2`, 4`, . . . }.
Come si puó vedere dalla figura 3.6, le wavelets w(x, 2`) hanno la proprietá
di essere ortogonali l’una all’altra solo all’interno di una assegnata scala di
lunghezza. Questa proprietá delle wavelets si riflette nell’equazione 3.31, in
cui le funzioni base w(x, 2`) forniscono una completa rappresentazione della
funzione φ(x) a tutte le scale di osservazione `. In contrasto con le funzioni
b(x, `), l’intera informazione sulla distribuzione φ(x) é contenuta giá alla piú
piccola scala (` = 1).
Infatti:
X
φ(x) =
p(x0 , 1)b(x − x0 , 1),
(3.32)
{x0 }
dove {x0 } = {0, 1, 2, . . . }. Le differenze tra i due tipi di espansione possono
essere apprezzate in figura 3.7.
Il risultato di questa trattazione é che la funzione “differenziale”, introdotta
nell’equazione 3.21, ci fornisce un metodo alternativo per studiare il
comportamento di una distribuzione al variare della scala di analisi nei casi
in cui la classica analisi multifrattale fornisce un risultato ambiguo.
3.4.4 Sistemi a piú dimensioni
3.4.4
59
Sistemi a piú dimensioni
L’analisi di wavelet descritta in precedenza puó essere estesa a reticoli ndimensionali. In due dimensioni vengono utilizzate tre funzioni discrete
indicate schematicamente da:
+ −
+ −
+ +
− +
+ −
− −
(3.33)
(2)
(1)
(3)
Queste portano a scrivere tre diverse funzioni di partizione Wq (`), i = 1, 2, 3,
definite come:
XX
Wq(1) (`) =
h|p(x, y, `) + p(x + `, y, `)
{x} {y}
−p(x, y + `, `) − p(x + `, y + `, `)|q i,
Wq(2) (`) =
XX
{x} {y}
h|p(x, y, `) − p(x + `, y, `)
+p(x, y + `, `) − p(x + `, y + `, `)|q i,
Wq(3) (`) =
XX
{x} {y}
(3.34)
(3.35)
h|p(x, y, `) − p(x + `, y, `)
−p(x, y + `, `) + p(x + `, y + `, `)|q i,
(3.36)
dove {x} = {0, 2`, 4`, . . . }, {y} = {0, 2`, 4`, . . . }. Queste funzioni avranno un
i
andamento del tipo Wqi ∼ `β (q) , quando ` → 1 ed in generale gli esponenti
β i (q) saranno diversi.
La generalizzazione dell’analisi di wavelet a sistemi tridimensionali é
semplice, ma la caratterizzazione della distribuzione richiede l’uso di una
base formata da sette wavelets diverse.
3.5
Skewness
Dall’osservazione delle immagini di sciami simulati, cosı́ come li vede ARGO,
si puó notare come una caratteristica degli sciami adronici, rispetto a quelli
elettromagnetici, sia la mancanza di simmetria nella distribuzione delle pad
accese nel rivelatore. L’idea é stata, dunque, di cercare un parametro che,
data la nostra distribuzione bidimensionale, potesse quantificare questo tipo
60
di effetto.
Tale variabile esiste, misura la mancanza di simmetria di una distribuzione
unidimensionale, ed é chiamata “skewness”. Dato un set di misure
X1 , X2 , . . . , XN , la skewness é definita come:
SKW =
PN
Xi − X
(N − 1) s3
i=1
3
(3.37)
dove X é la media della distribuzione, s la deviazione standard ed N il numero
di misure.
La skewness di una distribuzione normale é nulla, come accade per una
qualunque quantitá fisica la cui distribuzione é simmetrica rispetto ad un
dato punto. Un valore negativo indica che la distribuzione ha una asimmetria
sinistra, viceversa per valori positivi. Nel nostro caso, avendo a che fare con
delle distribuzioni bidimensionali, avremo due valori della skewness, una per
la distribuzione lungo l’asse x e l’altra lungo l’asse y.
Qualitativamente per un singolo evento da fotone ci aspettiamo la presenza
di una maggiore simmetria tra asse x ed y rispetto ad un evento da protone.
Questo non dovrebbe essere vero per un grande numero di eventi, ma
comunque si dovrebbe notare una maggiore fluttuazione intorno alla media
per eventi da protone.
Il comportamento dei parametri definiti in questo capitolo verrá testato
nel prossimo per cercare di caratterizzare il tipo di primario da cui un
determinato sciame é indotto. Questo sará fatto attraverso un programma,
sviluppato nell’ambito di questo lavoro di tesi, che calcolerá esponenti
multifrattali, di wavelet e skewness in riferimento ad un set di eventi simulati.
Capitolo 4
Simulazione degli eventi ed
analisi multiscala
Come giá accennato, il problema principale che si incontra nel fare
astronomia γ con apparati di superficie é la determinazione del tipo di
primario e, quindi, la reiezione del fondo isotropo che proviene dalla
componente adronica. Fino ad oggi, sono state sviluppate tecniche di
discriminazione basate sulla rivelazione diretta dei muoni e degli adroni nello
sciame e che, dunque, richiedono l’utilizzo di apparati appositi da affiancare
al rivelatore.
Negli esperimenti con telescopi Čerenkov, invece, vengono utilizzati i ben
noti parametri di Hillas[13] che permettono una caratterizzazione molto
efficace degli sciami. Attraverso di essi si cerca di parametrizzare la natura
ellittica dell’immagine dello sciame vista da un telescopio Čerenkov. Inoltre,
recentemente sono state utilizzate tecniche di analisi multifrattale e di wavelet
come quelle applicate nell’ambito di questa tesi. Con queste tecniche, insieme
ai parametri di Hillas, si riesce ad ottenere un fattore di discriminazione
segnale-fondo Q ∼ 2[44].
Questi risultati sono dovuti sia all’alta definizione spazio-temporale con cui
l’immagine viene registrata sia al campionamento dello sviluppo laterale dello
sciame.
L’idea utilizzata nel nostro studio é quella di sfruttare l’alta granularitá
spazio-temporale di ARGO (vedi capitolo 2) per fare discriminazione
γ/adroni attraverso l’analisi della sola componente dello sciame vista al suolo
dal suddetto rivelatore. In questo capitolo si mostreranno i risultati delle
simulazioni di sciami adronici ed elettromagnetici cosı́ come li vede ARGO,
62
Simulazione degli eventi ed analisi multiscala
nonché gli andamenti delle variabili citate nel capitolo 3, per chiarire se, e
come, possano aiutare la reiezione del fondo.
4.1
Simulazione degli sciami
Per la simulazione degli sciami é stato utilizzato il programma CORSIKA[22]
(COsmic Ray SImulation for KAscade), sviluppato originariamente per
l’esperimento KASCADE. All’interno di CORSIKA, come modello di
interazione adronica alle basse energie (∼ 100 GeV ), si é scelto di utilizzare
GHEISHA[15] (Gamma Hadron Electron Interaction SHower code), mentre
alle alte energie, é stato usato il modello QGSJET[43] (Quark Gluon String
model with JETs).
La struttura dell’apparato nonché la sua risposta agli sciami generati con
CORSIKA sono state simulate utilizzando il programma ARGOG, basato sul
codice GEANT. Per l’analisi dei dati simulati é stato usato MEDEA++1 .
Poiché MEDEA++ é basato sul linguaggio di programmazione object
oriented C++, nel corso di questo lavoro di tesi, sono stati sviluppati apposite
classi di oggetti e relativi metodi che, integrati in MEDEA++, ci hanno
permesso di calcolare le quantitá desiderate.
Tutte le variabili ricavate ed i dati riguardanti la simulazione sono stati
successivamente analizzati con ROOT, programma per l’analisi dati scritto
in linguaggio di programmazione C++ e sviluppato al Cern.
Primario
Indice
Emin (GeV)
Emax (TeV)
spettrale
γ
2.5
30
100
protoni
2.7
30
100
Tabella 4.1: Parametri riguardanti gli sciami simulati.
Sono stati generati ∼ 2.8 · 105 sciami iniziati da γ e ∼ 2.6 · 105 aventi come
primario protoni in un intervallo energetico che varia tra 30 GeV e 100 T eV ,
con una inclinazione variabile tra 0 e 15 gradi rispetto alla verticale e con il
core dello sciame nel centro geometrico di ARGO (vedi tabella 4.1 e figura
4.1).
I gamma sono stati generati con uno spettro simile a quello dei fotoni
provenienti dalla Crab, mentre per i protoni si é scelto lo spettro
1
Sia ARGOG che MEDEA++ sono programmi sviluppati appositamente dalla
collaborazione per l’esperimento ARGO-YBJ.
4.1 Simulazione degli sciami
63
Figura 4.1: Andamento degli spettri energetici di γ (in alto) e protoni (in basso)
generati con CORSIKA. Gli indici spettrali con cui gli spettri sono stati generati
sono γ = 2.5 e γ = 2.7 per gamma e protoni rispettivamente.
comunemente osservato (vedi tabella 4.1). Come é mostrato in figura
4.2, nota l’energia del primario, la separazione tra γ e protoni potrebbe
essere fatta semplicemente attraverso un taglio sul numero di hit2 .
Sperimentalmente ció non é possibile, poiché l’apparato non permette una
misura dell’energia del primario ed é, quindi, indispensabile adoperare altre
tecniche per distinguere tra sciami da fotone e sciami da adrone. Tale
situazione implica necessariamente che l’analisi sui dati simulati e tutte le
considerazioni che ne conseguono devono esser fatte a numero di hit fissato
o, almeno, in finestre di molteplicitá.
Attraverso l’impostazione di una soglia nel programma di simulazione di
ARGO, tra gli eventi generati sono stati presi in considerazione solo quelli
che accendevano piú di 10 pad nel rivelatore, poiché uno studio topologico
sarebbe stato privo di senso su un immagine costituita da pochi punti.
Per evitare che i risultati dell’analisi fossero influenzati dal fatto di aver a
disposizione eventi generati in una finestra finita di energia, é stato fatto
un ulteriore taglio agli estremi dello spettro di molteplicitá scartando sia gli
eventi che accendevano un numero di pad < 50 che quelli con un numero di
pad superiore a 6000.
2
Per numero di hit si intende il numero di pad accese dallo sciame nel rivelatore
64
Figura 4.2: Andamento degli spettri di molteplicitá per gamma (linea continua) e
protoni (linea tratteggiata) in due diversi intervalli di energia.
4.2
4.2.1
Analisi multiscala
Schematizzazione dell’apparato
Come giá detto precedentemente, l’immagine dello sciame fornita da ARGO
puó essere riguardata come una distribuzione bidimensionale definita su di
un reticolo. Ció permette di applicare ad essa le tecniche di analisi multiscala
descritte nel capitolo 3. Una volta trascurato l’anello esterno del rivelatore, se
consideriamo come unitá di misura dell’apparato le pad formate da 8 strip,
il tappeto di rivelatori ha dimensioni (120 × 130)pad. L’analisi multiscala
richiede di calcolare per diversi valori di ` (` é la dimensione della cella
quadrata della griglia con cui dividiamo l’immagine) le variabili Wq e Zq .
Per fare questo abbiamo bisogno di preservare la simmetria alle diverse scale
di osservazione, per cui si é pensato di ridurre ARGO ad una matrice di
dimensione variabile (2n × 2n )pad. A tale scopo, oltre all’anello esterno
trascuriamo due righe di pad, una nella parte superiore ed una in quella
inferiore. Inoltre, aggiungiamo ai bordi sinistro e destro rispettivamente
due colonne di pad (vedi figura 4.3); naturalmente, queste 4 colonne sono
fittizie e, come tali, risultano sempre vuote ai fini dell’analisi. In questo
modo, la dimensione di massima risoluzione risulta pari a (128 × 128)pad.
4.2.1 Schematizzazione dell’apparato
65
Figura 4.3: Visualizzazione dello schema utilizzato per suddividere l’immagine
dello sciame e calcolare i valori di Z q (`) e Wq (`). Come si vede viene sottratta
una riga di pad in alto ed in basso e ne vengono aggiunte due colonne a destra e
a sinistra. La suddivisione viene mostrata fino a valori di n = 4 corrispondente a
` = 8, mentre nell’analisi si é scesi fino ad ` = 2.
66
La suddivisione massima della griglia corrisponde alla massima risoluzione
con cui si puó analizzare l’immagine dello sciame ed al minimo valore di ` per
cui si calcola il momento multifrattale Zq (`) e il momento di wavelet Wq (`).
Facciamo presente che, poiché in ogni pad il numero di strip é 8 al livello di
dettaglio massimo, il contenuto di ogni pad sará dato da un valore compreso
tra 0 e 8. Inoltre si puó facilmente vedere che la relazione sussistente tra `
ed n é data da:
`=
128
2n
(4.1)
Il procedimento utilizzato puó essere compreso osservando la figura 4.3 in
cui viene rappresentata la suddivisione in celle fino al passo n = 4 di una
distribuzione bidimensionale sul tappeto di RPC di ARGO-YBJ.
4.2.2
Analisi del singolo evento
Il procedimento, implementato attraverso il codice C++, suddivide
l’immagine e calcola Zq (`) e Wq (`) valutando il contenuto delle celle, in
termini del numero di strip ivi accese, per ogni valore di q e per tutti i 6
valori di ` consentiti dalla 4.1 e compresi tra 64 e 2. Avendo a che fare
con numeri molto piccoli, vengono, in realtá, calcolati il Log(Zq (Log`)) ed
il LogWq (Log`). A questo punto, per ogni valore di q, vengono adattate le
curve Log(Zq (Log`)) vs Log(`) e LogWq (Log`) vs Log(`) con una polinomiale
di primo grado interpolando 5 dei 6 valori trovati. L’ultimo valore Zq (64)
(ed anche Wq (64)) viene scartato perché ci aspettiamo che l’andamento dei
momenti devii dal comportamento descritto dall’equazione 3.19 (3.21nel caso
dell’analisi di wavelet) per valori di ` >> 1. La pendenza della retta risulta
proprio essere il valore dell’esponente multifrattale τ (q) o di wavelet β i (q),
a seconda del caso considerato. Dei tre valori di β i (q), derivanti dalle tre
espressioni per i momenti di wavelet di una distribuzione bidimensionale (vedi
equazioni 3.34, 3.35, 3.36), si é calcolato un solo valore che é la media dei tre.
Si é optato per questa strada in quanto, per sciami con inclinazioni piccole,
come quelli da noi analizzati, le distribuzioni sono pressocché simmetriche.
Questa scelta non ha nulla di particolare se si pensa che gli sciami con
inclinazioni qualsiasi possono essere ridotti al caso simmetrico effettuando
l’analisi di wavelet ponendosi nel piano del fronte dello sciame. In alcuni
eventi si é notato un discostamento dall’andamento lineare per alcuni valori
di `; questo eccesso fa presupporre che quel particolare valore di ` sia
direttamente collegato all’ordine di grandezza tipico delle sottostrutture
dell’immagine associata all’evento. Questo rivela le potenzialitá del metodo
che si é scelto di utilizzare.
4.2.2 Analisi del singolo evento
67
Figura 4.4: Immagine di uno sciame da γ con E = 7.9 T eV cosı́ come viene
vista da ARGO-YBJ.
68
Figura 4.5: Adattamento del Log(Wq (`)) medio e Zq (l) con una retta per valori
di q = 4, 6, 8 nel caso di un evento da γ con E = 7.9 T eV .
4.2.2 Analisi del singolo evento
69
Figura 4.6: Immagine di uno sciame da protone con E = 7.4 T eV cosı́ come
viene vista da ARGO-YBJ.
70
Figura 4.7: Adattamento del Log(Wq (`)) medio e Zq (l) e con una retta per valori
di q = 4, 6, 8 nel caso di un evento da protone con E = 7.4 T eV .
4.2.3 Andamenti di τ (q) e β(q)
4.2.3
71
Andamenti di τ (q) e β(q)
Da quanto scritto nel capitolo 3, le informazioni sull’immagine e, dunque,
sull’evento, sono contenute in τ (q) e β(q). Una interessante questione é la
dipendenza dei parametri dall’indice q e, soprattutto, come la separazione
tra γ e protoni viene influenzata dalla scelta di un particolare valore di q nel
calcolo di τ e β. Precedentemente all’analisi del campione simulato, é stato
effettuato uno studio di τ (q) e β(q) in riferimento ad una particolare finestra
energetica (3 T eV ÷ 10 T eV ) per 7 diversi valori di q. Dalla figura 4.8, in cui
Figura 4.8: Andamenti di τ (q) e β(q) al variare di q per sciami da γ e da protone
in un intervallo di energia tra 3 T eV e 10 T eV . I valori riferiti ai protoni sono
traslati sull’asse delle ascisse per evitare una sovrapposizione delle barre.
72
sono mostrati i valori medi delle varie distribuzioni e le rispettive larghezze,
si possono estrarre alcune considerazioni:
• vi é una dipendenza lineare degli esponenti τ e β dal valore dell’ordine
q.
• la separazione tra gamma e protoni aumenta al crescere di q;
• la larghezza delle distribuzioni cresce con q.
Queste osservazioni (in perfetto accordo con quanto trovato in una analoga
analisi fatta per l’esperimento HEGRA[44]), insieme all’aumento del tempo
di processamento degli eventi al crescere di q, ci hanno indotto a effettuare
un analisi solo per q = 4, 6, 8. La verifica dell’andamento degli esponenti é
Figura 4.9: Andamento di β(q) medio al variare di q per sciami da γ e da protone
in un intervallo di molteplicitá tra 500 hits e 800 hits. I valori riferiti ai protoni
sono traslati sull’asse delle ascisse per evitare una sovrapposizione delle barre.
stata fatta per i 3 valori di q suddetti in cinque diverse finestre di molteplicitá
(nhitsmin <nhits< nhitsmax ) e viene mostrata nelle figure 4.10 e 4.9. Gli
intervalli di molteplicitá scelti corrispondono a finestre di energia differenti
per gli sciami da fotone e per quelli da protone I valori sono riportati in
tabella 4.2, mentre gli spettri delle distribuzioni sono mostrati nel capitolo 5
in figura 5.1.
Osservando poi le distribuzioni generali di β(q) e τ (q), per i γ e per i protoni
in queste cinque finestre di molteplicitá (vedi figure 4.11 e 4.12), si nota che,
per un numero di hits 50÷100, le distribuzioni sono sovrapposte. Ció sembra
logico considerando che una immagine costituita da pochi punti risulta piú
povera di sottostrutture.
Con il crescere del numero di hits, la situazione migliora, ma non permette
73
Figura 4.10: Andamento di τ (q) al variare di q per sciami da γ e da protone in
un intervallo di molteplicitá tra 500 hits e 800 hits. I valori riferiti ai protoni sono
traslati sull’asse delle ascisse per evitare una sovrapposizione delle barre.
né di effettuare un taglio osservando direttamente le distribuzioni né, quindi,
di effettuare una stima del parametro di qualitá Q.
Questo fatto ci ha indotto ad utilizzare gli esponenti multifrattali τ (q) e
di wavelet β(q) per addestrare una rete neurale allo scopo di esaltare le
differenze esistenti tra gli sciami da gamma e da protone. In una scelta
di questo tipo siamo stati incoraggiati dai risultati ottenuti con l’utilizzo
delle reti neurali artificiali per lo studio di immagini in altri esperimenti, ad
esempio HEGRA[44].
< Eγ >
numero di
< Ep > numero di eventi
(TeV)
eventi da γ
(TeV)
da protone
50 ÷ 100
0.5
6955
0.8
4160
100 ÷ 500
1.1
11902
1.7
7601
500 ÷ 800
2.9
2885
4.9
1951
800 ÷ 1500
4.6
3397
7.7
2770
1500 ÷ 6000
11.3
5145
18
3367
nhits
Tabella 4.2: valori medi delle distribuzioni di energia per γ e protoni nei 5
intervalli di molteplicitá scelti per l’analisi.
74
Figura 4.11: Distribuzioni dell’esponente multifrattale τ (q) per q = 6 nelle 5
finestre di molteplicitá selezionate.
75
Figura 4.12: Distribuzioni dell’esponente di wavelet β(q) medio per q = 6 nelle 5
finestre di molteplicitá selezionate.
76
4.3
Studio della simmetria dell’immagine
Per sfruttare la presenza di disomogeneitá nella distribuzione degli hits nel
caso di sciami da protone al fine di distinguerli da quelli da γ, si é calcolato
l’andamento della skewness in riferimento ai nostri sciami simulati.
Data una distribuzione unidimensionale lungo x, é stata definita:
P
ni x3i
xcube = Pi
(4.2)
i ni
dove ni non é altro che la molteplicitá di strip della pad del rivelatore di
coordinata x.
Si é optato per l’utilizzo di questa variabile in quanto, a differenza della
skewness (vedi equazione 3.37), non richiede di conoscere x e, cioé, di
ricostruire l’evento cercando il core dello sciame o, comunque, il suo
baricentro. Tale scelta é stata fatta per limitare l’introduzione, nell’analisi,
di possibili errori sistematici dovuti al metodo di ricostruzione dell’evento.
Nel nostro caso abbiamo a che fare con una distribuzione bidimensionale;
quindi, dopo aver valutato le distribuzioni di xcube e ycube riferite al campione
di eventi simulati sia di γ che di protoni, si é considerata la distribuzione
di xcube /ycube nelle cinque finestre di molteplicitá giá utilizzate nell’analisi
multiscala.
Come si puó vedere dalla figura 4.13, le distribuzioni sono centrate intorno al
valore ' 1 sia per gli sciami da protone che per quelli da γ: questo fatto
é spiegabile pensando che, mediamente, le distribuzioni sugli assi hanno
la stessa simmetria (essendo gli sciami quasi verticali e posti al centro
dell’apparato). Ció non é vero per gli eventi singoli: infatti, nel caso di sciami
da protone, ci aspettiamo una maggiore deviazione dall’unitá del valore di
xcube /ycube .
Si nota, comunque, una sostanziale differenza tra i due tipi di primario.
Infatti, nel caso di sciami iniziati da protone si notano maggiori fluttuazioni
della distribuzione intorno alla media rispetto alla distribuzione riferita ai γ.
Per discriminare γ e protoni si potrebbe, perció, mettere un taglio
nel seguente modo: si considera una finestra intorno alla media delle
distribuzioni, la percentuale di eventi ivi contenuti vengono considerati sciami
da fotone con una contaminazione di eventi da protone pari alla frazione che
ve ne cade all’interno.In tabella 4.3 sono riportate le stime del valore di
Q, calcolato secondo la 2.3, in ognuna delle cinque finestre di molteplicitá
considerate.
I valori del fattore di discriminazione Q trovati con questa procedura sono
relativamente bassi. Pertanto, si é deciso di utilizzare le informazioni su
xcube /ycube insieme a quelle provenienti dall’analisi multiscala per addestrare
una rete neurale.
4.3 Studio della simmetria dell’immagine
77
Figura 4.13: Distribuzioni del rapporto xcube /ycube in 5 finestre di molteplicitá
riferite ad eventi simulati da γ (linea continua) e da protone (linea tratteggiata).
78
Nel prossimo capitolo si introdurranno, quindi, i concetti base necessari
per utilizzare le reti neurali come strumento di analisi. Le variabili fin qui
studiate verranno impiegate come vettore di input per la rete allo scopo di
esaltare le minime differenze presenti nelle distribuzioni.
nhits
xcube /ycube (min)
xcube /ycube (max)
Q
50 ÷ 100
0.67
1.39
1.22
100 ÷ 500
0.78
1.22
1.27
500 ÷ 800
0.82
1.07
1.31
800 ÷ 1500
0.85
1
1.30
1500 ÷ 6000
0.86
0.97
1.27
Tabella 4.3: Valori di Q calcolati in 5 finestre di molteplicitá effettuando un taglio
direttamente sul valore di xcube /ycube .
Capitolo 5
Discriminazione γ/h per mezzo
di una rete neurale artificiale
Nel capitolo precedente si é mostrato come la semplice analisi delle
distribuzioni degli esponenti multiscala e del momento terzo non sia sufficente
a discriminare tra sciami iniziati da γ e da protone.
Tale situazione ci ha indotto a fare uso di una rete neurale artificiale (ANNArtificial Neural Network). Uno strumento di questo tipo si rivela di
grandissima utilitá nei casi, come il nostro, in cui le differenze tra il segnale
(raggi gamma) ed il fondo (raggi cosmici) sono molto piccole.
L’utilizzo della rete neurale, opportunamente addestrata, dovrebbe dare
informazioni sulla natura del primario e fornire dei risultati migliori per Q
rispetto a quelli mostrati in tabella 4.3, migliorando, quindi, la sensibilitá di
ARGO-YBJ. Un aumento della sensibilitá si traduce immediatamente in una
diminuzione del tempo di presa dati necessario a vedere una sorgente con un
certo numero di sigma superiore al fondo isotropo della radiazione cosmica.
In questo capitolo si descriveranno il tipo di rete neurale utilizzata ed i
risultati ottenibili con essa, ricavando un valore del fattore di discriminazione
Q in ognuna delle 5 finestre di molteplicitá in cui é sta effettuata l’analisi
multiscala.
Ad ogni intervallo di molteplicitá corrisponde una distribuzione dell’energia
(vedi figura 5.1) i cui i valori medi e larghezze corrispondenti vengono
riportate in tabella 5.1.
80
Discriminazione γ/h per mezzo di una rete neurale artificiale
Figura 5.1: Spettri energetici non normalizzati nei 5 intervalli di molteplicitá
scelti per l’analisi. La linea in rosso é riferita a sciami da γ, mentre la linea in
blu a sciami da protone.
5.1 Le reti neurali
81
Come si puó vedere i valori dell’energia media riferiti a sciami iniziati da
fotoni sono, in ognuno degli intervalli di molteplicitá, piú bassi di quelli per
sciami da protone.
I dati sono riferiti a sciami simulati (vedi capitolo 4) i cui spettri seguono
una legge a potenza ∝ E −γ con γ = 2.5 nel caso di sciami da fotoni e γ = 2.7
per sciami aventi come primario un protone.
< Eγ >
< RMSγ >
< Ep >
RMSp
(TeV)
(TeV)
(TeV)
(TeV)
50 ÷ 100
0.5
0.3
0.8
0.8
100 ÷ 500
1.1
0.8
1.8
1.5
500 ÷ 800
2.9
1.4
4.9
2.9
800 ÷ 1500
4.6
2
7.6
4.3
1500 ÷ 6000
11.3
6.2
18.4
11.3
nhits
Tabella 5.1: valori medi delle distribuzioni di energia per γ e protoni nei 5
intervalli di molteplicitá scelti per l’analisi.
5.1
Le reti neurali
Nel caso di questa analisi il problema della discriminazione γ/p é
riconducibile ad un problema di riconoscimento delle immagini in cui i
dati da analizzare sono affetti da grosse fluttuazioni (vedi capitolo 4) e le
caratteristiche delle immagini sono note attraverso un insieme discreto di
esempi (i singoli eventi). Questioni di questo tipo vengono solitamente risolte
attraverso l’uso delle reti neurali.
Recentemente sono state utilizzate per l’analisi dati in molti esperimenti
di fisica delle alte energie. In particolare, sono state impiegate per la
discriminazione γ/adroni nell’esperimento HEGRA[44] adoperando come
input gli esponenti multiscala relativi alle immagini degli sciami. Bisogna
tener presente, comunque, che le informazioni di partenza sono totalmente
diverse rispetto a quelle date da ARGO-YBJ.
Ció che l’esperienza altrui insegna é che il calcolo effettuato dalle reti neurali
fornisce maggiori prestazioni rispetto all’applicazione di tagli effettuati con
tecniche tradizionali.
Il cervello umano é costituito da ∼ 1011 cellule che prendono il nome di
neuroni, collegati da connessioni di intensitá variabile wij dette sinapsi.
82
Figura 5.2: Schematizzazione di una piccola parte di una rete neurale biologica. I
dentriti danno l’input neti al neurone, se questo raggiunge uno stato di attivazione
ai manda un output oi alla sua connessione. Attraverso le sinapsi i capi della
connessione sono legati con forza w ij ai dentriti del neurone vicino. La freccia in
alto nella figura indica il verso del flusso di informazioni.
Un neurone riceve degli stimoli in entrata (neti ) dai suoi dentriti; la somma
di questi impulsi produce un potenziale elettrochimico. Se questo potenziale
eccede una certa soglia, il neurone si attiva (stato ai ) dando in uscita un
segnale oi che si propaga attraverso i neuriti e viene trasmesso agli altri
neuroni dalle sinapsi (vedi figura 5.2).
La sinapsi determina le intensitá wij con cui ogni dentrite é legato al neurite
(e quindi al neurone). L’intensitá delle sinapsi é aumentata dall’attivazione
ripetuta di uno dei due neuroni da parte dell’altro.
Questa struttura permette al cervello, sebbene le connessioni siano lente1 ,
di risolvere problemi fuori dalla portata dei tradizionali calcolatori.
Inoltre, il processo di apprendimento puó essere approssimato come un
adattamento delle sinapsi agli stimoli esterni; in pratica, si ha una continua
riconfigurazione dell’architettura del cervello. L’idea é quella di cercare
di risolvere determinati problemi effettuando delle simulazioni dei processi
cognitivi cerebrali. La differenza fondamentale con i calcolatori tradizionali
é una distribuzione in parallelo del calcolo su piú processori (quelli che
nel cervello sono i neuroni). Ció conferisce alle reti neurali artificiali delle
proprietá:
• possibilitá di un “mapping” non lineare;
1
Si pensi che la velocitá di trasmissione tra un neurone e l’altro é ∼ 10−3 s contro i
∼ 10−9 s di un transistor
5.1.1 Neuroni
83
• le funzioni risultanti dal “mapping” sono differenziabili;
• capacitá di apprendere da esempi e generalizzare (estrapolare ed
interpolare) a partire da essi;
• stabilitá nella risposta rispetto alle fluttuazionui dei dati sperimentali.
Grosse fluttuazioni nei dati di input non precludono, dunque, la possibilitá
di un’ottima risposta della rete, rendendola uno strumento fondamentale
a trattare problemi in cui vi siano difficoltá legate a rumore di fondo o
fluttuazioni statistiche.
5.1.1
Neuroni
Le reti neurali sono, in perfetta analogia con i corrispettivi biologici,
composte dai neuroni e dalle connessioni tra essi (che simulano le sinapsi).
Lo stato del neurone é descritto da tre quantitá:
• La soglia Θj applicata all’input
• L’attivazione aj (tensione di eccitazione), che viene calcolata
attraverso la funzione di attivazione fact a partire dall’input netj
ed é definita da:
aj (t + δt) = fact (Θj , aj (t), netj (t)),
(5.1)
dove δt corrisponde ad un ciclo di aggiornamento dei neuroni. Se, come
spesso accade, il calcolo di aj é indipendente dal valore dell’attivazione
precedente, la formula 5.1 diventa:
aj = fact (Θ, netj ).
(5.2)
• L’output (corrispondente al segnale che viaggia nel neurite), che si
ricava a partire dal valore di aj associato al neurone j-esimo attraverso
la funzione di output fout secondo:
oj = fout (aj ),
(5.3)
La funzione di propagazione, che calcola l’input del neurone j-esimo dato
l’output oi dell’unitá precedente e i pesi wij delle connessioni, é data da:
netj =
X
i
wij oi
(5.4)
84
Figura 5.3: Modello di una rete neurale replicata da una rete biologica, i dentriti,
le sinapsi e i neuriti sono schematizzati da connessioni pesate.
Nel caso in cui si scelga come funzione di output fout l’identitá (nelle
applicazioni piú comuni si fa solitamente cosı́), si ha:
oj = fout (aj ) ≡ aj ⇒ netj =
X
wij aj
(5.5)
i
In generale, la funzione di attivazione é una funzione non lineare. Questa
caratteristica é essenziale se vogliamo che la rete apprenda un mapping non
lineare.
In letteratura esiste un vasto elenco di funzioni di attivazione a seconda del
problema che si vuole risolvere. La piú semplice é la funzione a gradino di
Heavsyde:
−1 se net < 0
(5.6)
θ(net) =
+1 se net ≥ 0
Questa funzione é priva di una soglia Θ e riproduce il comportamento dei
neuroni cerebrali.
Una classe di funzioni spesso utilizzate nella simulazione di reti neurali é
quella delle sigmoidi, di cui fa parte la funzione di attivazione logistica2 scelta
nel nostro caso. Essa é data da:
fact (net, Θ) =
5.1.2
1
1+
e−(net−Θ)
(5.7)
Topologia
La topologia della rete é definita dalle connessioni fra i neuroni e dei neuroni
con l’esterno. In base al loro rapporto con il mondo esterno, i neuroni possono
essere suddivisi in tre tipi:
2
Come si puó vedere dall’espressione 5.7 questa é strettamente legata alla funzione di
Fermi; infatti, fact () = fF ermi (−) = 1 − fact ()
5.1.2 Topologia
85
• neuroni di input: hanno solo le sinapsi in uscita e ricevono le
informazioni dall’esterno.
• neuroni di output: inviano le informazioni all’esterno (memoria).
• neuroni hidden: hanno sinapsi sia in uscita che in entrata, ma non
hanno scambi di informazioni con l’esterno.
Figura 5.4: Rappresentazione schematica di: (a) rete feedforward generica, (b)
rete feedforward a strati completamente connessa
I possibili modi di connessione tra i neuroni danno origine a differenti
tipi di reti. In questa trattazione ci limiteremo a parlare solo delle reti
feedforward a strati completamente connesse, da noi utilizzate.
Le reti feedforward sono quelle che non contengono ricorrenze nelle
connessioni, cioé sinapsi che facciano tornare indietro nel percorso connettivo;
il calcolo termina dopo un numero finito di passi andando da un neurone di
input ad uno di output.
Le reti a strati sono una sottocategoria di queste, in cui i neuroni vengono
raggruppati in sottoinsiemi detti “layers” ed i neuroni di un determinato layer
possono avere connessioni solo con neuroni appartenenti a layers diversi.
L’espressione “completamente connesse” sta ad indicare che ciascun neurone
di un layer é connesso a tutti i neuroni del layer successivo (vedi figura 5.4).
86
5.1.3
Addestramento
Fissate le funzioni di attivazione e di output dei neuroni insieme con la
topologia della rete, le uniche cose che restano da assegnare sono gli n pesi,
dove n é il numero totale di connessioni nella rete. Tutta l’informazione sulla
rete é data dal valore che tali pesi assumono.
Addestrare la rete significa, appunto, stabilire i valori da assegnare ai pesi
affinché la rete effettui il mapping voluto:
F : RNi −→ RNo
(5.8)
dove RNi (RNo ) é lo spazio Ni -dimensionale ( No -dimensionale) in cui sono
definiti i vettori di input (output). Per quanto riguarda l’andamento di F , se
esso é noto a priori, si parla di rete preprogrammata. Nei casi comuni si ha
a disposizione un set di vettori di input ed uno di vettori di output e, quindi,
in principio la funzione di mapping é nota per un insieme di punti finito e la
sua forma dipende dai pesi che si assegnano alle connessioni.
Da questo punto di vista, il problema di addestrare la rete si riconduce a
trovare il vettore n-dimensionale dei pesi wij che determina il miglior fit dei
punti noti. La situazione é complicata dal fatto che solitamente i dati a
disposizione sono affetti da errori e fluttuazioni e la funzione di mapping non
é necessariamente lineare.
Assegnato un set di esempi p, composto da un vettore di input ed uno di
output, ed inizializzati i pesi ad un valore casuale, si definisce per ogni
pattern3 p il vettore No -dimensionale degli errori come la differenza tra
l’output effettivo della rete op e l’output atteso tp :
ep = op − t p
(5.9)
Una misura scalare della differenza tra output effettivo e atteso é data dalla
somma degli errori al quadrato:
ξp =
1X
1
(op (i) − tp (i))2 = eTp ep
2 i
2
(5.10)
dove op (i) e tp (i) sono le componenti i-esime dei vettori di output reale ed
output atteso.
L’errore globale E sull’intera procedura di training é dato, invece, dalla
somma degli errori sul singolo pattern:
E=
3
X
p
1
ξp = T r{E T E}
2
(5.11)
Per pattern si intende l’insieme di esempi, con output noto, su cui la rete viene
addestrata.
5.1.3 Addestramento
87
dove E é la matrice avente come colonne i vettori ep . Lo scopo della procedura
di assegnazione dei pesi si riduce, dunque, a trovare il minimo della curva
n-dimensionale definita nello spazio dei pesi e data dalla 5.11.
In teoria, quindi, sono applicabili tutti i metodi di minimizzazione di funzioni;
tuttavia, dobbiamo tener presente che va evitato l’impiego di algoritmi
complessi che aumentano il tempo di calcolo.
Inoltre, se vogliamo che la rete sia capace di funzionare in modo efficiente
su dati diversi da quelli usati per l’addestramento, bisogna fermare
l’apprendimento prima che i valori dei pesi diventino dipendenti dalle
fluttuazioni presenti negli esempi. Per fare ció, si usa il metodo del “cross
validation”, in cui si utilizza un ulteriore set di dati detto di validazione.
Ad ogni passo del processo di minimizzazione, una volta assegnati i nuovi
pesi, si calcola l’errore sul set di validazione.
Se nei dati vi é la presenza di fluttuazioni, si osserva, dopo un certo
numero di cicli di minimizzazione, un aumento di questo errore. In tal caso,
l’apprendimento viene interrotto in corrispondenza del minimo di questo
errore. Una reiterazione ulteriore del processo di apprendimento porterebbe
la rete in “overtraining”, cioé alla perdita della capacitá di generalizzare.
Volendo schematizzare l’intera procedura di apprendimento, possiamo
suddividerla in quattro fasi:
I) inizializzazione casuale dei valori dei pesi, cioé si sceglie in modo casuale
il punto della superficie d’errore 5.11 da cui iniziare la minimizzazione;
II) applicazione dell’algoritmo di minimizzazione ad ogni pattern e calcolo
della variazione ∆wp del vettore dei pesi tra un passo ed il successivo;
P
III) calcolo della somma delle variazione del vettore dei pesi ∆w = p ∆wp
e assegnazione dei nuovi pesi wij (t + 1) = wij (t) + ∆wij (con k indice
dell’iterazione);
IV) calcolo dell’errore sul set di validazione che ferma il processo o lo reitera.
L’applicazione dell’algoritmo di minimizzazione alle funzioni ξp e il successivo
calcolo delle variazione non é sempre equivalente (dipende dall’algoritmo)
alla minimizzazione della 5.11, ma viene comunque impiegata in quanto
riduce i tempi di calcolo. La scelta dell’algoritmo di viene fatta sulla base
dell’andamento della funzione d’errore E, se essa é nota; altrimenti, come nel
nostro caso, sulla base di approssimazioni successive.
Nel nostro caso sono stati testati tre diversi tipi di funzioni di aggiornamento
dei pesi (vedi appendice A) valutando, dai risultati, quale fosse quello piú
adatto alla risoluzione del problema.
88
5.2
Analisi degli eventi di ARGO tramite
ANN
5.2.1
SNNS (Stuttgart Neural Network Simulator)
Per la simulazione delle reti neurali é stato utilizzato SNNS (Stuttgart
Neural Network Simulator) funzionante su piattaforma Unix e sviluppato
dall’Institute for Parallel and Distribuited High Performance Systems”
(IPVR) presso l’Universitá di Stuttgart.
Il vantaggio di SNNS é quello di essere uno strumento efficiente e flessibile
per la simulazione e l’applicazione delle reti neurali.
SNNS é costituito da 2 parti principali:
1) Il kernel del simulatore scritto in C;
2) l’interfaccia grafica X11R4 o X11R5.
Il kernel opera sulla struttura interna delle reti ed esegue tutte le operazioni
di apprendimento e memorizzazione. Esso puó essere utilizzato senza le altre
parti come un programma in C integrato in altre applicazioni.
SNNS supporta, inoltre, l’aggiunta di funzioni di attivazione definite
dall’utente e procedure di apprendimento personalizzate introducibili come
semplici programmi in C da integrare con il kernel.
L’interfaccia grafica XGUI ( X Graphical User Interface) fornisce all’utente
una rappresentazione bidimensionale o tridimensionale della rete e consente
il monitoraggio ed il controllo delle procedure di apprendimento. In aggiunta,
l’interfaccia bidimensionale é integrata ad un editor che puó essere utilizzato
per creare, manipolare e visualizzare le reti.
5.2.2
Topologia utilizzata
Una rete neurale é definita dalla sua topologia ovvero in base al numero,
disposizione, tipo e connessioni dei neuroni. La rete che si é scelto di usare
nel nostro caso é di tipo feedforward a strati completamente connessa
formata da 8 neuroni di input, uno strato di 5 neuroni “nascosti” ed un solo
neurone di output.
Si é arrivati a questa struttura valutando i risultati raggiunti con diverse
topologie (anche con piú strati di neuroni “hidden”) e tenendo presente che,
aumentando il numero di neuroni, aumenta la dimensione dello spazio in cui
é definita la funzione degli errori da minimizzare. Nel nostro caso, tenendo
conto delle connessioni e dei neuroni, la 5.11 é una funzione a 85 variabili.
L’input della rete neurale é, quindi, un vettore ip a 8 dimensioni i cui elementi,
per ogni singolo evento, sono:
5.2.3 Procedura di addestramento della rete
89
Figura 5.5: Componenti di SNNS: simulation kernel, interfaccia grafica xgui,
batchman e compilatore snns2c
• il numero di hit dell’evento (nhit);
• il rapporto xcube /ycube .
• gli esponenti multifrattali τ (4), τ (6), τ (8);
• gli esponenti di wavelet β(4), β(6), β(8).
Come giá detto in precedenza, l’osservabile nel caso di ARGO non é
l’energia, ma il numero di hit; perció, si é scelto di utilizzarlo come ulteriore
informazione per l’addestramento della rete. Inoltre, ribadiamo che, data la
dipendenza lineare osservata di τ e i β da q, sarebbe stato inutile usare piú
di 3 valori per ognuno dei 2 esponenti.
Il vettore di output é invece ad una sola dimensione ed é definito come:
1 per i γ
op =
(5.12)
0 per i protoni
5.2.3
Procedura di addestramento della rete
I pesi vengono variati in fase di addestramento allo scopo di trovare una
funzione che faccia un mapping degli eventi (incogniti) in modo esatto.
Come funzione di attivazione dei neuroni é stata scelta la funzione logistica
data dalla 5.7 con soglia Θ = 1.
90
Figura 5.6: Finestra di SNNS in cui é possibile vedere la topologia della rete con
tutte le connessioni, in questo caso vi é rappresentata la risposta della rete, dopo
l’addestramento, per un evento da γ. Le diverse colorazioni dei neuroni indicano
il diverso stato di attivazione.
Per l’apprendimento é stato usato l’algoritmo RProp (vedi appendice A),
questo metodo di minimizzazione locale é in assoluto quello a piú rapida
convergenza. In tabella 5.2 vengono riportate le caratteristiche della rete
insieme con i valori dei parametri utilizzati per addestrarla.
Il parametro α é detto “weight-decay” e determina la relazione tra
Topologia della rete
8−4−1
Valore iniziale di ∆ij
0.6
Valore limite dell’aggiornamento ∆ij
50.0
Weight-decay α
3.0
η−
0.5
η+
1.2
Pesi iniziali (presi casualmente)
[−0.1, 0.1]
Tabella 5.2: Parametri della rete neurale.
5.2.3 Procedura di addestramento della rete
91
l’errore dell’output della rete e la riduzione dei pesi nella procedura di
minimizzazione.
L’addestramento della rete é stato effettuato separatamente nelle 5 finestre
di molteplicitá definite nel capitolo 4 in quanto si vogliono ottenere differenti
valori del parametro di discriminazione Q nei diversi intervalli.
Innanzitutto, si é cercato di valutare quanti cicli di addestramento fossero
sufficienti per considerare terminata la procedura di apprendimento. In
figura 5.7 vengono mostrate sia la frazione di γ riconosciuti sia quella di
contaminazione dei protoni, per la stessa rete, in funzione del numero di cicli
di addestramento. Per fare ció si é fissato un taglio sul valore di output della
rete pari a Cout = 0.7.
Dopo circa 2000 cicli di addestramento i 2 valori raggiungono un plateau,
anche se si notano delle oscillazioni intorno al punto di equilibrio. La
scelta finale é stata di effettuare 5000 cicli di addestramento tenendo conto
che anche il valore dell’errore globale E (dato da 5.11) non cambiava
apprezzabilmente all’aumentare del numero di cicli. L’ampiezza delle
oscillazioni nei valori trovati, visibile in figura 5.7, potrebbe essere utilizzata
Figura 5.7: Frazione di sciami da γ (quadratini) riconosciuti e contaminazione di
protoni (triangolini) con un taglio sull’output della rete neurale C out = 0.7. Dopo
∼ 2000 cicli di addestramento il valore inizia ad oscillare intorno ad un valore
stabile. La figura in questione si riferisce ad eventi nella finestra compresa tra 500
hits e 800 hits.
92
per cercare di dare una stima dell’errore che si commette nel valutare il
parametro Q. Poiché le incertezze sui due termini potrebbero essere correlate,
una valutazione dell’errore su Q, fatta in questo modo, potrebbe essere
errata; si é preferito, quindi, utilizzare un altro metodo. Si é addestrata
la rete piú volte usando lo stesso set di eventi e lo stesso numero di cicli
di apprendimento (5000). Analizzando le varie reti su lo stesso campione
di dati, si é ricavato il valore di Q medio ed il relativo errore. Ricordiamo
che Q, definito dall’equazione 2.3, é dato dal rapporto tra la frazione di
gamma riconosciuti εγ e la radice quadrata della frazione di contaminazione
da protoni (1 − εp ).
La scelta del valore di Cout é stata fatta in modo da selezionare quello
che massimizzava il valor medio di Q corrispondente (vedi figura 5.8).
Dalla diversitá nei valori trovati nelle stesse condizioni, si é stimata l’entitá
dell’indeterminazione su Q, ottenendo errori relativi compresi tra il 2.4% e il
10% (vedi tabella 5.4). Nel seguito dell’analisi ci si riferirá a tale stima ogni
volta che si parlerá di errore su Q.
Figura 5.8: Valori di Q, della frazione di gamma riconosciuti ε γ e della frazione
di contaminazione da protoni (1 − εp ) in riferimento ad eventi nell’intervallo di
molteplicitá compreso tra 500 hits e 800 hits. Analoghi andamenti si ottengono per
gli altri intervalli di molteplicitá.
5.3 Analisi dei risultati
93
intervallo di molteplicitá eventi di training
eventi di training
(nhit)
(γ)
(p)
50 ÷ 100
6655
3860
100 ÷ 500
11602
7301
500 ÷ 800
2585
1651
500 ÷ 1500
3097
1970
1500 ÷ 6000
4845
3067
Tabella 5.3: Suddivisione degli eventi da γ utilizzati per addestrare le reti nelle
diverse finestre di molteplicitá.
5.3
Analisi dei risultati
Come giá detto, si sono suddivisi gli sciami simulati in 5 finestre di
molteplicitá e, con le quantitá calcolate nel capitolo 4, si sono addestrate
5 diverse reti, aventi la stessa topologia. Questo é servito ad ottimizzare la
risposta della rete nell’intervallo di molteplicitá desiderato. Nella tabella 5.3
viene riportato il numero di eventi usato per addestrare la rete nei cinque
intervalli.
Non sono stati utilizzati tutti gli eventi a disposizione, in quanto una parte é
servita come set di validazione per la rete. Gli eventi di validazione servono a
controllare la risposta della rete, dopo un certo numero di cicli su eventi non di
“training”, ed eventualmente fermare l’addestramento se l’errore sull’output,
riferito a tale set, risulta inferiore ad una certa soglia. Questo é necessario per
evitare un irrigidimento della risposta della rete dovuta alle troppe iterazioni
sul set di addestramento con una conseguente perdita della sua capacitá di
generalizzare.
Per questa procedura sono stati utilizzati 100 eventi da γ e 100 da protone in
ogni intervallo di molteplicitá; con essi SNNS controllava la risposta delle reti
ogni 10 epoche di addestramento. Dopo averle addestrate, le reti sono state
testate su pacchetti da 400 eventi (200 sciami da γ e 200 da protone) diversi
da quelli usati per la procedura di apprendimento e validazione (i risultati
delle procedure di test sono mostrati in figura 5.9).
Un modulo scritto in C++ é servito a calcolare il valore di Q massimo,
l’errore ad esso associato ed il valore di Cout in ognuna delle 5 finestre di
molteplicitá secondo i criteri illustrati nel paragrafo precedente. Come si
puó vedere in tabella 5.4 il valore massimo di Q si ottiene nella finestra di
molteplicitá 500 ÷ 800 hits, corrispondente ad una energia media dei γ di
∼3 T eV , dove le immagini degli sciami sono ricche di dettagli. Analizzando la
94
Figura 5.9: Output della rete Cout nelle cinque finestre di molteplicitá per sciami
iniziati da γ (linea continua) e per sciami da protone (linea tratteggiata).
5.3 Analisi dei risultati
95
nhits
< Eγ >
Cout
< εγ >
< εp >
<Q>
50 ÷ 100
0.5 T eV
0.71
0.82 ± 0.01
0.58 ± 0.01
1.28 ± 0.01
100 ÷ 500
1.1 T eV
0.67
0.81 ± 0.02
0.67 ± 0.02
1.42 ± 0.02
500 ÷ 800
2.9 T eV
0.87
0.66 ± 0.04
0.89 ± 0.01
2.01 ± 0.10
800 ÷ 1500
4.6 T eV
0.83
0.78 ± 0.04
0.80 ± 0.02
1.78 ± 0.07
1500 ÷ 6000 11.3 T eV
0.83
0.79 ± 0.04
0.80 ± 0.02
1.78 ± 0.06
Tabella 5.4: Schema riassuntivo dei valori dei tagli sull’output C out , delle
efficienze di riconoscimento < εγ > e < εp > e del parametro di discriminazione
< Q > nelle 5 finestre di molteplicitá selezionate.
situazione nei 2 intervalli di molteplicitá piú alti, si osserva un abbassamento
del valore di Q che é giustificato se si considera che l’aumento della densitá di
particelle rende difficile isolare le sottostrutture presenti nell’immagine degli
sciami adronici e, quindi, separare il segnale dal fondo.
Figura 5.10: Valore di Q in funzione dell’energia media < E γ > corrispondente
ai 5 intervalli di molteplicitá studiati. Le barre d’errore sull’asse delle x sono le
larghezze delle distriduzioni di energia dei fotoni nella corrispondente finestra di
molteplicitá.
96
I risultati trovati con questa analisi sono analoghi a quelli ottenuti
nell’ambito dell’esperimento HEGRA[44] nel quale in aggiunta all’analisi
multiscala anche i parametri di Hillas. Ció é molto confortante se si
considera che l’esperimento HEGRA utilizza un telescopio Čerenkov in grado
di campionare uno sciame durante tutto il suo sviluppo in aria. ARGO,
invece, vede una sola sezione dello sciame ma, grazie al metodo da noi trovato
si riesce ad ovviare a ció ottenendo un fattore di reiezione del fondo molto
alto.
Nel prossimo paragrafo si mostrerá come un tale valore di Q possa influenzare
positivamente lo studio di una data sorgente ed aumentare la capacitá dei
scoperta di ARGO-YBJ.
5.4
Aumento della sensibilitá del rivelatore
U fattore molto importante nella astronomia γ é la sensibilitá ad una data
sorgente. Se si considera il numero di dati raccolti in una data direzione, la
sensibilitá dell’apparato puó essere stimata, in prima approssimazione, dal
rapporto tra il flusso dei gamma e le fluttuazioni del fondo, dato dagli sciami
adronici.
Con la nostra analisi e l’ausilio delle reti neurali siamo riusciti a sopprimere
il fondo di un fattore (1 − εp ), mentre il segnale dato dagli sciami fotonici é
attenuato di un fattore εγ .
Il rapporto richiesto é quindi dato da:
p
nγ
φγ
εγ
S'√ ∝p ·p
· Aef f T
np
1 − εp
φp
(5.13)
dove T é il tempo per cui la sorgente viene osservata, Aef f é l’area efficace del
rivelatore (vedi capitolo 2) e φγ e φp sono i flussi della sorgente e del fondo
isotropo.
Questo corrisponde a dire che:
S(T, φγ , Q) ' S◦ · Q
(5.14)
dove S◦ = S(T, φγ , Q = 1). Con il nostro risultato Q ' 2 (vedi tabella
5.4) troviamo un valore della sensibilitá che é circa il doppio di quello che si
ottiene con il solo puntamento della sorgente.
Invertendo l’espressione 5.13, si trova che, fissata la sensibilitá con cui si
vuol vedere una data sorgente, un aumento del fattore Q corrisponde ad una
diminuzione del tempo di presa dati definito da:
T (S, φγ , Q) '
1
· T◦
Q2
(5.15)
5.4 Aumento della sensibilitá del rivelatore
97
con T◦ = T (S, φmin
γ , Q = 1).
Se si considera il valore Q = 2.01 che é il piú alto da noi ottenuto (vedi
tabella 5.4), si trova una diminuzione del tempo di osservazione di un fattore
∼ 4, mentre con il peggiore dei risultati (Q = 1.28) si ottiene un tempo di
osservazione T (1.28) ' 0.6 · T (1).
Se, invece, fissiamo il valore della sensibilitá voluta ed il tempo di presa dati,
dalla 5.13 si puó notare come un valore di Q superiore all’unitá comporti una
diminuzione del flusso minimo osservabile:
φmin
γ (S, T, Q) =
1
· φ◦ (Q)
Q
(5.16)
con φ◦ (Q) = φmin
γ (S, T, Q = 1). Se si considera, ad esempio, la Crab,
dalle stime della sensibilitá ottenute senza tenere conto del fattore di
discriminazione Q, é stato calcolato che, per vederla con una sensibilitá di
5σ
5σ, é necessario un tempo di presa dati TCrab
(Q = 1) ' 120 giorni, per eventi
con Nh ≥ 100 (vedi tabella 2.2).
Ció significa che, applicando la tecnica sviluppata nell’ambito di questa tesi,
il tempo di presa dati necessario ad osservare la Crab con la stessa sensibilitá
5σ
diventa TCrab
(Q = 2) ' 30 giorni.
In definitiva, l’utilizzo dell’analisi multiscala e del momento terzo, con
l’ausilio delle reti neurali, abbassa il tempo di osservazione necessario a
rivelare una sorgente di raggi γ aumentando notevolmente la possibilitá di
scoperta di nuovi siti di emissione.
98
Conclusioni
I
risultati cui si é pervenuti nel capitolo 5 dimostrano che l’analisi delle
immagini degli sciami, attraverso lo studio delle loro caratteristiche frattali
e della forma che esse assumono, permette di individuare, con l’ausilio delle
reti neurali, delle differenze intrinseche tra gli sciami iniziati da fotone e quelli
aventi come particella primaria un adrone.
Dalla sola analisi dell’immagine dello sciame fornita da ARGO, si sono
ottenuti dei valori del parametro di qualitá Q (vedi tabella 5.4) confrontabili
con quelli ricavati nell’ambito di esperimenti che utilizzano telescopi
Čerenkov.
In particolare, i risultati ottenuti nell’ambito di questa tesi sono confrontabili
con quelli che vengono dall’analisi multifrattale e di wavelet applicate
all’esperimento HEGRA[44]. Si puó capire l’importanza di un tale risultato
se si pensa che HEGRA, utilizzando un telescopio Čerenkov, effettua un
campionamento dello sciame lungo tutto il suo sviluppo, mentre ARGO ne
vede solo una sezione.
Se si considera la regione di energia intorno a ∼ 1 T eV , dove l’impiego delle
tecniche descritte in questa tesi produce il miglior valore di Q ' 2, si hanno
tre importantissime conseguenze se si tiene conto che:
a. fissato il tempo di osservazione ed il flusso minimo che si vuole rivelare,
si ha un aumento della sensibilitá S(Q) = Q · S(Q = 1);
b. fissata la sensibilitá con cui si vuole osservare una sorgente ed il flusso
mimimo che si vuol rivelare, si ottiene una diminuzione del tempo di
presa dati necessario a ció T (Q) = Q12 · T (Q = 1);
c. fissata la sensibilitá che si vuole ottenere ed il tempo di presa dati, il
1
min
flusso minimo osservabile diventa φmin
γ (Q) = Q · φγ (Q = 1).
Si fa presente che, in questa tesi, la risposta della rete e dei 3 parametri
suddetti é stata testata su sciami simulati posti al centro dell’apparato e
aventi una direzione di arrivo con angolo compreso tra 0◦ e 15◦ . Sará quindi
100
Conclusioni
necessario testare il metodo su sciami con maggiore inclinazione e diverse
posizioni.
In linea di principio, non vi é nessuna controindicazione ad estendere l’analisi
a casi piú generali in quanto essa non richiede né la conoscenza del centro
dello sciame né dell’angolo di impatto sul rivelatore.
Sará, dunque, indispensabile in futuro generalizzare lo studio fin qui
affrontato al fine di utilizzare questa tecnica per l’analisi dei dati reali che,
nella configurazione finale dell’apparato, inizieranno ad arrivare nel 2005
quando la costruzione di ARGO-YBJ sará ultimata.
Appendice A
Algoritmi di addestramento di
una rete neurale
A.1
BackPropagation
Il piú famoso algoritmo di apprendimento é il BackPropagation introdotto
nel 1986 da Rumelhart e McClelland.
La regola di aggiornamento dei pesi, anche detta “generalized delta-rule”, é
data da:
∆wij = η δj oi
δj
dove:
=
 0
 fj (netj )(tj − oj )

fj0 (netj )
P
k δk wjk
se l’unitá j é di tipo output
se l’unitá j é di tipo hidden
η é una costante detta fattore da apprendimento;
δj é l’errore dell’unitá j-esima;
tj é l’output teorico dell’unitá j-esima;
oj é l’output dell’unitá i-esima (precedente alla j-esima);
(A.1)
102
Appendice A
fj0 é la derivata di f funzione di attivazione;
i é l’indice riferito all’unitá precedente a quella corrente j con peso wij
tra i e j;
j é l’indice riferito all’unitá corrente;
k é l’indice riferito all’unitá successiva a quella corrente j con peso wjk
tra j e k.
Nel caso in cui la funzione di output fout non sia l’identitá, la situazione é
0
0
piú complessa e si ha che f 0 ≡ fout
· fact
.
Vi é, inoltre, un’altra variante dell’algoritmo detto BackpropMomentum in
cui la regola di aggiornamento dei pesi é data da:
∆wij = ηδj oi + µ∆wij (t)
δj
=
 0
 fj (netj + c)(tj − oj )

fj0 (netj + c)
P
k δk wjk
se l’unitá j é di tipo output
(A.2)
se l’unitá j é di tipo hidden
dove µ e c sono due valori costanti detti rispettivamente momento e ”flat-spot
elimination value”.
A.2
QuickProp
Questo algoritmo, ideato da Fahlman nel 1988, assume che la superficie degli
errori possa essere localmente approssimata da una funzione quadratica. Ad
ogni passo, l’algoritmo sposta i pesi dalla posizione corrente al minimo della
forma quadratica. Dopo aver valutato il gradiente della funzione d’errore, i
pesi vengono spostati verso il minimo della funzione secondo:
∆wij (t + 1) = −
∂e
∂wij
∂e
∂wij
|t+1 ∆wij (t)
∂e
|t+1 − ∂w
|t
ij
(A.3)
Nel caso in cui il denominatore della A.3 sia zero, per un dato peso, si pone
lo spostamento uguale a zero. Rispetto ad altri algoritmi, il QuickProp
ha una veloce convergenza in quanto permette rapidi spostamenti sulla
superficie d’errore. Gli svantaggi derivano dal fatto che, invece di incontrare
un minimo della forma quadratica, possiamo incorrere in un massimo.
Quando ció accade puó essere utile utilizzare un altro algoritmo per evitare
l’allontanamento dal minimo reale.
Appendice A
A.3
103
RProp
RProp sta a significare Resilient Propagation ed é un metodo di
minimizzazione locale. Il principio base dell’RProp é utilizzare, per ogni
peso, un diverso valore dello spostamento. La dimensione della variazione
dei pesi é determinata dal cosiddetto “update-value” ∆ij (t) secondo:

∂E (t)

 −∆ij (t) , se ∂wij > 0
∂E (t)
∆wij (t) =
<0
∆ij (t) , se ∂w

ij

0 , altrimenti
(A.4)
Il secondo passo é quello di determinare i nuovi valori ∆ij (t + 1) attraverso
un processo noto come “sign-dependent adaptation.

∂E (t) ∂E (t+1)
+

>0
 η ∆ij (t) , se ∂wij ∂wij
(t)
(t+1)
∂E
∂E
∆ij (t + 1) =
(A.5)
<0
η − ∆ij (t) , se ∂w
∂wij

ij

0 , altrimenti
dove 0 < η − < 1 < η + . In pratica, questa regola di adattamento funziona
in tal modo: ogni volta che la derivata parziale del peso corrispondente wij
cambia segno (il che sta ad indicare che l’ultimo aggiornamento é stato troppo
grande e ci ha fatto oltrepassare il minimo), il valore di aggiornamento ∆ij (t)
viene diminuito di un fattore η − ; se la derivata conserva il segno, il valore
di aggiornamento viene, invece, accresciuto di un fattore η + per accelerare
la convergenza nel minimo. Questo rende RProp in assoluto l’algoritmo di
minimizzazione piú rapido.
104
Appendice A
Bibliografia
[1] Aharonian F., Drury L., Volk H., Astronomy and Astrophysics,285, 645,
(1994).
[2] Alexandreas D.E., Nucl. Instrum. Methods Phys. Res A, 311, 350.
[3] ARGO Collaboration, Proposal of the ARGO experiment, (1996).
[4] ARGO Collaboration, Addendum to the ARGO Proposal, (1998).
[5] Begelman, M.C., R.D. Blandford, e M.J. Rees, Rev. Mod. Phys., 56,
255.
[6] Bell A.R.,Mon. Not. Roy. Astron. Soc., 182 , 443, (1978).
[7] Burnett T.H., Astrophy.J, 349, L25, (1990).
[8] Carlson J.F. e Oppenheimer J.R., Physical Rev., 51, 1169, (1949).
[9] Clark G.W., Physical Rev., 108, 450, (1957).
[10] deJager O.C., A.K. Harding, Astrophy.J 396, 161, (1992).
[11] Dermer C.D. e R. Schlickeiser, Astrophy.J 416, 458, (1993).
[12] Dingus B. L., Catelli J. R., Schneid E. J., 25th ICRC Proc. 3, 30, (1997).
[13] Fegan D.J., γ/hadron separation at TeV energies, J.Phys. G: Nucl. Part.
Phys. 23, 1013-1060, (1997).
[14] Fermi E.,Physical Rev., 1169, (1949).
[15] Fesefeldt H., Report PITHA-85/02, RWTH Aachen, (1985).
[16] Frank J., A. King e D. Raine, Accretion Power in Astrophisics,
Cambridge University Press, Cambridge, (1992).
[17] Gaisser T.K.,Cosmic Rays and particle physics., University Press,
Cambridge (1990).
106
Bibliografia
[18] Gaisser T.K., R.J. Protheroe, T. Stanev, Gamma-ray production in
Supernova Remnants, Astr. Jou., 492, 219-227, (1998).
[19] Goldreich P. e Julian W.H., Astrophys. J., 157, 839, (1969).
[20] Halsey T.C., Jensen M.H., Kadanoff L.P, Procaccia I. e Shraiman B.I.,
Phys. Res A, 33, 1141, (1986).
[21] Halzen F.,High-Energy Neutrino Astronomy: Science and first results,
arXiv:astro-ph/0301143 v1, (2003).
[22] Heck D. e Knapp J., Extensive Air Showers Simulation with CORSIKA:
A User’s Guide v6.020, (1998)
[23] Henri G., G. Pelletier, P.O. Petrucci e N. Renault, Astropart.Phys.,
(1999).
[24] Hayakawa S. Cosmic ray physics Wiley Interscience, NY, (1969).
[25] Honda M. et al., Physical Rev., D52, 4985, (1995).
[26] Hermsen W., K.Bennett, J.B.G.M Bloemen, R. Buccheri, F.A. Jansen,
A. Mastichiadis, H.A. Mayer-Hasselwander, M.E. Ozel, A.M.T. Pollock
e A.W Strong, Astron. Astrophys., 175 141, (1987).
[27] Linsley J.,20th International Cosmic Ray Conference, Nauka Moscow,
Vol.2 p.442, 1987.
[28] Levinson A. e R. Blandford, Jets in Extragalactic Radio Sources, H.J.
Röser e K. Meisenheimer, New York (1991).
[29] Longair M.S., High energy astrophysics, UniversityPress, Cambridge
(1981).
[30] Kirk J.G., A. Mastichiadis e W.Bednarek, Proceedings of the Heilderberg
Workshop on Gamma-Ray Emitting AGN 1996, Max-Planck Institut
Für Kernphysik, Heidelberg, (1997).
[31] Mandelbrot B.B, J. Fluid Mech., 62, 331, (1974).
[32] Manhnheim K., Astron.Astrophys., 269, 67, (1993).
[33] Maraschi L., G. Ghisellini e A. Celotti, Astophys.J., 397, L5, 1992.
[34] Meyer H. TeV gamma ray astronomy, Nucl.Phys.B, 70, 391-398, (1999).
[35] Miller R.S., Westerhoff S., Conceptual design of a next generation all-sky
γ-ray telescope operating at TeV energies, Astropart.Phys., 11, 379-393,
(1996).
Bibliografia
107
[36] Muzy J.F., Bacry E. e Arneodo A., J. Stat. Phys., 70, 635, (1993).
[37] Muzy J.F., Bacry E. e Arneodo A., Phys. Rev. E, 47, 875, (1993).
[38] Naito T. e Takahara, Astophys.J., 20, 477, (1994).
[39] Padovani P., Very High Energy Phenomena in the Universe: Proceedings
of the XXXII Rencontres de Moriond, Editions Frontieres, Gif-surYvette, France (1997).
[40] Perkins D., Introduction to High Energy Physics. sec. ed., AddisonWesley, Massachussets, (1982).
[41] Protheroe R.J., A. Mastichiadis e C.D. Dermer, Astropart.Phys., 1, 113,
(1992).
[42] Protheroe R.J., Origin and Propagation of the Highest Energy Cosmic
Rays, arXiv:astro-ph/9612212v1.
[43] Kalmykov N.N. e Ostapchenko S.S. e A.I. Pavlov, Nucl. Phys. B (Proc,
Suppl.) 52B, 17, (1997).
[44] Schäfer B.M., Hofmann W., Lampeitl H., Hemberger M., Particle
identification by multifractal parameters in γ-astronomy with the
HEGRA-Cherenkov-telescopes, Nucl. Instr. & Meth. in Phys. Res. A,
465, (2001).
[45] Shapiro S.A., e S.A. Teukolsky, Black Holes, White Dwarfs, and Neutron
Stars: The Physics of Compact Objects, Wiley , New York (1983).
[46] Sikora M.C., M.C. Begelman e M.J. Rees, Astophys.J. 421, 153, (1994).
[47] Sokolosky P., Introduction to Ultrahigh Energy Cosmic Ray Physics,
Addison-Wesley, (1989).
[48] Thompson, D. J., et al., Astrophys. J., Suppl. Ser.86, 629, (1993).
108
Ringraziamenti
D
esidero prima di tutto ringraziare il Dott. Ivan DE MITRI che, con
la sua costante presenza e assoluta disponibilitá, ha reso questi ultimi otto
mesi l’esperienza formativa piú importante della mia carriera universitaria.
Desidero, inoltre, ringraziare tutto il gruppo 2 della sezione INFN di Lecce,
in particolare la Dott.sa Carla BLEVE e il Dott. Daniele MARTELLO per
i loro preziosi suggerimenti.
Un particolare ringraziamento va alla mia famiglia e ad Ilaria (la mia
splendida professoressa di italiano), le uniche persone che hanno avuto fiducia
nelle mie capacitá nei momenti piú brutti della mia vita.
Un grazie sincero va ai miei “amici di sempre”, agli amici della “Saletta
Laureandi” e in particolare, a Martino (Leo), Gianfranco (Janfranc) e Karen
per avermi fatto credere, con le loro parole, di essere un “genio”, anche
quando mi sentivo Homer Simpson.
Infine il mio pensiero non puó non rivolgersi all’Arma dei Carabinieri dalla
quale ho imparato lo spirito di sacrificio che mi mancava.

universit`a degli studi di lecce

Transcript

Documenti analoghi

Economia di Comunione - Città Nuova Editrice

Per ulteriori informazione chiamare Marco Nocci

Daniele Piccini Poesie

Codice ISO 4406:1999

Tab.17-Classi Contaminazione ISO

Come funziona il riscaldamento a raggi infrarossi “HYBRID”?

Intervista al filosofo Byung-Chul Han sugli eccessi della Rete

Teli di Copertura per Tetti in PVC > Telo in tessuto impermeabile