Le ricerche in HEP - Dipartimento di Fisica

Transcript

Le ricerche in HEP - Dipartimento di Fisica
Le ricerche
in HEP
y
Les Très R
Riches Heures du Duc de Berry.
Le Mois de Décembre, le terme d’une chasse.
Musée Condé de Chantilly (F).
Paolo Bagnaia - Le ricerche in HEP
1
LaLaricerca
Bosone
gg con
Acautela)
LEP
6/5 a di
ricerca del del
Bosone
di Higgs
LEPHiggs
(usare
(avvertenze)
• Le pagine che seguono provengono da un vero corso del 5 anno;
• in questa sede NON è indispensabile conoscere la “parte teorica” (il modello standard
delle particelle elementari, il ruolo del bosone di Higgs nella teoria), che sarà trattata negli anni
successivi (*);
• occorre soltanto capire il trattamento dei dati, assumendo :
1. l’esistenza di una teoria (accettata da quasi tutti, ma non ancora
completamente verificata), che prevede certi stati (e.g. il b.H.), che sono
sperimentalmente osservabili, ma non completamente fissati dalla teoria (e.g.
nel nostro caso, la massa del b.H. non è fissata dalla teoria);
2. la definizione di sezione d’urto σx (∝ probabilità di un dato processo ”x”);
3. la definizione di luminosità differenziale Ld e di luminosità integrata LI
(n numero di eventi nell’unità di tempo,
(n=numero
tempo N=numero
N numero totale di eventi) :
n x = L d σx ,
________________________________________________________
∫
LI = Nx/σx = Lddt .
(*)
Potrei rifrasare la lezione immaginando (e.g.) un criminologo, che cerchi arsenico sul luogo di un delitto con uno
spettrometro di massa come quello delle pagine precedenti; però ci tengo a mostrare un vero esempio di analisi, realmente
Paoloeffettuata
Bagnaia - Le
in HEP
daricerche
ricercatori
del nostro Dipartimento.
2
sommario
•
•
•
•
generalità sulle ricerche;
“frequentisti”
frequentisti e “bayesiani”;
bayesiani ;
probabilità, distribuzioni di Gauss e Poisson);
procedura di analisi (“blind”);
• esempio : Higgs a LEP 1;
• luminosità di scoperta e di esclusione;
• calcolo di un limite (“al 95% di CL”);
• esempio : Higgs a LEP 2000;
• metodo della likelihood;
• appendice : alcune proprietà della funzione di
likelihood.
Paolo Bagnaia - Le ricerche in HEP
3
esempio : limiti su mH alla fine di LEP I - 4 exp.
~ 3.7 M [Z→adroni] / exp (1989-94);
→ mH>65.2 GeV @ 95% CL
• questa curva congloba i limiti di
tutti e quattro gli esperimenti :
A
: 63.1
GeV
D
: 55.4
“
L
: 60.2
“
O
: 59.1
“ ;
• ll’evento
evento a mH = 67 GeV (OPAL)
peggiora il limite di O(.1 GeV).
Paolo Bagnaia - Le ricerche in HEP
J.F.Grivaz,
Bruxelles '95
95
4
la fisica delle “ricerche”
ricerche
• preliminare : esiste un modello (ex. SM, SUSY, etc.) che predice un fenomeno
(
(ex.
una particella,
i ll un effetto
ff
di
dinamico)
i ) in
i funzione
f
i
di qualche
l h parametro non
fissato (ex. la massa della particella per il bosone di Higgs);
• [[altro caso p
più semplice
p
: il fenomeno è completamente
p
fissato dalla teoria,, ex.
la produzione di W± e Z al Collider SppS];
• un acceleratore di nuova costruzione è potenzialmente in grado di osservare il
fenomeno in un intervallo dello spazio dei parametri ancora inesplorato;
• pertanto, si possono dare due casi :
A. osservazione del fenomeno : la teoria è “verificata” ((leggere
gg
Popper, please),
) g
gli
eventuali parametri liberi sono misurati;
B. non-osservazione : un qualche intervallo nello spazio dei parametri è dimostrato
impossibile
p
((cioè si p
pone un “limite”);
); q
quando tutto l’intervallo eventualmente
permesso dalla teoria è esaurito, la teoria è “falsificata”;
™
altro approccio (“model independent”), meno comune : cercare fenomeni
imprevisti senza predizioni teoriche; ex.
imprevisti,
ex stati legati ℓ+ℓ- di alta massa (cfr.
(cfr J/ψ).
J/ψ)
Paolo Bagnaia - Le ricerche in HEP
5
“blind
blind analysis
analysis” (perché blind ?)
• di solito, b>>s, ma b e s hanno distribuzioni aspettate differenti → tagli nelle variabili
cinematiche degli eventi (ex.
(ex masse combinate,
combinate distribuzioni angolari,
angolari …);
);
• quando il numero di eventi osservato è “grande” (n>>√n), le fluttuazioni statistiche
modificano poco il risultato [però gli sperimentatori sono sempre impazienti …];
• viceversa,
viceversa in caso di piccoli numeri,
numeri la distribuzione di eventi trovati è discreta e fluttua;
• piccole variazioni della selezione (che corrispondono a piccole differenze di eventi di
fondo / segnale aspettati) producono grandi differenze di eventi trovati (ex., con fondo
aspettato
tt t trascurabile,
t
bil passare da
d 0 → 1 evento
t trovato,
t
t come nella
ll figurina,
fi i
f grande
fa
d
differenza);
• nessun analista è “neutrale” : a posteriori, si
possono sempre trovare
t
argomentiti formalmente
f
l
t
corretti per modificare di poco un taglio e cambiare
di molto i risultati;
• occorre fissare i criteri di analisi a priori sui mc,
ottimizzando la visibilità del segnale aspettato, e
poi applicare questi criteri “alla cieca” sugli eventi
quale
l è il taglio
t li “giusto”
“ i t ”?
realili (→
( “blind
“bli d analysis”).
l i ”)
Paolo Bagnaia - Le ricerche in HEP
6
osservazione di un effetto nuovo
[nel caso semplice, non c’è problema : se la ricerca di un fenomeno mai prima osservato
non ha fondo significativo aspettato,
aspettato la prima osservazione porta alla scoperta; anche un
solo evento è significativo, ex. e+, pbar, Ω- a Brookhaven, W e Z al SppS];
• nel caso generale, esiste un fondo (calcolabile), prodotto da eventi di altri processi fisici
che simulano quello cercato,
cercato o da eventi mal misurati dal rivelatore;
• la scoperta è pertanto un’osservazione che è incompatibile (ad un livello di confidenza
predefinito) con una fluttuazione statistica +va del solo fondo aspettato;
• si può invece porre un limite se si compie un’osservazione che è incompatibile con una
fluttuazione -va del numero di eventi (fondo+segnale) aspettati, se la teoria fosse vera;
e g , in app
approssimazione
oss a o e d
di g
grande
a de numero
u eo d
di e
eventi,
e t, a p
priori
o ssi de
deve
e co
confrontare
o ta e il
• e.g.,
segnale aspettato (s) con la fluttuazione del fondo (√b) : nσ = s / √b; a posteriori il numero
osservato (N) con il solo fondo (b) o con la somma (s+b);
Esempio
Ci si aspettano 100 eventi di fondo (b=100, σb=√b=10) e 44 di segnale (s+b=144, σs+b=12). Si è scelto un livello di
confidenza di “3σ”. Si può annunciare la scoperta se si osservano >130 eventi. Si può invece porre un limite se N
< 108.
108 Se
S 108<N<130 non c’è
’è decisione.
d i i
I valori
l i N < 70 e N >180 sono “impossibili”
“i
ibili” in
i questo
t schema.
h
Paolo Bagnaia - Le ricerche in HEP
7
la distribuzione di Poisson
• alcune difficoltà aggiuntive sorgono nel caso in cui l’approssimazione “n
grande” (cioè distribuzione di Gauss) non possa essere utilizzata;
grande
• in questo caso, la distribuzione degli eventi segue la funzione di probabilità di
Poisson [PDG, § 27.3.2 e § 28.6.5] :
[NB i fisici
fi i i misurano
i
n→
e−mmn
(n | m ) =
; 〈 n〉 = m; σn = m;
ottengono informazioni su m];
n!
℘
ex. n=0 → m ≤ 3 @ 95% CL.
• caso con fondo (media b, nota) + segnale (media s, ignota) :
℘
e −( b +s ) (b + s )n
(n | b + s ) =
; 〈 n〉 = b + s; σn = b + s;
n!
¾ misurare n;
¾ decisione : ad un dato CL, n è incompatibile con b+s (scelta LEP per
esclusione : 95%) ? n è incompatibile con b, cioè s≠0 (scelta LEP per
scoperta : 5 σ → 5.7×10
5 7×10-5) ? oppure il caso è dubbio ?
Paolo Bagnaia - Le ricerche in HEP
8
procedura di analisi
mc segnale (teoria per vari valori dei parametri,
σ, dσ/dcosθ, particelle di stato finale, …)
mc fondi (σ, dσ/dcosθ,
particelle di stato finale, …)
identico !!!
mc rivelatore (include risposta, risoluzione, malfunzionamenti, …)
mc rivelatore (…)
analisi : ottimizzazione dei tagli in modo da migliorare la visibilità del segnale
(e.g. s/√b), talora funzione dei parametri liberi del segnale (e.g. mH) o di Lintegrata.
tagli “standard”
vietato tornare indietro
(ottimali)
sensibilità
Paolo Bagnaia - Le ricerche in HEP
scoperta
p
dati reali
???
limite
9
scoperta o esclusione ?
• gli esperimenti, in genere, usano una convenzione omogenea (conservativa)
per le richieste statistiche di scoperta e esclusione :
¾ SCOPERTA
: CL di “5σ”, cioè P (b solamente) ≤ 5.7×10-5;
¾ ESCLUSIONE : CL di “2σ”,
“2 ” cioè
i è P (s+b)
( +b) ≤ 5×10
5 10-22 [in
[i gergo, “95% CL”];
CL”]
• a priori, si definisce la luminosità L necessaria per la scoperta /esclusione :
¾ Lscoperta =luminosità
l i
ità integrata
i t
t minima,
i i
affinchè
ffi hè il 50% degli
d li esperimenti
i
ti(Ã)
(cioè un esperimento nel 50% dei casi) veda almeno 5σ oltre il
fondo;
¾ Lesclusione =luminosità integrata minima, affinchè il 50% degli esperimenti(Ã)
(cioè un esperimento nel 50% dei casi) veda almeno 2σ meno
p
per fondo + segnale;
p
g
del valore aspettato
NB : questa condizione è quella della mediana [“un esperimento, nel 50% dei casi…”], che è
differente da quella della media [“un esperimento, che osservi esattamente il numero
aspettato di eventi…”].
(Ã)
talvolta un “esperimento” LEP [LHC] è la somma dei dati di tutte le 4 [2] collaborazioni.
Paolo Bagnaia - Le ricerche in HEP
10
paradossi
A. è necessaria molta più luminosità per la scoperta che per l’esclusione; cioè,
assumendo
d la
l presenza del
d l segnale
l ad
d un dato
d
valore
l
di massa, e un flusso
fl
continuo di dati, presumibilmente gli esperimenti si troveranno per lungo
tempo in una situazione di “limbo”, senza poter distinguere tra una
sovrafluttuazione del fondo (che impedisce di stabilire il limite) e una genuina
presenza di segnale, che consenta di affermare la scoperta;
B i valori aspettati sono “al
B.
al 50%
50%”;; cioè nella metà dei casi la luminosità
realmente necessaria è minore, e nell’altra metà maggiore; però LEP II ha
preso realmente dati una sola volta nella storia del mondo [che succede se
si costruisce un acceleratore e ci si lavora per anni,
anni pensando che i dati
saranno sufficienti a dirimere un problema, e poi c’è una fluttuazione ?];
C. 95% non è un numero molto alto, in un caso / 20 il limite è infondato; gli
esperimenti pubblicano molti limiti (decine ogni anno); è bene sapere che
circa il 5% di essi sono statisticamente infondati [non sono sbagliati, può
darsi che il valore vero sia molto superiore
p
al limite,, solo che non si sa].
]
Paolo Bagnaia - Le ricerche in HEP
11
esempio
ese
p o : limite
te pe
per mHiggs (b
(b=0,
0, n=0)
0)
Neventi
il disegno è solo un esempio
s(mH) =
σsegnale(mH) × Lint × εanalisi
℘
Animazione
limiteeventivisti; CL=95%
(n=0|m) ≥ 1-CL → m ≤ - ℓn (1-CL) →
m ≤ 2.996 ≈ 3
3
esclusione al CL del 95%
mlimite
Paolo Bagnaia - Le ricerche in HEP
mH
12
esempio
ese
p o : limite
te aspettato pe
per mHiggs (b
(b>0)
0)
Neeventi
il disegno è solo un esempio
s+b =
Lint [σs(mH)×εs+ σb×εb]
NB : εs e εb possono essere funzione
di mH, oppure no (“mass independent
selection”).
l ti
)
b = Lint× σb×εb
limiteeventifondo; CL
CL=95%
95%
Animazione
n
(j|m) ≥ 1-CL
j=0
Σ ℘
n
m
0
3.00
1
4.74
2
6.30
3
7.75
n>>
1
n+
1.96√n
esclusione aspettata al CL del 95%
mlimite
Paolo Bagnaia - Le ricerche in HEP
mH
13
esempio
ese
p o : limite
te ttrovato
o ato pe
per mHiggs (b
(b>0,
0, n>0)
0)
Neeventi
il disegno è solo un esempio
eventi trovati (include
risoluzione)
Animazione
il limite trovato può essere
maggiore o minore di quello
aspettato (variabile statistica →
t
trovare
di t ib i
distribuzione
generando
d
molti “pseudo-esperimenti”).
limite superiore al CL (95%)
mlimite
Paolo Bagnaia - Le ricerche in HEP
mH
14
le distribuzioni statistiche reali
¾ nella vita reale, gli eventi non seguono le distribuzioni matematiche dei libri : la funzione
di Gauss ((o di Poisson)) è un caso “semplice”,
p
, che richiede approssimazioni
pp
in g
genere
non valide;
• le distribuzioni reali sono generate numericamente dal mc della fisica e del rivelatore;
• molto spesso,
spesso a causa di effetti sistematici complicati (ex.
(ex le zone morte dei rivelatori),
rivelatori)
le “code” sono più importanti che nel caso gaussiano; l’eccessiva semplificazione può
produrre gravi errori;
• è possibile calcolare numericamente i parametri delle distribuzioni (media,
(media s.d.,
s d valori
corrispondenti ai limiti);
• in gergo, si dice “n σ” per indicare il valore corrispondente all’integrale della funzione di
Gauss : ex.
ex “sovra-fluttuazione
“sovra fluttuazione a 3 σ” vuol dire che la probabilità di ottenere un valore più
elevato (calcolata numericamente dalla distribuzione realmente aspettata) è 0.27 % (pari
all’integrale della gaussiana da <x>+3σ a +∞); non vuol dire che si è superato il valor medio
(questo è vero solo nel caso g
gaussiano));
di 3 volte la s.d. (q
•
per alcune distribuzioni statistiche (ex. distribuzione del limite aspettato), l’elemento
della popolazione non è l’evento singolo, ma la distribuzione degli eventi (o un suo
derivato); in questi casi si devono generare molti esperimenti indipendenti virtuali
(“Gedanken-experiment”), ciascuno con alta statistica (dispendio di calcolo);
Paolo Bagnaia - Le ricerche in HEP
15
[ancora : limiti su mH alla fine di LEP I - 4 exp.]
~ 3.7 M [Z→adroni] / exp (1989-94);
→ mH>65.2 GeV @ 95% CL
• questa curva congloba i limiti di
tutti e quattro gli esperimenti :
A
: 63.1
GeV
D
: 55.4
“
L
: 60.2
“
O
: 59.1
“ ;
• ll’evento
evento a mH = 67 GeV (OPAL)
peggiora il limite di O(.1 GeV).
Paolo Bagnaia - Le ricerche in HEP
J.F.Grivaz,
Bruxelles '95
95
16
problemi di analisi
A. problemi finti (occupano la maggior parte delle pubblicazioni) :
• difficoltà matematiche (calcoli vari,
vari interpretazione,
interpretazione …);
);
• difficoltà statistiche (approccio soggettivo/oggettivo, …);
B. problemi veri (i cosiddetti “errori sistematici”) :
• statistica dei mc (molti fondi a molti valori di √s,
√ “griglia” nello spazio dei
parametri)
→ non risparmiare
p
sui computers
p
((né sugli
g uomini)) e non avere fretta;;
• conoscenza della risposta del rivelatore (“code non gaussiane” a bassa
statistica, malfunzionamenti rari, …)
→ molta pazienza,
pazienza sforzo,
sforzo tempi lunghi;
• calcoli approssimati (ordini superiori, processi rari, parametrizzazioni
che falliscono per 1 evento / 106, …)
→ … tempo
t
…;
• errori di analisi (sono tante e molto complicate, difficile trovare veri
esperti e controllarli)
→ controllo rigoroso e, se possibile, duplicazione dell’analisi.
Paolo Bagnaia - Le ricerche in HEP
17
luminosità di scoperta
con le definizioni precedenti, assumendo la probabilità di Poisson e
chiamando σS (σB) le sezioni d
d’urto
urto osservate
osservate* del segnale (del fondo) e L
la luminosità integrata disponibile, si ha :
⎡L ( εB σB + εS σS ) ⎤⎦
℘B +S (i | L ) = exp ⎡⎣ −L ( εB σB + εS σS ) ⎤⎦ ⎣
;
i!
i
℘B (i | L ) = exp [ −LεB σB ]
[ −LεB σB ]i ;
LεBσB
i!
< n >B +S = L ( εB σB + εS σS )); ∆ B +S = L ( εB σB + εS σS );
< n >B = LεB σB ;
∆ B = LεB σB ;
PB
L(εBσB+εBσS)
PB+S
< n >B +S − < n >B = LεS σS ∝ L;
< n > B +S − < n > B
∆
2
B +S
+∆
2
B
= L
Paolo Bagnaia - Le ricerche in HEP
ε S σS
2εB σB + εS σS
∝ L.
i
18
definizione di luminosità di scoperta
¾
le equazioni precedenti possono essere interpretate e risolte in termini di
LD, la “luminosità integrata di scoperta” :
1 − e− LDεB σB ×
N −1
∑
( LD εB σB )
i =0
e
− LD ( εB σB +εS σS )
N −1
×
∑
i =0
i!
i
≤℘(5σ) = 5.7 × 10 −5 ;
⎡⎣LD ( εB σB + εS σS ) ⎤⎦
≤ 0.5;
i!
i
cut
PB
PB+S
≥ 0.5
N = NS = LD ( εB σB + εS σS ) .
≤ 5.7×10-5
¾
i
“la luminosità per cui, nell’ipotesi di esistenza del segnale, il 50% degli
esperimenti
p
trova una incompatibilità
p
con il solo fondo al livello di 5σ”.
Paolo Bagnaia - Le ricerche in HEP
19
calcolo delle luminosità di scoperta/esclusione
• le formule precedenti, a dispetto della grande complicazione formale, sono
solo delle pallide approssimazioni dei calcoli realmente eseguiti [v.
[v oltre];
• inoltre, non tengono conto degli errori sistematici (come si fa ?);
• nella vita reale, la luminosità è raccolta a valori di √s via via crescenti; nel
calcolo bisogna combinare tutti i valori di √s, senza perdere preziosa
informazione;
• tutto ciò premesso,
premesso le formule precedenti possono essere interpretate come
delle equazioni in LD e LS, note εB, σB, εS, σS (calcolate via mc, come
discusso in precedenza).
tornare a “Higgs a LEP”
Paolo Bagnaia - Le ricerche in HEP
20
il metodo del caso Higgs a LEP II (A
(A.D.
D MM)
una variazione del metodo
pprecedente,, molto complicata;
p
;
però bisogna studiarla :
™ il caso reale più complesso
mai avvenuto finora;
™ buon esempio di quello che
succederà a LHC, se le cose si
faranno interessanti…
interessanti
estratto da
PL B565
(2003) 61.
(2003),
61
Paolo Bagnaia - Le ricerche in HEP
21
metodo di calcolo dei limiti ((ancora …))
• [non è una ridefinizione in contrasto con le precedenti, ma un approfondimento];
• la
l procedura
d
è lla seguente
t [non
[
tutte
t tt le
l sottigliezze,
tti li
mii pare già
ià troppo]
t
]:
¾ raccolta dei dati (4 exp × molte √s × tutti i possibili stati finali) [def. “canale”,
ex. il canale L3 - 204 GeV – b bbar µ+µ-];
¾ analisi su mc (segnale e fondi) e dati reali per tutti gli “N” canali :
™ ripetuta per ogni valore accessibile di mH [“test mass”];
™ differente per ogni canale “c”
c e per ogni mH “m”
m : {σS, σB, εS, εB, L , n}c,m
[def. L εS σS ≡ sc,m, L εB σB ≡ bc,m, entrambi ƒ(mH)];
™ per ognuno degli nc,m
, eventi osservati (j=1,…nc,m
, ), un insieme di valori
osservati [ex. massa ricostruita mj, variabile di b-tag; def. ∑cnc,m≡Mm];
™ in genere “tutto è funzione di tutto il resto” [ex. mj = mjm = mj(mH),
perché l’efficienza, i tagli e i fit cinematici dipendono da mH];
™ mc(segnale) e mc(fondo) producono anche ƒSc,m(x1,…) e ƒBc,m(x1,…),
distribuzioni di densità per tutte le variabili misurabili “x”, a valle dei tagli
e dei fit;;
[… continua …]
Paolo Bagnaia - Le ricerche in HEP
22
calcolo dei limiti - 2
combinazione statistica dei vari canali [LEP Higgs working group, LHWG] :
™ funzione di distribuzione degli eventi osservatI per segnale e fondo [xjc sono le
grandezze cinematiche del j-esimo evento del canale c] :
G
G
ƒ S ( x jc ) ≡ ƒ Sc ( x jc | mH );
™
G
G
ƒB ( x jc ) ≡ ƒBc ( x jc | mH )
likelihood per segnale (ΛS) e fondo (ΛB) :
G
B G
⎧⎪
⎡sc ƒ ( x jc ) + bc ƒ ( x jc )⎤ ⎫⎪
ΛS = ΛS (mH ) = ∏⎨℘(nc | sc ,bc ) × ∏⎢
⎥ ⎬;
sc + bc
c =1 ⎪
j =1 ⎣
⎦ ⎭⎪
⎩
N
nc
S
nc
⎧
B G ⎫
ΛB = ΛB(mH ) = ∏⎨℘(nc | bc ) ×∏ƒ (xjc )⎬;
c=1 ⎩
j =1
⎭
N
™
test sul rapporto tra le likelihood Q (-2 ℓn Q → ∆χ2 a grande M) :
− 2AnQ = −2An ( ΛS Λ B ) ;
[… continua …]
Paolo Bagnaia - Le ricerche in HEP
23
calcolo dei limiti - 3
G
G
⎧⎪e−(sc +bc ) ( sc + bc )nc nc ⎡sc ƒS (x jc ) + bc ƒB ( x jc )⎤ ⎫⎪
esplicitamente :
ΛS = ∏⎨
× ∏⎢
⎥⎬=
nc !
sc + bc
c =1 ⎩
j =1 ⎣
⎪
⎦ ⎭⎪
N
⎧e−(sc +bc ) nc
⎫
S G
B G
−
b
n
N
⎧e c × bc c nc B G ⎫ = ∏⎨ n ! × ∏⎡⎣sc ƒ (x jc ) + bc ƒ ( x jc )⎤⎦ ⎬;
j =1
⎭
ΛB = ∏⎨
× ∏ƒ (x jc )⎬ = c=1 ⎩ c
nc !
c =1 ⎩
j =1
⎭
N
⎧e−bc nc
B G ⎫
= ∏⎨
× ∏bc ƒ (x jc )⎬;
c =1 ⎩ nc !
j =1
⎭
N
⎛ N ⎧ e −( sc + bc ) nc
⎫⎞
S G
B G
⎡
⎤
×
s
ƒ
(
x
)
+
b
ƒ
(
x
)
⎜∏⎨
∏
c
jc ⎦ ⎬ ⎟
jc
⎣ c
!
n
⎛ ΛS ⎞
j =1
⎭⎟ =
⎜ c =1 ⎩ c
−2AnQ = −2An ⎜
=
−
2
n
A
⎟
N
⎜
⎟
⎧ e − bc nc
⎫
⎝ ΛB ⎠
B G
× ∏ bc ƒ ( x jc )⎬
⎨
⎜
⎟
∏
n
!
c =1 ⎩ c
j =1
⎭
⎝
⎠
G
N
N ⎡ nc
⎛ sc ƒ S ( x jc ) ⎞ ⎤
= 2 ∑ sc − 2 ∑ ⎢ ∑ An ⎜ 1 +
⎟ ⎥.
B G
c =1
c =1 ⎣
⎢ j =1 ⎝ bc ƒ ( x jc ) ⎠ ⎥⎦
Paolo Bagnaia - Le ricerche in HEP
24
le likelihood e il loro rapporto
A.
G
G
⎧⎪e−(sc +bc ) ( sc + bc )nc nc ⎡ sc ƒS ( x jc ) + bc ƒB ( x jc ) ⎤ ⎫⎪
ΛS = ΛS (mH ) = ∏ ⎨
× ∏⎢
⎥ ⎬;
nc !
sc + bc
c =1 ⎪
j =1 ⎣
⎦ ⎪⎭
⎩
N
⎧e−bc bc nc nc B G ⎫
ΛB = ΛB (mH ) = ∏ ⎨
× ∏ ƒ ( x jc )⎬;
nc !
c =1 ⎩
j =1
⎭
N
la likelihood [PDG, §28.3.1, pag. 196] è il prodotto delle densità di probabilità [pdf],
calcolata per i valori osservati degli eventi; nel nostro caso, il prodotto della funzione di
Poisson, calcolato per il valore osservato di eventi in ogni canale, per la pdf di ciascun
evento, calcolata per i valori osservati; il tutto è ripetuto due volte (ipotesi di
segnale+fondo oppure di solo fondo), in funzione del parametro allo studio (mH).
B.
G
N
N ⎡ nc
⎛ sc ƒS ( x jc ) ⎞⎤
⎛ ΛS ⎞
− 2AnQ = −2An ⎜ ⎟ = 2 sc − 2 ⎢ An ⎜1+
⎟⎟⎥;
B G
⎜
Λ
b
ƒ
(
x
)
⎝ B⎠
c
jc ⎠ ⎥
c =1
c =1 ⎢
⎣ j =1 ⎝
⎦
∑
∑∑
il rapporto tra le likelihood dello stesso fenomeno, generate da due pdf differenti, è un
potente test di ipotesi tra le possibilità rappresentate dalle due pdf; nel nostro caso, il
termine “-2
2 ℓn …” è solo per convenienza [ -2ℓn(Λ)
2ℓn(Λ) → χ2 , vedi prossima pag.].
pag ]
Paolo Bagnaia - Le ricerche in HEP
25
limite “gaussiano”
gaussiano
La likelihood è definita come la probabilità combinata delle misure; pertanto, essa è
maggiore
i
quando
d lla ffunzione
i
di di
distribuzione
t ib i
è corretta;
tt quindi
i di :
G
N
N ⎡ nc
⎛ sc ƒS (x jc ) ⎞⎤
⎛ ΛS ⎞
− 2AnQ = −2An⎜ ⎟ = 2 sc − 2 ⎢ An⎜1+
⎟⎟⎥ =
B G
⎜
Λ
b
ƒ
(
x
)
⎝ B⎠
⎢ j =1 ⎝
⎥
c
jc ⎠⎦
c=1
c=1 ⎣
∑
∑∑
-2ℓnQ
Animazione
⎧−A n("grande"/"piccolo") → −∞ se (s+b) ok
=⎨
;
−
A
n("piccolo"/"grande")
n(
piccolo
/
grande
)
→
+∞
se
(
(b)
b)
ok
⎩
b
dati
reali
mH
ciò è confermato dal “limite gaussiano” [ -2ℓn(Λ) → χ2 ] :
− 2AnQ = −2An( ΛS ΛB ) = χS2 − χB2 =
⎧("piccolo" - "grande") → −∞ se (s+b) ok
=⎨
;
(
"grande"
"piccolo"
)
→
+∞
se
(b)
ok
⎩
Paolo Bagnaia - Le ricerche in HEP
s+b
buona
separazione
cattiva
”
26
likelihood “binnata”
binnata
™
in pratica (per minimizzare le fluttuazioni statistiche mc), per ogni valore di mH,
si fa una “scacchiera”
scacchiera nel piano delle variabili cinematiche rilevanti :
ƒ “mHrec”, la massa del candidato Higgs, ricostruita per ciascun evento;
ƒ “G”, una variabile globale, che contiene b-tag, cinematica, jet, … ;
i “quadratini” della scacchiera (“i”=1,…,N) devono essere abbastanza piccoli da
poter trascurare le variazioni di ƒS,B all’interno e abbastanza grandi da non dare
problemi con la statistica mc;
™ di conseguenza [stot ≡ segnale totale aspettato;
G
si, bi, ni ≡ segnale, fondo, eventi trovati in “i”] :
™
G
⎡ nc ⎛ sc ƒS (x jc ) ⎞⎤
−2AnQ = 2 ∑sc − 2 ∑⎢∑An⎜1+
⎟⎥ =
B G
c =1 ⎢
c =1
⎣ j =1 ⎝ bc ƒ (x jc ) ⎠⎥⎦
N
N
⎡
⎛ si ⎞⎤
= 2stot − 2∑⎢ni An⎜1+ ⎟⎥ .
i =1 ⎣
⎝ bi ⎠⎦
si;bi
Q
Paolo Bagnaia - Le ricerche in HEP
mHrec
27
risultati per mH a LEP 2 (esempio)
⎡
⎛ s
− 2AnQ = 2stot − 2∑ ⎢ni An ⎜ 1 + i
i =1 ⎣
⎝ bi
Q
⎞⎤
⎟⎥ .
⎠⎦
di solito il risultato viene mostrato
in una figura con :
ƒ ascisse : mH “test mass”;
ƒ ordinate : -2
2 ℓn Q per quel
valore di mH;
ƒ valore di -2 ℓn Q in :
¾ caso aspettato di s+b : ····;
¾ caso aspettato di solo b (+
bande a ±1σ
±1 e ±2σ)
±2 ) : ----;;
¾ dati osservati (—);
Paolo Bagnaia - Le ricerche in HEP
28
Fine – Limiti e ricerche
Paolo Bagnaia - Le ricerche in HEP
♠
29