Lagrange Multiplier Test

Transcript

Lagrange Multiplier Test
Lagrange Multiplier Test
Eduardo Rossi
Università di Pavia
Test Lagrange Multiplier
Si è detto che nel caso del test LM, si deve partire dall’ipotesi nulla.
Si tratta di ottenere una stima di MV vincolata, cioè:
max log L (y; θ)
θ∈Θ
sotto il vincolo:
g (θ) = [g1 (θ) g2 (θ) ...gG (θ)]′ = 0
dove per ogni i = 1, 2, .., G, gi (θ) rappresenta una funzione continua e
derivabile. Se le restrizioni che imponiamo sono vere allora il prezzo,
come misurato dai moltiplicatori di Lagrange, sarà nullo. Questo
significa anche che lo score valutato in corrispondenza della stima
vincolata è nullo.
1
La statistica del test è, quindi, basata o sugli stimatori dei moltiplicatori o sullo score valutato in corrispondenza dello stimatore vincolato
(da qui la doppia denominazione di test LM o dello Score). Il problema di massimo vincolato si può scrivere come
n
max log L (y; θ) + λ′g (θ)
θ∈Θ
o
2
dove λ è il vettore (G × 1) dei moltiplicatori di Lagrange. Le condizioni
di primo ordine per un massimo sono:
e
∂ log L y; θ
∂θ
+
′
∂g θe
∂θ
e =0
λ
(1)
g θe = 0
(2)
3
dove






∂g (θ)

=

∂θ′




∂g1 (θ) ∂g1 (θ)
∂θ1
∂θ2
∂g2 (θ) ∂g2 (θ)
∂θ1
∂θ2
.
.
∂gG (θ) ∂gG (θ)
∂θ1
∂θ2
...
...
...
...
∂g1 (θ)
∂θk
∂g2 (θ)
∂θk
.
∂gG (θ)
∂θk












4
Le soluzioni delle condizioni del primo ordine sono lo stimatore vincolato di MV del vettore dei parametri θ, indicato con θe e da uno
e
stimatore del vettore dei moltiplicatori di Lagrange λ.
5
Consideriamo, sotto H0, l’espansione in serie di Taylor del primo or∂ log L (y; θ)
dine in un intorno del parametro vero della
nei punti θe e
∂θ
e
λ:
∂ log L y; θe
∂θ
∂ log L (y; θ0)
∂ 2 log L (y; θ0) e
θ − θ0 + op (1)
=
+
∂θ
∂θ∂θ′
(3)
6
sostituendo la (3) nella (1)
∂ log L (y; θ0)
∂ 2 log L (y; θ0) e
+
θ − θ0 +
∂θ
∂θ∂θ′
′
∂g θe
∂θ
e
λ+o
p (1) = 0.
(4)
∂g ′ (θ) e
Si possono omettere i termini dell’espansione di ∂θ λ perchè si può
mostrare che gli altri termini dell’espansione possono essere trascurati.
Espandendo in serie di Taylor del primo ordine il vettore dei vincoli
valutati in θe intorno a θ0 si ha:
∂g
θ
)
(
0
e − θ + o (1)
θ
g θe = g (θ0) +
p
0
∂θ′
(5)
sappiamo
però che il vettore dei vincoli è nullo quando è valutato in
e g θe = 0. Si può mostrare che θe è uno stimatore consistente di
θ:
θ0, quando quest’ultimo soddisfa i vincoli, cioè quando θ0 è tale che
g (θ0) = 0.
7
Questo significa che la (5) si riduce a:
∂g (θ0) e
θ − θ0 = op (1) .
∂θ′
(6)
√
1
√
Premoltiplichiamo la relazione (4) per n e la (6) per n. Lo scopo
di tali operazioni è quello di ottenere il limite in distribuzione di queste
quantità.
8
Dalla (4) si ottiene:
1 ∂ log L (y; θ0)
1 ∂g ′ (θ0) e
1 ∂ 2 log L (y; θ0) √ e
n θ − θ0 − √
λ+op (1)
=−
√
′
n
n ∂θ
∂θ
n
∂θ∂θ
(7)
dalla (6):
∂g (θ0) √ e
n θ − θ0 = op (1)
(8)
′
∂θ
9
Le equazioni (7) e (8) costituiscono un sistema:



∂
log
L(
y
;θ

0)
√1
a
∂θ
 n
=


0
∂ 2 log L (y; θ0)
1
−n
∂θ∂θ′
∂g (θ0)
−
∂θ′

′

∂g (θ0)  √ e

−
  n θ − θ0 
∂θ

e
√1 λ

n
0
(9)
a
(NB. il segno = indica equivalenza asintotica ovvero che la differenza
tra il lato destro e sinistro del segno di uguale tende a zero in probabilità, ovvero è uguale a op (1)).
10
Ricordando che:
1 ∂ log L (θ0) d
→ N (0, I (θ0))
√
n
∂θ
allora:


"
# "
#!
1 ∂ log L (y; θ0)
0
I (θ0) 0
 √
 d
→
N
,


n
∂θ
0
0
0
0
11
Sappiamo, inoltre, che
"
1 ∂ 2 log L (y; θ0)
−
n
∂θ∂θ′
#
p
→ I (θ0)
possiamo, quindi, concludere che:

 √ e
n θ − θ0
d

→
N (0, V (θ0)) .
e
√1 λ
n
(10)
La matrice V (θ0) è pari a:



V (θ0) = 

I (θ0)
−
∂g (θ0)
−
∂θ′
∂g ′ (θ0)
∂θ
0
−1




"
I (θ0) 0
0
0
#





I (θ0)
−
∂g (θ0)
−
∂θ′
∂g ′ (θ0)
∂θ
0
12
−1




Per comodità di notazione poniamo:
∂g (θ0)
= G (θ0)
′
∂θ
Possiamo calcolare con la formula dell’inversa della matrice a blocchi:
"
I (θ0) −G′
−G
0
#−1
−1 
−1 − I −1 G′ GI −1 G′
GI −1 −I −1G′ GI −1G′
 I

=
−1
−1

−1
′
−1
−1
′
′
− GI G
GI
GI G

−1
(11)
da quest’ultima possiamo ricavare la matrice di varianze e covarianze
asintotica degli stimatori:

−1 − I −1G′
 I
V (θ0) = 
GI −1G′
0
−1
GI −1
0
GI −1G′


−1 
(12)
13
Adesso è chiaro che
−1
1 e d
√ λ → N 0, G (θ0) I −1 (θ0) G′ (θ0)
n
la statistica costruita con la forma quadratica:
1 e′ d
LM
−1
′
e →
ξn = λ G (θ0) I (θ0) G (θ0) λ
χ2
G
n
(13)
è distribuita asintoticamente, sotto H0 come una χ2 con G gradi di
libertà.
14
La versione in termini di score può essere ottenuta immediatamente;
dalla (1) premoltiplicata per √1n :
e
1 ∂ log L y; θ
√
n
per cui
ξnLM =
∂θ
=−
e
1 ∂ log L y; θ
n
e
∂g ′ θe λ
∂θ′
∂θ
√
n
I −1 (θ0)
e
λ
′
e
≡ −G θ √
n
e
∂ log L y; θ
∂θ
.
(14)
15
La regione critica del test è definita da:
n
ξnLM ≥ χ2
G,1−α
o
Il calcolo della (13) e della (14) richiedono la stima della matrice
d’informazione e, nella (13) della G (θ0). Tali stime possono essere
e sotto H sono stime consistenti. La
ottenute sostituendo θ0 con θ;
0
matrice d’informazione può essere approssimata con l’hessiano o con
il prodotto esterno del gradiente.
16