Definitezza di matrici simmetriche

Transcript

Definitezza di matrici simmetriche
Definitezza di matrici simmetriche
L.V., 2012
In quanto segue, H = (hij )ni,j=1 è una matrice reale simmetrica. Ad essa viene
associata la forma quadratica q : Rn → R, data da
(1)
q(x) = hHx, xi.
La matrice H (o la corrispondente forma quadratica q) viene detta:
• definita positiva [negativa] se, per ogni x ∈ Rn \ {0}, q(x) > 0 [q(x) < 0];
• semidefinita positiva [negativa] se, per ogni x ∈ Rn , q(x) ≥ 0 [q(x) ≤ 0] e
H non è definita positiva [negativa];
• indefinita se esistono x, y ∈ Rn tali che q(x) < 0 < q(y).
Le matrici definite positive o negative vengono chiamate matrici definite.
Si ricordi che, essendo H reale e simmetrica, tutti gli n autovalori di H sono reali
(non necessariamente distinti tra loro). Il seguente teorema è ben noto.
Teorema 1 (Definitezza e autovalori). Siano λ1 ≤ . . . ≤ λn gli n autovalori di H,
ordinati in modo non decrescente. Allora:
(i) H è definita positiva [negativa] se e solo se λ1 > 0 [λn < 0];
(ii) H è semidefinita positiva [negativa] se e solo se λ1 = 0 [λn = 0];
(iii) H è indefinita se e solo se λ1 < 0 < λn .
Si osservi che:
• H è definita se e solo se λ1 λn > 0;
• H è semidefinita se e solo se λ1 λn = 0;
• H è indefinita se e solo se λ1 λn < 0.
Per stabilire se H è definita o indefinita, possiamo utilizzare il seguente criterio di
Cartesio, applicandolo al polinomio p(λ) = det(λI − H).
Teorema 2 (Criterio di Cartesio). Sia
(2)
p(λ) = λn + a1 λn−1 + a2 λn−2 + . . . + an−1 λ + an
un polinomio a coefficienti reali avente solo radici reali. Allora:
(i) tute le radici di p sono > 0 se e solo se (−1)k ak > 0 per ogni k = 1, . . . , n;
(ii) tute le radici di p sono < 0 se e solo se ak > 0 per ogni k = 1, . . . , n.
Inoltre, supponendo che an 6= 0, si ha che, in tutti i casi diversi da (i),(ii), p ammette
due radici non nulle di segno opposto.
Dimostrazione. Se λ1 , . . . , λn sono le n radici di p, possimo scrivere
(3)
p(λ) = (λ − λ1 )(λ − λ2 ) · · · (λ − λn ).
Iniziamo con la dimostrazione di (ii). Se tutti i λk < 0 per ogni k, possiamo scrivere
p(λ) = (λ+|λ1 |) · · · (λ+|λn |) ed è ovvio che, svolgendo il prodotto, tutti i coefficienti
1
2
di p saranno positivi. Per il vice versa, è sufficiente osservare che (se ak > 0 per ogni
k) un numero λ ≥ 0 non può essere radice di p in quanto p(λ) ≥ an > 0.
Dimostrazione di (i). Supponiamo che λk > 0 per ogni k. Dall’uguaglianza (3) si
deduce che
!
X
Y
k
ak = (−1) ·
λi
A⊂{1,...,n}
card(A)=k
i∈A
(cioè, a1 = (−1) per la somma delle radici, a2 = la somma di tutti i prodotti di
coppie [non ordinate] delle radici, a3 = (−1) per la somma di tutti i prodotti di
terne [non ordinate] delle radici, eccetera). Di conseguenza, sign(ak ) = (−1)k per
ogni k. Per dimostrare il viceversa, supponiamo che i coefficienti di p siano a segni
alterni. Se λ ≤ 0, allora
n pari ⇒ p(λ) ≥ an > 0;
n dispari ⇒ p(λ) ≤ an < 0.
Quindi tale λ non è una radice di p.
Per dimostrare la parte finale dell’enunciato, è sufficiente notare che l’ipotesi an 6= 0
significa che 0 non è tra le radici di p. Quindi, se le radici non sono tutte dello stesso
segno allora ve ne sono due (non nulle) di segno opposto.
Terminiamo con un altro criterio di definitezza per matrici simmetriche. La dimostrazione può essere trovata su alcuni testi di algebra lineare.
Teorema 3 (“Minori principali nord-ovest”). Sia H = (hij )ni,j=1 una matrice reale
simmetrica. Supponiamo che i seguenti n numeri (detti “minori principali nordovest”)
dk = det(hij )ki,j=1
(k = 1, . . . , n)
siano tutti non nulli. Allora:
(i) H è definita positiva ⇔ dk > 0 per ogni k;
(ii) H è definita negativa ⇔ (−1)k dk > 0 per ogni k;
(iii) H è indefinita ⇔ H non è definita (cioè, la sequenza dei segni dei dk è
diversa dai due casi precedenti).
Da qui segue il ben noto criterio per matrici del tipo 2 × 2:
Corollario 4. Sia H = (hij )2i,j=1 una matrice reale simmetrica 2 × 2. Allora:
(i) Se det H > 0, la matrice è definita: positiva se h11 > 0, negativa se h11 < 0.
(ii) Se det H < 0, la matrice è indefinita.
(iii) Se det H = 0, la matrice è semidefinita.
La parte (iii) segue dal fatto che gli autovalori sono solo due (infatti, il determinante
nullo significa che almeno uno di essi è nullo).
3
Commenti conclusivi
(a) Sia q(x) = hHx, xi la forma quadratica data dalla matrice (reale simmetrica) H. Allora l’origine è un punto stazionario per q e la matrice hessiana
di q in 0 soddisfa
Hq (0) = 2H.
(b) H è definita positiva se e solo se 0 è l’unico punto di minimo per q; in tal
caso, esiste a > 0 tale che
q(x) ≥ akxk2
∀ x ∈ Rn .
(Analogamente: H è def. negativa ⇔ 0 è l’unico punto di massimo per q;
in tal caso, q ≤ −ak · k2 per un opportuno a > 0.)
(c) H è indefinita se e solo se 0 è un punto di sella per q.
(d) H è semidefinita positiva se e solo se q ha più di un punto di minimo. In
tal caso, se denotiamo
K = {x : q(x) = 0},
l’insieme K è un sottospazio vettoriale di Rn e, per un’opportuno a > 0,
q(x) ≥ a · dist(x, K)2
∀ x ∈ Rn .
(E analogamente per matrici semidefinite negative.)
Si osservi che l’ultima formula è una generalizzazione della corrispondente
formula in (b) (infatti, nel caso di H definita positiva, K = {0}).