Il Teorema di Jordan

Transcript

Il Teorema di Jordan
Il Teorema di Jordan
Antonio Orvieto
October 19, 2014
Tutti gli endomorfismi che useremo sono tra spazi vettoriali complessi.
Notazione : (f − λ)m = (f − λ)o(f − λ)o... m volte.
Definizione 1 (Autovettore generalizzato). v è un autovettore generalizzato relativo all’autovalore λ di
un endomorfismo f : V → V se esiste m tale che (f − λ)m (v) = 0. Il minimo m per cui ciò accade è
detto periodo di v.
S
Definizione 2. Vλ := m>0 Ker(f − λ)m
Teorema 1. Preso v autovettore generalizzato di periodo m relativo all’autovalore λ, allora v, (f −
λ)(v), (f − λ)2 (v), .., (f − λ)m−1 sono linearmente indipendenti
Proof. Dobbiamo dimostrare che α1 v +α2 (f −λ)(v)+α3 (f −λ)2 (v)+..+αm−1 (f −λ)m−1 = 0 se e solo se
tutti i coefficienti sono 0. Applichiamo a destra e a sinistra (f −λ)m−1 . Allora ottengo α1 (f −λ)m−1 v = 0,
che è vero solo se α1 = 0. In modo analogo applicando (f − λ)m−2 dimostro che α2 = 0 e cosı̀ via.
È ovvio che Ker(f − λ) ⊆ Ker(f − λ)2 ⊆ Ker(f − λ)3 ⊆ .. ⊆ Ker(f − λ)m ⊆ V . Inoltre come conseguenza del teorema precedente Vλ = Ker(f − λ)dim(V ) (sennò avrei più di dim(V ) vettori linearmente
indipendenti in V), non è però detto che dim(V ) sia il primo numero k tale che Ker(f − λ)k = Vλ . Possiamo dire di più : se esiste un autovettore generalizzato v con m > i allora Ker(f − λ)i ⊂ Ker(f − λ)i+1 .
Proviamo a dimostrarlo per assurdo : esiste un indice k tale che Ker(f − λ)i = Ker(f − λ)i+1 ⊂
Ker(f − λ)i+2 ; ma allora ∃v ∈ Ker(f − λ)i+2 , ∈
/ Ker(f − λ)i+1 . Quindi esiste un vettore (f − λ)(v) ∈
i+1
i
Ker(f − λ)
∈
/ Ker(f − λ) , che è assurdo essendo i due spazi uguali per ipotesi.
Segue che, riassumendo, Ker(f − λ) ⊂ Ker(f − λ)2 ⊂ Ker(f − λ)3 ⊂ .. ⊂ Ker(f − λ)dim(V ) ⊆ V
Teorema 2. Siano λ1 , .., λr autovalori di f a due a due distinti. Due qualsiasi autovettori generalizzati
relativi a diversi autovalori sono linearmente indipendenti
Proof. Per prima cosa è necessario rendersi conto che (f − λi )o(f − λj )(v) = (f − λj )o(f − λi )(v) : infatti
basta sviluppare i calcoli e sfruttare la linearità di f . Da questo segue che (f − λi )m o(f − λj )n (v) =
(f − λj )n o(f − λi )m (v)
Inoltre è importante notare che, presa mi il periodo di vi , (f − λj )o(f − λi )mi −1 (v) = (λi − λj )(v).
Presa allora la combinazione lineare di autovettori generalizzati relativi ad autovalori distinti dobbiamo
dimostrare che è il vettore nullo se e solo se tutti i coefficienti sono nulli. α1 v1 + α2 v2 + .. + αr vr = 0,
applichiamo a destra e a sinistra (f − λ1 )m1 −1 o(f − λ2 )m2 o..o(f − λr )mr .
Il risultato è α1 (λ1 − λ2 )m2 o(λ1 − λ3 )m3 o..o(λ1 − λr )mr o(f − λi )mi −1 = 0 se e solo se α1 = 0. Applicando
poi (f − λ2 )m2 −1 o(f − λ3 )m3 o..o(f − λr )mr si dimostra α2 = 0 e cosı̀ via.
Teorema 3. f : V → V , V con dimensione finita su C, V ha una base di autovettori generalizzati
rispetto a f .
Proof. Per induzione sulla dimensione di V :
Se dim(V ) = 1 allora ogni vettore è un autovettore.
Supponiamo che la proposizione sia vera per dim(V ) = n−1, dimostriamo la proposizione per dim(V ) = n
: Preso λ, autovalore complesso di f , se Ker(f − λ)n = Vλ = V si conclude, altrimenti consideriamo
Wλ = Im(f − λ)n . Si ha Vλ ⊕ Wλ = V (non ci sono dubbi sulla dimensione della somma, ma sul fatto
che questa sia diretta) in quanto Vλ ∩ Wλ = 0 : se un vettore v è in Wλ significa che esiste u tale che
v = (f − λ)n (u), se v appartenesse a Vλ allora si avrebbe che (f − λ)n (v) = (f − λ)2n (u) = 0. Ma essendo
che n è il massimo periodo di un autovalore generalizzato (f − λ)n (u) = v = 0.
1
Ora però dobbiamo dimostrare che è possibile costruire un endomorfismo da Wλ a Wλ . Possiamo tranquillamente prendere lo stesso endomorfismo V → V , in quanto Wλ è stabile rispetto a questo. Infatti
f (f − λ)i (v) = (f − λ)i f (v)
Per ipotesi induttiva, essendo dim(Wλ ) ≤ n − 1, Wλ ammette una base di autovettori generalizzati.
Quindi possiamo unire la base di Wλ e Vλ ottenendo una base di autovettori generalizzati di V
Teorema 4. Preso un endomorfismo come quelli precedenti, sia P (x) = (x−λ1 )e1 (x−λ2 )e2 · · · (x−λr )er
il polinomio caratteristico, allora.
1. V = Vλ1 ⊕ Vλ2 ⊕ · · · ⊕ Vλr
2. Vλi è stabile ∀i
3. Vλ1 = Ker(f − λi )ei
Proof. Dimostriamo un punto alla volta
1. Dal teorema precedente ogni spazio vettoriale ha una base di autovettori generalizzati, e per il
Teorema 2 questi si organizzano in dei Vλ che sono in somma diretta.
2. se (f − λ)n (v) = 0 allora 0 = f (f − λ)n (v) = (f − λ)n (f (v))
3. Restringiamo l’endomorfismo a Vλ l’unico autovalore sarà λ (Per il Teorema 2 sennò i Vλ si mischierebbero). Dato che V = Vλ1 ⊕ Vλ2 ⊕ · · · ⊕ Vλr e che Vλi è stabile ∀i, sappiamo (determinante
matrice a blocchi) che il polinomio caratteristico dell’endomorfismo è il prodotto di tutti i polinomi
caratteristici degli endomorfismi ristretti ai rispettivi Vλ . Ma allora la dimensione di ogni Vλ è per
forza la molteplicità algebrica dell’autovalore λ, Pertanto Vλ1 = Ker(f − λi )ei (per il Teorema 1).
Nonostante abbiamo dimostrato che Vλ1 = Ker(f − λi )ei non è detto che ei sia il minimo numero
intero k tale che Vλ1 = Ker(f − λi )k ; chiamiamo questo numero, per ogni i, mi .
Definizione 3 (Polinomio Minimo). Q(x) = (x − λ1 )m1 (x − λ2 )m2 · · · (x − λr )mr
È ovvio che un endomorfismo è diagonalizzabile se e solo se tutti gli mi sono pari ad 1 : infatti se Vλ ,
che ha dimensione ei , non coincide con Ker(f − λ), allora significa che mg(λ) < ma(λ).
Teorema 5 (Hamilton-Cayley). Q(x) è il polinomio monico di grado minimo che si annulla su f : ovvero
Q(f ) è l’endomorfismo nullo.
Proof. Deriva direttamente dal fatto che esiste una base di autovettori generalizzati
Teorema 6 (Jordan). Sia f : V → V un endomorfismo di V, spazio vettoriale complesso.
Allora

 esiste
0 ··· 0


una base per cui la matrice di f ha sulla diagonale delle sottomatrici diverse da  ... . . . ...  e zero
0
altrove. Inoltre ogni blocco sulla diagonale è caratterizzato da un autovalore
(anche
se

λi 1 0
 0 λi 1
più blocchi caratterizzati dallo stesso autovalore) e la sua forma è del tipo 
 0 0 λi
0 0 0
Jordan)
··· 0
possono
esistere

0
0
 ∀i (blocco di
1
λ
Proof. La prima parte del teorema deriva direttamente dal Teorema 4 : essendo i vari Vλ stabili e con
intersezione nulla, la forma della matrice è quella con delle sottomatrici quadrate non nulle sulla diagonale
e blocchi nulli altrove.
Interessante è la parte sulla forma delle sottomatrici. Sia Vλ = Ker(f − λ)m , dove m è preso minimo.
Ovviamente Ker(f − λ)m = Ker(f − λ)m−1 ⊕ < v1 , .., vs >, dove v1 , .., vs sono autovettori generalizzati
di periodo m. Vogliamo dimostrare che i seguenti vettori sono linearmente indipendenti
v1 , (f − λ)(v1 ), .., (f − λ)m−1 (v1 ), v2 , (f − λ)(v2 ), .., (f − λ)m−1 (v2 ), .., vs , (f − λ)(vs ), .., (f − λ)m−1 (vs ).
2
Prendiamo allora una combinazione lineare e la posiamo a 0, vediamo come devono essere i coefficienti :
(0)
(1)
(m−1)
(0)
(1)
(m−1)
α1 v1 +α1 (f −λ)(v1 )+..+α1
(f −λ)m−1 (v1 )+α2 v2 +α2 (f −λ)(v2 )+..+α2
(f −λ)m−1 (v2 )+
(0)
(1)
(m−1)
.. + αs vs + αs (f − λ)(vs ) + .. + αs
(f − λ)m−1 (vs ) = 0
i
Portando i termini con un (f − λ) a destra e applicando a entrambi i membri (f − λ)m−1 , ottengo
(0)
(0)
(0)
α1 (f − λ)m−1 v1 + α2 (f − λ)m−1 v2 + ... + αs (f − λ)m−1 vs = 0
(0)
(0)
(0)
Quindi α1 v1 + α2 v2 + .. + αs vs ∈ Ker(f − λ)m−1 . Che per ipotesi è vero solo se tutti i coefficienti
di grado (0) sono nulli. Si procede in modo analogo per dimostrare che tutti gli altri coefficienti sono nulli.
Essendo che dim(Ker(f −λ)m )−dim(Ker(f −λ)m−1 ) = s, allora per quanto abbiamo appena dimostrato
dim(Ker(f − λ)i ) − dim(Ker(f − λ)i−1 ) ≥ s (al minimo è s in quanto tra precendente serie di vettori linearmente indipendenti ce ne sono s che appartengono a dim(Ker(f −λ)i ) ma non a dim(Ker(f −λ)i−1 )).
Prendiamo allora il caso più semplice : dim(Ker(f − λ)i ) − dim(Ker(f − λ)i−1 ) = s, ∀i.
Allora Vλ ha dimensione m · s e una sua base di autovettori generalizzati è v1 , (f − λ)(v1 ), .., (f −
λ)m−1 (v1 ), v2 , (f −λ)(v2 ), .., (f −λ)m−1 (v2 ), .., vs , (f −λ)(vs ), .., (f −λ)m−1 (vs ).. Se restringiamo l’endomorfismo
allo spazio < v1 , (f − λ)(v1 ), .., (f − λ)m−1 (v1 ) >, ad esempio, otteniamo un blocco di Jordan.
Questo perchè (f − λ)(f − λ)m−j (v) = (f − λ)m−j+1 (v) quindi ∀j f ((f − λ)m−j (v)) = λ(f − λ)m−j (v) +
(f − λ)m−j+1 (v).
Quindi in questo caso avremo, per ogni Vλ , s blocchi di Jordan (s varia con l’autovalore).
Prendiamo ora il caso in cui ∃j, dim(Ker(f − λ)j ) − dim(Ker(f − λ)j−1 ) > s, prendiamo allora
questo j, se ne esistono più di uno prendiamo il più alto possibile. Ker(f − λ)j = Ker(f − λ)j−1 ⊕ <
(f − λ)m−j (v1 ), .., (f − λ)m−j (vs ) > ⊕ < w1 , .., wt−s >.
Ragionando come abbiamo fatto in precedenza troviamo questa serie di vettori linearmente indipendenti w1 , (f − λ)(w1 ), .., (f − λ)j−1 (w1 ), w2 , (f − λ)(w2 ), .., (f − λ)j−1 (w2 ), .., wt−s , (f − λ)(wt−s ), .., (f −
λ)j−1 (wt−s ). A questi vettori corrispondono t − s blocchi di Jordan di ordine j.
Continuando poi se ∃h, dim(Ker(f − λ)h ) − dim(Ker(f − λ)h−1 ) > t prendiamo h il più alto possibile,
e procediamo come sopra
3