Il Teorema di Jordan
Transcript
Il Teorema di Jordan
Il Teorema di Jordan Antonio Orvieto October 19, 2014 Tutti gli endomorfismi che useremo sono tra spazi vettoriali complessi. Notazione : (f − λ)m = (f − λ)o(f − λ)o... m volte. Definizione 1 (Autovettore generalizzato). v è un autovettore generalizzato relativo all’autovalore λ di un endomorfismo f : V → V se esiste m tale che (f − λ)m (v) = 0. Il minimo m per cui ciò accade è detto periodo di v. S Definizione 2. Vλ := m>0 Ker(f − λ)m Teorema 1. Preso v autovettore generalizzato di periodo m relativo all’autovalore λ, allora v, (f − λ)(v), (f − λ)2 (v), .., (f − λ)m−1 sono linearmente indipendenti Proof. Dobbiamo dimostrare che α1 v +α2 (f −λ)(v)+α3 (f −λ)2 (v)+..+αm−1 (f −λ)m−1 = 0 se e solo se tutti i coefficienti sono 0. Applichiamo a destra e a sinistra (f −λ)m−1 . Allora ottengo α1 (f −λ)m−1 v = 0, che è vero solo se α1 = 0. In modo analogo applicando (f − λ)m−2 dimostro che α2 = 0 e cosı̀ via. È ovvio che Ker(f − λ) ⊆ Ker(f − λ)2 ⊆ Ker(f − λ)3 ⊆ .. ⊆ Ker(f − λ)m ⊆ V . Inoltre come conseguenza del teorema precedente Vλ = Ker(f − λ)dim(V ) (sennò avrei più di dim(V ) vettori linearmente indipendenti in V), non è però detto che dim(V ) sia il primo numero k tale che Ker(f − λ)k = Vλ . Possiamo dire di più : se esiste un autovettore generalizzato v con m > i allora Ker(f − λ)i ⊂ Ker(f − λ)i+1 . Proviamo a dimostrarlo per assurdo : esiste un indice k tale che Ker(f − λ)i = Ker(f − λ)i+1 ⊂ Ker(f − λ)i+2 ; ma allora ∃v ∈ Ker(f − λ)i+2 , ∈ / Ker(f − λ)i+1 . Quindi esiste un vettore (f − λ)(v) ∈ i+1 i Ker(f − λ) ∈ / Ker(f − λ) , che è assurdo essendo i due spazi uguali per ipotesi. Segue che, riassumendo, Ker(f − λ) ⊂ Ker(f − λ)2 ⊂ Ker(f − λ)3 ⊂ .. ⊂ Ker(f − λ)dim(V ) ⊆ V Teorema 2. Siano λ1 , .., λr autovalori di f a due a due distinti. Due qualsiasi autovettori generalizzati relativi a diversi autovalori sono linearmente indipendenti Proof. Per prima cosa è necessario rendersi conto che (f − λi )o(f − λj )(v) = (f − λj )o(f − λi )(v) : infatti basta sviluppare i calcoli e sfruttare la linearità di f . Da questo segue che (f − λi )m o(f − λj )n (v) = (f − λj )n o(f − λi )m (v) Inoltre è importante notare che, presa mi il periodo di vi , (f − λj )o(f − λi )mi −1 (v) = (λi − λj )(v). Presa allora la combinazione lineare di autovettori generalizzati relativi ad autovalori distinti dobbiamo dimostrare che è il vettore nullo se e solo se tutti i coefficienti sono nulli. α1 v1 + α2 v2 + .. + αr vr = 0, applichiamo a destra e a sinistra (f − λ1 )m1 −1 o(f − λ2 )m2 o..o(f − λr )mr . Il risultato è α1 (λ1 − λ2 )m2 o(λ1 − λ3 )m3 o..o(λ1 − λr )mr o(f − λi )mi −1 = 0 se e solo se α1 = 0. Applicando poi (f − λ2 )m2 −1 o(f − λ3 )m3 o..o(f − λr )mr si dimostra α2 = 0 e cosı̀ via. Teorema 3. f : V → V , V con dimensione finita su C, V ha una base di autovettori generalizzati rispetto a f . Proof. Per induzione sulla dimensione di V : Se dim(V ) = 1 allora ogni vettore è un autovettore. Supponiamo che la proposizione sia vera per dim(V ) = n−1, dimostriamo la proposizione per dim(V ) = n : Preso λ, autovalore complesso di f , se Ker(f − λ)n = Vλ = V si conclude, altrimenti consideriamo Wλ = Im(f − λ)n . Si ha Vλ ⊕ Wλ = V (non ci sono dubbi sulla dimensione della somma, ma sul fatto che questa sia diretta) in quanto Vλ ∩ Wλ = 0 : se un vettore v è in Wλ significa che esiste u tale che v = (f − λ)n (u), se v appartenesse a Vλ allora si avrebbe che (f − λ)n (v) = (f − λ)2n (u) = 0. Ma essendo che n è il massimo periodo di un autovalore generalizzato (f − λ)n (u) = v = 0. 1 Ora però dobbiamo dimostrare che è possibile costruire un endomorfismo da Wλ a Wλ . Possiamo tranquillamente prendere lo stesso endomorfismo V → V , in quanto Wλ è stabile rispetto a questo. Infatti f (f − λ)i (v) = (f − λ)i f (v) Per ipotesi induttiva, essendo dim(Wλ ) ≤ n − 1, Wλ ammette una base di autovettori generalizzati. Quindi possiamo unire la base di Wλ e Vλ ottenendo una base di autovettori generalizzati di V Teorema 4. Preso un endomorfismo come quelli precedenti, sia P (x) = (x−λ1 )e1 (x−λ2 )e2 · · · (x−λr )er il polinomio caratteristico, allora. 1. V = Vλ1 ⊕ Vλ2 ⊕ · · · ⊕ Vλr 2. Vλi è stabile ∀i 3. Vλ1 = Ker(f − λi )ei Proof. Dimostriamo un punto alla volta 1. Dal teorema precedente ogni spazio vettoriale ha una base di autovettori generalizzati, e per il Teorema 2 questi si organizzano in dei Vλ che sono in somma diretta. 2. se (f − λ)n (v) = 0 allora 0 = f (f − λ)n (v) = (f − λ)n (f (v)) 3. Restringiamo l’endomorfismo a Vλ l’unico autovalore sarà λ (Per il Teorema 2 sennò i Vλ si mischierebbero). Dato che V = Vλ1 ⊕ Vλ2 ⊕ · · · ⊕ Vλr e che Vλi è stabile ∀i, sappiamo (determinante matrice a blocchi) che il polinomio caratteristico dell’endomorfismo è il prodotto di tutti i polinomi caratteristici degli endomorfismi ristretti ai rispettivi Vλ . Ma allora la dimensione di ogni Vλ è per forza la molteplicità algebrica dell’autovalore λ, Pertanto Vλ1 = Ker(f − λi )ei (per il Teorema 1). Nonostante abbiamo dimostrato che Vλ1 = Ker(f − λi )ei non è detto che ei sia il minimo numero intero k tale che Vλ1 = Ker(f − λi )k ; chiamiamo questo numero, per ogni i, mi . Definizione 3 (Polinomio Minimo). Q(x) = (x − λ1 )m1 (x − λ2 )m2 · · · (x − λr )mr È ovvio che un endomorfismo è diagonalizzabile se e solo se tutti gli mi sono pari ad 1 : infatti se Vλ , che ha dimensione ei , non coincide con Ker(f − λ), allora significa che mg(λ) < ma(λ). Teorema 5 (Hamilton-Cayley). Q(x) è il polinomio monico di grado minimo che si annulla su f : ovvero Q(f ) è l’endomorfismo nullo. Proof. Deriva direttamente dal fatto che esiste una base di autovettori generalizzati Teorema 6 (Jordan). Sia f : V → V un endomorfismo di V, spazio vettoriale complesso. Allora esiste 0 ··· 0 una base per cui la matrice di f ha sulla diagonale delle sottomatrici diverse da ... . . . ... e zero 0 altrove. Inoltre ogni blocco sulla diagonale è caratterizzato da un autovalore (anche se λi 1 0 0 λi 1 più blocchi caratterizzati dallo stesso autovalore) e la sua forma è del tipo 0 0 λi 0 0 0 Jordan) ··· 0 possono esistere 0 0 ∀i (blocco di 1 λ Proof. La prima parte del teorema deriva direttamente dal Teorema 4 : essendo i vari Vλ stabili e con intersezione nulla, la forma della matrice è quella con delle sottomatrici quadrate non nulle sulla diagonale e blocchi nulli altrove. Interessante è la parte sulla forma delle sottomatrici. Sia Vλ = Ker(f − λ)m , dove m è preso minimo. Ovviamente Ker(f − λ)m = Ker(f − λ)m−1 ⊕ < v1 , .., vs >, dove v1 , .., vs sono autovettori generalizzati di periodo m. Vogliamo dimostrare che i seguenti vettori sono linearmente indipendenti v1 , (f − λ)(v1 ), .., (f − λ)m−1 (v1 ), v2 , (f − λ)(v2 ), .., (f − λ)m−1 (v2 ), .., vs , (f − λ)(vs ), .., (f − λ)m−1 (vs ). 2 Prendiamo allora una combinazione lineare e la posiamo a 0, vediamo come devono essere i coefficienti : (0) (1) (m−1) (0) (1) (m−1) α1 v1 +α1 (f −λ)(v1 )+..+α1 (f −λ)m−1 (v1 )+α2 v2 +α2 (f −λ)(v2 )+..+α2 (f −λ)m−1 (v2 )+ (0) (1) (m−1) .. + αs vs + αs (f − λ)(vs ) + .. + αs (f − λ)m−1 (vs ) = 0 i Portando i termini con un (f − λ) a destra e applicando a entrambi i membri (f − λ)m−1 , ottengo (0) (0) (0) α1 (f − λ)m−1 v1 + α2 (f − λ)m−1 v2 + ... + αs (f − λ)m−1 vs = 0 (0) (0) (0) Quindi α1 v1 + α2 v2 + .. + αs vs ∈ Ker(f − λ)m−1 . Che per ipotesi è vero solo se tutti i coefficienti di grado (0) sono nulli. Si procede in modo analogo per dimostrare che tutti gli altri coefficienti sono nulli. Essendo che dim(Ker(f −λ)m )−dim(Ker(f −λ)m−1 ) = s, allora per quanto abbiamo appena dimostrato dim(Ker(f − λ)i ) − dim(Ker(f − λ)i−1 ) ≥ s (al minimo è s in quanto tra precendente serie di vettori linearmente indipendenti ce ne sono s che appartengono a dim(Ker(f −λ)i ) ma non a dim(Ker(f −λ)i−1 )). Prendiamo allora il caso più semplice : dim(Ker(f − λ)i ) − dim(Ker(f − λ)i−1 ) = s, ∀i. Allora Vλ ha dimensione m · s e una sua base di autovettori generalizzati è v1 , (f − λ)(v1 ), .., (f − λ)m−1 (v1 ), v2 , (f −λ)(v2 ), .., (f −λ)m−1 (v2 ), .., vs , (f −λ)(vs ), .., (f −λ)m−1 (vs ).. Se restringiamo l’endomorfismo allo spazio < v1 , (f − λ)(v1 ), .., (f − λ)m−1 (v1 ) >, ad esempio, otteniamo un blocco di Jordan. Questo perchè (f − λ)(f − λ)m−j (v) = (f − λ)m−j+1 (v) quindi ∀j f ((f − λ)m−j (v)) = λ(f − λ)m−j (v) + (f − λ)m−j+1 (v). Quindi in questo caso avremo, per ogni Vλ , s blocchi di Jordan (s varia con l’autovalore). Prendiamo ora il caso in cui ∃j, dim(Ker(f − λ)j ) − dim(Ker(f − λ)j−1 ) > s, prendiamo allora questo j, se ne esistono più di uno prendiamo il più alto possibile. Ker(f − λ)j = Ker(f − λ)j−1 ⊕ < (f − λ)m−j (v1 ), .., (f − λ)m−j (vs ) > ⊕ < w1 , .., wt−s >. Ragionando come abbiamo fatto in precedenza troviamo questa serie di vettori linearmente indipendenti w1 , (f − λ)(w1 ), .., (f − λ)j−1 (w1 ), w2 , (f − λ)(w2 ), .., (f − λ)j−1 (w2 ), .., wt−s , (f − λ)(wt−s ), .., (f − λ)j−1 (wt−s ). A questi vettori corrispondono t − s blocchi di Jordan di ordine j. Continuando poi se ∃h, dim(Ker(f − λ)h ) − dim(Ker(f − λ)h−1 ) > t prendiamo h il più alto possibile, e procediamo come sopra 3