Metodi perturbativi. II. - Dipartimento di Matematica

Transcript

Metodi perturbativi. II. - Dipartimento di Matematica
Capitolo 8
Metodi perturbativi. II.
Questo capitolo è dedicato allo studio di un metodo perturbativo molto generale
dalle molteplici applicazioni: il metodo della media. Esso risale a Lagrange ed
è legato alla tecnica di variazione delle costanti. Lo presenteremo seguendo lo
schema ternario già usato per altri metodi al Capitolo 6 iniziando da una illustrazione informale del metodo per passare alla sua giustificazione e giungere a
qualche applicazione. In questo caso, concentrandoci su sistemi in cui i parametri subiscono una variazione lenta nel tempo, giungeremo naturalmente alla
definizione di invariante adiabatico. Osservato che per un oscillatore armonico
con frequenza naturale lentamente variabile l’azione è un invariante adiabatico,
per mostrare il risultato in generale è doveroso riferirsi alla teoria canonica delle
perturbazioni che studia sistemi hamiltoniani in cui la funzione hamiltoniana è
composta da due addendi: il primo corrisponde ad un sistema completamente
canonicamente integrabile per il quale esiste una formulazione in termini di variabili azione-angolo; il secondo addendo rappresenta un disturbo ed in genere
è piccolo rispetto al primo, in un senso da chiarire. Mentre, per definizione, la
hamiltoniana integrabile è esprimibile solo in termini delle variabili di azione,
le variabili angolari figurano nella funzione di disturbo e l’obiettivo della teoria
canonica delle perturbazioni è quello di trovare una famiglia di trasformazioni
completamente canoniche scritte come sviluppo in serie di un piccolo parametro
caratteristico del problema e tali da rendere sempre meno rilevante la dipendenza dalle variabili angolari. Per sistemi ad un grado di libertà il processo
ha successo e la matematica impiegata in questo contesto è la stessa che serve
per dimostrare che, in generale, l’azione è un invariante adiabatico. Mostrato
questo teorema, affronteremo lo studio della teoria canonica delle perturbazioni
per sistemi a più gradi di libertà e ci renderemo conto delle grandi difficoltà
che si presentano nel tentativo di raggiungere l’obiettivo della teoria, difficooltà
che culmineranno in alcuni risultati negativi, dovuti a Poincaré. Si presenta
in particolare il problema di sviluppi in serie divergenti che possono apparire
completamente inutili ma che invece possono essere usati con profitto per approssimare funzioni, come illustreremo nel caso della serie di Stieltjes, esempio
importante di serie asintotica.
141
142
8.1
CAPITOLO 8. METODI PERTURBATIVI. II.
Il metodo della media: introduzione
Illustriamo il metodo su un problema incontrato più volte, quello della perturbazione di un oscillatore armonico
ẍ + x = εf (x, ẋ) .
(8.1)
Per trovarne una soluzione, Lagrange osservò che per ε = 0 (8.1) ammette
soluzione
x(t) = r0 cos(ψ0 + t)
(8.2)
dove l’ampiezza r0 e la fase ψ0 sono costanti. Nel caso ε 6= 0, Lagrange ipotizzò
per la soluzione di (8.1) la struttura
x(t) = r(t) cos(ψ(t) + t)
(8.3)
dove ora r e ψ sono funzioni incognite del tempo. Egli inoltre richiese che la
derivata temporale di (8.3) avesse struttura analoga a quella di (8.2), cioè
ẋ(t) = −r(t) sin(ψ(t) + t)
(8.4)
che pertanto richiede di sodisfare l’equazione
ṙ cos(ψ(t) + t) − rψ̇ sin(ψ(t) + t) = 0 .
(8.5)
Derivando (8.4) rispetto al tempo e servendosi di (8.3) e (8.1), la seconda
condizione da imporre alle incognite r(t) e ψ(t) è
ṙ sin(ψ(t) + t) + rψ̇ cos(ψ(t) + t) = −εf (r cos(ψ(t) + t), −r sin(ψ(t) + t)) . (8.6)
A questo punto, con manipolazioni algebriche simili a quelle già incontrate nel
Cap. 6 possiamo ricavare dalle (8.5) e (8.6) le equazioni per r(t) e ψ(t):

 ṙ = −ε sin(ψ(t) + t)f (r cos(ψ(t) + t), −r sin(ψ(t) + t))
(8.7)

ψ̇ = rε cos(ψ(t) + t)f (r cos(ψ(t) + t), −r sin(ψ(t) + t)) :
è implicito nella scrittura del sistema (8.7) che questo approccio vale quando si
può garantire che r 6= 0. Il sistema (8.7) è poi accompagnato dalle condizioni
iniziali
r(0) cos ψ(0) = x(0)
− r(0) sin ψ(0) = ẋ(0).
Lagrange a questo punto fece due osservazioni cruciali: anzitutto, i membri di
destra delle equazioni (8.7) si possono sviluppare, almeno formalmente come
serie trigonometriche del tipo
ε[g0 (r, ψ)+g1 (r, ψ) sin t+h1 (r, ψ) cos t+....+gn (r, ψ) sin nt+hn (r, ψ) cos nt+...]
per un insieme di opportune funzioni g0 , gi ed hi che dipendono dalle incognite r
e ψ. La seconda osservazione è che l’evoluzione delle variabili r e ψ descritta dalle
8.1. IL METODO DELLA MEDIA: INTRODUZIONE
143
(8.7) le qualifica come variabili lente in quanto le loro derivate temporali sono di
ordine ε 1: si assume tacitamente che non ci siano problemi di convergenza
negli sviluppi in serie trigonometriche appena descritti. In questo modo, in
un intervallo temporale di ampiezza 2π possiamo trascurare le variazioni di r
e ψ quando le incontriamo nei membri di destra delle (8.7) e trattarle come
delle costanti. A questo punto Lagrange sostituisce il sistema (8.7) con un altro
sistema in cui le funzioni a destra sono rimpiazzate con le loro medie integrali
nell’intervallo [0, 2π], calcolate trattando r e ψ come costanti. Poiché tutte le
funzioni trigonometriche sin nt e cos nt hanno media nulla in [0, 2π], il sistema
che sostituisce (8.7) è

 ṙa = εg0 (ra , ψa )
(8.8)

ra ψ̇a = εg 0 (ra , ψa )
soggetto alle stesse condizioni iniziali di (8.7).
Esempio. Si consideri l’equazione non lineare
ẍ + x = ε(x2 − ẋ) .
Il sistema (8.7) in questo caso diventa

 ṙ = −ε sin(t + ψ)[r2 cos2 (t + ψ) + r sin(t + ψ)]

ψ̇ = −ε cos(t + ψ)[r cos2 (t + ψ) + sin(t + ψ)]
dove abbiamo omesso, per brevità l’argomento t in r e ψ. Trattando r e ψ come
costanti abbiamo
Z 2π
1
1
sin2 (t + ψ)dt =
2π 0
2
mentre
Z 2π
Z 2π
Z 2π
1
1
1
sin(t+ψ) cos(t+ψ)dt =
cos3 (t+ψ)dt =
sin(t+ψ) cos2 (t+ψ)dt = 0
2π 0
2π 0
2π 0
per cui il sistema da studiare nelle variabili mediate ra e ψa è

r
 ṙa = −ε 2a
che ammette soluzione

ψ̇a = 0
1
ra (t) = r(0)e− 2 εt
ψa (t) = ψ(0) .
L’affermazione da giustificare è che le soluzioni di (8.8) approssimano quelle di
(8.7), a parità di condizioni iniziali. Questa affermazione, data per valida da
Lagrange, fu mostrata agli inizi degli anni ‘20 del XX secolo ad opera di un
gruppo di matematici della scuola di Kiev: Krylov, Bogoljubov e Mitropolski.
Alla giustificazione del metodo della media dedicheremo la prossima sezione.
144
8.2
CAPITOLO 8. METODI PERTURBATIVI. II.
Giustificazione del metodo della media
Per giustificare il metodo della media osserviamo che è stato cruciale scrivere
l’equazione di partenza (8.1) come sistema (8.7) in cui le incognite sono variabili
lente, nel senso discusso sopra. Consideriamo allora un sistema di equazioni
differenziali in Rn da studiare per t ≥ 0 del tipo

 ẋ = A(t)x + εg(t, x)
(8.9)

x(0) = x0 ,
in cui la matrice n × n è una funzione continua del tempo e g è una funzione
regolare dei suoi argomenti. Quando ε = 0 il sistema (8.9) è lineare ed indichiamo con Φ(t) una matrice fondamentale, ad esempio quella che sodisfa Φ(0) = I
e definiamo una nuova variabile y tramite
x = Φ(t)y .
Nella nuova variabile, il sistema (8.9) diventa
Φ̇y + Φẏ = AΦy + εg(t, Φy)
e dal momento che Φ̇ = AΦ possiamo porre (8.9) nella forma standard di
Lagrange
ẏ = εΦ−1 g(t, Φy)
(8.10)
che sistematizza la forma (8.7) illustrata nella sezione precedente dal momento
che individua in y il vettore di variabili lente cui applicare il processo di media.
Con questa precisazione, abbiamo tutto quello che ci occorre per giustificare
il metodo della media e chiarirne la portata.
Teorema 8.1 Sia dato il problema
ẋ = εf (t, x) + ε2 g(t, x, ε)
x(0) = x0
(8.11)
dove f (t, x) è periodica in t con periodo T . Definita la funzione
f 0 (y) :=
1
T
Z
T
f (t, y)dt
(8.12)
0
dove l’argomento y è trattato come una costante nel processo di integrazione, si
consideri il problema
ẏ = εf 0 (y)
y(0) = x0 .
(8.13)
Se x0 , x ed y appartengono ad un insieme D ∈ Rn per tutti i t ≥ 0 e se
∂f
sono continue e limitate su [0, +∞) × D da una
1. le funzioni f , g e ∂x
costante M indipendente da ε;
2. la funzione g è lipschitziana in x ∈ D;
8.2. GIUSTIFICAZIONE DEL METODO DELLA MEDIA
145
3. la funzione f (t, x) è periodica in t con periodo T indipendente da ε ed ha
media f 0 (x) indipendente da ε;
4. y(t) è nell’interno di D per tutti i t ≥ 0,
allora le soluzioni x(t) ed y(t) dei problemi (8.11) e (8.13), rispettivamente,
sono tali che
x(t) − y(t) = O(ε)
su scala temporale 1/ε.
Dim. Le ipotesi 1 e 2 garantiscono esistenza ed unicità della soluzione per (8.11)
e (8.13) su scala temporale 1/ε. Definiamo la funzione
u(t, x) :=
Z
t
[f (s, x) − f 0 (x)]ds
(8.14)
0
ed osserviamo che, essendo f periodica in t, per definizione di f 0 (x) abbiamo
che
u(nT, x) = 0
∀n ∈ N
e dunque, per stimare u è sufficiente prendere t ∈ [0, T ]. Per l’ipotesi 1 si ha
allora
||u(t, x)|| ≤ 2M T
x ∈ D, t ≥ 0 .
(8.15)
Introduciamo ora la trasformazione prossima all’identità
x(t) = z(t) + εu(t, z(t))
(8.16)
ed osserviamo che (8.11) si trasforma in
ẋ = ż + ε
∂u(t, z(t)
∂u(t, z(t))
= f (t, z + εu(t, z)) + ε2 g(t, z + εu(t, z), ε) .
ż + ε
∂z
∂t
Per la definizione di u e le proprietà di f , la funzione matriciale ∂u(t,z(t)
è
∂z
uniformemente limitata in [0, +∞) × D e dunque, riscritta l’ultima equazione
ottenuta nella forma più compatta
∂u(t, z)
ż = εf 0 (z) + R(t, z)
(8.17)
I+ε
∂z
con
R(t, z) := ε[f (t, z + εu(t, z)) − f (t, z)] + ε2 g(t, z + εu(t, z), ε) ,
(8.18)
possiamo invertire la matrice applicata su ż:
−1
∂u(t, z)
∂u(t, z)
I+ε
+ O(ε2 )
=I−ε
∂z
∂z
(8.19)
146
CAPITOLO 8. METODI PERTURBATIVI. II.
per z ∈ D e t ≥ 0. Grazie all’ipotesi 1 e alla stima (8.15) vale anche la stima
||f (t, z + εu(t, z + εu(t, z)) − f (t, z)|| ≤ εL||u(t, z)|| ≤ 2M LT ε
(8.20)
e dunque, dalla (8.19),
ż = εf 0 (z) + R(t, z) − ε2
∂u 0
f (z) + O(ε3 )
∂z
(8.21)
con condizione iniziale z(0) = x(0). Inoltre, essendo g limitata possiamo
concludere che esiste una costante C, indipendente da ε e tale che
||R(t, z)|| ≤ Cε2
z ∈ D,
t ≥ 0.
Introdotto il tempo riscalato τ := εt possiamo scrivere (8.21) come
 dz
 dτ = f 0 (z) + R0 (τ, z)

(8.22)
z(0) = x(0)
dove R0 (t, z) = O(ε) su [0, +∞)×D. Per il Teorema 6.1 abbiamo che la soluzione
di (8.13) approssima quella di (8.22) nel senso che
z(τ ) − y(τ ) = O(ε)
su scala temporale 1 nel tempo riscalato τ e dunque su scala temporale 1/ε per
il tempo t. Poiché x e z sono legate da una trasformazione vicina all’identità,
vale la stima
x(τ ) − y(τ ) = O(ε)
su scala temporale 1/ε per t e ciò conclude la dimostrazione del teorema.
Osservazione. Ferme restando le ipotesi 1, 2 e 4, il teorema vale anche quando
f ammette lo sviluppo
N
X
fi (t, x)
f (t, x) =
i=1
dove fi (t, x) = fi (t + Ti , x). La soluzione del problema

RT
PN
 ẏ = ε i=1 T1i 0 i fi (t, y)dt

(8.23)
y(0) = x(0)
è tale che x(t) − y(t) = O(ε) su scala temporale 1/ε, dove x(t) risolve (8.11).
Una ulteriore generalizzazione si ha quando, sempre sotto le ipotesi 1-2 e 4
del Teorema 8.1, esiste
f 0 (x) := lim
T →+∞
Z
0
T
f (t, x)dt .
147
8.3. INVARIANTI ADIABATICI
In questo caso la soluzione di

 ẏ = εf 0 (y)

(8.24)
y(0) = x(0)
e la soluzione x(t) di (8.11) sodisfano
x(t) − y(t) = O(δ(ε))
su scala temporale 1/ε, dove
Z t
[f (s, x) − f 0 (x)]ds .
x∈D 0≤εt≤C
δ(ε) := sup sup
0
Si possono costruire esempi (cfr. §11.4 di [1]) in cui la stima O(δ(ε)) è
peggiore rispetto a quella O(ε) ottenuta nelle versioni precedenti.
Esempio. Consideriamo l’equazione di van der Pol
ẍ + x = ε(1 − x2 )ẋ
che portiamo nella forma (8.7)

ṙ = εr sin2 (t + ψ)[1 − r2 cos2 (t + ψ)]


ψ̇ = ε sin(t + ψ) cos(t + ψ)[1 − r2 cos2 (t + ψ)]
che, dopo il processo di media, diventano

r

 ṙa = ε 2a 1 −


2
ra
4
ψ̇a = 0
da cui si ottiene la soluzione approssimata
1
ra (t) = r(0) h
8.3
e 2 εt
1+
r 2 (0) εt
4 (e
i1/2
− 1)
ψa (t) = ψ(0) .
Invarianti adiabatici
Come applicazione non convenzionale del metodo della media consideriamo l’equazione di un oscillatore armonico la cui frequenza naturale ω non è costante
ma varia lentamente nel tempo, precisamente
ẍ + ω 2 (εt)x = 0 .
(8.25)
148
CAPITOLO 8. METODI PERTURBATIVI. II.
L’applicazione del metodo della media che ci condurrà a definire gli invarianti
adiabatici è piuttosto articolata e passa per trasformazioni ad hoc cioè specifiche
del tipo di equazione in esame. In questo caso introduciamo la variabile y legata
alla x da
ẋ = ω(εt)y
(8.26)
e poniamo
x = r sin ϕ
cosicché
y = r cos ϕ
(8.27)

 ẋ = ṙ sin ϕ + rϕ̇ cos ϕ = ω(εt)r cos ϕ

(8.28)
ẏ = ṙ cos ϕ − rϕ̇ sin ϕ
dove l’ultima uguaglianza nella (8.28)1 si ottiene combinando (8.26) e (8.27).
Possiamo modificare l’equazione per ẏ osservando che, grazie a (8.25) e a (8.26)
−ω 2 (εt)x = ẍ = ω(εt)ẏ + εω 0 (εt)y
dove un apice indica la derivazione rispetto all’argomento εt della funzione ω.
Risolvendo rispetto ad ẏ e sostituendo in (8.28)2 abbiamo
ẏ = ṙ cos ϕ − rϕ̇ sin ϕ = −ω(εt)r sin ϕ − εr
ω0
cos ϕ :
ω
da (8.28)1 e (8.29), assumendo ω 6= 0 e definendo τ := εt segue che

0
ṙ = −εr ωω cos2 ϕ



0

ϕ̇ = ω + ε ωω sin ϕ cos ϕ


τ̇ = ε
(8.29)
(8.30)
che non è ancora nella forma standard di Lagrange per la presenza del termine ω
nella seconda equazione. Per procedere, conviene fare delle ipotesi sulla funzione
ω: assumeremo che esistano tre costanti positive a, b e c tali che
dω <c
a < ω(τ ) < b
(8.31)
dτ per tutti i valori di τ . Grazie a queste ipotesi possiamo affermare che la variabile
ϕ è di tipo temporale, nel senso che ϕ̇ > 0. Possiamo allora riscrivere il sistema
(8.30) nella forma

2
1 0
dr
ω ω r cos ϕ

 dϕ = −ε ω+ε ω1 ω0 sin ϕ cos ϕ
(8.32)

 dτ = ε
1
dϕ
ω+ε 1 ω 0 sin ϕ cos ϕ
ω
che consente l’applicazione del Teorema 8.1 ottenendo come sistema mediato

dω(τa )
ra
dr

 dϕa = −ε 2ω2 (τ
dτa
a)
(8.33)

 dτa = ε 1 :
dϕ
ω(τa )
8.4. TEORIA CANONICA DELLE PERTURBAZIONI. I.
poiché
dτa
dϕ
149
> 0, da (8.33) ricaviamo
dra
ra dω
=−
dτa
2ω(τa ) dτa
da cui segue che
1
ω 2 (τa )ra = C
cioè
ω(τa )ra2 = C 2
con C costante. A questo integrale primo del sistema mediato corrisponde, in
virtù del Teorema 8.1, la relazione
ω(εt)x2 +
1
ẋ2 = C 2 + O(ε)
ω(εt)
su scala temporale 1/ε. In altre parole, la quantità
[ω 2 (εt)x2 + ẋ2 ]/ω(εt)
(8.34)
si mantiene costante a meno di correzioni di ordine 1 in ε e su una scala temporale 1/ε. Quantità con questa proprietà sono dette invarianti adiabatici, con
nomenclatura tratta dalla termodinamica.
Definizione 8.1 Sia dato in Rn e per t ≥ 0 il sistema ẋ = f (εt, x); una
funzione scalare I(x, εt) è detta invariante adiabatico del sistema se
I(x(t), εt) = I(x(0), 0) + o(1)
(8.35)
su scala temporale 1/ε.
Tornando all’equazione (8.34), il numeratore è pari a 2E(t), il doppio dell’energia meccanica non conservata. Pertanto, se ricordiamo che il legame tra energia ed azione in un oscillatore armonico unidimensionale è E/ω = I, la (8.34)
afferma che, almeno nel caso dell’oscillatore armonico, l’azione è un invariante
adiabatico. L’estendibilità di questo risultato ad altri sistemi richiede di ritornare al formalismo canonico e di studiare la teoria canonica delle perturbazioni,
oggetto della prossima sezione.
Osservazione. Sinora abbiamo considerato approssimazioni di ordine 1 in ε. Il
metodo della media si può estendere anche ad ordini superiori ma i calcoli si
complicano rapidamente.
8.4
Teoria canonica delle perturbazioni. I.
Consideriamo (Cap.12 di [2]) un sistema hamiltoniano autonomo ad n gradi
di libertà e descritto da n coordinate q := {q1 , q2 , ..., qn } ed n momenti p :=
{p1 , p2 , ...., pn } e la cui hamiltoniana h(p, q, ε) dipenda anche da un parametro
adimensionale ε tale che |ε| 1 ed abbia la struttura
h(p, q, ε) = h0 (p, q) + εf (p, q)
(8.36)
150
CAPITOLO 8. METODI PERTURBATIVI. II.
dove h0 rappresenta la hamiltoniana di un sistema completamente canonicamente integrabile ed f è una funzione di disturbo che specifica lo scostamento di h
dalla parte integrabile h0 . Problemi in cui la hamiltoniana ha questa struttura
sono molto frequenti in meccanica celeste dove spesso h0 è la hamiltoniana del
problema di Keplero per descrivere l’interazione gravitazionale tra due corpi ed
f contiene le perturbazioni dovute alla presenza di altri corpi celesti. Affinché
abbia senso parlare di f come disturbo della parte integrabile occorre che f
sia in qualche modo controllata da h0 . Un criterio di controllo possibile è il
seguente: preso un compatto K ⊂ R2n , si richiede che
max(p,q)∈K |f (p, q)|
≤ MK
max(p,q)∈K |h0 (p, q)|
(8.37)
dove MK è una costante dipendente unicamente dalla scelta del compatto K.
Sistemi per i quali vale la stima (8.37) sono detti quasi integrabili. Il fatto
che h0 sia la hamiltoniana di un sistema completamente canonicamente integrabile ci garantisce dell’esistenza di una trasformazione completamente canonica (p, q) 7→ (I, χ) a variabili azione-angolo che permette di trasformare
h0 (p, q) 7→ H0 (I) e dunque di integrare immediatamente le equazioni di moto.
L’aspettativa della teoria canonica delle perturbazioni è quella di riuscire, eventualmente attraverso una successione di trasformazioni canoniche, a rendere la
dipendenza di h da χ poco rilevante o addirittura assente del tutto. La trasformazione canonica (p, q) 7→ (I, χ) nasce per semplificare la hamiltoniana h0 ma,
come abbiamo visto in precedenza, l’essere trasformazione canonica non dipende
dalla hamiltoniana. Pertanto è possibile studiare l’effetto di (p, q) 7→ (I, χ) su
h(p, q, ε). Ovviamente non possiamo aspettarci che χ scompaia da h e quello
che ragionevolmente succede è che la trasformazione canonica (p, q) 7→ (I, χ)
mandi h(p, q, ε) in
H(I, χ, ε) = H0 (I) + εF (I, χ)
(8.38)
dove F eredita dalle p e q una dipendenza 2π-periodica nelle variabili angolari
χ = {χ1 , χ2 , ..., χn }. Le variabili di azione sodisfano le equazioni
∂H
∂F
I˙k = −
= −ε
∂χk
∂χk
e dunque, già al primo ordine nel parametro ε, non sono più costanti. Il problema
centrale della teoria canonica delle perturbazioni al primo ordine è quello di
trovare una ulteriore trasformazione canonica {I, χ} 7→ {I0 , χ0 } con la proprietà
che la hamiltoniana trasformata H 0 (I0 , χ0 ) dipenda solo dai momenti I0 , almeno
fino al primo ordine in ε. Formalmente,
H(I, χ, ε) 7→ H 0 (I0 , χ0 , ε) = H(I(I0 , χ0 , ε), χ(I0 , χ0 , ε), ε) =
(8.39)
H00 (I0 ) + εH10 (I0 ) + ε2 F 0 (I0 , χ0 , ε)
dove appunto la dipendenza dalle variabili χ0 compare solo a partire dai termini
contenenti ε2 . Se questo programma fosse realizzabile potremmo scrivere
0
∂H
I˙k0 = − 0 = O(ε2 )
∂χk
(8.40)
151
8.4. TEORIA CANONICA DELLE PERTURBAZIONI. I.
cosı̀ che le nuove variabili di azione restano pressoché costanti per un intervallo
di tempo maggiore. Il procedimento al primo ordine in ε potrebbe in linea
di principio essere generalizzato fino al punto di trovare una trasformazione
canonica il cui effetto sulla hamiltoniana è quello di trasformarla in
H 0 (I0 , ε) =
∞
X
Hn0 (I0 )εn
(8.41)
i=0
dove la dipendenza dalle variabili χ è scomparsa. Come vedremo, molti ostacoli
si frappongono alla realizzazione di questo ambizioso progetto.
Affrontiamo il problema al primo ordine in ε ed osserviamo che, siccome
H0 dipende solo dalle variabili di azione I, all’ordine ε0 la trasformazione canonica cercata è l’identità. Come fatto più volte, cerchiamo una funzione generatrice W (I0 , χ, ε) per effettuare il passaggio da {I, χ} a {I0 , χ0 }. L’identità è
rappresentata tramite la funzione generatrice
W0 (I0 , χ) = I0 · χ
perché, richiamando i risultati del Cap. 3, con questa trasformazione si ha
Ik =
∂W0
= Ik0
∂χk
χ0k =
∂W0
= χk .
∂Ik
Dunque, appare ragionevole cercare una funzione generatrice W (I0 , χ, ε) nella
forma
W (I0 , χ, ε) = I0 · χ + εW (1) (I0 , χ) + O(ε2 )
(8.42)
richiedendo che W (1) sia 2π-periodica in ciascuna delle variabili χk . Abbiamo
ora
(1)
∂W
2
= Ik0 + ε ∂W
Ik = ∂χ
∂χk + O(ε )
k
(8.43)
∂W (1)
∂W
2
0
χk = ∂I 0 = χk + ε ∂I 0 + O(ε )
k
k
che possono essere inserite nella richiesta (8.39) che si riformula nelle variabili
naturali {I0 , χ} come
H0 (I0 + ε∇χ W (1) ) + εF (I0 , χ) = H00 (I0 ) + εH10 (I0 ) + O(ε2 ) ,
dove ∇χ indica l’operatore gradiente rispetto alle variabili angolari χ. In questa
equazione le incognite da determinare sono W (1) , H00 ed H10 . Se ricordiamo che
per un sistema completamente canonicamente integrabile le frequenze ωk sono
date da
∂H0
ωk =
,
∂Ik
sviluppando in serie di Taylor H0 ed F e fermandosi al primo ordine in ε
abbiamo, detto ω il vettore delle frequenze ω := {ω1 , ..., ωn },
H0 (I0 ) + εω(I0 ) · ∇χ W (1) (I0 , χ) + εF (I0 , χ) = H00 (I0 ) + εH10 (I0 )
152
CAPITOLO 8. METODI PERTURBATIVI. II.
e dunque, uguagliando i termini che contengono ε ad una certa potenza abbiamo
H00 (I0 ) = H0 (I0 )
(8.44)
H10 (I0 ) = ω(I0 ) · ∇χ W (1) (I0 , χ) + F (I0 , χ) .
(8.45)
e
La richiesta (8.44) era da attendersi: all’ordine ε0 , il programma della teoria
canonica delle perturbazioni è realizzato automaticamente: H00 è semplicemente
la hamiltoniana integrabile H0 calcolata in I0 . L’equazione (8.45) è nota come
equazione fondamentale della teoria delle perturbazioni ed affronteremo il problema della sua risolubilità dapprima nel caso n = 1, cioè per sistemi ad un
grado di libertà e, in seguito, nel caso generale n > 1.
Teorema 8.2 Sia dato un sistema quasi integrabile ad un grado di libertà. Se
ω(I 0 ) 6= 0 allora (8.45) è risolta da
H10 (I 0 ) =
e
1
2π
1
ω(I 0 )
W (1) (I 0 , χ) =
Z
2π
F (I 0 , χ)dχ
(8.46)
0
Z
0
χ
[H10 (I 0 ) − F (I 0 , s)]ds.
(8.47)
La coppia (H10 (I 0 ), W (1) (I 0 , χ)) è univocamente determinata se si richiede che
la media integrale di W (1) sia nulla, cioè a dire se
1
2π
Z
2π
W (1) (I 0 , χ)dχ = 0 .
(8.48)
0
Dim. Per sistemi ad un grado di libertà la (8.45) si riduce a
ω
∂W (1)
+ F (I 0 , χ) = H10 (I 0 ) .
∂χ
(8.49)
Poiché W (1) è periodica in χ, se integriamo (8.49) nell’intervallo [0, 2π] otteniamo che H10 (I 0 ) deve essere data dalla (8.46) che dunque costituisce una condizione necessaria per la risolubilità di (8.49). Con questa espressione di H10 (I 0 ), la
(8.47) segue per integrazione. Per l’unicità, se si suppone l’esistenza di un’altra
0
coppia (H 1 (I 0 ), W
(1)
) soluzione (8.49), cosı̀ da avere
(1)
∂W
ω
∂χ
0
+ F (I 0 , χ) = H 1 (I 0 ) ,
per differenza con la (H10 (I 0 ), W (1) (I 0 , χ)) si ha anche
ω(I 0 )
∂
(1)
0
(W (1) − W )(I 0 , χ) = H10 (I 0 ) − H 1 (I 0 )
∂χ
(8.50)
153
8.4. TEORIA CANONICA DELLE PERTURBAZIONI. I.
che, integrata nell’intervallo [0, 2π], grazie alla periodicità di W (1) e W
0
sente di concludere che H10 (I 0 ) = H 1 (I 0 ). Restiamo pertanto con
(1)
con-
∂
(1)
(W (1) − W )(I 0 , χ) = 0
∂χ
che, dopo una integrazione, fornisce
W
(1)
− W (1) = g(I 0 )
per una funzione arbitraria g dei nuovi momenti I 0 . Se si richiede (8.48), occorre
che g(I 0 ) ≡ 0, da cui segue l’unicità.
Osservazione. L’espressione (8.45) per la hamiltoniana trasformata al primo
ordine in ε merita un commento. Il Teorema 8.2 asserisce che, a seguito della
trasformazione canonica (I, χ) 7→ (I 0 , χ0 ) la perturbazione F (I, χ) viene sostituita dalla sua media rispetto alla dipendenza angolare, non molto diversamente
da quanto ottenuto con il teorema 8.1.
Risolto il problema della teoria canonica delle perturbazioni al primo ordine
in ε, l’equazione di moto per il nuovo momento I 0 è
0
∂H
I˙ = − 0 = O(ε2 )
∂χ
che, integrata nell’intervallo [0, t] e supponendo limitato il membro di destra,
fornisce la stima
|I 0 (t) − I 0 (0)| = O(ε)
su scala temporale 1/ε in quanto al crescere dell’intervallo di integrazione la
stima, piuttosto rozza in verità, si degrada. Quanto alle vecchie variabili di
azione abbiamo
|I(t) − I(0)| ≤ |I(t) − I 0 (t)| + |I 0 (t) − I 0 (0)| + |I 0 (0) − I(0)|
dove il secondo termine di destra è O(ε) cosı̀ come i restanti termini dal momento che, per (8.43), la differenza tra I ed I 0 ad ogni istante è O(ε). Dunque
concludiamo che
|I(t) − I(0)| = O(ε)
su scala temporale 1/ε.
Nel caso di sistemi ad un grado di libertà, si può dimostrare che esiste una
trasformazione completamente canonica
W (I 0 , χ, ε) = I 0 χ +
∞
X
W (n) (I 0 , χ)εn
(8.51)
n=1
ed una famiglia di funzioni Hn0 (I 0 ) tali che la hamiltoniana trasformata ha la
struttura (8.41). Inoltre, gli sviluppi (8.41) e (8.51) convergono uniformemente
se H0 ed F sono funzioni analitiche. Dunque, almeno per sistemi ad un grado
di libertà, il programma della teoria canonica delle perturbazioni può essere
portato a termine. Ben diverso è l’esito per sistemi a più gradi di libertà, come
vedremo più avanti.
154
8.5
CAPITOLO 8. METODI PERTURBATIVI. II.
Invarianza adiabatica dell’azione
A chiusura della Sez. 8.3 abbiamo mostrato che per un oscillatore armonico con
frequenza variabile lentamente nel tempo l’azione è un invariante adiabatico,
nel senso della Def. 8.1. Vogliamo ora generalizzare il risultato per una classe
di sistemi ad un grado di libertà descritti da una hamiltoniana del tipo
H(p, q, r(εt)) = H(p, q, r(τ ))
(8.52)
che dipende esplicitamente dal tempo attraverso un parametro r che varia lentamente nel tempo, in quanto ha per argomento τ := εt, con ε 1. Precisamente, supponiamo che per ogni valore fissato del parametro r il sistema retto
dalla (8.52) abbia moti di rotazione o di librazione e dunque esista una trasformazione completamente canonica, parametrizzata da r, che realizza il passaggio
dalle variabili (p, q) alle variabili azione-angolo (I, χ). Indichiamo con W (I, q, r)
la funzione generatrice di questa trasformazione, con K0 (I, r) la hamiltoniana
corrispondente a (8.52) nelle nuove coordinate e con
ω0 (I, r) =
∂K0
(I, r)
∂I
la frequenza associata. Vogliamo dimostrare il seguente teorema, la cui collocazione dopo la discussione introduttiva sulla teoria canonica delle perturbazioni
si giustifica in quanto le tecniche dimostrative ricalcano in buona misura quelle
utilizzate per mostrare il Teorema 8.2.
Teorema 8.3 Si supponga che la hamiltoniana H e la funzione r(τ ) che figurano in (8.52) siano almeno di classe C 3 nei loro argomenti e che esista una
costante positiva δ tale che ω0 (I, r(τ )) > δ. Allora l’azione I(p, q, r(τ )) è un
invariante adiabatico.
Dim. La funzione W = W (I, q, r(τ )), in cui la dipendenza del parametro dal
tempo è stata liberata, genera ancora una trasformazione canonica che però ora
dipende esplicitamente dal tempo per cui la hamiltoniana trasformata non è più
K0 bensı̀
K(I, χ, τ ) = K0 (I, r(τ )) +
∂W
(q(I, χ, r(τ )), I, r(τ )).
∂t
Osservando che la dipendenza esplicita di W dal tempo è mediata dal parametro
r concludiamo che
∂W
∂W 0
=ε
r (τ ) =: εf (I, χ, τ )
∂t
∂r
dove l’apice denota la derivazione rispetto a τ . Dunque
K(I, χ, τ ) = K0 (I, r(τ )) + εf (I, χ, τ )
8.5. INVARIANZA ADIABATICA DELL’AZIONE
155
che ha struttura analoga alla hamiltoniana (8.38). Nelle variabili azioni angolo
le equazioni di moto sono

∂f
I˙ = −ε ∂χ


χ̇ = ω0 (I, r(τ )) + ε ∂f
∂I .
Cerchiamo ora di portare a termine in questo contesto un progetto analogo a
quello sviluppato nella Sez. (8.4) cercando una funzione generatrice W (I 0 , χ, τ )
di una trasformazione canonica dalle variabili (I, χ) a nuove variabili (I 0 , χ0 ) tali
che la hamiltoniana trasformata
K(
∂W
∂W
∂W
∂W
∂W
, χ, τ ) +
= K0 (
, r(τ )) + εf (
, χ, τ ) +
∂χ
∂t
∂χ
∂χ
∂t
(8.53)
assuma in realtà la forma
K 0 (I 0 , τ ) + εK 1 (I 0 , τ ) + O(ε2 )
(8.54)
per funzioni K 0 e K 1 da determinare. Come fatto in precedenza, poiché al livello
ε0 K0 già non contiene la variabile angolare, cerchiamo W come trasformazione
vicina all’identità:
(1)
W = I 0 χ + εW (I 0 , χ, τ )
(8.55)
(1)
con W
funzione 2π-periodica in χ. Se inseriamo (8.55) nella (8.53) ed uguagliamo lo sviluppo ottenuto alla (8.54) otteniamo, all’ordine 0 in ε
K 0 (I 0 , τ ) = K0 (I 0 , r(τ ))
mentre al primo ordine in ε abbiamo
(1)
∂W
(I 0 , χ, τ ) + f (I 0 , χ, τ ) = K 1 (I 0 , τ )
ω0 (I , r(τ ))
∂χ
0
(8.56)
dal momento che
(1)
(1)
∂W
∂W
=ε
∂t
∂t
= ε2
∂W
∂τ
= O(ε2 ) .
L’equazione (8.56) è analizzabile esattamente come la (8.49) ed ha soluzione
Z 2π
1
0
f (I 0 , χτ )dχ
K 1 (I , τ ) =
2π 0
e
W
(1)
=
1
0
ω0 (I , r(τ ))
Z
χ
[K 1 (I 0 , τ ) − f (I 0 , s, τ )]ds.
0
Accertata la risolubilità della (8.56), nelle nuove variabili abbiamo
∂K
I˙0 = − 0 = O(ε2 )
∂χ
156
CAPITOLO 8. METODI PERTURBATIVI. II.
per cui possiamo ancora concludere che
0
0
|I (t) − I (0)| = O(ε)
su scala temporale 1/ε e, poiché I ed I 0 sono legate da una trasformazione vicina
all’identità abbiamo, sulla stessa scala temporale,
|I(t) − I(0)| = O(ε)
che conclude la dimostrazione del teorema.
Osservazione. La regolarità richiesta alla hamiltoniana garantisce che la funzione
(1)
W
sia di classe C 2 e dunque sia una ammissibile funzione generatrice di una
trasformazione canonica.
8.6
Teoria canonica delle perturbazioni. II.
Consideriamo ora il caso generale di sistemi a più gradi di libertà e cerchiamo
di risolvere l’equazione (8.45). Osserviamo che per la periodicità di W (1) negli
argomenti angolari, quando (8.45) viene integrata sul toro n-dimensionale T n =
S 1 × S 1 × · · ·S 1 , poiché ω non dipende dagli angoli abbiamo
{z
}
|
n volte
1
(2π)n
I
[H1 (I0 ) − F (I0 , χ)]dχ = 0
Tn
e dunque
H10 (I0 ) =
1
(2π)n
I
Tn
F (I0 , χ)dχ =
1
(2π)n
Z
2π
0
Z
0
2π
···
Z
2π
F (I0 , χ)dχ1 dχ2 ···dχn =: F0 (I 0 )
0
(8.57)
è ancora la media integrale della funzione di disturbo F (I0 , χ). La (8.57) è ancora
condizione necessaria alla risolubilità di (8.45) ma ora l’inversione dell’operatore
differenziale
ω(I0 ) · ∇χ
(8.58)
necessaria per risolvere (8.45) rispetto a W (1) è un’operazione delicata. Per
renderci conto delle difficoltà, ragioniamo ad I0 fissato ed osserviamo che le tra
le funzioni di χ di periodicità 2π in tutte le componenti di χ le autofunzioni di
(8.58) sono
uλ (χ) = eim·χ
dove i è l’unità immaginaria ed m := {m1 , m2 , ..., mn } appartiene a Z n . L’autovalore di (8.58) corrispondente a uλ è
λ = im · ω
(8.59)
e pertanto l’invertibilità di (8.58) è legata al fatto che, per tutti gli m ∈ Z n \{0},
si abbia λ 6= 0. Questa condizione coinvolge il vettore delle frequenze ω e,
indirettamente, le variabili di azione I0 e giustifica la seguente
8.6. TEORIA CANONICA DELLE PERTURBAZIONI. II.
157
Definizione 8.2 Un vettore ω ∈ Rn è detto risonante se esiste un vettore
m ∈ Z n \ {0} tale che m · ω = 0. Al contrario un vettore ω ∈ Rn è detto non
risonante se m · ω 6= 0 per tutti i vettori m ∈ Z n \ {0}.
Quando ω è non risonante, λ = 0 è autovalore di (8.58) corrispondente ad
m = 0 e con molteplicità pari ad 1. Possiamo ora dimostrare un primo teorema
sulla risolubilità formale di (8.45). L’aggettivo formale ricorda che, dal momento
che la soluzione è ottenuta come sviluppo in serie, si prescinde dalla convergenza
della serie ottenuta.
Teorema 8.4 Se H10 (I0 ) soddisfa (8.57) ed ω(I0 ) non è risonante, allora (8.45)
ammette una soluzione formale W (1) che è unica se si richiede che
I
W (1) dχ = 0 .
Tn
Dim. Sviluppiamo F (I0 , χ) e W (1) (I0 , χ) in serie di Fourier multidimensionale
e scriviamo
X
F (I0 , χ) =
Fbm (I0 )eim·χ
m∈Z n
e
W (1) (I0 , χ) =
X
m∈Z n
c (1) (I0 )eim·χ
W
m
e sostituiamoli nella (??) ottenendo
X
(1) 0
cm
(I )] = 0,
eim·ω [Fbm (I0 ) + iω(I0 ) · mW
m∈Z n \{0}
mentre per m = 0 si riottiene la (8.57). Poiché le funzioni eim·χ formano una
base di L2 (T n ) possiamo uguagliare a zero i singoli coefficienti
(1) 0
cm
(I )] = 0
[Fbm (I0 ) + iω(I0 ) · mW
per tutti gli m ∈ Z n \ {0} e quindi ottenere, grazie all’ipotesi di non risonanza
su ω,
0
b
c (1) (I0 ) = − Fm (I )
W
m
0
iω(I ) · m
che risolve formalmente (8.45). L’unicità si mostra come già fatto nel Teorema
8.2.
Il successo della teoria delle perturbazioni nel caso di sistemi ad un grado
di libertà dipende dal fatto che la condizione su ω, ω 6= 0 è ben controllabile.
Purtroppo l’insieme delle ω(I0 ) non risonanti e quello delle ω(I0 ) risonanti non
sono ben separati dal momento che il secondo insieme, interpretabile geometricamente come insieme degli ω ∈ Rn ortogonali a qualche vettore m ∈ Z n \ {0}
158
CAPITOLO 8. METODI PERTURBATIVI. II.
è denso in Rn . Questa affermazione si giustifica facilmente nel caso n = 2 dove
la condizione di risonanza diventa
m1 ω 1 + m2 ω 2 = 0
e richiede che ω1 /ω2 sia un numero razionale. Poiché i razionali sono densi nei
reali, abbiamo verificato l’asserto in questo caso. La densità delle frequenze
risonanti è alla base delle difficoltà della teoria canonica nel caso n > 1.
Per procedere nell’analisi è opportuno distinguere due famiglie di hamiltoniane integrabili H0 (I) con la seguente
Definizione 8.3 Una hamiltoniana H0 (I) integrabile è non degenere su un
aperto A ⊂ Rn se esiste una costante C > 0 tale che
2 ∂ H0
(I) ≥ C ∀I ∈ A .
(8.60)
det
∂Ij Ik
In caso contrario, la hamiltoniana integrabile H0 è detta degenere.
Se ricordiamo che ωj =
∂H0
∂Ij ,
la condizione (8.60) si può riscrivere come
det
∂ωj
∂Ik
≥C>0
e dunque afferma l’esistenza di un diffeomorfismo locale tra le variabili di azione
e le frequenze. Pertanto, nel caso di hamiltoniane ottenute perturbando un sistema integrabile non degenere, l’insieme delle azioni che danno luogo a frequenze
risonanti costituisce un insieme denso in A e dunque in questo caso non resta
che rinunciare alla possibilità di ottenere una soluzione W (1) di (8.49) che sia
funzione regolare delle variabili di azione. Precisamente, sotto ipotesi ragionevoli su F , vale il seguente teorema, dovuto a Poincaré, per la cui dimostrazione
rimandiamo, ad esempio, a [2], §12.4. Premettiamo all’enunciato del teorema di
Poincaré una definizione.
Definizione 8.4 Una funzione F : A×T n → R, dove A è un aperto di Rn e T n
è il toro n-dimensionale, ha sviluppo di Fourier generico se ∀I ∈ A e ∀m ∈ Z n
esiste un vettore m0 ∈ Z n parallelo ad m e tale che Fbm0 (I) 6= 0.
Teorema 8.5 Se la parte integrabile H0 della hamiltoniana (8.38) è non degenere su un aperto A ⊂ Rn e se la funzione di disturbo F ha uno sviluppo di
Fourier generico, allora l’equazione (8.45) non ammette soluzione W (1) (I0 , χ)
regolare in I0 ∈ A.
Strettamente legato al Teorema 8.5 è il seguente risultato, dovuto sempre a
Poincaré, che toglie la speranza di trovare integrali primi indipendenti dalla hamiltoniana e che siano utili alla integrazione delle equazioni di moto per sistemi
con quasi integrabili con parte integrabile non degenere.
8.6. TEORIA CANONICA DELLE PERTURBAZIONI. II.
159
Teorema 8.6 Sia assegnato un sistema integrabile con hamiltoniana data dalla (8.38) avente parte integrabile non degenere e con funzione di disturbo che
ha sviluppo di Fourier generico. Non esiste un integrale primo g(I, χ, ε) indipendente dalla hamiltoniana ed analitico, cioè che possa essere scritto nella
forma
∞
X
gn (I, χ)εn
g(I, χ, ε) =
n=0
in cui lo sviluppo in serie è ben definito e convergente uniformemente rispetto
ad I ∈ A ⊂ Rn e a χ ∈ T n , almeno per |ε| 1.
La richiesta di indipendenza dalla hamiltoniana equivale a chiedere che non esista una funzione analitica γ non costante di una variabile tale che g = γ(H).
Non dimostreremo questo teorema (si veda in proposito [2], §12.4) ma ci limitiamo a fornire un argomento euristico sufficiente a convincere che le difficoltà
che si incontrano per costruire un integrale primo per il sistema retto da (8.38)
sono simili a quelle incontrate nel risolvere (8.45). Infatti, la funzione g deve
sodisfare l’equazione
[g, H] = 0
(8.61)
per poter essere un integrale primo. Inserendo lo sviluppo di g e servendosi della
struttura di H, all’ordine più basso in ε la (8.61) equivale a chiedere
[g0 , H0 ] = 0
ovvero, ricordando la definizione di parentesi di Poisson unitamente al fatto che
H0 non dipende dalle variabili angolari,
∂g0 ∂H0
= (ω · ∇χ )g0 = 0
∂χk ∂Ik
e dunque ci dobbiamo ancora una volta confrontare con lo spinoso problema
dell’inversione dell’operatore (8.58).
Resta da discutere il caso di hamiltoniana integrabile degenere. Anzitutto
non si tratta di un caso troppo particolare in quanto l’oscillatore armonico ha
hamiltoniana H0 = ωI e dunque rientra in questa categoria. Più in generale, un
insieme di n oscillatori armonici unidimensionali ed indipendenti è un sistema
integrabile con hamiltoniana H0 = I · χ che è ancora degenere. In questo caso,
poiché le frequenze sono indipendenti dalle azioni, la condizione di risonanza
ω · m = 0 non riguarda le variabili di azione ma i parametri presenti nella
hamiltoniana. Consideriamo allora la hamiltoniana
H(I, χ, ε) = ω · I + εF (I, χ) .
(8.62)
Definizione 8.5 Un vettore ω ∈ Rn con n > 1 sodisfa una condizione diofantea
di costante γ > 0 ed esponente µ ≥ n − 1—in simboli, ω ∈ Cγ,µ —se, per tutti
gli m ∈ Z n \ {0}
|m · ω| ≥ γ|m|−µ
(8.63)
dove |m| := |m1 | + |m2 | + ... + |mn |.
160
CAPITOLO 8. METODI PERTURBATIVI. II.
A volte si dice che la condizione (8.63) misura quanto ω è irrazionale. L’importanza della condizione (8.63) si apprezza con il seguente
Teorema 8.7 Sia dato un sistema con Hamiltoniana di tipo (8.62) con ω ∈
Cγ,µ , sia A ⊂ Rn un insieme aperto e si supponga che la funzione F che compare
in (8.62) sia di classe C ∞ . La serie di Fourier
X
W (1) (I0 , χ) = −
m∈Z n \{0}
Fbm (I0 ) im·χ
e
iω(I0 ) · m
(8.64)
converge uniformemente al variare di (I0 , χ) in K × T n , dove K ⊂ A è un
insieme compatto.
Rimandiamo anche qui il lettore interessato alla dimostrazione di questo teorema al §12.5 di [2]. Ci limitiamo ad osservare che la condizione diofantea (8.63)
è essenziale per maggiorare la serie di Fourier (8.64) con una serie geometrica
convergente.
Grazie al Teorema 8.7, concludiamo che per le hamiltoniane degeneri il programma della teoria delle perturbazioni è coronato da successo, almeno al primo
ordine in ε. Anche qui, sembra naturale cercare una trasformazione canonica
(I, χ) → (I0 , χ0 ) generata da una funzione
0
0
W (I , χ, ε) = I · χ +
∞
X
W (r) (I0 , χ)εr
(8.65)
r=1
e tale che la nuova hamiltoniana abbia la struttura
H 0 (I0 , ε) =
∞
X
Hr (I0 )εr
(8.66)
r=0
che ancora una volta dipenda solo dai momenti I0 e dunque consenta di integrare
le equazioni di moto. Ora, il programma si può portare a termine se ω non è risonante ma in generale non è possibile ottenere sviluppi (8.65)-(8.66) convergenti.
Le serie (8.65)-(8.66), dette serie di Birkhoff, anche se divergenti sono molto utili
per ottenere risultati di stabilità su intervalli di tempo estremamente lunghi. Le
applicazioni delle serie di Birkhoff sono però tecniche e rimandiamo il lettore
interessato al §12.5 di [2] per una discussione più approfondita. Nella prossima sezione cercheremo di capire attraverso un esempio scorrelato dalla teoria
canonica delle perturbazioni come una serie divergente ma dotata di proprietà
opportune, possa essere usata con profitto per approssimare una funzione.
Osservazione. Per hamiltoniane degeneri, ad una frequenza che soddisfi (8.63)
corrisponde una azione il cui insieme di appartenenza indichiamo con Aγ,µ .
Ora, un importante teorema di meccanica analitica, il teorema di KolmogorovArnol’d-Moser (KAM) afferma che, se una variabile di azione appartiene ad
Aγ,µ , se H è una funzione analitica e se ε è sufficientemente piccolo, allora il
8.7. A COSA SERVE UNA SERIE DIVERGENTE?
161
toro invariante corrispondente ad H0 non viene distrutto dalla perturbazione F
ma solo deformato e dunque, almeno sull’insieme Aγ,µ è possibile integrare le
equazioni di Hamilton con il formalismo delle variabili azione-angolo. Resta il
fatto che la struttura di Aγ,µ è parecchio complessa in quanto esso è un insieme
di Cantor ed il suo complementare è denso in A. I tori che corrispondono ad
azioni che non appartengono ad Aγ,µ vengono distrutti dalla perturbazione ma
è possibile mostrare che la loro misura di Lebesgue nello spazio delle fasi tende
a 0 quando ε → 0.
8.7
A cosa serve una serie divergente?
Come accennato sopra, l’utilità delle serie di Birkhoff, benché divergenti, nello studio di problemi di stabilità è un argomento troppo settoriale per essere
trattato convenientemente in un corso introduttivo. Lo scopo di questa sezione è di illustrare attraverso ad un esempio come una serie divergente possa in
realtà rivelarsi utile nell’approssimare una funzione. Ovviamente non ogni serie
divergente gode di questa proprietà. Tuttavia la classe delle serie asintotiche,
studiate per prime da Poincaré e Stieltjes, si rivela di particolare utilità benché
in generale non sia composta da serie convergenti. Premettiamo una definizione.
Definizione 8.6 Una successione δn (ε) di funzioni reali di variabile reale è
detta asintotica quando ε → 0 se
δn (ε) = o(δn−1 )
per ε → 0
Sono esempi di successioni asintotiche εn , sin εn , εn/3 e (log ε)−n .
Si consideri ora un punto x0 ∈ R, una funzione y : R 7→ R definita in un
intorno di x0 e la successione asintotica (x − x0 )n .
Definizione 8.7 La serie di potenze
∞
X
an (x − x0 )n
n=0
è detta asintotica alla funzione y(x) quando x → x0 se
y(x) −
N
X
an (x − x0 )n = o(x − x0 )N
per x → x0 e ∀N .
(8.67)
n=0
Osservazione. La proprietà (8.67) delle serie asintotiche viene espressa simbolicamente come
∞
X
y(x) ∼
an (x − x0 )n (x → x0 ) .
n=0
In termini verbali, la Definizione 8.7 asserisce che una serie di potenze è asintotica ad una funzione y(x) per x → x0 quando la differenza tra y(x) e la somma dei
162
CAPITOLO 8. METODI PERTURBATIVI. II.
primi N termini della serie è trascurabile rispetto all’ultimo termine considerato
nello sviluppo, nel limite in cui x → x0 .
Notiamo anche che, se y(x) ammette uno sviluppo centrato in x0 in serie di
Taylor convergente abbiamo, dopo N +1 applicazioni della regola di de l’Hôpital,
PN
y(x) − n=0 an (x − x0 )n
y (N +1)
=
lim
x→x0
(x − x0 )N +1
(N + 1)!
e dunque vale anche la (8.67). Tuttavia la convergenza della serie non è richiesta
nella definizione di serie asintotica. Per apprezzare meglio le differenze tra serie
convergenti ed asintotiche, osserviamo che per una serie di potenze convergente
nell’insieme |x − x0 | < R
y(x) =
∞
X
an (x − x0 )n
n=0
deve essere vero che, all’interno del disco di convergenza, il resto
rN (x) :=
∞
X
an (x − x0 )n → 0,
per x fissato.
N +1
La richiesta di convergenza è assoluta in quanto dipende unicamente dai coefficienti an . La convergenza della serie può essere dimostrata a prescindere dalla
conoscenza della funzione cui essa converge. Al contrario, la proprietà di una
serie di essere asintotica ad una funzione è una proprietà relativa dei coefficienti
dello sviluppo e della funzione. Osserviamo che la proprietà di essere asintotica
implica che
rN (x) = o(x − x0 )N per x → x0 ad N fissato,
condizione diversa da quella di convergenza.
Supponiamo che valga la (8.67) e mostriamo che i coefficienti an dello sviluppo sono determinati univocamente. Infatti nel caso N = 0, (8.67) equivale a
chiedere
y(x) − a0 = o(1)
e dunque
lim y(x) = a0
x→x0
che fissa univocamente a0 , se il limite esiste. Quando N = 1 abbiamo
lim
x→x0
y(x) − a0 − a1 (x − x0 )
=0
x − x0
per cui
y(x) − a0
x − x0
è ancora determinato univocamente. Procedendo in successione otteniamo che
PN −1
y(x) − n=0 an (x − x0 )n
aN = lim
x→x0
(x − x0 )N
a1 = lim
x→x0
163
8.7. A COSA SERVE UNA SERIE DIVERGENTE?
e dunque tutti i coefficienti sono determinati univocamente. Resta inteso che
l’esistenza dei limiti che li definiscono è condizione indispensabile perché la serie
di potenze sia asintotica alla funzione y(x) per x → x0 .
Costruiamo ora un esempio di serie asintotica ad una funzione partendo dalla
soluzione dell’equazione lineare, omogenea a coefficienti non costanti
x2 y 00 + (1 + 3x)y 0 + y = 0
(8.68)
e cerchiamone una soluzione con il metodo di Frobenius che impone la rappresentazione
∞
X
an xn+α
(8.69)
y(x) =
n=0
con a0 6= 0 ed in cui i coefficienti an e l’esponente α sono incognite da determinare. Ora, l’equazione (8.68) ha in x = 0 un punto singolare irregolare e dunque
il metodo di Frobenius non dà una serie convergente come soluzione (§§3.1-3.2
di [3]). Tuttavia noi fingiamo di ignorare il fatto e procediamo formalmente per
vedere dove porta il metodo. Deriviamo formalmente (8.69) ottenendo
y 0 (x) =
∞
X
an (n + α)xn+α−1
y 00 (x) =
∞
X
an (n + α)(n + α − 1)xn+α−2
n=0
n=0
che, sostituite in (8.68) la trasformano in
∞
X
an (n+α)(n+α−1)xn+α +
∞
X
an (n+α)xn+α−1 +3
an (n+α)xn+α +
∞
X
an xn+α = 0 .
n=0
n=0
n=0
n=0
∞
X
(8.70)
Osservando (8.70) ci si accorge che xα−1 compare solo nella seconda serie quando
n = 0 per cui il suo coefficiente a0 α viene posto uguale a zero e assumendo a0 6= 0
dobbiamo scegliere α = 0 che trasforma la (8.70) ulteriormente in
∞
X
an n(n − 1)xn +
n=0
∞
X
an nxn−1 + 3
n=0
∞
X
an nxn +
n=0
∞
X
an xn = 0 .
(8.71)
n=0
ed il coefficiente di xn è
(n + 1)[an+1 + (n + 1)an ]
che si annulla quando vale la relazione di ricorrenza sui coefficienti
an+1 = −(n + 1)an
o, in modo equivalente
an = (−1)n n!a0 .
Dunque il processo formale seguito ha condotto allo sviluppo in serie
y(x) =
∞
X
n=0
(−1)n n!xn
(8.72)
164
CAPITOLO 8. METODI PERTURBATIVI. II.
dove, senza perdere di generalità abbiamo posto a0 = 1. La serie (8.72) è nota
come serie di Stieltjes e converge solo in x = 0. Per comprenderne l’utilità
serviamoci dell’identità
Z ∞
e−t tn dt
n! =
(8.73)
0
che può essere dimostrata per induzione. Infatti, posto n = 1 ed integrando per
parti si ha
Z ∞
Z ∞
∞
e−t tdt = −e−t t +
e−t dt = 1 = 1!
0
0
0
D’altra parte, supponendo verificata l’identità al livello n − 1 ed integrando per
parti si ha
Z ∞
Z ∞
∞
e−t tn−1 dt = n(n − 1)! = n!
e−t tn dt = −e−t tn 0 + n
0
0
Operiamo ora formalmente sulla serie di Stieltjes che, servendosi della (8.73) si
riscrive come
Z ∞
∞
∞ Z ∞
∞
X
X
X
dte−t
(−tx)n
e−t tn dt(−x)n “ =00
n!(−x)n =
y(x) =
n=0
n=0
0
0
n=0
00
dove il simbolo “ = indica un passaggio puramente formale, in questo caso
lo scambio di una integrazione con una sommatoria infinita, privo di una solida giustificazione. Procedendo con questo atteggiamento baldanzoso scriviamo
ancora
Z ∞ −t
e
y(x)“ =00
dt
1
+ xt
0
P∞
dove abbiamo rimpiazzato la serie geometrica n=0 (−tx)n con la sua somma
1/(1 + xt) ignorando il fatto che ciò è vero a patto che |xt| < 1. La funzione
integrale cosı̀ ottenuta
Z ∞ −t
e
dt
I(x) :=
1
+ xt
0
è detta integrale di Stieltjes e benché ci siamo arrivati attraverso una serie di
passaggi quantomeno discutibili, rappresenta per x > 0 una funzione analitica.
Poiché è lecito derivare I(x) rispetto ad x sotto il segno di integrale ottenendo
Z ∞
Z ∞
−te−t
2t2 e−t
00
I 0 (x) =
dt
e
I
(x)
=
dt ,
2
(1 + xt)
(1 + xt)3
0
0
il membro si sinistra di (8.68) calcolato su y(x) = I(x) diventa
Z ∞
(1 − xt − t − xt2 ) −t
e dt
(1 + xt)3
0
che si può porre nella forma
Z ∞
0
t
d
−t
e
dt = 0 :
dt (1 + xt)2
8.7. A COSA SERVE UNA SERIE DIVERGENTE?
165
pertanto l’integrale di Stieltjes è soluzione di (8.68). Il rapporto che intercorre
tra I(x) e la serie di Stieltjes (8.72) viene messo in luce grazie all’identità
Z ∞
Z ∞
−n −t
(1 + xt) e dt = 1 − nx
(1 + xt)−(n+1) e−t dt
(8.74)
0
0
che può essere facilmente verificata con un’integrazione per parti. Applicando
(8.74) a partire da n = 1 e poi in successione su tutti gli interi abbiamo
R∞
I(x) = 1 − x 0 (1 + xt)−2 e−t dt =
R∞
= 1 − x 1 − 2x 0 (1 + xt)−3 e−t dt =
R∞
= 1 − x + 2x2 1 − 3x 0 (1 + xt)−4 e−t dt =
R∞
= 1 − x + 2x2 − 6x3 1 − 4x 0 (1 + xt)−5 e−t dt =
= 1 − x + 2!x2 − 3!x3 + 4!x4 + .... + (−1)N N !xN + rN (x)
dove il resto
N +1
rN (x) = (−1)
N +1
(N + 1)!x
Z
∞
(1 + xt)−(N +2) e−t dt ,
0
nel limite x → 0+ , essendo (1 + xt)(N +2) > 1 nel dominio di integrazione, è
controllato in modulo da
Z ∞
|rN (x)| ≤ (N + 1)!xN +1
e−t dt ≤ (N + 1)!xN +1 = o(xN )
0
che dimostra come la serie di Stieltjes sia asintotica all’integrale di Stieltjes.
Osserviamo che, per x = 1/10 l’errore R3 (1/10) è controllato da 24/10000.
166
CAPITOLO 8. METODI PERTURBATIVI. II.
Bibliografia
[1] F. Verhulst: Nonlinear Differential Equations and Dynamical Systems.
Springer, Berlin, (1990).
[2] A. Fasano, S. Marmi: Meccanica Analitica. Boringhieri, Torino, (1994).
[3] C.M. Bender, S.A. Orszag: Advanced Mathematical Methods for Scientists
and Engineers. I. Asymptotic Methods and Perturbation Theory. Springer,
New York, (1999).
167