Appunti integrativi per il Corso di Metodi Matematici per

Transcript

Appunti integrativi per il Corso di Metodi Matematici per
Appunti integrativi per il Corso di
Metodi Matematici per l’Ingegneria
A.A. 2015/2016
Marco Bramanti
Politecnico di Milano
16 settembre 2015
Indice
1 Elementi di analisi funzionale
1.1 Generalità sugli spazi di funzioni . . . . . . . . . . . . . . . . . .
1.1.1 Spazi vettoriali . . . . . . . . . . . . . . . . . . . . . . . .
1.1.2 Spazi metrici . . . . . . . . . . . . . . . . . . . . . . . . .
1.1.3 Limiti di successioni, continuità di funzioni . . . . . . . .
1.1.4 Successioni di Cauchy e completezza . . . . . . . . . . . .
1.2 Convergenza uniforme per successioni e serie di funzioni . . . . .
1.2.1 Successioni di funzioni: convergenza puntuale e uniforme
1.2.2 Successioni di funzioni e derivazione . . . . . . . . . . . .
1.2.3 Serie di funzioni: convergenza puntuale e uniforme . . . .
1.3 Operatori lineari continui . . . . . . . . . . . . . . . . . . . . . .
1.4 L’integrale di Lebesgue . . . . . . . . . . . . . . . . . . . . . . . .
1.4.1 Motivazione . . . . . . . . . . . . . . . . . . . . . . . . . .
1.4.2 La misura di Lebesgue . . . . . . . . . . . . . . . . . . . .
1.4.3 Integrale di Lebesgue . . . . . . . . . . . . . . . . . . . . .
1.4.4 Relazione tra integrale di Riemann e integrale di Lebesgue
1.4.5 I teoremi di convergenza per l’integrale di Lebesgue . . .
1.4.6 Derivazione sotto il segno di integrale . . . . . . . . . . .
1.4.7 Spazi Lp . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.4.8 Integrali doppi in Rn . . . . . . . . . . . . . . . . . . . . .
1.4.9 Convoluzione in Rn . . . . . . . . . . . . . . . . . . . . .
1.5 Richiami sulle serie di Fourier . . . . . . . . . . . . . . . . . . . .
1.5.1 Serie di Fourier in L2 . . . . . . . . . . . . . . . . . . . .
1.5.2 Convergenza puntuale delle serie di Fourier e rapidità di
convergenza a zero dei coe¢ cienti . . . . . . . . . . . . . .
1
5
5
5
8
10
11
13
14
21
25
30
32
32
35
40
47
51
55
60
65
67
68
68
70
2 Generalità su equazioni e problemi ai limiti per equazioni a
derivate parziali
2.1 Equazioni lineari del second’ordine . . . . . . . . . . . . . . . . .
2.2 Equazioni ellittiche, paraboliche, iperboliche . . . . . . . . . . . .
2.3 Condizioni al contorno . . . . . . . . . . . . . . . . . . . . . . . .
2.3.1 Equazioni ellittiche. Problemi al contorno . . . . . . . . .
2.3.2 Equazioni paraboliche. Problemi al contorno e ai valori
iniziali . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3.3 Equazioni iperboliche. Problemi al contorno e ai valori
iniziali . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.4 Principio di sovrapposizione . . . . . . . . . . . . . . . . . . . . .
2.5 Problemi ben posti . . . . . . . . . . . . . . . . . . . . . . . . . .
75
75
76
79
79
81
83
84
86
3 Metodo di separazione di variabili e sviluppi di Fourier per
problemi ai limiti
89
3.1 Equazione di Laplace e di Poisson . . . . . . . . . . . . . . . . . 89
3.1.1 Unicità, principio di massimo, dipendenza continua . . . . 89
3.1.2 L’equazione di Laplace sul cerchio . . . . . . . . . . . . . 95
3.1.3 Equazione di Poisson sul cerchio . . . . . . . . . . . . . . 114
3.2 Equazione di di¤usione . . . . . . . . . . . . . . . . . . . . . . . . 118
3.2.1 Unicità e principio di massimo parabolico . . . . . . . . . 118
3.2.2 Equazione di di¤usione sul segmento . . . . . . . . . . . . 123
3.3 L’equazione della corda vibrante . . . . . . . . . . . . . . . . . . 131
3.3.1 La corda vibrante …ssata agli estremi . . . . . . . . . . . . 131
3.3.2 La corda vibrante illimitata . . . . . . . . . . . . . . . . . 138
3.4 Equazione delle onde in dimensione superiore . . . . . . . . . . . 142
3.4.1 Energia e risultato di unicità . . . . . . . . . . . . . . . . 143
3.4.2 Onde sferiche tridimensionali . . . . . . . . . . . . . . . . 144
3.5 Esercizi sul metodo di separazione di variabili e sviluppi di Fourier145
4 Trasformata di Fourier e problemi ai limiti
149
4.1 La trasformata di Fourier in L1 (Rn ) . . . . . . . . . . . . . . . . 149
4.1.1 De…nizione e proprietà elementari . . . . . . . . . . . . . 149
4.1.2 Approssimazioni dell’identità . . . . . . . . . . . . . . . . 158
4.1.3 Il teorema di inversione . . . . . . . . . . . . . . . . . . . 160
4.2 L’equazione di Laplace nel semipiano . . . . . . . . . . . . . . . . 163
4.3 L’equazione del calore in tutto lo spazio . . . . . . . . . . . . . . 168
4.4 Problemi unidimensionali per l’equazione di di¤usione con trasporto
e reazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174
4.5 L’equazione di Poisson nello spazio . . . . . . . . . . . . . . . . . 176
4.6 L’equazione delle onde nello spazio . . . . . . . . . . . . . . . . . 180
5 Spazi di Hilbert
185
5.1 Spazi vettoriali con prodotto interno . . . . . . . . . . . . . . . . 185
5.2 Spazi di Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
5.3 Analisi di Fourier in spazi di Hilbert . . . . . . . . . . . . . . . . 195
2
5.4
5.5
5.6
Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . .
Il sistema trigonometrico. Serie di Fourier in una o più
5.5.1 Completezza del sistema trigonometrico . . . .
5.5.2 Serie di Fourier in più variabili . . . . . . . . .
Base di Haar e wavelets . . . . . . . . . . . . . . . . .
. . . . .
variabili
. . . . .
. . . . .
. . . . .
.
.
.
.
.
203
205
205
209
211
6 Applicazioni dei metodi di ortogonalità a problemi di¤erenziali216
6.1 Problemi di Sturm-Liouville e polinomi ortogonali . . . . . . . . 216
6.2 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228
6.3 Laplaciano in coordinate sferiche. Polinomi di Legendre e armoniche sferiche . . . . . . . . . . . . . . . . . . . . . . . . . . . 230
6.3.1 Il dato indipendente dalla longitudine. Polinomi di Legendre233
6.3.2 Il caso generale. Funzioni di Legendre associate e armoniche sferiche . . . . . . . . . . . . . . . . . . . . . . . 235
6.3.3 Soluzione del problema di Dirichlet per l’equazione di Laplace
sulla sfera . . . . . . . . . . . . . . . . . . . . . . . . . . . 241
6.4 Oscillatore armonico quantistico e polinomi di Hermite . . . . . . 243
6.5 Il problema agli autovalori per il laplaciano (equazione di Helmholz)
e le sue applicazioni . . . . . . . . . . . . . . . . . . . . . . . . . 249
6.6 L’equazione di Helmholz sul rettangolo . . . . . . . . . . . . . . . 252
6.6.1 Membrana vibrante rettangolare . . . . . . . . . . . . . . 253
6.6.2 Equazione del calore sul rettangolo . . . . . . . . . . . . . 257
6.7 L’equazione di Helmholz sul cerchio. Funzioni di Bessel di ordine
intero . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 257
6.7.1 Equazione di Bessel ed autofunzioni del laplaciano sul
cerchio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 258
6.7.2 La membrana vibrante circolare . . . . . . . . . . . . . . . 263
6.8 Equazione di Helmholz sul cilindro . . . . . . . . . . . . . . . . . 266
6.8.1 L’equazione del calore sul cilindro . . . . . . . . . . . . . 268
6.9 Equazione di Helmholz sulla sfera. Funzioni di Bessel sferiche . . 269
6.9.1 Equazione e funzioni di Bessel di ordine semiintero . . . . 270
6.10 L’equazione di Schrödinger per l’atomo di idrogeno e i polinomi
di Laguerre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 275
6.10.1 Equazione e polinomi di Laguerre associati . . . . . . . . 279
6.10.2 Orbitali atomici . . . . . . . . . . . . . . . . . . . . . . . 283
6.10.3 Soluzioni dell’equazione di Schrödinger . . . . . . . . . . . 288
6.10.4 Calcoli dettagliati per la risoluzione dell’equazione radiale 288
3
Nota bene. Questi appunti integrativi sono messi a disposizione degli
studenti del corso di Metodi Matematici per l’Ingegneria, A.A. 2015/2016 come
materiale complementare. Il programma d’esame, che sarà precisato nell’arco
del corso alla pagina web:
http://www1.mate.polimi.it/~bramanti/corsi/metodi_2016.htm
comprende sia una parte del materiale contenuto nel libro di testo:
G. C. Barozzi: Matematica per l’ingegneria dell’informazione. Zanichelli,
2004
sia una parte del materiale contenuto in questa dispensa. Entrambe le fonti
(libro di testo e dispensa) sono dunque necessarie per l’esame, anche se ognuna
delle due è utilizzata solo in parte. Ho lasciato in questa dispensa (che ha origine
dal corso degli anni passati, con un diverso programma) anche parti che certamente non saranno utilizzate, perché potrebbero servire all’approfondimento o
alla curiosità dello studente interessato.
Questa dispensa va considerata provvisoria, in fase di revisione, e potrà
essere sostituita nell’arco del corso da versioni più aggiornate.
4
1
1.1
Elementi di analisi funzionale
Generalità sugli spazi di funzioni
Cominciamo con l’introdurre o richiamare alcune strutture astratte che si utilizzano per studiare gli spazi di funzioni che sono coinvolti nei problemi analitici
che incontreremo.
1.1.1
Spazi vettoriali
Iniziamo a ricordare la de…nizione di spazio vettoriale che lo studente ha incontrato nello studio dell’algebra lineare.
De…nizione 1.1 (Spazio vettoriale) Uno spazio vettoriale sul campo K (= R o C)
è un insieme X su cui sono de…nite:
1. un’operazione + (“somma di vettori”), che associa ad ogni coppia di
vettori (x; y) un vettore x + y; l’operazione di somma soddisfa le proprietà (per
ogni x; y; z 2 X):
-commutativa: x + y = y + x;
-associativa: x + (y + z) = (x + y) + z;
-esistenza dell’elemento neutro 0; tale che x + 0 = 0 + x = x;
-esistenza dell’opposto x di ogni elemento x, tale che x + ( x) = 0:
2. Un’operazione di prodotto tra un vettore e uno scalare, che associa a
una coppia ( ; x) con 2 K; x 2 X un vettore
x 2 X; l’operazione1 soddisfa
le proprietà (per ogni x; y 2 X; ; 2 K):
-distribuitva del prodotto per uno scalare rispetto alla somma di vettori:
(x + y) = x + y
-distribuitva del prodotto per uno scalare rispetto alla somma di scalari:
( + ) x = x + x;
-pseudoassociativa: ( x) = ( ) x;
-l’elemento neutro del prodotto tra scalari è elemento neutro del prodotto per
uno scalare: 1 x = x:
Ricordiamo che uno spazio X ha dimensione …nita quando esiste un numero
…nito di elementi e1 ; e2 ; :::; en 2 X tali che ogni altro elemento di X è combinazione lineare di questi. Altrimenti si dice che X ha dimensione in…nita. Nel
corso di algebra lineare e geometria lo studente ha incontrato soprattutto spazi
vettoriali di dimensione …nita, come sono gli spazi Rn e Cn , gli spazi di matrici,
gli spazi di polinomi di grado minore o uguale di un n …ssato. In analisi ci
interessano spazi vettoriali di funzioni, e questi sono solitamente di dimensione
in…nita.
De…nizione 1.2 (Spazio di funzioni) Sia
F = ff :
1 Come nell’algebra usuale, il simbolo
sottointeso.
un insieme qualsiasi e sia
! Rg :
di prodotto tra vettore e scalare è comunemente
5
(Si potrebbero considerare anche funzioni a valori in Rn o Cn , ma per semplicità
limitiamoci ora a questo caso). F è uno spazio vettoriale su R, con le operazioni
naturali di somma di funzioni:
(f + g) (x) = f (x) + g (x)
e prodotto di una funzione per uno scalare:
( f ) (x) = f (x) :
La veri…ca delle proprietà delle operazioni richieste dalla de…nizione di spazio
vettoriale è immediata, seguendo queste dalle analoghe proprietà delle operazioni
su numeri reali.
Notiamo che se ad esempio
= (a; b)
R, F ha dimensione in…nita:
non esiste un numero …nito di funzioni di cui tutte le altre siano combinazioni
lineari (ad esempio, le funzioni xn per n = 1; 2; 3; ::: sono un esempio di in…nite
funzioni di cui nessuna è combinazione lineare di un numero …nito delle altre, e
naturalmente esistono funzioni di tipo ancora diverso).
Di solito si studiano spazi di funzioni con qualche proprietà aggiuntiva (ad
esempio funzioni continue, o integrabili, o derivabili...).
Esempio 1.3 C 0 (a; b) = ff : (a; b) ! R : f è continuag è uno spazio vettoriale. Il modo più semplice di dimostrarlo non è veri…care daccapo le proprietà
delle operazioni, ma veri…care che questo sottoinsieme di F(a;b) è un sottospazio
vettoriale. Questo consiste nel veri…care che la combinazione lineare di due elementi di C 0 (a; b) è ancora un elemento di C 0 (a; b), il che segue per le proprietà
note delle funzioni continue.
Puntualizziamo quindi il
Teorema 1.4 (Criterio di riconoscimento dei sottospazi) Dato uno spazio
vettoriale X su K e un sottoinsieme X0 X; X0 risulta un sottospazio vettoriale
(cioè uno spazio vettoriale rispetto alle medesime operazioni) se
x + y 2 X0 per ogni x; y 2 X0 ; ;
2 K:
Esempio 1.5 Applicando il criterio precedente è immediato veri…care che sono
spazi vettoriali i seguenti:
C 0 [a; b] ; insieme delle funzioni continue su [a; b]
C 1 [a; b] ; insieme delle funzioni derivabili con derivata continua su [a; b]
L [a; b] ; insieme delle funzioni limitate su [a; b]
e analoghi spazi di funzioni de…nite su tutto R oppure su un opportuno insieme
Rn .
Invece, non è uno spazio vettoriale l’insieme
P (R) , insieme delle funzioni periodiche su R,
6
in quanto la somma di due funzioni periodiche non sempre è periodica, come
mostra l’esempio
f (x) = sin x + sin ( x) .
Quando in analisi si parla di “spazio di funzioni” solitamente si intende
indicare uno spazio vettoriale, i cui elementi sono funzioni (con qualche proprietà particolare). Nei casi (non così frequenti) in cui ci interessa considerare
un insieme di funzioni che non costituisce uno spazio vettoriale, solitamente
si utilizzano termini come insieme delle funzioni... o classe delle funzioni...,
rinunciando cioè a usare la parola spazio.
Come negli spazi Rn esiste il modulo (o norma) di un vettore, così in molti
spazi vettoriali esiste una norma che consente di misurare la “grandezza”di un
vettore e quindi la distanza tra due vettori:
De…nizione 1.6 (Spazio vettoriale normato) Sia X uno spazio vettoriale
su K. Si dice norma su X una funzione
k k : X ! [0; +1)
che ad ogni vettore associa un numero reale non negativo, con le seguenti proprietà (per ogni x; y 2 X; 2 K):
-proprietà di annullamento: kxk = 0 () x = 0
-omogeneità: k xk = j j kxk
-disuguaglianza triangolare: kx + yk kxk + kyk.
In questo caso (X; k k) si dice spazio vettoriale normato.
Esempio 1.7 1. In Rn la norma usuale è
v
u n
uX
2
jxi j
jxj = t
i=1
che veri…ca le proprietà precedenti. Non è l’unica norma naturale in Rn . Sono
norme anche:
jxj0 =
jxj1 =
max
i=1;2;:::;n
n
X
i=1
jxi j oppure
jxi j :
Si può dimostrare che queste tre norme sono tutte tra loro equivalenti, il che
signi…ca che per certe costanti c1 ; c2 > 0 risulta
c1 jxj0
jxj
c2 jxj0
e analoghe disuguaglianze permettono di confrontare jxj con jxj1 e jxj0 con jxj1 .
2. In C 0 [a; b] possiamo de…nire:
kf kC 0 [a;b] = max jf (x)j ,
x2[a;b]
7
che risulta …nita per ogni f 2 C 0 [a; b] in base al teorema di Weierstrass. E’
immediato veri…care che valgono le proprietà di norma. Analoga norma si può
de…nire più in generale in C 0 (K) dove K è un sottoinsieme chiuso e limitato
di Rn .
3. In C 0 [a; b] possiamo de…nire anche2 :
kf kL1 [a;b] =
Z
a
b
jf (x)j dx.
Anche questa risulta una norma su C 0 [a; b], pur essendo sostanzialmente diversa dalla norma kf kC 0 [a;b] . Le norme k kC 0 e k kL1 non sono equivalenti.
Vediamo quindi che su uno spazio di funzioni, diversamente che in Rn , possono
esistere norme sostanzialmente diverse tra loro.
4. Se provassimo a de…nire la norma kf kC 0 o kf kL1 in C 0 (a; b) (che pure
è uno spazio vettoriale), queste norme non risulterebbero …nite per ogni f 2
C 0 (a; b), in quanto C 0 (a; b) contiene anche funzioni illimitate. Quindi su questo
spazio queste non sarebbero norme. Vediamo quindi che non in ogni spazio
vettoriale esistono norme “naturali”.
1.1.2
Spazi metrici
Una diversa struttura astratta utile in analisi è quello di spazio metrico, che ora
introduciamo.
De…nizione 1.8 (Spazio metrico) Si dice spazio metrico un insieme X dotato di una funzione distanza
d:X
X ! [0; 1]
che soddisfa le seguenti proprietà (per ogni x; y 2 X):
-proprietà di annullamento: d (x; y) = 0 () x = y
-simmetria: d (x; y) = d (y; x)
-disuguaglianza triangolare: d (x; y) d (x; z) + d (z; y).
Notiamo subito che ogni spazio vettoriale normato è uno spazio metrico:
ponendo
d (x; y) = kx yk
si ha che d soddisfa le proprietà della distanza. Tuttavia la struttura di spazio
metrico non presuppone di per sé quella di spazio vettoriale. Ad esempio è
immediata la seguente:
Proposizione 1.9 Se (X; d) è uno spazio metrico e X0
sieme qualsiasi, anche (X0 ; d) è uno spazio metrico.
X un suo sottoin-
2 L’origine del nome L1 dato a questa norma si chiarirà in un prossimo capitolo, parlando
dell’integrale di Lebesgue. Per ora è solo un simbolo come un altro scelto per denotare questa
norma integrale.
8
In particolare: qualunque sottoinsieme di uno spazio vettoriale normato è
uno spazio metrico, pur non essendo più, in generale, uno spazio vettoriale.
Esempio 1.10 1. Sia X un qualunque sottoinsieme di Rn e d (x; y) = jx yj.
Questo è uno spazio metrico (e in generale, non è uno spazio vettoriale).
2. X = C 0 [a; b] con d (f; g) = kf gkC 0 è uno spazio metrico, essendo uno
spazio vettoriale normato.
3. X = f 2 C 0 [a; b] : kf kC 0 1 con d (f; g) = kf gkC 0 è uno spazio
metrico, essendo sottoinsieme di uno spazio vettoriale normato. Non è uno
spazio vettoriale (combinazione lineare di funzioni che soddisfano kf kC 0 1 in
generale non soddisfa la stessa limitazione).
4. X = ff : R ! R : f periodica e limitatag con d (f; g) = kf gkC 0 è uno
spazio metrico. Infatti, anche se la di¤ erenza tra due funzioni periodiche può
non essere periodica, quindi X non è uno spazio vettoriale, è comunque vero che
la di¤ erenza tra due funzioni periodiche e limitate è limitata, quindi kf gkC 0
risulta …nita.
Gli spazi metrici che ci interesseranno nel seguito saranno quasi sempre
sottoinsiemi di uno spazio vettoriale normato.
In tutti gli spazi metrici, quindi in particolare negli spazi vettoriali normati,
si possono introdurre nozioni topologiche in modo analogo a quanto si fa in Rn .
Data la somiglianza di questi concetti con quelli che dovrebbero essere già noti
in Rn non ci so¤ermeremo nell’esempli…care queste nozioni.
De…nizione 1.11 (Intorni sferici) Sia (X; d) uno spazio metrico. Si dice
sfera aperta o intorno sferico di centro x0 2 X e raggio r > 0 l’insieme
Br (x0 ) = fx 2 X : d (x; x0 ) < rg :
De…nizione 1.12 (Tipi di punti di un insieme) Sia (X; d) uno spazio metrico e E X. Un punto x 2 X si dice:
interno ad E se esiste un intorno sferico Br (x) E;
esterno ad E se esiste un intorno sferico Br (x) E c (il simbolo E c indice
il complementare di E; cioè E c = X n E);
di frontiera per E se non è né interno né esterno. Esplicitamente: x è di
frontiera per E se ogni intorno sferico Br (x) contiene un punto y 2 E e un
punto z 2
= E:
De…nizione 1.13 (Tipi di insiemi) Sia (X; d) uno spazio metrico e E
Si dice che:
E è aperto se ogni punto di E è interno ad E;
E è chiuso se il complementare di E è aperto.
X.
Naturalmente un insieme può non essere né aperto né chiuso.
De…nizione 1.14 Sia (X; d) uno spazio metrico e E
X: Si dice che E è
limitato se esiste una sfera (di raggio e centro qualsiasi) Br (x0 ) E.
In particolare in uno spazio vettoriale normato si dice che E è limitato se
esiste K > 0 tale che kxk < K per ogni x 2 E.
9
1.1.3
Limiti di successioni, continuità di funzioni
In ogni spazio metrico, e quindi in particolare negli spazi vettoriali normati, si
può de…nire il concetto di limite di successione:
De…nizione 1.15 (Limite di successione) Sia (X; d) uno spazio metrico e
1
fxn gn=1
X. Si dice che xn ! x se d (xn ; x) ! 0: Esplicitamente, questo
signi…ca che:
per ogni " > 0 esiste n0 tale che per ogni n n0 è xn 2 B" (x) :
Si noti come la convergenza in X è stata ricondotta, via il concetto di distanza, alla convergenza in R. Questo è del resto ciò che si fa anche per de…nire
la convergenza in Rn . Vale naturalmente il teorema di unicità del limite, con
“la solita” dimostrazione.
Molto importante è la prossima proprietà, che getta un ponte tra il concetto
topologico di insieme chiuso e quello di successione convergente:
Teorema 1.16 (Caratterizzazione successionale dei chiusi) Sia (X; d) uno
spazio metrico e C
X: L’insieme C è chiuso se e solo se vale la seguente
proprietà:
1
per ogni successione fxn gn=1 C tale che xn ! x per qualche x 2 X si ha
che x 2 C:
Detto altrimenti: un insieme è chiuso se e solo se contiene i limiti di tutte le
proprie successioni convergenti in X. (Si noti che la successione fxn g per ipotesi
ha limite in X; il punto è che questo limite appartenga in e¤ etti al sottoinsieme
C).
La de…nizione di limite consente di de…nire, al solito modo, il concetto di
funzione continua su uno spazio metrico, a valori reali o in un altro spazio
metrico:
De…nizione 1.17 Siano (X; dX ) ; (Y; dY ) due spazi metrici. Una funzione f :
X ! Y si dice continua in x 2 X se per ogni successione fxn g X tale che
xn ! x in X si ha f (xn ) ! f (x) in Y: Equivalentemente, se per ogni " > 0
esiste > 0 tale che dX (x; x) < =) dY (f (x) ; f (x)) < ":
La funzione f si dice continua in X se è continua in ogni punto x 2 X.
Si possono formulare i concetti topologici di insieme aperto e chiuso in
termini di funzioni continue:
Teorema 1.18 (Insiemi aperti e chiusi de…niti mediante funzioni continue)
Sia (X; d) metrico e f : X ! R continua. Allora gli insiemi:
E1 = fx 2 X : f (x) > 0g
E2 = fx 2 X : f (x) < 0g
E3 = fx 2 X : f (x) 6= 0g
sono aperti; gli insiemi:
E4 = fx 2 X : f (x) 0g
10
E5 = fx 2 X : f (x) 0g
E6 = fx 2 X : f (x) = 0g
sono chiusi.
Esempio 1.19 In uno spazio vettoriale normato (X; k k) gli insiemi
fx 2 X : kxk = 1g ; fx 2 X : kxk
fx 2 X : kxk > 1g è aperto.
1g sono chiusi;
Terminiamo con la seguente
De…nizione 1.20 Sia (X; d) uno spazio metrico. Un sottoinsieme E
X si
dice denso in X se E = X. Equivalentemente: E è denso in X se per ogni
1
x 2 X esiste una successione fxn gn=1 E tale che xn ! x:
Quindi un sottoinsieme denso, pur possedendo meno elementi di X; consente
di approssimare bene quanto vogliamo qualsiasi elemento di X. Ad esempio, Q
è denso in R.
1.1.4
Successioni di Cauchy e completezza
Introduciamo ora un’importante concetto che riguarda il comportamento delle
successioni in uno spazio metrico, in particolare in uno spazio vettoriale normato: la nozione di successione di Cauchy, che servirà a sua volta a evidenziare un’importante proprietà che questi spazi possono avere o non avere: la
completezza.
De…nizione 1.21 (Successione di Cauchy) Sia (X; d) uno spazio metrico e
1
fxn gn=1 X: Si dice che questa successione è di Cauchy se:
8" > 0 9n0 : 8n; m
n0 si ha d (xn ; xm ) < ":
Detto in modo meno preciso ma più intuitivo: una successione è di Cauchy
se i suoi termini sono sempre più vicini tra loro, o anche: se d (xn ; xm ) ! 0 per
n; m ! 1. Per ra¤ronto, si noti che una successione è convergente (a x) se i
suoi termini sono sempre più vicini a x. E’facile allora capire che:
Proposizione 1.22 Se una successione converge in (X; d) ; allora è di Cauchy
in (X; d).
Il fatto che una successione sia di Cauchy è quindi una condizione necessaria,
in ogni spazio metrico, a¢ nché la successione sia convergente. Il fatto che una
successione sia di Cauchy o meno si può veri…care senza sapere preliminarmente
quale sia il “candidato limite” x, mentre per provare che fxn g è convergente
in base alla de…nizione di limite occorre già avere un’idea su quale sia il limite
stesso. Ad ogni modo la condizione necessaria non è in generale su¢ ciente, come
mostra il prossimo
11
n
Esempio 1.23 Sia xn = 1 + n1
per n = 1; 2; 3; ::: E’ noto che xn ! e per
n ! 1, e che e è un numero irrazionale, mentre tutti i numeri xn sono razion1
ali. Dunque la successione fxn gn=1 nello spazio metrico Q non è convergente.
Tuttavia la successione in R è convergente, quindi è di Cauchy; ma allora è
di Cauchy anche in Q, perché la distanza usata in Q ed R è la stessa (quella
euclidea). Abbiamo quindi un esempio, nello spazio metrico Q, di successione
di Cauchy ma non convergente.
Vale anche la seguente semplice
1
Proposizione 1.24 Se una successione fxn gn=1 è di Cauchy in (X; d), allora
è limitata.
Diamo ora la seguente
De…nizione 1.25 (Spazio metrico completo) Uno spazio metrico (X; d) si
dice completo se ogni successione di Cauchy in X è convergente in X.
Quindi negli spazi metrici completi la condizione di Cauchy risulta equivalente alla convergenza. In uno spazio completo se veri…chiamo che una successione è di Cauchy (il che, ricordiamolo ancora, non richiede la previa conoscenza
del candidato limite) ne segue che esiste un elemento x 2 X a cui la successione
converge. La completezza dello spazio è un’ipotesi importante nei teoremi di
esistenza dell’analisi matematica.
L’Esempio 1.23 mostra che lo spazio metrico Q non è completo. Vale invece
il seguente fondamentale
Teorema 1.26 Rn è completo.
Tornando agli spazi metrici qualsiasi proviamo ora che:
Teorema 1.27 Se (X; d) è uno spazio metrico completo e C
chiuso. Allora (C; d) è uno spazio metrico completo.
X è un insieme
Ad esempio, ogni sottoinsieme chiuso di Rn è uno spazio metrico completo.
De…nizione 1.28 (Spazio di Banach) Uno spazio vettoriale normato, completo rispetto alla distanza della norma, si dice spazio di Banach.
Ad esempio Rn è uno spazio di Banach. Un sottoinsieme chiuso di Rn ,
invece, è uno spazio metrico completo ma non è uno spazio di Banach perché
non è uno spazio vettoriale.
La cosa importante per dimostrare teoremi di esistenza per problemi di
analisi è trovare spazi di funzioni (quindi in…nito dimensionali) che siano di
Banach.
12
Esempio 1.29 Consideriamo lo spazio C 0 [ 1; 1] con la norma integrale:
kf kL1 [
1;1]
=
Z
1
1
jf (x)j dx:
Mostriamo che non è completo. Consideriamo la successione:
p
n
x
se x 0
p
fn (x) =
n
x se x 0:
La successione è di Cauchy. Infatti per n > m si ha:
Z 1
Z
kfn fm kL1 [ 1;1] =
jfn (x) fm (x)j dx = 2
1
=2
1
1+
1
p
n
x
p
m
x dx
0
1
n
1
1
1+ m
! 0 per n; m ! 1:
D’altro canto la successione non converge ad alcun elemento dello spazio. Questa
a¤ ermazione non è facile da giusti…care rigorosamente a questo livello del corso.
In sostanza, tuttavia, il ragionamento è il seguente: la successione converge (con
questa norma) alla funzione limite
fn (x) =
1
1
se x > 0
se x > 0
che è discontinua, ossia non sta nello spazio considerato. Perciò, in questo
spazio, la successione non converge.
L’esempio precedente mostra che garantire la completezza di uno spazio di
funzioni non è scontato, e in particolare dipende in modo cruciale dalla norma
che si considera. Nel seguito ci occuperemo di spazi di funzioni continue e
derivabili e mostreremo la loro completezza, nella norma opportuna.
Successivamente ci occuperemo di spazi di funzioni integrabili, gli spazi di
Lebesgue, e mostreremo come per ottenere spazi di Banach di questo tipo sia
stato necessario sviluppare un nuovo tipo di integrale. Questo ci porterà ad
accennare alla teoria della misura e dell’integrazione nata all’inizio del 1900, su
cui si basa ad esempio lo studio moderno delle equazioni alle derivate parziali,
dell’analisi armonica, del calcolo delle variazioni.
1.2
Convergenza uniforme per successioni e serie di funzioni
Molti procedimenti risolutivi per i problemi di¤erenziali che studieremo porteranno a rappresentare la soluzione cercata come somma di una serie di funzioni.
Per garantire che la funzione così ottenuta abbia le proprietà richieste occorre
sapere quando una data serie di funzioni rappresenta una funzione continua,
quando rappresenta una funzione derivabile, e come si possono calcolarne le
13
derivate. Un concetto chiave in questa direzione è quello di convergenza uniforme, che ora discuteremo, prima per successioni e poi per serie. Questo sarà
anche lo strumento per dimostrare che gli spazi di funzioni C 0 [a; b] ; C k [a; b] ; e
i loro analoghi per funzioni di più variabili, sono spazi di Banach.
1.2.1
Successioni di funzioni: convergenza puntuale e uniforme
De…nizione 1.30 (Convergenza puntuale) Sia fn : I ! R per n = 1; 2; 3; :::
1
con I R o in Rn . Si dice che la successione ffn gn=1 converge in x0 2 I se la
1
1
successione reale ffn (x0 )gn=1 è convergente; si dice che la successione ffn gn=1
converge puntualmente in I se converge in x0 per ogni x0 2 I: In questo caso
risulta de…nita una nuova funzione f : I ! R, f (x) = limn!1 fn (x), detta
1
limite puntuale della successione ffn gn=1 in I.
La nozione di convergenza puntuale è semplice ma anche molto debole. Ci
si rende conto facilmente, infatti, che il limite puntuale di una successione di
funzioni talvolta non “eredita”le buone proprietà possedute dalle fn . I prossimi
esempi vogliono illustrare i tipi di fenomeni che si possono presentare.
Esempio 1.31 Sia fn (x) = xn in [0; 1).
8
< 0 se x 2 [0; 1)
1 se x = 1
fn (x) !
:
+1 se x > 1:
La successione converge puntualmente solo nell’intervallo [0; 1], in cui risulta
de…nita la funzione limite puntuale
f (x) =
0 se x 2 [0; 1)
1 se x = 1:
Osserviamo che in questo caso il limite puntuale è una funzione discontinua,
sebbene le fn siano tutte funzioni continue.
p
Esempio 1.32 Sia fn (x) = n jxjsgn(x) in [ 1; 1].
8
< 1 se x 2 (0; 1]
0 se x = 0
fn (x) !
:
1 se x 2 [ 1; 0):
Anche in questo caso il limite puntuale è una funzione discontinua, sebbene le
fn siano tutte funzioni continue.
Esempio 1.33 Sia fn : [0; +1) ! R de…nita per n = 1; 2; 3; :::da:
fn (x) =
1
x
per x 2 [ n1 ; 1)
nx per x 2 0; n1 :
14
Si ha:
1
x
per x 2 (0; 1)
0 per x = 0:
fn (x) !
In questo caso il limite puntuale di una successione di funzioni continue e limitate è una funzione discontinua e illimitata. (Si noti che il limite è …nito in
ogni punto).
Esempio 1.34 Sappiamo che l’insieme Q\ [0; 1] è numerabile, perciò possiamo
1
elencare i suoi elementi in una successione3 fxn gn=1 . Sia ora:
1 se x = x1 ; x2 ; x3 ; :::; xn
0 altrimenti.
fn (x) =
Si ha:
fn (x) !
1 se x 2 Q
0 altrimenti.
Si noti che ogni funzione fn : [0; 1] ! R è continua tranne che in n punti;
in particolare è Riemann integrabile. Invece la funzione limite f [0; 1] ! R è
discontinua in tutti i punti e non è Riemann integrabile.
Esempio 1.35 Sia fn : R ! R de…nita per n = 1; 2; 3; ::: da
1
1+ n
fn (x) = jxj
:
Si ha:
fn (x) ! jxj :
1
Notiamo che ogni fn è derivabile: fn0 (x) = 1 + n1 jxj n sgn(x), in particolare
esiste fn0 (0) = 0 e si ha fn 2 C 1 (R), mentre il limite puntuale f non è derivabile
in x = 0. Si ha f 2 C 0 (R) n C 1 (R) :
La morale di questi esempi è: in generale la convergenza puntuale di una
successione di funzioni non permette di a¤ermare che la funzione limite f abbia
le “buone proprietà” delle singole fn . Per poter provare dei risultati che permettono di trasferire proprietà delle fn alla f è necessario introdurre e studiare
una nozione più forte delle convergenza puntuale: la convergenza uniforme, che
ora introduciamo.
De…nizione 1.36 (Convergenza uniforme) Sia fn : I ! R per n = 1; 2; 3; :::
1
con I R o in Rn . Si dice che la successione ffn gn=1 converge uniformemente
in I alla funzione f : I ! R se
sup jfn (x)
x2I
f (x)j ! 0 per n ! +1
ossia se
8" > 0 9n0 tale che n
n0 =) jfn (x)
f (x)j < " 8x 2 I:
3 Non si tratterà di una successione monotona. Ad esempio, i suoi primi termini potrebbero
essere:
0; 1; 1=2; 1=3; 2=3; 1=4; 3=4; 1=5; 2=5; :::
15
A titolo di confronto, notiamo che invece a¤ermare che fn ! f puntualmente
in I signi…ca che
8x 2 I; 8" > 0 9n0 tale che n
n0 =) jfn (x)
f (x)j < ":
Dal punto di vista logico, la di¤erenza sta tutta nella posizione del quanti…catore
“8x 2 I”; nel caso della convergenza puntuale, a¤ermare che per ogni x e
per ogni " esiste n0 tale che..., implicitamente signi…ca che il numero n0 può
dipendere anche da x (oltre che da "); nel caso della convergenza uniforme invece
l’ordine dei quanti…catori ci dice che n0 non dipende da x. Questo si traduce
nel fatto che la distanza tra il gra…co di fn e quello di f diventa uniformemente
piccolo; precisamente, tutto il gra…co di fn (x) in I è compreso nella striscia
(f (x) "; f (x) + ") non appena n n0 .
1+1=n
Esempio 1.37 La successione fn (x) = jxj
converge uniformemente in
[ 1; 1] a f (x) = jxj. (Questa a¤ ermazione sarà provata in un esempio successivo). Illustriamo il signi…cato geometrico di questa a¤ ermazione. Tracciamo
per prima cosa il gra…co di f insieme al gra…co delle prime fn :
Ora tracciamo il gra…co di f (x) insieme a quello di f (x) + 0:1 e f (x) 0:1;
ottenendo così una striscia in cui devono essere contenuti i gra…ci interi delle
16
funzioni fn ; almeno per n abbastanza grande:
f1 non sta nella striscia
f2 non sta nella striscia
f3 sta nella striscia
f4 sta nella striscia, e così via
p
Esempio 1.38 La successione fn (x) = n jxjsgn(x) converge a
8
< 1 se x 2 (0; 1]
0 se x = 0
f (x) =
:
1 se x 2 [ 1; 0):
(come già visto nell’Esempio 1.32). Mostriamo che la convergenza non è uniforme. Come sopra, tracciamo per prima cosa il gra…co di f insieme al gra…co
delle prime fn :
17
Ora tracciamo il gra…co di f (x) insieme a quello di f (x) + 0:1 e f (x) 0:1,
ottenendo così una striscia in cui devono essere contenuti i gra…ci interi delle
funzioni fn ; almeno per n abbastanza grande:
f1 non sta nella striscia
f3 non sta nella striscia
f6 non sta nella striscia
f10 non sta nella striscia
e si capisce che anche aumentando l’indice n non è possibile che il gra…co intero
sia contenuto nella striscia. Infatti il gra…co di ogni fn è continuo, perciò non
può entrare nei due pezzi di striscia, che sono tra loro discosti.
Si noti anche che:
fn ! f uniformemente in I () kfn
f kC 0 (I) ! 0:
In altre parole, la norma C 0 (I) è la norma della convergenza uniforme. Si
osservi tuttavia che la nozione di convergenza uniforme si può applicare anche
a funzioni discontinue. In altre parole qui stiamo usando la norma di C 0 (I) per
calcolare la distanza tra due funzioni qualsiasi de…nite su I (e naturalmente tale
distanza non sempre è …nita).
Vediamo ora alcuni risultati che mostrano come per una successione di funzioni uniformemente convergente alcune buone proprietà delle fn si trasferiscano
al limite f .
Teorema 1.39 (Convergenza uniforme e continuità) Siano fn : I ! R,
con I
Rn , funzioni continue in un certo punto x 2 I per n = 1; 2; 3:::; e
supponiamo che fn ! f uniformemente in I. Allora f è continua in x. Se le
fn sono continue in tutto I, anche f è continua in I.
18
Dimostrazione. Proviamo che f è continua in x 2 I in cui sono continue tutte
le fn . Scriviamo anzitutto
jf (x)
f (x)j
jf (x)
fn (x)j + jfn (x)
fn (x)j + jfn (x)
f (x)j ;
con un n che ora sceglieremo. Per " > 0 …ssato, per de…nizione di convergenza uniforme esiste n0 tale che per ogni n
n0 si ha jf (x) fn (x)j < ": In
particolare allora si ha:
jf (x)
f (x)j
" + jfn0 (x)
fn0 (x)j + ":
Poiché fn0 è continua in x, …ssato " > 0 esiste > 0 tale che jx
jfn0 (x) fn0 (x)j < ": Allora per jx xj < si ha
jf (x)
f (x)j
xj <
=)
3";
e f è continua in x.
Teorema 1.40 (Convergenza uniforme e limitatezza) Siano fn : I ! R,
con I
Rn , funzioni limitate per n = 1; 2; 3:::; e supponiamo che fn ! f
uniformemente in I. Allora f è limitata in I.
Teorema 1.41 (Convergenza uniforme e integrabilità) Siano fn : [a; b] !
R, funzioni limitate e Riemann integrabili per n = 1; 2; 3:::; e supponiamo che
fn ! f uniformemente in I. Allora f è (limitata e) Riemann integrabile in
[a; b]. Inoltre
Z b
Z b
fn (x) dx !
f (x) dx:
a
a
Dimostrazione. Non dimostriamo la Riemann integrabilità di f (questo potrà
essere fatto più facilmente in seguito utilizzando la teoria dell’integrale di Lebesgue),
ma mostriamo la convergenza degli integrali. Si ha:
Z b
Z b
Z b
fn (x) dx
f (x) dx =
[fn (x) f (x)] dx
a
a
Z
a
a
b
jfn (x)
f (x)j dx
sup jfn (t)
f (t)j (b
a)
t2(a;b)
e per la convergenza uniforme, supt2(a;b) jfn (t) f (t)j ! 0:
E’interessante rileggere alla luce di questi teoremi gli esempi presentati in
precedenza: negli esempi 1.31 e 1.32 una successione di funzioni continue converge a una funzione discontinua; nell’esempio 1.33 una successione di funzioni
limitate converge a una funzione illimitata; nell’esempio 1.34 una successione
di funzioni Riemann integrabili converge a una funzione non integrabile. Evidentemente in tutti questi esempi la convergenza non è uniforme. Si invita il
lettore a rendersene conto ragionando sul gra…co delle funzioni e sul signi…cato
geometrico di convergenza uniforme.
Illustriamo ora un criterio che sarà utile a provare la completezza degli spazi
di funzioni continue.
19
Teorema 1.42 (Condizione di Cauchy per la convergenza uniforme) Siano
fn : I ! R, con I
Rn , per n = 1; 2; 3::: e supponiamo che valga la seguente
condizione di Cauchy:
8" > 09n0 tale che 8n; m
n0 ; 8x 2 I risulta jfn (x)
fm (x)j < ":
(1.1)
Allora la successione fn converge uniformemente in I ad una certa funzione
f : I ! R. Viceversa, se fn converge uniformemente in I ad una certa funzione
f : I ! R; allora vale la (1.1).
L’ipotesi del teorema si chiama appunto condizione di Cauchy per la convergenza uniforme, e si può scrivere anche così:
8" > 09n0 tale che 8n; m
n0 ; 8x 2 I risulta kfn
fm k1 < ":
(1.2)
Dimostrazione. Assumiamo che valga la (1.1). Allora per ogni x 2 I …ssato,
1
la successione reale ffn (x)gn=1 risulta di Cauchy. Quindi, per la completezza
di R, fn (x) converge a un limite, che chiameremo f (x). Risulta così de…nita
una funzione che è limite puntuale delle fn . Dobbiamo provare che è anche
limite uniforme. Fissato " > 0 applichiamo l’ipotesi (1.1) e nella disuguaglianza
jfn (x) fm (x)j < " passiamo al limite per m ! 1; poiché fm (x) ! f (x), per
il teorema di permanenza del segno si ha:
jfn (x)
f (x)j
"
8x 2 I:
Quindi …ssato " > 0 esiste n0 tale che per ogni n n0 risulta jfn (x) f (x)j < "
per ogni x 2 I, perciò fn ! f uniformemente, che è la tesi.
Viceversa, se la successione converge uniformemente, cioè converge nella
norma k k1 ; allora è di Cauchy in norma k k1 (stessa dimostrazione vista per
provare che in uno spazio metrico una successione convergente è di Cauchy),
quindi vale la (1.1).
Possiamo ora provare il primo risultato fondamentale di completezza di uno
spazio di funzioni:
Teorema 1.43 Sia K
Rn un insieme chiuso e limitato. Allora lo spazio
0
vettoriale normato C (K) (delle funzioni f : K ! R continue, con la norma
k kC 0 (K) ) è completo, cioè è uno spazio di Banach.
Dimostrazione. Ricordiamo anzitutto che l’ipotesi K chiuso e limitato serve a
garantire che le funzioni in C 0 (K) siano limitate (per il teorema di Weierstrass)
e quindi la loro norma k kC 0 (K) sia …nita.
1
Sia ffn gn=1
C 0 (K) una successione di Cauchy in C 0 (K) , e proviamo
0
che converge in C (K). Dire che è di Cauchy nello spazio vettoriale normato
C 0 (K) signi…ca dire che vale la (1.2), quindi la (1.1); perciò per il Teorema
1
1.42 ffn gn=1 converge uniformemente, cioè in norma k kC 0 (K) , a una certa f .
D’altro canto, essendo limite uniforme di funzioni continue, per il Teorema 1.39
anche f 2 C 0 (K). Quindi fn ! f in C 0 (K), e C 0 (K) è completo.
20
1.2.2
Successioni di funzioni e derivazione
Vorremmo ora dimostrare che analoghi spazi di funzioni derivabili sono completi.
Ragioniamo sullo spazio C 1 [a; b], che si può vedere come sottospazio vettoriale
di C 0 [a; b]. Sappiamo che un sottoinsieme chiuso di uno spazio metrico completo è completo, quindi se mettiamo in C 1 [a; b] la norma k kC 0 [a;b] possiamo
vedere
C 1 [a; b] ; k kC 0 [a;b]
come sottoinsieme dello spazio metrico completo
C 0 [a; b] ; k kC 0 [a;b] . Se questo risulta chiuso, allora è completo. Non è così
però, come mostra il prossimo
1
1+ n
Esempio 1.44 Sia fn (x) = jxj
1; 2; 3; :::; con
fn0 (x) =
1+
1
n
in [ 1; 1] : Si ha fn 2 C 1 [ 1; 1] per n =
1
jxj n sgn (x) per x 6= 0; fn0 (0) = 0:
Risulta: fn (x) ! f (x) = jxj per x ! 1. Si veri…ca inoltre che questa
convergenza è uniforme, infatti:
max jfn (x)
f (x)j = per simmetria
x2[ 1;1]
= max
x2[0;1]
Ora cerchiamo il massimo di g (x) = x
g 0 (x) = 1
1+
1
1 + n1
x
max g (x) = g
x2[0;1]
=
1
n
1
x1+ n .
0 per
n
1
1 + n1
1
1 + n1
1
xn
1
x1+ n :
x
n
!
1
=
n
1 + n1
!
1
n 1 + n1
n
1
1
1+
1
n
!
1
! 0:
en
Pertanto fn ! f uniformemente in C 0 [ 1; 1], ossia fn ! f in norma C 0 [ 1; 1] :
Tuttavia il limite f non appartiene a C 1 [ 1; 1] (f (x) = jxj non è derivabile in
0), quindi C 1 [ 1; 1] non è un sottoinsieme chiuso di C 0 [ 1; 1]. Inoltre: poiché
fn ! f in norma C 0 [ 1; 1] ; fn è di Cauchy in norma C 0 [ 1; 1] e dunque è di
Cauchy anche in C 1 [ 1; 1] ; k kC 0 [ 1;1] , ma non converge in C 1 [ 1; 1] perché
f non sta in questo spazio. Pertanto lo spazio
completo.
21
C 1 [ 1; 1] ; k kC 0 [
1;1]
non è
Si presti attenzione al signi…cato dell’esempio precedente, che mostra due
cose distinte:
1. Lo spazio vettoriale normato C 1 [ 1; 1] ; k kC 0 [ 1;1] non è completo.
2. Lo spazio C 1 [ 1; 1] ; k kC 0 [
, visto come sottoinsieme dello spazio
1;1]
metrico C 0 [ 1; 1] ; k kC 0 [ 1;1] , non è chiuso.
La seconda cosa è in un certo senso la giusti…cazione intuitiva della prima. Una successione di Cauchy in C 1 [ 1; 1] ; k kC 0 [ 1;1] è anche di Cauchy
in
C 0 [ 1; 1] ; k kC 0 [
1;1]
, pertanto in questo secondo spazio converge per-
ché questo spazio è completo; il limite sta in C 0 [ 1; 1] ma non necessariamente in C 1 [ 1; 1]; in quest’ultimo caso abbiamo una successione di Cauchy in
C 1 [ 1; 1] ; k kC 0 [ 1;1] ma non convergente in questo spazio.
All’origine di questo problema sta il fatto che stiamo mettendo in C 1 [ 1; 1]
la norma sbagliata: quella k kC 0 [ 1;1] , che dà un controllo sulla f ma non su f 0 .
L’idea è che se vogliamo sperare che uno spazio vettoriale normato di funzioni sia
completo, la norma deve controllare le proprietà importanti della funzione che
determinano l’appartenenza allo spazio stesso: se stiamo studiando uno spazio
di funzioni derivabili, a¢ nché sia completo sarà necessario mettere una norma
che controlli anche la derivata; se studiamo uno spazio di funzioni integrabili,
a¢ nché sia completo sarà necessario mettere una norma che controlli l’integrale,
e così via.
Facciamo anche la seguente ulteriore osservazione. Nell’esempio appena
considerato, fn ! f uniformemente, ma
fn0 (x) =
1+
1
n
1
jxj n sgn (x) ! sgn (x) (per x 6= 0),
e questa convergenza non è certamente uniforme, dal momento che le fn0 sono
continue mentre il loro limite è discontinuo. Questo suggerisce che per conservare la derivabilità del limite della successione occorra richiedere la convergenza
uniforme delle derivate. E’quanto a¤erma il prossimo teorema:
Teorema 1.45 (Convergenza uniforme e derivabilità) Sia fn : [a; b] !
R, fn 2 C 1 [a; b] e supponiamo che:
1. La successione fn0 converge uniformemente in [a; b] a una certa funzione
g.
2. La successione fn converge puntualmente in [a; b] a una certa funzione f .
Allora:
La successione fn converge uniformemente in [a; b] a f 2 C 1 [a; b], e f 0 = g:
Schematicamente:
se ffn g converge puntualmente e ffn0 g converge uniformemente, allora
lim fn
n!1
0
= lim fn0 :
n!1
22
Dimostrazione. Poiché fn0 ! g uniformemente in [a; b] e le fn0 sono continue,
per i teoremi già visti la g è continua e
Z x
Z x
0
fn (t) dt !
g (t) dt 8x 2 (a; b)
a
a
(se la convergenza è uniforme in [a; b], a maggior ragione lo è in [a; x] per x 2
(a; b)), ossia (per il teorema fondamentale del calcolo integrale)
Z x
g (t) dt = lim [fn (x) fn (a)] = f (x) f (a) ;
n!1
a
poiché fn ! f puntualmente. Ma essendo g continua, la funzione integrale
Z x
g (t) dt
a
1
è C (a; b) e vale
d
(f (x)
dx
d
f (a)) =
dx
Z
x
g (t) dt = g (x)
a
ossia f 0 = g. In particolare, f 2 C 1 [a; b]. In…ne, la convergenza di fn a f è
uniforme perché
fn (x)
f (x) = fn (x) fn (a) + fn (a) f (a) + f (a)
Z x
=
[fn0 (t) f 0 (t)] dt + fn (a) f (a) ;
f (x)
a
quindi
jfn (x)
f (x)j
sup jfn0 (t)
f 0 (t)j (x
t2(a;b)
a) + jfn (a)
f (a)j ;
e il secondo membro è minore di " > 0 pre…ssato per n abbastanza grande
(indipendentemente da x, che a secondo membro non compare).
Dal teorema precedente segue il prossimo risultato fondamentale:
Teorema 1.46 Lo spazio C 1 [a; b] ; con la norma
kf kC 1 [a;b] = kf kC 0 [a;b] + kf 0 kC 0 [a;b]
è di Banach.
1
Dimostrazione. Sia ffn gn=1 una successione di Cauchy in C 1 [a; b] : Per
1
1
de…nizione di norma kf kC 1 [a;b] ; questo signi…ca che sia ffn gn=1 che ffn0 gn=1
soddisfano la condizione di Cauchy per la convergenza uniforme; pertanto esistono f; g 2 C 0 [a; b] tali che fn ! f uniformemente e fn0 ! g uniformemente
in [a; b] : Per il teorema precedente, questo implica che f 2 C 1 [a; b] e f 0 = g;
dunque
kfn f kC 0 [a;b] ! 0 e kfn0 f 0 kC 0 [a;b] ! 0;
23
ossia fn ! f in C 1 [a; b].
Questi risultati si possono generalizzare a funzioni di classe C k anche in più
variabili. De…niamo quindi con precisione gli spazi vettoriali normati classici di
funzioni derivabili:
De…nizione 1.47 (Spazi C k ) Sia
Rn un aperto limitato. Ricordiamo
anzitutto la scrittura a multiindice per le derivate parziali di qualsiasi ordine di
una funzione reale di n variabili:
= ( 1 ; 2 ; :::; n ) ; dove i sono interi
j j = 1 + 2 + ::: + n ; allora
@ f (x) =
@
1
x1
0 e poniamo
@j jf
(x) :
@x22 :::@xnn
Per k = 1; 2; 3; ::: de…niamo:
Ck
= f:
! R : f 2 C0
e @ f 2 C0
Poniamo
kf kC k ( ) = kf kC 0 ( ) +
k X
X
j=1 j j=j
8
con j j
k
:
k@ f kC 0 ( ) :
Osservazione 1.48 (Perché ?) Si noti che mentre lo spazio C 0 (K) è de…nito con K sottoinsieme chiuso e limitato di Rn , perché in base al teorema di
Weierstrass questo è su¢ ciente a garantire la …nitezza della norma kf kC 0 (K) ;
per calcolare le derivate parziali di f abbiamo bisogno di essere in un insieme
aperto; partiamo perciò da un insieme aperto e limitato , la cui chiusura è
un insieme chiuso e limitato; f si suppone de…nita e continua in ; le derivate
parziali di f esistono in
e si suppone si possano prolungare con continuità
…no al bordo di ; a questo modo f e le @ f sono continue sul chiuso e limitato
; quindi kf kC k ( ) è …nita.
Valgono i seguenti risultati:
Teorema 1.49 Gli spazi C k
sopra de…niti sono di Banach.
Teorema 1.50 (Convergenza uniforme e derivate parziali) Sia fk : !
R, per k = 1; 2; 3; :::; con
Rn aperto, supponiamo che per ogni k sia
@fk
0
fk ; @xi 2 C
per un certo i = 1; 2; :::; n; e supponiamo che:
k
1. La successione @f
a una certa funzione g.
@xi converge uniformemente in
2. La successione fk converge in almeno un punto x0 2 .
Allora:
La successione fk converge uniformemente in a una certa f 2 C 0
ed
@f
esiste @x
=
g:
i
24
1.2.3
Serie di funzioni: convergenza puntuale e uniforme
La nozione di convergenza uniforme e i teoremi precedenti si possono interpretare in particolare per le serie di funzioni.
De…nizione 1.51 (Convergenza di una serie di funzioni) Sia fn : I ! R
per n = 1; 2; 3; ::: con I R o in Rn . Si dice che la serie di funzioni
1
X
fn (x)
n=1
converge in x0 2 I, oppure converge puntualmente in I, oppure converge uniformemente in I se la successione delle somme parziali
sn (x) =
n
X
fk (x)
k=1
converge in x0 2 I, oppure converge puntualmente in I, oppure converge uniformemente in I, rispettivamente.
Si dice che la serie di funzioni
1
X
fn (x)
n=1
converge assolutamente (in un punto x0 o in un insieme I) se la serie di funzioni
1
X
n=1
jfn (x)j
converge (in x0 o in I rispettivamente), cioè se la successione delle somme
parziali
n
X
Sn (x) =
jfk (x)j :
k=1
Come per le serie numeriche, se una serie di funzioni converge assolutamente
(in x0 o in I) allora converge puntualmente (in x0 o in I).
Come per le successioni di funzioni, se una serie converge uniformemente
allora converge puntualmente.
Una condizione su¢ ciente molto utile talvolta a stabilire la convergenza
uniforme di una serie è la convergenza totale:
De…nizione 1.52 (Convergenza totale di una serie di funzioni) Sia fn :
I ! R per n = 1; 2; 3; ::: con I R o in Rn . Si dice che la serie di funzioni
1
X
fn (x)
n=1
25
1
converge totalmente in I se esiste una successione fan gn=1 di costanti positive,
tale che:
1)
jfn (x)j an per ogni n; per ogni x 2 I;
2)
1
X
n=1
Esempio 1.53 La serie
an < 1:
1
X
sin (nx)
n2
n=1
converge totalmente in R perché
sin (nx)
n2
e
1
n2
1
X
1
< 1:
n2
n=1
La serie
1
X
sin (nx)
n
n=1
non converge totalmente in R in quanto la più piccola successione numerica an
per cui sia vero che
sin (nx)
n
an per ogni x 2 R
è an = 1=n (basta porre x = =2n nella disuguaglianza
P1
canto n=1 n1 diverge.
sin(nx)
n
an ) e d’altro
Si noti che si parla di convergenza totale o di convergenza uniforme in un
insieme I (non in un singolo punto x0 ).
Vale la
Proposizione 1.54 (Criterio della convergenza totale) Se una serie di funzioni converge totalmente in un insieme I, allora converge assolutamente e
uniformemente in I.
Possiamo ora applicare alle serie di funzioni i teoremi visti per le successioni di funzioni: è su¢ ciente vedere la somma di una serie come limite della successione delle somme parziali per ottenere immediatamente i seguenti
teoremi.
26
Teorema 1.55 (Convergenza uniforme e continuità) Siano fn : I ! R,
con I Rn , funzioni continue per n = 1; 2; 3:::; e supponiamo che la serie
1
X
fn (x)
n=1
converga uniformemente in I, con somma f (x). Allora f è continua in I.
Teorema 1.56 (Convergenza uniforme e integrabilità) Siano fn : [a; b] !
R, funzioni limitate e Riemann integrabili per n = 1; 2; 3:::; e supponiamo che
la serie
1
X
fn (x)
n=1
converga uniformemente in I, con somma f (x). Allora f è (limitata e) Riemann integrabile in [a; b].
Teorema 1.57 (Convergenza uniforme e derivate parziali) Sia fk : !
R, per k = 1; 2; 3; :::; con
Rn aperto, supponiamo che per ogni k sia
@fk
0
fk ; @xi 2 C
per un certo i = 1; 2; :::; n; e supponiamo che:
P1 @fk
1. La serie k=1 @xi converge uniformemente in a una certa funzione g.
P1
2. La serie k=1 fk converge in almeno un punto x0 2 .
Allora: P
1
ed
La serie k=1 fk converge uniformemente in a una certa f 2 C 0
@f
esiste @xi = g; continua.
3. Se questo discorso vale ogni i = 1; 2; :::; n; si deduce che f 2 C 1 ( ).
Schematicamente:
P1
P1 @fk
se
k=1 fk converge puntualmente e
k=1 @xi converge uniformemente,
allora
!
1
1
X
X
@
@fk
fk =
:
@xi
@xi
k=1
k=1
Esempio 1.58 Consideriamo la serie di funzioni
1
X
e
n=1
nt
sin (nx)
n2
de…nita per x 2 [0; ] ; t 2 [0; 1]. Studiamo la continuità e derivabilità di questa
serie (cioè: della funzione somma di questa serie, dopo che avremo veri…cato
che la serie e¤ ettivamente converge).
Le funzioni
e nt sin (nx)
fn (x; t) =
n2
27
sono continue e derivabili in…nite volte nell’insieme Q = [0; ] [0; 1]. Per
studiare la convergenza della serie applichiamo il criterio della convergenza
totale:
e nt sin (nx)
1
per ogni (x; t) 2 [0; ] [0; 1] :
2
n
n2
P 1
Poiché
n2 converge, la serie di partenza converge totalmente e quindi uniformemente in Q, e poiché le fn sono continue, la somma della serie
u (x; t) =
1
X
e
nt
n=1
sin (nx)
n2
è una funzione continua in Q (Teorema 1.55).
Vediamo se u è derivabile. Consideriamo le serie delle derivate parziali:
1
X
@
@x
n=1
1
X
@
@t
n=1
e
nt
e
nt
sin (nx)
n2
=
sin (nx)
n2
=
1
X
e
n=1
1
X
nt
e
cos (nx)
n
nt
n=1
sin (nx)
:
n
In base al teorema visto, potremmo garantire che u è derivabile e che la serie si
può derivare termine a termine se sapessimo che queste serie convergono uniformemente. Entrambe le serie però non convergono totalmente in Q; inoltre,
la prima serie per x = 0; t = 0 diverge addirittura; la seconda serie per t = 0 diP1
che converge puntualmente per il criterio di Dirichlet4 ma
venta n=1 sin(nx)
n
sembra improbabile che converga uniformemente. Quindi non ci sono speranze
di provare che u sia derivabile in tutto l’insieme Q.
La situazione cambia drasticamente se ci mettiamo nel sottoinsieme Q =
[0; ] [ ; 1] ; cioè se studiamo u per t discosto da zero. Infatti in questo caso
l’esponenziale e nt
e n aiuta molto la convergenza della serie. Possiamo
scrivere che per (x; t) 2 Q si ha:
Pe
e
nt
e
nt
cos (nx)
n
e
sin (nx)
n
e
n
n
n
n
n
converge, le serie delle derivate parziali prime rispetto a x e
e poiché
n
rispetto a t convergono totalmente, e quindi uniformemente, in Q . Ne segue
che, in Q , la u è derivabile, con
1
X
@u
e
(x; t) =
@x
n=1
4 v.
1
X
@u
(x; t) =
@t
n=1
[An2], Proposizione 7.1. p.369.
28
nt
e
cos (nx)
n
nt
sin (nx)
:
n
Il discorso si può iterare a ogni ordine di derivata. Ad esempio,
1
X
@2
@x2
n=1
1
X
@2
@x3
n=1
e
e
nt
nt
sin (nx)
n2
=
sin (nx)
n2
=
1
X
n=1
1
X
e
ne
nt
sin (nx)
nt
cos (nx)
n=1
convergono ancora totalmente in Q . Concludiamo che u (x; t) è in…nitamente
derivabile in Q . E poiché questo vale per ogni > 0, in realtà u è in…nitamente
derivabile nella regione
x 2 [0; ] ; t 2 (0; 1]
(anche se non in tutto Q). La u è continua …no a t = 0, ma regolare solo per
t > 0.
Si osservi la diversa logica:
la serie delle derivate converge totalmente in Q (per ogni > 0) ma non in
Q;
la u è derivabile in Q (per ogni > 0) e quindi è derivabile in Q.
Il diverso modo di ragionare si deve al fatto che il concetto di convergenza
totale è globale, mentre quello di derivabilità è puntuale.
Esempio 1.59 Consideriamo la serie di funzioni
1
X
sin (nx) cos (nt)
n3
n=1
de…nita per (x; t) 2 Q = [0; 2 ] [0; 2 ]. Studiamo la continuità e derivabilità
di questa serie.
La disuguaglianza
sin (nx) cos (nt)
1
3
n
n3
mostra che la serie converge totalmente in Q, perciò essendo le fn (x; t) continue,
anche la funzione
1
X
sin (nx) cos (nt)
u (x; t) =
n3
n=1
è continua. Le serie delle derivate parziali prime sono:
1
X
@
@x
n=1
1
X
@
@t
n=1
1
X
cos (nx) cos (nt)
=
n2
n=1
sin (nx) cos (nt)
n3
sin (nx) cos (nt)
n3
=
1
X
n=1
29
sin (nx) sin (nt)
:
n2
e convergono totalmente, per analoghe disuguaglianze. Quindi u 2 C 1 (Q) ; con
1
X
@u
cos (nx) cos (nt)
(x; t) =
@x
n2
n=1
1
X
@u
(x; t) =
@t
n=1
sin (nx) sin (nt)
:
n2
Provando a iterare il discorso, però, ci dobbiamo fermare. Ad esempio:
1
X
@
@x
n=1
cos (nx) cos (nt)
n2
=
1
X
n=1
sin (nx) cos (nt)
;
n
e l’ultima serie non converge totalmente. Questa volta la situazione non migliora mettendosi in un sottoinsieme di Q. Dobbiamo concludere che u 2 C 1 (Q)
ma non è possibile a¤ ermare che sia derivabile due volte in Q. (Si noti che
queste argomentazioni non permettono di concludere rigorosamente che una certa derivata non esiste; semplicemente, non c’è un modo semplice per a¤ ermare
che esiste e verosimilmente non esiste, almeno in qualche punto).
1.3
Operatori lineari continui
Diamo qualche cenno, poco più che una terminologia, su questo importante
concetto di analisi funzionale.
De…nizione 1.60 Siano X; Y due spazi vettoriali normati sul campo K (= R o C).
Una funzione T : X ! Y si dice operatore lineare se
T ( x + y) = T (x) + T (y) 8x; y 2 X; 8 ;
2 K.
Solitamente quando un operatore è lineare si omette la parentesi nell’argomento, e si scrive T x invece che T (x) (ma naturalmente bisogna comunque
scrivere T (x + y) se l’argomento è una somma!).
Teorema 1.61 Siano X; Y due spazi vettoriali normati e T : X ! Y un
operatore lineare. Sono equivalenti le seguenti tre condizioni:
(a) T (vista come funzione tra due spazi metrici) è continua in 0.
(b) T è continua in ogni punto.
(c) vale la seguente condizione di limitatezza:
kT xkY
< 1:
x2X;x6=0 kxkX
sup
De…nizione 1.62 Un operatore lineare T : X ! Y tra due spazi vettoriali normati X; Y si dice continuo se vale una delle tre condizioni equivalenti espresse
dal teorema precedente. In tal caso si de…nisce norma dell’operatore il numero
kT k =
sup
x2X;x6=0
30
kT xkY
.
kxkX
Risulta, per de…nizione
kT xkY
kT k kxkX
8x 2 X:
Se T : X ! Y è un operatore lineare e si mostra che esiste una costante
K > 0 per cui vale
kT xkY
K kxkX
8x 2 X;
(1.3)
allora T è continuo, e kT k K. Solitamente è così che si dimostra la continuità
di un operatore lineare, senza necessariamente riuscire a determinare la norma
di T , che è la migliore (cioè la minima) costante per cui vale la (1.3).
Esempio 1.63 Sia
T : C 2 [a; b] ! C 0 [a; b]
T f (x) = (x) f 00 (x) + (x) f 0 (x) + (x) f (x)
con ; ; 2 C 0 [a; b] : L’operatore di¤erenziale T è (ovviamente lineare e)
continuo perché
kT f kC 0 [a;b] = k f 00 + f 0 + f kC 0 [a;b]
k f 00 kC 0 [a;b] + k f 0 kC 0 [a;b] + k f kC 0 [a;b]
k kC 0 [a;b] kf 00 kC 0 [a;b] + k kC 0 [a;b] kf 0 kC 0 [a;b] + k kC 0 [a;b] kf kC 0 [a;b]
o
n
k kC 0 [a;b] + k kC 0 [a;b] + k kC 0 [a;b] kf kC 2 [a;b]
c kf kC 2 [a;b] :
Esempi di operatori lineari continui di altro tipo (ad esempio, espressi analiticamente da integrali) si potranno fare più avanti.
Si veri…ca facilmente che ogni combinazione lineare di operatori lineari continui tra X e Y è a sua volta un operatore lineare continuo. Si può considerare
quindi lo spazio L (X; Y ) di tutti gli operatori lineari continui tra gli spazi
vettoriali normati X e Y , che risulta uno spazio vettoriale. Anzi, la norma
operatoriale
kT xkY
kT kL(X;Y ) = sup
x2X;x6=0 kxkX
risulta e¤ettivamente una norma in questo spazio, quindi: L (X; Y ) è uno spazio
vettoriale normato.
Vale il seguente teorema, che ci limitiamo a enunciare:
Teorema 1.64 Siano X; Y spazio vettoriali normati. Se Y è completo anche
anche L (X; Y ) è completo.
31
1.4
1.4.1
L’integrale di Lebesgue
Motivazione
A partire dagli inizi del 20 secolo la teoria classica dell’integrazione, di Riemann, è stata sostanzialmente sostituita da una nuova teoria, dovuta a Lebesgue,
estremamente più generale, ‡essibile e potente, che ha rivoluzionato l’analisi
matematica. Noi non ci occuperemo di questioni da cui emerga …no in fondo
l’importanza di questa diversa impostazione, ma non possiamo comunque farne
a meno, per molti motivi. Vediamo molto sinteticamente alcune questioni5
rispetto alle quali l’integrale di Riemann è inadeguato ed è auspicabile avere un
concetto diverso di integrale.
1. Vorremmo un concetto di integrale in cui la possibilità che la funzione
integranda sia illimitata e/o che l’insieme di integrazione sia illimitato costituisca
la regola e non l’eccezione (come è nella teoria di Riemann, in cui l’integrale viene
“generalizzato” solo in un secondo momento per includere queste situazioni).
2. Vorremmo un concetto di integrale in cui, sia in una variabile che in più
variabili, l’insieme di integrazione possa essere di tipo molto generale, anche
molto irregolare.
3. Vorremmo un concetto di integrale in cui ci l’insieme delle funzioni integrabili sia “stabile” rispetto a un gran numero di operazioni, in particolare
rispetto al passaggio al limite di successione. (Per l’integrale di Riemann, invece,
una successione di funzioni integrabili può convergere a un limite non integrabile). Questo signi…cherà anche che dovranno essere integrabili anche funzioni
“molto discontinue”.
4. Vorremmo un concetto di integrale con cui l’integrazione di successioni
e serie di funzioni obbedisca a regole semplici, cioè si possa dimostrare che lo
scambio tra limite e integrale è lecito sotto ipotesi piuttosto generali e di facile
veri…ca. (Nella teoria di Riemann l’unico criterio semplice di integrazione per
successioni richiede la convergenza uniforme, che è un’ipotesi piuttosto forte).
5. Vorremmo che lo spazio (vettoriale) delle funzioni integrabili su un certo
dominio, munito della norma dell’integrale, fosse uno spazio di Banach (cioè
fosse completo), cosa che non accade per l’integrale di Riemann.
Ottenere un integrale con proprietà migliori (dai punti di vista spiegati)
signi…ca ovviamente cambiare la de…nizione di integrale, e più precisamente
cambiarlo in un senso che renda meno restrittiva la richiesta di integrabilità.
Ricordiamo come è stato de…nito l’integrale di Riemann come limite di somme:
lim sn = lim
n!1
n!1
n
X
b
k=1
a
n
f
(n)
k
dove al passo n-esimo l’intervallo [a; b] è stato suddiviso in n intervalli uguali
(n)
(n)
(n)
(n)
mediante i punti a = x0 ; x1 ; x2 ; :::; xn = b e ad ogni passo si sono scelti,
5 Ci limiteremo a segnalare questioni che siano rilevanti per il seguito del nostro discorso,
senza con ciò voler a¤ermare che queste siano le motivazioni più importanti per introdurre
l’integrale di Lebesgue.
32
h
i
(n)
(n)
(n)
arbitrariamente, gli n punti k 2 xk 1 ; xk , k = 1; 2; :::; n. La funzione f si
dice Riemann-integrabile se il limite esiste …nito e non dipende da come si sono
(n)
scelti, ad ogni passo, i punti k . Si capisce dalla de…nizione che ciò che “mette
a rischio”l’integrabilità è il fatto che f abbia numerosi punti di discontinuità, e
quindi nel corso della costruzione succeda “tanteh volte” chei scegliendo il punto
(n)
(n)
(n)
in modi diversi all’interno dell’intervallino xk 1 ; xk
si ottengano delle
k
variazioni importanti nel valore di sn . Ad esempio, la funzione di Dirichlet
1 se x è razionale
0 se x è irrazionale
d (x) =
non è integrabile perché, ad ogni passo della costruzione iterativa, è possibile
(n)
scegliere i punti k tutti razionali, e allora sn = 1, o tutti irrazionali, e allora
sn = 0; perciò certamente successioni di Cauchy-Riemann diverse hanno limiti
diversi. Se vogliamo dare una de…nizione di integrale diversa, che risulti meno
restrittiva, dobbiamo trovare il modo di neutralizzare, nell’algoritmo di calcolo
dell’integrale, gli e¤ etti di instabilità dovuti alle (eventuali) grandi oscillazioni
o discontinuità della funzione.
Un’idea di questo tipo si trova nella nozione di integrale introdotta da Henri
Lebesgue nel 1902 nella sua tesi di dottorato presentata alla Facoltà di Scienze
di Parigi.
L’idea, apparentemente banale, è: invece di fare una costruzione iterativa suddividendo l’intervallo [a; b] sull’asse x in parti uguali, facciamo una
costruzione iterativa suddividendo in parti uguali, sull’asse y, un intervallo che
contenga l’insieme dei valori assunti dalla funzione (che per il momento supponiamo limitata). Ad esempio, se la funzione ha valori in [0; 1], al passo n-esimo
suddivideremo [0; 1] in parti uguali e considereremo gli insiemi
(n)
Ek
=
x 2 [a; b] :
k
1
n
f (x) <
k
n
, con k = 1; 2; :::; n:
Ovviamente un’approssimazione, per difetto o per eccesso, dell’area sotto il
gra…co di f si ottiene, rispettivamente, con le somme:
sn =
s+
n =
n
X
k=1
n
X
(n)
Ek
(n)
Ek
k=1
k
1
n
;
k
;
n
dove jEk j indica la misura dell’insieme Ek , cioè se ad es. è un intervallo la sua
lunghezza, se è l’unione di più intervalli la somma delle lunghezze degli itervalli,
33
e così via6 .
Una somma di Riemann di passo
Una somma di Lebesgue di passo
3
3
della stessa funzione
Ciò che dimostra quanto sia buona quest’idea, e quanto sia diversa da quella
dell’integrale di Riemann (non ostante l’apparente simmetria: suddividiamo
l’asse x / suddividiamo l’asse y) è che per come sono costruite le somme risulta
6 Come vedremo, buona parte del problema da a¤rontare sta in questo semplicistico “e così
via”.
34
sempre
0
s+
n
sn =
n
X
(n)
Ek
k=1
1
1
=
n
n
per cui lo scarto tra le approssimazioni per eccesso e per difetto tende necessariamente a zero! Signi…ca che questo algoritmo di approssimazione restituisce
“sempre”un limite. Apparentemente, ogni funzione risulta integrabile a questo
modo. In realtà, abbiamo in un certo senso spostato il problema: data una
(n)
funzione f e interi n; k qualsiasi, come sarà fatto l’insieme Ek ? Se f ha molte
oscillazioni e discontinuità potrà essere un insieme molto diverso da un intervallo o l’unione di un numero …nito di intervalli. Ad esempio, per la funzione di
(n)
Dirichlet tra gli insiemi Ek ci saranno
fx 2 [0; 1] : x 2 Qg ; fx 2 [0; 1] : x 2
= Qg ,
che non sono esprimibili come unioni …nite di intervalli.
Dunque: per costruire una teoria dell’integrazione di questo nuovo tipo dobbiamo prima impegnarci a costruire una “teoria della misura” che sia in grado
di assegnare una “lunghezza” anche a sottoinsiemi molto irregolari della retta.
1.4.2
La misura di Lebesgue
Procedendo ora in modo molto schematico, mostriamo come si arriva alla de…nizione
di questo nuovo tipo di integrale. Come anticipato, occorre prima de…nire una
nozione di misura, e questo richiede un po’di lavoro tecnico.
De…nizione 1.65 Sia un insieme. Si dice -algebra (su ) una famiglia M
di sottoinsiemi di (cioè7 M P ( )) tale che:
2 M;
E 2 M =) E c 2 M (dove E c indica il complementareSdi E in );
1
1
se fEn gn=1 è una successione di insiemi di M, allora n=1 En 2 M.
Gli insiemi di M si dicono insiemi misurabili, ( ; M) si dice spazio misurabile.
Ogni insieme
ha due -algebre banali: la più piccola è quella costituita
solo da e ;; la più grande è tutto P ( ). Dalla de…nizione segue facilmente la:
Proposizione 1.66 Se M è una -algebra, M è chiusa anche rispetto alle
seguenti operazioni insiemistiche: unione …nita, intersezione …nita o numerabile; di¤ erenza insiemistica8 .
7 dove P ( ) indica l’insieme delle parti di
compresi stesso e l’insieme vuoto ;
8 La di¤erenza insiemistica è de…nita così:
; cioè l’insieme di tutti i sottoinsiemi di
A n B = A \ Bc:
35
;
De…nizione 1.67 Sia ( ; M) uno spazio misurabile. Si dice misura (su questo
spazio) una qualunque funzione (d’insieme)
: M ! [0; +1]
1
che sia numerabilmente additiva, ossia tale che per ogni successione fEn gn=1
di insiemi di M a due a due disgiunti, si abbia
!
1
1
[
X
En =
En .
n=1
n=1
(Dove ambo i membri possono essere …niti o in…niti). In tal caso ( ; M; ) si
dice spazio di misura.
Notiamo esplicitamente che la scrittura
: M ! [0; +1] signi…ca che la
misura di un insieme può anche essere 0 o +1 (e questo accade anche per
insiemi non banali, ad esempio in R la lunghezza di un punto è 0, la lunghezza
di una semiretta è +1).
Da questa sola richiesta di numerabile additività seguono in realtà molte
altre proprietà della misura:
Teorema 1.68 Sia ( ; M; ) uno spazio di misura. Allora:
1. (;) = 0;
2.
è …nitamente additiva, cioè per ogni famiglia …nita E1 ; E2 ; :::; En di
insiemi di M a due a due disgiunti si ha
!
n
n
[
X
Ei =
Ei ;
i=1
i=1
3. è monotona, cioè 8A; B 2 M, A B =) (A)
(B) ;
4.
è condizionatamente sottrattiva, cioè 8A; B 2 M, A
B e (B) <
1 =) (B n A) = (B)
(A) ;
1
5.
è continua da sotto: se fEn gn=1
S1è una successione di insiemi di M
tale che En % E (cioè: En En+1 8n e n=1 En = E) allora (En ) ! (E) ;
1
6. è condizionatamente continua da sopra: se fEn gn=1 èTuna successione
1
di insiemi di M tale che En & E (cioè: En
En+1 8n e n=1 En = E) e
inoltre (E1 ) < 1, allora (En ) ! (E) ;
1
7.
è numerabilmente subadditiva, cioè se fEn gn=1 è una successione di
insiemi di M ( non necessariamente a due a due disgiunti), allora
!
1
1
[
X
En
En .
n=1
n=1
Nel seguito, come vedremo, saranno molto importanti gli insiemi di misura
nulla. Notiamo che se E; E0 2 M, E0 E e (E) = 0, allora (per la monotonia
della misura) anche (E0 ) = 0. Talvolta siamo in una situazione leggermente
36
diversa: abbiamo un insieme E 2 M tale che (E) = 0; e un altro insieme
E0
E (di cui a priori non sappiamo che sia misurabile); ci piacerebbe poter
comunque concludere che (E0 ) = 0 (cioè: che E0 2 M, e quindi (E0 ) = 0).
Questo non è vero per tutte le misure, ma solo per quelle per cui è noto che
i sottoinsiemi degli insiemi di misura nulla sono tutti misurabili (e quindi di
misura nulla).
De…nizione 1.69 Sia ( ; M; ) uno spazio di misura. Si dice che la misura
è completa se i sottoinsiemi degli insiemi di misura nulla sono tutti misurabili
(e quindi hanno misura nulla).
Esempi di misure. Non è così semplice costruire misure signi…cative. Cominciamo a introdurre un paio di esempi semplici (ma comunque importanti).
La misura del conteggio. Sia
un insieme qualsiasi, M = P ( ) e
:
M ! [0; +1] tale che
(A) =
numero di elementi di A, se A è …nito;
1 altrimenti.
Si veri…ca che
è una misura detta misura del conteggio. Come vedremo,
l’integrale rispetto a questa misura risulterà una serie numerica, quindi la teoria
astratta dell’integrazione assorbirà al suo interno la teoria delle serie numeriche.
La misura atomica o di Dirac. Sia
un insieme qualsiasi, x0 2 un suo
elemento …ssato, e M = P ( ). De…niamo : M ! [0; +1] tale che
(A) =
1 se x0 2 A
0 altrimenti.
Si veri…ca che è una misura, detta misura di Dirac concentrata in x0 e indicata
talvolta col simbolo x0 .
Saltando ora a pié pari il lungo percorso costruttivo e dimostrativo che porta
alla de…nizione della misura di Lebesgue, enunciamo i punti di arrivo di questo
percorso sotto forma di un risultato astratto di esistenza:
Teorema 1.70 (Misura di Lebesgue in Rn ) Esiste una -algebra L di sottoinsiemi di Rn , detta -algebra di Lebesgue (o degli insiemi Lebesgue misurabili), ed esiste una misura
su L, detta misura di Lebesgue in Rn 9 , con le
seguenti proprietà:
1. La -algebra L contiene tutti gli insiemi aperti, gli insiemi chiusi, gli
insiemi ottenuti per intersezione o unione di una successione di insiemi aperti
o chiusi10 .
9 Anche se “misura di Lebesgue in Rn ” è il modo in cui comunemente si chiama questa
misura, notiamo esplicitamente che questa non è de…nita per ogni sottoinsieme di Rn , ma
solo per quelli “misurabili”, cioè appartenenti alla -algebra L.
1 0 In pratica, L contiene qualsiasi insieme si riesca a de…nire in modo esplicito, costruttivo.
Per mostrare l’esistenza di insiemi non misurabili occorre utilizzare sottili procedimenti non
costruttivi.
37
2. La misura di Lebesgue estende la misura elementare, nel senso che data
una n-cella, cioè un insieme del tipo:
I = [a1 ; b1 ]
[a2 ; b2 ]
:::
[an ; bn ] ; con ai ; bi 2 R;
risulta11
(I) = jb1
a1 j jb2
a2 j ::: jbn
an j :
3. La misura di Lebesgue è invariante per traslazioni.
4. La misura di Lebesgue è completa.
Detto in parole povere: la misura di Lebesgue consente di misurare quasi
tutti gli insiemi di Rn , anche insiemi molto “irregolari”o “complicati”; al tempo
stesso, se consideriamo un insieme di cui la geometria elementare insegni a
calcolare la misura (cioè il volume se siamo in R3 , l’area se siamo in R2 , la
lunghezza se siamo in R, la misura di Lebesgue restituisce lo stesso valore che
ci aspetteremmo. Il “guadagno”dell’avere a disposizione la misura di Lebesgue
non è solo nel fatto che riusciamo a misurare anche insiemi molto complicati,
ma anche che per il fatto di essere una misura, soddisfa tutte le proprietà
delle misure (v. teorema 1.68) e inoltre è completa (v. de…nizione 1.69).
Esempio 1.71 Per visualizzare meglio come agisce la de…nizione di misura di
Lebesgue, facciamo qualche esempio.
1. Poiché la misura di Lebesgue estende la misura elementare, un punto ha
misura nulla (in Rn ; qualunque sia n).
2. D’altro canto la misura è numerabilmente additiva perciò, ogni insieme
numerabile (è misurabile e) ha misura nulla.
3. In R quanto appena a¤ ermato è particolarmente signi…cativo, perché
mostra che Q è un sottoinsieme di R misurabile e di misura nulla, non ostante
il fatto che Q sia denso in R. Si capisce che la valutazione di quanto sia “grande”
un insieme dal punto di vista della teoria della misura e dal punto di vista della
topologia può essere molto diverso. La misurabilità dell’insieme Q è un fatto che
deve far ri‡ettere sulla potenza della teoria: utilizzando le nozioni elementari di
misura dei segmenti, un insieme come Q sarebbe “intrattabile”.
4. Si ri‡etta sul fatto che, ad esempio, una retta (o una curva regolare) nel
piano o nello spazio ha misura nulla, così come un piano (o una super…cie regolare) nello spazio ha misura nulla. Questo si può vedere applicando le proprietà
generali delle misure e il fatto che la misura di Lebesgue estenda la misura elementare. A titolo di esempio, mostriamo che una retta, ad esempio l’asse x,
ha misura nulla nel piano. Per cominciare sia E il semiasse x 0; y = 0 nel
piano, e proviamo che (E) = 0. Possiamo coprire E con l’unione delle 2-celle
(cioè rettangoli) così fatte:
E
1
[
h
[k; k + 1]
k=0
" "i
;
2k 2k
E" :
1 1 e questo fatto, unito alle proprietà di cui gode
per il fatto di essere una misura, implica
che per qualsiasi insieme di cui la geometria elementare insegni a calcolare la misura, questa
coincide col valore assegnato dalla misura di Lebesgue.
38
Poiché la misura è monotona, sarà
(E)
(E" ) :
Calcoliamo ora (E" ): poiché la misura di Lebsegue di un rettangolo è semplicemente la sua area (cioè la misura elementare) e d’altro canto la misura è
numerabilmente additiva,
(E" ) =
1
X
k=0
[k; k + 1]
h
X
" "i
; k
=
1
k
2 2
1
k=0
2"
= 4":
2k
Perciò (E) < " per ogni " > 0, perciò (E) = 0:
Analogamente si prova che il semiasse x
0 ha misura nulla, da cui essendo unione di due insiemi di misura nulla l’asse x ha misura nulla in R2 .
Naturalmente, in R l’asse x avrebbe invece misura in…nita.
Osservazione 1.72 Esiste una buona misura rispetto a cui tutti gli
insiemi sono misurabili? Abbiamo visto che è possibile de…nire una “buona”
misura (la misura di Lebesgue, che ha le buone proprietà già ricordate) de…nita
su una certa -algebra di sottoinsiemi di Rn che è e¤ ettivamente molto ampia, il
che signi…ca che rispetto alla misura di Lebesgue, “quasi tutti” gli insiemi sono
misurabili. Chiediamoci se non è possibile fare di meglio: esiste una misura
in Rn che, oltre a soddisfare la de…nizione astratta di misura, estenda la misura
elementare, sia invariante per traslazioni, e inoltre si possa a¤ ermare che tutti i
sottoinsiemi di Rn sono misurabili? (Se fosse così, potremmo anche fare a meno
di introdurre la nozione di -algebra). La risposta però è negativa, e questo è
un risultato profondo di teoria degli insiemi. Se si vuole una buona teoria della
misura, nei sensi già spiegati, non si può scegliere una strada più semplice di
quella descritta; in particolare non si può rinunciare al concetto di -algebra.
Osservazione 1.73 (Misura di Lebesgue su un insieme ) Abbiamo costruito la misura di Lebesgue su Rn . Naturalmente in molte questioni non consideriamo lo spazio intero, ma un sottoinsieme
di Rn , e vorremmo avere una
misura sui sottoinsiemi di . Questo passaggio è molto semplice. La restrizione
della misura di Lebesgue a un sottoinsieme misurabile di Rn è la stessa misura
di Lebesgue, calcolata sui sottoinsiemi misurabili di , che sono tutti e soli gli
insiemi del tipo E \ con E sottoinsieme misurabile di Rn . Detto in modo più
preciso e generale:
Teorema 1.74 (Restrizione di una misura) Sia ( ; M; ) uno spazio di misura
astratto (qualsiasi), e sia 0
; 0 2 M (cioè 0 è un sottoinsieme misurabile
di ). Allora:
(a) La famiglia di insiemi M0 = fE0 = E \ 0 : E 2 Mg è una -algebra
di sottoinsiemi di 0 .
(b) La funzione d’insieme ristretta a M0 è una misura su ( 0 ; M0 ), quindi
dà luogo ad un nuovo spazio di misura ( 0 ; M0 ; 0 ) dove 0 = =M0 è detta
restrizione della misura a 0 .
39
La costruzione precedente è signi…cativa quando ( 0 ) > 0; altrimenti la
misura restrizione è identicamente nulla.
In particolare, in Rn , dato un qualsiasi sottoinsieme misurabile 0 di misura
positiva, parleremo della misura di Lebesgue in 0 per indicare la restrizione di
a 0.
1.4.3
Integrale di Lebesgue
Torniamo ora alla teoria generale astratta della misura. Supponiamo di avere
uno spazio di misura qualsiasi ( ; M; ) e supponiamo inoltre che la misura
sia completa (come accade per la misura di Lebsegue); vogliamo de…nire l’integrale rispetto a questa misura. Ricordando quanto spiegato nell’introduzione,
ci attende ancora un passo preliminare, quello di de…nire cosa sono le funzioni
misurabili, che saranno quelle per cui la costruzione dell’integrale di Lebesgue è
possibile. Cominciamo dal seguente semplice
Teorema 1.75 Sia ( ; M) uno spazio misurabile qualsiasi e sia f :
Sono equivalenti le seguenti 4 condizioni:
1. fx 2 : f (x) > ag 2 M per ogni a 2 R;
2. fx 2 : f (x) ag 2 M per ogni a 2 R;
3. fx 2 : f (x) < ag 2 M per ogni a 2 R;
4. fx 2 : f (x) ag 2 M per ogni a 2 R.
! R.
De…nizione 1.76 Sia ( ; M) uno spazio misurabile qualsiasi e sia f : ! R.
Si dice che f è misurabile (su ( ; M)) se vale una delle condizioni equivalenti
espresse dal teorema precedente.
Esempio 1.77 Sia ( ; M) uno spazio misurabile qualsiasi ed E
: De…niamo la funzione caratteristica dell’insieme E (un concetto che ci servirà spesso
in seguito),
1 se x 2 E
E (x) =
0 se x 2
= E:
Allora si vede facilmente che
la funzione
E
è misurabile se e solo se l’insieme E è misurabile.
Quindi costruire esempi di funzioni non misurabili è tanto di¢ cile quanto
costruire esempi di insiemi non misurabili. Questo suggerisce che la richiesta
di misurabilità di una funzione sia una richiesta generalmente molto debole.
Esempio 1.78 Consideriamo Rn con la -algebra degli insiemi Lebesgue misurabili. Allora: se f : Rn ! R è continua, f è misurabile. Infatti, per una
funzione continua, gli insiemi ai punti 1 e 3 del teorema sopra sono aperti,
mentre gli insiemi ai punti 2 e 4 del teorema sono chiusi; in tutti e 4 i casi,
sono insiemi Lebesgue misurabili.
La completezza della misura implica la prossima utile proprietà:
40
Proposizione 1.79 Siano f; g : ! R con f misurabile e g = f tranne che
su un insieme di misura nulla. Allora g è misurabile.
In particolare il teorema precedente implica che nel seguito della teoria possiamo considerare funzioni de…nite in salvo al più un insieme di misura nulla
o, come si dice comunemente, de…nite quasi ovunque (abbreviato in q.o.). Se
f è de…nita q.o. in , possiamo pensare di de…nirla in un qualsiasi modo anche nell’insieme di misura nulla residuo, e la sua misurabilità o meno in non
dipende da come l’abbiamo de…nita (quindi, in de…nitiva, possiamo non de…nirla
proprio).
Teorema 1.80 (Operazioni sulle funzioni misurabili) Siano f; g : ! R
misurabili. Allora:
f g è misurabile; f g è misurabile; cf è misurabile (se c è una costante
reale);
f =g è misurabile purché l’insieme in cui g si annulla abbia misura nulla;
f + = max (f; 0) ; f = min (f; 0) ; jf j sono misurabili;
se : R ! R è continua, (f ) è misurabile;
se : R2 ! R è continua, (f; g) è misurabile.
Il teorema precedente mostra sostanzialmente che ogni sequenza …nita di
operazioni su funzioni misurabili produce funzioni misurabili. Ci interessano
però anche operazioni in…nite, prima fra tutte il passaggio al limite. Si può
dimostrare quanto segue:
Teorema 1.81 Sia fn : ! [ 1; +1] (per n = 1; 2; 3:::) una successione di
funzioni, ciascuna de…nita q.o. in e misurabile, e supponiamo che esista per
q.o. x 2 la funzione
f (x) = lim fn (x) :
n!1
Allora f è misurabile.
Abbiamo ora tutti gli ingredienti per de…nire l’integrale rispetto ad una
misura (astratta) qualsiasi. L’integrale di una qualsiasi funzione (misurabile) f
sarà de…nito come estremo superiore o limite di opportune “somme di Lebesgue
di f ”(anziché somme di Cauchy-Riemann), dove queste somme (la cui costruzione
è stata anticipata intuitivamente nell’introduzione) si possono vedere come integrali di opportune funzioni approssimanti, le funzioni semplici, che ora introduciamo.
De…nizione 1.82 Si dice che una funzione s :
bile e assume un numero …nito di valori.
! R è semplice se è misura-
Una funzione semplice si può sempre scrivere nella forma
s (x) =
n
X
cj
j=1
41
Ej
(x)
con E1 ; E2 ; :::; En insiemi misurabili e c1 ; c2 ; :::; cn 2 R. (Ricordare che Ej è la
funzione caratteristica di Ej , che vale 1 in Ej e 0 altrove). Gli insiemi si possono
scegliere a due a due disgiunti (e allora i numeri cj sono esattamente i possibili
valori assunti da s (x)) ma se anche non lo sono la funzione rimane semplice. E’
naturale de…nire l’integrale di s rispetto alla misura come
Z
n
X
cj (Ej )
s (x) d (x) =
j=1
(pensare al caso della misura di Lebesgue sulla retta; se gli insiemi Ej sono intervalli l’integrale risulta l’area sotto il gra…co della poligonale s (x); naturalmente
la teoria è stata fatta proprio per poter considerare le situazioni in cui gli insiemi Ej non sono intervalli ma insiemi molto complicati). L’idea è allora de…nire
l’integrale di una funzione misurabile e positiva, per cominciare, come l’estremo
superiore degli integrali delle funzioni semplici s (x)
f (x). Il problema è se
c’è un modo standard di de…nire funzioni semplici che approssimano tanto bene
quanto si vuole la funzione f . Questa è esattamente l’idea, che è stata anticipata
nell’introduzione, di suddividere in parti uguali l’insieme dei valori assunti da
f , anziché il dominio di f . La costruzione è contenuta nel prossimo
Teorema 1.83 (Approssimazione con funzioni semplici) Sia f : ! [0; +1]
misurabile. Esiste una successione monotona crescente di funzioni semplici sk
che converge puntualmente a f in : Se inoltre f è limitata la convergenza è
uniforme.
Dimostrazione. Fissato un intero k = 1; 2; 3:::; sia
Ek = x 2
: f (x) > 2k
Ekj =
:
x2
j
1
2k
e siano
< f (x)
Poniamo
j
2k
per j = 1; 2; ::::; 22k .
2k
sk (x) = 2
k
Ek
(x) +
2
X
j
j=1
1
2k
Ekj
(x) :
Si veri…ca che le sk hanno le proprietà richieste. Si osservi in particolare
che il fatto che la successione sia monotona crescente dipende dal fatto che
ad ogni passo il numero di suddivisioni dell’intervallo 0; 2k (sull’asse y) viene
raddoppiato.
Si può ora dare la seguente
De…nizione 1.84 (Integrale di una funzione positiva) Sia f : ! [0; +1]
misurabile. Si pone
Z
Z
f (x) d (x) = sup
s (x) d (x) : s semplice, s (x) f (x)
(dove l’estremo superiore può essere …nito o +1).
42
Ci si convince facilmente che questo estremo superiore si può realizzare in
particolare mediante le sk costruite nel teorema precedente, perciò si può anche
scrivere
0
1
Z
22k
X
j
1
j
k
f (x) d (x) = lim @2 (Ek ) +
Ek A
k!1
2k
j=1
vedendo quindi l’integrale come un limite di somme “alla Lebesgue”:
Dunque per ogni funzione misurabile e non negativa è ben de…nito (…nito o
+1) l’integrale di Lebesgue. Si noti in particolare che in questa teoria il caso in
cui la funzione o il dominio sono illimitati vengono trattati direttamente e non,
come accadeva per la teoria di Riemann, in un secondo tempo facendo il limite
di integrali di funzioni limitate su domini limitati.
Per comprendere meglio il signi…cato geometrico della costruzione dell’integrale di Lebesgue, consideriamo il caso particolare in cui f è misurabile, positiva
e limitata, 0 f (x) M . La costruzione del teorema precedente si può allora
ritoccare ponendo
Ekj =
x2
:
j
1
2k
j
M
2k
M < f (x)
per j = 1; 2; ::::; 2k
k
sk (x) = M
2
X
j
j=1
Z
0
1
f (x) d (x) = lim @M
k!1
Ekj
2k
(x)
k
2
X
j
j=1
1
2k
e si ha, per ogni k,
k
M
2
X
j
j=1
1
2k
Ekj
Z
1
Ekj A
k
f (x) d (x)
43
M
2
X
j
k
2
j=1
Ekj ;
dove lo scarto tra l’approssimazione per eccesso e per difetto al passo k non
supera, se ha misura …nita,
k
2
X
1
M
k
2
j=1
k
Ekj
2
1 X
M k
2 j=1
Ekj =
M
( )
2k
e quindi può essere resa piccola a piacere. In particolare l’integrale in questo
caso è certamente …nito. Per esempio, in un intervallo di R, la funzione di
Dirichlet (che non è Riemann integrabile),
f (x) =
1 per x 2 Q
0 per x 2
=Q
è misurabile, q.o. nulla, quindi è Lebesgue integrabile con integrale nullo. Nella
teoria di Lebesgue dunque, in particolare, tutte le funzioni misurabili e limitate
hanno integrale …nito sugli insiemi di misura …nita.
Arriviamo ora alla de…nizione di integrale di Lebesgue per una funzione di
segno qualsiasi.
De…nizione 1.85 Sia f : ! [ 1; +1] misurabile. Si dice che f è Lebesgue
integrabile, o sommabile, se
Z
jf (x)j d (x) < 1
e in tal caso si pone
Z
Z
f (x) d (x) =
f + (x) d (x)
e risulta ovviamente
Z
f (x) d (x)
Z
Z
f (x) d (x)
jf (x)j d (x) < 1:
Notare che se f è misurabile allora anche jf j lo è (questa è una delle proprietà
delle funzioni misurabili che abbiamo elencato), ma il viceversa non è vero: se
E
è un insieme non misurabile e de…niamo
f (x) =
1 per x 2 E
1 per x 2
=E
allora f non è misurabile, mentre jf j (funzione costante uguale a 1!) ovviamente
lo è. Quindi nella de…nizione precedente è necessario richiedere la misurabilità di f e la …nitezza dell’integrale di jf j, non è possibile esprimere le ipotesi
unicamente su jf j.
Si confrontino le due de…nizioni di integrale introdotte (per funzioni positive
o di segno qualsiasi): per una funzione misurabile e positiva l’integrale è sempre
de…nito (…nito o +1) mentre per dar senso all’integrale di una funzione di
segno variabile richiediamo la …nitezza dell’integrale del modulo, che implica
quella della parte positiva e negativa.
44
De…nizione 1.86 Indichiamo con L1 ( ; M; ) ; o più brevemente con L1 ( )
quando M e si possono sottointendere, l’insieme delle funzioni sommabili nel
senso della de…nizione precedente.
Si veri…ca facilmente che L1 ( ; M; ) è uno spazio vettoriale. Ci interessa
mettere in questo spazio la norma dell’integrale, e vederlo quindi come spazio
vettoriale normato. Questo però richiede una precisazione importante.
Se de…niamo in L1 ( ; M; )
Z
kf kL1 ( ;M; ) =
jf (x)j d (x)
questa risulta soddisfare le proprietà della norma, tranne quella di annullamento.
Infatti, come vedremo nel Teorema 1.88,
kf kL1 (
;M; )
= 0 =) f (x) = 0 q.o. in
:
Per ottenere una norma è quindi necessario identi…care funzioni uguali q.o. tra
loro, ossia introdurre in L1 la relazione di equivalenza f g se f = g q.o. e considerare lo spazio delle classi di equivalenza di funzioni, che può essere reso uno
spazio vettoriale normato a questo modo. Questa operazione è coerente anche
perché la misura è completa, perciò se f è misurabile e g = f q.o., anche g è misurabile. Naturalmente sul piano intuitivo continueremo a pensare gli elementi
di L1 come funzioni, che sono tra loro indistinguibili quando sono uguali quasi
ovunque; sul piano formale, invece, gli elementi di L1 sono classi d’equivalenza
di funzioni. Nel seguito lasceremo sempre sottointesa questa osservazione.
Sottolineiamo che abbiamo de…nito l’integrale di Lebesgue in un generico
spazio astratto di misura (completa). Se in particolare stiamo considerando la
misura di Lebesgue su un sottoinsieme
Rn Lebesgue misurabile, avremo
de…nito un integrale, che chiamiamo ancora “integrale di Lebesgue”, che è quello
che principalmente ci interesserà nel seguito, e che ci aspettiamo generalizzi il
classico integrale di Riemann (anche se le relazioni tra questo integrale e quello
di Riemann andranno approfondite). In questo scriveremo più semplicemente
Z
Z
f (x) dx per indicare
f (x) d (x) :
Occorre naturalmente provare che l’integrale di Lebesgue soddisfa “le solite”
proprietà elementari dell’integrale. Premettiamo la seguente de…nizione, che ci
serve per dar senso all’integrale di una funzione su un sottoinsieme (misurabile)
di :
De…nizione 1.87 Se E 2 M; poniamo
Z
Z
f (x) d (x) =
(f
E ) (x) d
(x)
E
se f è una funzione misurabile in oppure è una funzione misurabile in E e noi
la de…niamo zero (o qualunque altro valore!) fuori da E. La de…nizione va intesa
45
nel senso che se f E 2 L1 ( ; M; ) allora diciamo che f 2 L1 E; M=E ;
e questa uguaglianza ne assegna l’integrale.
=E
Teorema 1.88 Siano f; g 2 L1 ( ; M; ) allora
1. Linearità dell’integrale: per ogni c1 ; c2 2 R,
Z
Z
Z
[c1 f (x) + c2 g (x)] d (x) = c1
f (x) d (x) + c2
g (x) d (x) ;
2. Monotonia dell’integrale
f (x)
g (x) q.o. in
E; F 2 M; E
F; f
=)
0 =)
Z
Z
f (x) d (x)
f (x) d (x)
E
Z
g (x) d (x) ;
Z
f (x) d (x)
F
3. Proprietà di annullamento
se
(E) = 0 allora
Z
f (x) d (x) = 0;
ZE
se f (x) = 0 q.o. in allora
f (x) d (x) = 0;
Z
se
jf (x)j d (x) = 0 allora f (x) = 0 q.o. in :
Il teorema precedente si dimostra abbastanza facilmente in base alla de…nizione
di integrale, riconducendosi al caso delle funzioni semplici.
La proprietà di additività rispetto all’insieme di integrazione, che non è compresa nel teorema precedente, vale in una forma più forte di quella che conosciamo per l’integrale di Riemann; precisamente, vale una numerabile additività,
che però enunciamo solo per funzioni positive:
1
Teorema 1.89 Sia f : ! [0; +1] misurabile e fEn gn=1 una successione di
sottoinsiemi misurabili di a due a due essenzialmente disgiunti12 . Allora
Z
1 Z
X
f (x) d (x) =
f (x) d (x) :
[1
n=1 En
n=1
En
Misura con peso
Si osservi che il teorema precedente si può rileggere anche dicendo che una
funzione misurabile f : ! [0; +1] induce una nuova misura f su ( ; M) ;
de…nita da
Z
(E)
=
f (x) d (x) :
(1.4)
f
E
Si dice che f è la densità di f (rispetto alla misura originaria ). Questo tipo
di misura si dice misura densità o anche misura con peso e si indica anche col
1 2 Due insiemi misurabili si dicono essenzialmente disgiunti se la loro intersezione ha misura
nulla. In particolare, due insiemi disgiunti sono anche essenzialmente disgiunti.
46
simbolo d f = f (x) d (x) o d f = f (x) dx quando la misura originaria è la
misura di Lebsegue su un sottoinsieme di Rn . Cosa sarà l’integrale rispetto a
questa nuova misura? Si dimostra (come ci si può aspettare) che
Z
Z
g (x) d f (x) =
g (x) f (x) dx:
E
E
Si dice che l’integrale di g è stato fatto rispetto al peso f . Lo spazio delle
funzioni integrabili rispetto a questa misura si indica con
L1 ( ; f (x) dx) :
Serie numeriche come integrali
Un’altra applicazione utile della teoria dell’integrazione rispetto a una misura
astratta è la seguente. Consideriamo lo spazio di misura ( ; M; ) dove = N,
1
M = P (N), è la misura del conteggio. Qualsiasi successione fan gn=1 a valori
reali
P1 si può quindi vedere come una funzione misurabile a (n) su ; se la serie
n=1 an risulta assolutamente convergente, la funzione a sarà sommabile e si
avrà
Z
1
X
a (n) d (n) =
an :
n=1
In altre parole, le serie sono particolari integrali astratti. Nella teoria di Lebesgue
quindi l’analisi del discreto e del continuo non hanno più solamente “certe analogie”, ma possono vedersi formalmente come due diverse applicazioni concrete
della medesima teoria astratta. Questo è fondamentale ad esempio nelle applicazioni al Calcolo delle Probabilità, che difatti nella sua formulazione moderna,
dovuta a Kolmogorov, anni 1930, è fondata sulla teoria astratta della misura,
uni…cando così, ad esempi, i concetti di variabili aleatorie discrete e continue.
1.4.4
Relazione tra integrale di Riemann e integrale di Lebesgue
Come già accennato, è naturale arrivati a questo punto confrontare il “nuovo”
integrale con il “vecchio”integrale di Riemann, nella situazione in cui entrambi
sono de…niti.
Particolarizziamo quindi ora la de…nizione di integrale astratto al caso della
misura di Lebesgue sulla retta R. In questo contesto possiamo ora confrontare
le nozioni di integrale di Riemann e integrale di Lebesgue. Per poter e¤ettuare
il confronto, mettiamoci nell’insieme delle funzioni limitate de…nite su un intervallo [a; b]. Tra queste, le funzioni sommabili secondo Lebesgue sono tutte e
solo le funzioni misurabili. Per confronto, si può dimostrare il seguente
Teorema 1.90 Sia f : [a; b] ! R una funzione limitata. Allora f è Riemannintegrabile se e solo se è continua quasi ovunque (dove l’espressione “quasi
ovunque” ha il solito signi…cato, quindi signi…ca che l’insieme dei punti di discontinuità ha misura di Lebesgue nulla), e in questo caso il valore dell’integrale
di Riemann coincide con quello dell’integrale di Lebesgue.
47
Poiché si può dimostrare che tutte le funzioni continue quasi ovunque sono
misurabili, ne segue che tutte le funzioni Riemann integrabili 13 sono anche
Lebesgue integrabili. L’integrale che abbiamo costruito è quindi e¤ettivamente
più generale di quello che conoscevamo dalla teoria classica.
Per esempio, come sappiamo la funzione di Dirichlet (uguale a 1 sui razionali e 0 sugli irrazionali) non è Riemann integrabile, e difatti è discontinua
ovunque. Dal punto di vista della teoria di Lebesgue la funzione di Dirichlet è
indistinguibile dalla funzione identicamente nulla, ovviamente integrabile.
Per poter calcolare e¤ettivamente l’integrale di Lebesgue in casi semplici ma
signi…cativi è indispensabile capire anche la relazione tra integrale di Lebesgue
e integrale di Riemann generalizzato. Consideriamo prima il caso dell’integrale
di Riemann generalizzato di una funzione limitata su un intervallo illimitato.
Ricordiamo la seguente:
De…nizione 1.91 Sia f : (a; +1) ! R una funzione limitata, con la proprietà
di essere Riemann integrabile su ogni intervallo (a; k) (per k > a). Se esiste
…nito
Z k
lim
f (x) dx = l
k!+1
a
allora si dice che l’integrale di Riemann generalizzato
Z +1
f (x) dx
a
converge, ed è uguale a l.
Si può dimostrare il seguente
Teorema 1.92 Nelle ipotesi della de…nizione precedente, si supponga inoltre
che per qualche k a si abbia f (x) 0 per ogni x k (oppure f (x) 0 per
ogni x
k). Allora se l’integrale di Riemann generalizzato di f converge, la
funzione f è anche sommabile secondo Lebesgue, e il suo integrale di Lebesgue
su (a; +1) è uguale all’integrale generalizzato.
In pratica, l’ipotesi richiede che la funzione f non cambi di segno in…nite volte
per x ! +1. Un discorso analogo vale ovviamente per l’integrale generalizzato
su ( 1; 0). Qualche esempio chiarirà i modi in cui solitamente si ragiona.
Esempio 1.93 Si consideri
Z
0
1
1
x
sin dx:
4
1+x
x
Si osservi che la funzione è continua e limitata in (0; +1) (in particolare tende
a zero per x ! 0+ ), quindi è Riemann integrabile su ogni intervallo (0; k).
1 3 In senso proprio, non generalizzato. Della relazione tra integrale di Lebesgue e integrale
di Riemann generalizzato diremo qualcosa tra breve.
48
Inoltre, f cambia di segno in…nite volte vicino all’origine, ma è positiva per
ogni x > 1= . Quindi il teorema è applicabile. Controlliamo se l’integrale
generalizzato di f converge.
x
1
sin
4
1+x
x
x
1 + x4
1
per x ! +1,
x3
perciò l’integrale generalizzato converge assolutamente, e quindi converge. Ne
segue che f è sommabile secondo Lebesgue. Si poteva in realtà anche tralasciare la veri…ca sui cambi di segno di f ragionando direttamente su jf j, così:
la funzione jf j è continua e limitata su (0; +1), non negativa, integrabile in
senso generalizzato, quindi jf j è Lebsegue sommabile; poiché f è ovviamente
misurabile, anche f è Lebsegue sommabile.
Esempio 1.94 Si consideri:
Z
+1
1
sin x
dx:
x2
La funzione cambia di segno in…nite volte per x ! 1, perciò non si può applicare
il teorema direttamente a f , ma lo si può applicare a jf j: poiché jf j è continua,
limitata, non negativa, e
1
jf (x)j
;
x2
jf j è integrabile in senso generalizzato perciò è anche Lebesgue sommabile; d’altro canto f è misurabile perché continua, quindi anche f è Lebsegue sommabile.
Esempio 1.95 Si consideri:
Z
1
+1
sin x
dx:
x
La funzione cambia di segno in…nite volte per x ! 1, perciò non si può applicare il teorema direttamente a f . D’altro canto ragionando su jf (x)j non si
riesce a concludere la convergenza dell’integrale generalizzato. Il teorema non è
quindi in questo caso di alcuna utilità per stabilire l’esistenza o la non esistenza
dell’integrale di Lebesgue. Si può dimostrare che:
1. L’integrale generalizzato di f converge, ma:
2. la funzione f non è Lebesgue sommabile, in quanto l’integrale di Lebesgue
di jf (x)j diverge.
Questo esempio mostra quindi un tipo di situazione in cui l’integrabilità
secondo Lebesgue risulta una condizione più esigente dell’integrabilità in senso generalizzato secondo Riemann. L’idea geometrica soggiacente è la seguente:
nell’integrale generalizzato di una funzione che cambia di segno in…nite volte si
possono avere compensazioni tra le aree con segno delle porzioni del gra…co di
f che stanno ora sopra ora sotto l’asse delle x; l’integrale di Lebesgue richiede
invece di calcolare prima il contributo totale della parte di gra…co sopra l’asse
delle x, poi quello della parte sotto l’asse delle x, e poi sottrarre: se entrambi
49
questi numeri sono in…niti, l’integrale perde signi…cato, non consentendo quindi le compensazioni parziali che avvenivano calcolando l’integrale su (0; k) e
facendo poi tendere k a +1.
Un discorso completamente analogo si può fare per l’integrale di Riemann
generalizzato per una funzione illimitata su un intervallo illimitato:
De…nizione 1.96 Sia f : (a; b] ! R una funzione con la proprietà di essere
limitata e Riemann integrabile su ogni intervallo [a + "; b] (per " > 0). Se esiste
…nito
Z b
lim
f (x) dx = l
"!0+
a+"
allora si dice che l’integrale di Riemann generalizzato
Z b
f (x) dx
a
converge, ed è uguale a l.
Si può dimostrare il seguente
Teorema 1.97 Nelle ipotesi della de…nizione precedente, si supponga inoltre
che per qualche "0 > 0 si abbia f (x) 0 per ogni x 2 (a; a + "0 ) (oppure f (x)
0 per ogni x 2 (a; a + "0 )). Allora se l’integrale di Riemann generalizzato di f
converge, la funzione f è anche sommabile secondo Lebesgue, e il suo integrale
di Lebesgue su (a; b) è uguale all’integrale generalizzato.
In questo caso ciò che va escluso è che la funzione cambi di segno in…nite
volte in ogni intorno del punto a in cui la funzione è illimitata. Se la funzione
non ha in…niti cambi di segno, la convergenza dell’integrale di Riemann generalizzato implica la Lebesgue sommabilità della funzione; se invece la funzione
ha in…niti cambi di segno, si può provare la Lebesgue sommabilità mostrando la
convergenza dell’integrale generalizzato del modulo di f . Rimane la possibilità,
però, che una funzione con in…niti cambi di segno in un intorno di un punto in
cui è illimitata abbia integrale di Riemann generalizzato convergente e tuttavia
non sia Lebesgue sommabile.
Esempio 1.98 Consideriamo
Z
0
1
1
1
p sin dx:
x
x
La funzione è continua e limitata (quindi Riemann integrabile) in ogni intervallo
["; 1] per " > 0. Poiché
1
1
1
p sin
p ;
x
x
x
per i criteri di integrabilità l’integrale di Riemann generalizzato di jf j converge,
quindi (essendo ovviamente f misurabile), f è Lebesgue sommabile.
50
Esempio 1.99 Consideriamo
Z
0
1
1
1
sin dx:
x
x
In questo caso la maggiorazione
1
1
sin
x
x
1
x
è inconcludente, perché l’integrale generalizzato di 1=x diverge; d’altro canto la
funzione cambia di segno in…nite volte in (0; 1), perciò il teorema precedente
non è di aiuto a stabilire se la funzione è Lebesgue sommabile oppure no. Si
può dimostrare che non lo è, e che tuttavia l’integrale generalizzato di Riemann
converge. Infatti il cambio di variabili:
Z 1
1
1
sin dx = 1=x = t; dx = 1=t2 dt
x
x
0
Z +1
sin t
=
dt
t
1
riconduce l’integrale a quello dell’Esempio 1.95.
1.4.5
I teoremi di convergenza per l’integrale di Lebesgue
Finora abbiamo costruito l’integrale di Lebesgue, ne abbiamo elencato le proprietà di base, abbiamo constatato (ultimo paragrafo) che le funzioni Lebesgue
integrabili sono più di quelle Riemann integrabili, ma non abbiamo realmente
illustrato i vantaggi di questo integrale rispetto a quello classico. Cominciamo
ora proprio a illustrare questi vantaggi, che consistono anzitutto in alcuni importanti teoremi sulle relazioni tra l’integrale di Lebesgue e le operazioni di limite
di successione di funzioni, e di serie di funzioni.
Torniamo ancora nel contesto astratto di un qualsiasi spazio di misura ( ; M; ),
in cui supponiamo come in precedenza che la misura sia anche completa.
Teorema 1.100 (della convergenza monotona) Sia fn : ! [0; +1] una
successione di funzioni misurabili, monotona crescente, cioè fn (x)
fn+1 (x)
per ogni intero n e x 2 . Allora
Z
Z
lim
fn (x) d (x) =
lim fn (x) d (x)
n!+1
n!+1
dove i due membri dell’uguaglianza possono essere …niti o in…niti. (L’esistenza
dei due limiti è parte della tesi).
Il teorema precedente riguarda una successione di funzioni misurabili e positive, e considera integrali …niti o in…niti. Il prossimo teorema invece considera
successioni di funzioni di segno qualsiasi, ma sommabili. Questo è probabilmente
il più importante teorema della teoria di Lebesgue:
51
Teorema 1.101 (della convergenza dominata, o “teorema di Lebesgue”)
Sia fn :
! [ 1; +1] una successione di funzioni misurabili, convergente
puntualmente (quasi ovunque) a una certa funzione f . Supponiamo che esista
una funzione g sommabile in tale che per ogni intero n sia
jfn (x)j
Allora
In particolare,
Z
jfn (x)
lim
n!1
g (x) per q.o. x 2 :
f (x)j d (x) ! 0 per n ! 1:
Z
fn (x) d =
cioè il limite si scambia con l’integrale.
Z
f (x) d
La funzione g che compare nell’ipotesi del teorema si chiama funzione dominante integrabile (perché domina, cioè maggiora, il modulo delle fn ), da cui il
nome del teorema.
Vediamo ora qualche esempio pratico di passaggio al limite sotto il segno di
integrale per l’integrale di Lebesgue, a confronto con quanto si può dire nella
teoria dell’integrale di Riemann.
Nella teoria di Riemann, se ffn g è una successione di funzioni fn : [a; b] ! R
limitate e Riemann integrabili e inoltre fn ! f uniformemente in [a; b], si può
Rb
Rb
garantire che a fn (x) dx ! a f (x) dx. Supponiamo di sapere soltanto che le
funzioni fn sono misurabili, jfn (x)j c per ogni x 2 [a; b] e per ogni n, e inoltre
fn ! f puntualmente quasi ovunque in [a; b]. Per il teorema di Lebesgue della
Rb
Rb
convergenza dominata risulterà a fn (x) dx ! a f (x) dx, sotto ipotesi che
quindi sono molto più deboli della convergenza uniforme.
Esempio 1.102 Sia
1=n
fn (x) = jxj
in [ 1; 1] :
Si ha fn (x) ! 1 q.o. ma non uniformemente (poiché fn (0) = 1 si ha kfn 1k1 =
1). Perciò la teoria di Riemann non è applicabile. In base al teorema della convergenza dominata, invece, essendo jfn (x)j
1 (e la costante è integrabile in
[ 1; 1]) risulta
Z 1
Z 1
fn (x) dx !
1dx = 2:
1
1
Esempio 1.103 Sia
fn (x) =
sin nx
in [0; +1):
nx3=2
Controlliamo anzitutto che ciascuna fn 2 L1 . Per x ! 0 è
fn (x)
1
nx
= 1=2 ;
3=2
nx
x
52
integrabile in un intorno di 0. D’altro canto
jfn (x)j =
sin nx
nx3=2
1
;
nx3=2
integrabile in un intorno di 1. Perciò fn 2 L1 [0; +1):
Per n ! 1; fn (x) ! 0 puntualmente ovunque. Cerchiamo una dominante
integrabile su [0; +1). Per trovarla è più semplice ragionare separatamente
sugli intervalli [0; 1] e [1; +1). Si ha:
per x 2 [0; 1] ;
nx
1
= 1=2 2 L1 [0; 1]
jfn (x)j
nx3=2
x
(abbiamo usato la disuguaglianza jsin tj jtj);
per x 2 [1; +1);
jfn (x)j
1
2 L1 [1; +1)
x3=2
1
nx3=2
(abbiamo usato le disuguaglianze jsin tj
Dunque
jfn (x)j
g (x) =
1
x1=2
1
x3=2
1 e 1=n
per x 2 [0; 1]
per x 2 [1; +1)
1).
con g 2 L1 [1; +1);
perciò il teorema di Lebesgue è applicabile, e
Z +1
Z +1
fn (x) dx !
0dx = 0:
0
0
Si osservi che, diversamente dall’esempio precedente, questa volta la maggiorante integrabile è una funzione illimitata.
Si poteva anche, del resto, valutare direttamente l’integrale:
Z +1
Z +1
dt
sin t dt
sin nx
dx
=
nx
=
t;
dx
=
=
3=2
3=2 n
n
nx
0
0
n nt
Z +1
1
sin t
c
p
dt = p ! 0 per n ! 1
=
n 0
n
t3=2
R +1 sin t
perché c = 0
dt è una costante (abbiamo dimostrato all’inizio che ogni
t3=2
fn è L1 , questa integranda è f1 ).
L’altro risultato fondamentale che ha a che fare con la relazione tra integrale
e limite di successioni è il seguente:
Teorema 1.104 Lo spazio vettoriale normato L1 ( ; M; ) (de…nito indenti…cando funzioni uguali q.o.) è completo.
53
Ricordiamo che questo signi…ca, esplicitamente, che se ffn g è una successione
di funzioni in L1 ( ; M; ) che è di Cauchy, cioè tale che
Z
j(fn fm ) (x)j dx ! 0 per n; m ! 1;
allora esiste una funzione f 2 L1 ( ) tale che
Z
j(fn f ) (x)j dx ! 0 per n ! 1;
e in particolare
Z
fn (x) dx !
Z
f (x) dx per n ! 1:
Dalle proprietà dell’integrale di Lebesgue in relazione all’operazione di limite di successione di funzioni, si possono dedurre le sue proprietà in relazione
all’operazione di serie di funzioni.
La domanda che ci poniamo è: sotto quali ipotesi si può a¤ermare che
Z X
1
1 Z
X
fn (x) dx =
fn (x) dx?
n=1
n=1
Rispondono i prossimi due teoremi.
Teorema 1.105 Siano fn : ! R misurabili e non negative. Allora è sempre
vero che
Z X
1
1 Z
X
fn (x) dx =
fn (x) dx
n=1
n=1
dove entrambi i membri possono essere …niti o +1.
In particolare, questo signi…ca che se fn : ! R sono misurabili e di segno
qualsiasi, allora è sempre vero che
Z X
1 Z
1
X
jfn (x)j dx
jfn (x)j dx =
n=1
n=1
dove entrambi i membri possono essere …niti o +1.
E’utile anche il seguente
Teorema 1.106 Siano fn :
! R appartenenti a L1 ( ). Se
1 Z
X
jfn (x)j dx < 1;
n=1
P1
allora la serie di funzioni n=1 fn converge in L1 e puntualmente q,o. a una
funzione f 2 L1 ( ) ; e risulta
Z
Z X
1
1 Z
X
f (x) dx =
fn (x) dx =
fn (x) dx:
n=1
n=1
54
1.4.6
Derivazione sotto il segno di integrale
Nel risolvere problemi di¤erenziali, talvolta stabiliremo delle formule di rappresentazione della soluzione in cui questa è assegnata da un opportuno integrale,
con una formula del tipo:
Z
u (x) =
k (x; y) f (y) dy
dove u è la soluzione cercata, f un dato o termine noto, k un nucleo che dipende
dall’operatore di¤erenziale e dal tipo di problema, ma non da dati o termini noti;
in questa formula ciascuna delle variabili x; y può essere scalare o vettoriale.
Si tratta di veri…care che la u così de…nita risolve esplicitamente l’equazione
di¤erenziale assegnata; perciò bisogna saper calcolare le derivate di u rispetto
a x (o le derivate parziali di u rispetto alle variabili xi ). Ora, nell’integrale che
assegna la u la variabile di integrazione è la y, mentre la x dal punto di vista
dell’integrale è un parametro. Il problema matematico che ci interessa è quindi:
derivare un integrale dipendente da un parametro, rispetto a quel parametro.
Supponiamo, ad esempio, che sia x che y siano variabili bidimensionali ossia
scriviamo, più esplicitamente,
Z Z
u (x1 ; x2 ) =
k (x1 ; x2 ; y1 ; y2 ) f (y1 ; y2 ) dy1 dy2 :
@u
(x1 ; x2 ). In questo caso y1 ; y2 sono le variabili di
Proponiamoci di calcolare @x
1
integrazione, x1 il parametro rispetto a cui si deriva (quindi bisognerà pensarlo
come variabile), mentre x2 non gioca alcun ruolo, in altre parole è un parametro
@u
che si può ritenere …ssato. Quando vorremo calcolare @x
(x1 ; x2 ) diventerà
2
importante il ruolo di x2 mentre sarà la x1 a svolgere il ruolo di parametro …ssato.
In ogni caso, nel discutere il problema teorico della derivazione dell’integrale
dipendente da un parametro (eventualmente vettoriale), …ssiamo l’attenzione
su un parametro (scalare) alla volta, quindi tanto vale studiare direttamente
questa situazione, ossia:
Z
u (x) =
k (x; y) f (y) dy
con y eventualmente vettoriale, ma x scalare. Inoltre, nella trattazione generale
possiamo inglobare la funzione f nel nucleo k, e considerare una scrittura
Z
u (x) =
k (x; y) dy con x 2 (a; b) ; y 2
Rn :
Vogliamo calcolare
d
du
(x) =
dx
dx
Z
k (x; y) dy:
(Notare che x è variabile scalare, la u è una funzione da R a R, quindi usiamo
d
per la u, non quello di derivata parziale).
il simbolo di derivata dx
55
Se la derivata si potesse portare sotto il segno di integrale, si avrebbe:
Z
du
@k
(x) =
(x; y) dy:
(1.5)
dx
@x
(Si noti che il nucleo k dipende dalle variabili x e y, quindi la derivata di k
rispetto a x è una derivata parziale, diversamente da quella di u).
Ci chiediamo sotto quali ipotesi si può a¤ermare che la (1.5) vale. Utilizzeremo a questo scopo il teorema di Lebesgue della convergenza dominata.
Cominciamo a considerare:
Z
u (x) =
k (x; y) dy:
Perché la scrittura abbia senso, dovremo chiedere anzitutto che sia:
k : (a; b)
!R
con
Rn misurabile; k (x; ) 2 L1 ( ) per ogni x 2 (a; b). Ora vogliamo
calcolare du
dx (x0 ) in un certo punto x0 2 (a; b). Consideriamo una successione
hn ! 0 di numeri reali, e studiamo il rapporto incrementale:
Z
u (x0 + hn ) u (x0 )
k (x0 + hn ; y) k (x0 ; y)
=
dy:
hn
hn
Poniamo
fn (y) =
k (x0 + hn ; y)
hn
k (x0 ; y)
:
A questo modo il problema è ricondotto al calcolo del limite dell’integrale di
una successione. Infatti:
du
u (x0 + hn ) u (x0 )
(x0 ) = lim
n!1
dx
hn
Z
k (x0 + hn ; y) k (x0 ; y)
= lim
n!1
hn
Z
= lim
fn (y) dy
dy
n!1
e se vale il passaggio al limite sotto il segno di integrale questo è uguale a
Z
k (x0 + hn ; y) k (x0 ; y)
lim
dy
n!1
hn
Z
@k
=
(x0 ; y) dy:
@x
Il punto è quindi giusti…care il passaggio al limite sotto il segno di integrale. Applichiamo il teorema di Lebesgue, richiedendo la validità delle ipotesi necessarie.
Ci serve sapere:
56
1. che esista per q.o. y 2
k (x0 + hn ; y)
hn
lim
n!1
k (x0 ; y)
=
@k
(x0 ; y) ;
@x
2. che sia, per ogni n e per q.o. y 2 ;
k (x0 + hn ; y)
hn
k (x0 ; y)
g (y) 2 L1 ( ) :
@k
Questa è l’ipotesi più delicata. Supponiamo che @x
(x; y) esista non solo per
x = x0 ma per ogni x in un certo intorno di x0 ;del tipo (x0
; x0 + ) (e per
q.o. y). Allora applicando il teorema di Lagrange rispetto alla x possiamo
scrivere
k (x0 + hn ; y) k (x0 ; y)
@k
=
(x0 + h hn ; y)
hn
@x
con j n j < 1. Dunque il punto x0 + h hn appartiene allo stesso intorno (x0
; x0 + ).
Ricaviamo quindi la seguente informazione: se esistono una funzione g 2 L1 ( )
e un intorno (x0
; x0 + ) tali che
@k
(x; y)
@x
g (y)
per q.o. y 2 e per ogni x 2 (x0
; x0 + ), allora si può applicare il teorema di Lebesgue e passare al limite sotto il segno di integrale. Raccogliamo la
discussione precedente nel seguente:
Teorema 1.107 (Derivazione sotto il segno di integrale) Sia
k : (a; b)
!R
con
Rn misurabile; k (x; ) 2 L1 ( ) per ogni x 2 (a; b). Supponiamo che
esistano un intervallo (x0
; x0 + ) (a; b) a una funzione g 2 L1 ( ) a tali
che per q.o. y 2 e per ogni x 2 (x0
; x0 + )
esiste
@k
(x; y) e
@x
@k
(x; y)
@x
g (y) :
Allora per ogni x 2 (x0
; x0 + ) esiste
Z
Z
d
@k
k (x; y) dy =
(x; y) dy:
dx
@x
Il teorema è già completamente dimostrato, con un’unica osservazione. Dalla discussione precedente sembrerebbe di poter concludere che la formula di
derivazione valga nel punto x0 . Poiché però le ipotesi valgono in un intorno
di x0 (che si può vedere come un intorno di qualsiasi altro suo punto), anche
la conclusione vale in quest’intorno. Si osservi che per concludere la tesi nel
solo punto x0 non sarebbe possibile assumere meno di così, come è emerso dalla
dimostrazione.
57
Esempio 1.108 Sia
u (x) =
Z
e
(x y)2
R
f (y) dy; per x 2 R.
Supponiamo che f sia misurabile e limitata, e proviamo che per ogni x 2 R
esiste
Z
Z
2
@
0
(x y)2
u (x) =
e
f (y) dy =
2 (x y) e (x y) f (y) dy:
@x
R
R
La derivata
@
e
@x
(x y)2
f (y) =
2 (x
y) e
(x y)2
f (y)
2
esiste per ogni x; y 2 R. Consideriamo la funzione 2 (x y) e (x y) . Per
ogni x 2 R …ssato, come funzione di y questa è integrabile. Rappresentiamone
un gra…co:
2
Di conseguenza, essendo f (y) misurabile e limitata, la funzione 2 (x y) e (x y) f (y)
sarà integrabile. Ma noi dobbiamo trovare una maggiorante indipendente da x,
valida per ogni x in un intorno di un …ssato x0 . Consideriamo allora l’in2
sieme dei gra…ci delle funzioni 2 (x y) e (x y) ; per x variabile in un piccolo
intorno di x0 :
58
Non è di¢ cile de…nire una funzione integrabile che sia maggiore in modulo
di tutte queste funzioni e tenda a zero ancora in modo esponenziale:
(si potrebbe scrivere facilmente l’espressione analitica di questa funzione, disegnata col tratto più spesso nel gra…co precedente, ma ci accontentiamo del
gra…co). Indicando con h (y) questa funzione, si ha
2 (x
y) e
(x y)2
f (y)
g (y) 2 L1 (R)
h (y) jf (y)j
in quanto h è integrabile e f limitata.
Se avessimo saputo a priori che f era integrabile, sarebbe stato su¢ ciente
trovare h limitata, e la maggiorazione sarebbe stata più immediata:
2 (x
perché la funzione di una variabile
2 (x
y) e
(x y)2
(x y)2
y) e
t2
2te
f (y)
c
è limitata in tutto R, e quindi
c jf (y)j
g (y) 2 L1 (R) :
Perciò, per f integrabile o per f limitata, è comunque vera la conclusione.
Esempio 1.109 Sia
u (x; t) =
Z
R
e
(x
y)2
t
f (y) dy; per x 2 R.
Supponiamo che f sia misurabile e limitata, oppure sia integrabile in R. Allora
per ogni x 2 R e t > 0 esiste
Z
Z
(x y)2
@u
@
(x y) (x y)2
t
t
(x; t) =
e
f (y) dy =
2
e
f (y) dy:
@x
t
R @x
R
59
E’sostanzialmente lo stesso esempio di prima, dove ora t > 0 si può vedere
come un parametro …ssato. Questo è un esempio del modo in cui e¤ ettivamente
utilizzeremo il teorema: avremo una funzione di più variabili, espressa come
integrale dipendente da più parametri; poiché però la deriviamo rispetto a una
variabile alla volta, concettualmente il problema si può vedere come derivazione
di un integrale dipendente da un parametro scalare.
Ci siamo posti il problema di calcolare le derivate di una funzione u assegnata
mediante un integrale. Concettualmente, un passo prima di questo problema c’è
quello di garantire che la u sia una funzione continua del parametro. Enunciamo
un teorema che risponde a tale problema.
Teorema 1.110 (Continuità di un integrale dipendente da un parametro)
Sia
k:I
!R
con I R intervallo e
Rn misurabile; k (x; ) 2 L1 ( ) per ogni x 2 (a; b).
Supponiamo che esistano un intervallo (x0
; x0 + ) I a una funzione g 2
L1 ( ) a tali che
1. per q.o. y 2 sia k ( ; y) continua in x0 e
2. per q.o. y 2 e per ogni x 2 (x0
; x0 + ) sia
jk (x; y)j
Allora la funzione
u (x) =
Z
g (y) :
k (x; y) dy
è continua in x0 . Se le ipotesi valgono per ogni x 2 I, la funzione u è continua
in tutto I:
La dimostrazione, che si lascia per esercizio essendo simile a quella del teorema precedente, si basa ancora sul teorema della convergenza dominata, il che
è la ragione dell’ipotesi 2 di controllo valido per ogni x in un intorno di x0 (e
non solo in x0 ).
Esempio 1.111 La funzione
u (x) =
Z
e
jx yj
f (y) dy
R
è continua in tutto R se f 2 L1 (R), o se f è misurabile e limitata.
dimostrazione di questo fatto si lascia per esercizio.
1.4.7
La
Spazi Lp
Sia ( ; M; ) uno spazio di misura, con misura completa. Oltre allo spazio
L1 ( ) delle funzioni sommabili, è utile in molte questioni introdurre spazi di
funzioni misurabili una cui opportuna potenza è sommabile. Diamo anzitutto
la seguente
60
De…nizione 1.112 Per p 2 [1; 1); poniamo
Z
p
Lp ( ) = f : ! R misurabile :
jf (x)j d (x) < 1 :
Per p = 1 ritroviamo lo spazio L1 ( ) già introdotto, delle funzioni Lebesguesommabili.
p
Chiediamoci: la richiesta che risulti jf j sommabile per qualche p > 1 è più
forte o più debole rispetto a jf j sommabile? In generale le due richieste non
sono confrontabili:
Esempio 1.113 La funzione f (x) = 1=x sta in Lp (1; +1) per p > 1 ma non
per p = 1; invece f (x) = 1=x log2 x sta in L1 (0; 1=2) ma non sta in Lp (0; 1=2)
per nessun p > 1.
Dunque questi spazi non soddisfano reciproche inclusioni banali, in generale.
Gli spazi Lp ( ) sono vettoriali anche per p > 1 (per p = 1 lo sappiamo
già). Infatti la combinazione lineare di funzioni misurabili è misurabile, e vale
la disuguaglianza
p
p
p
jf + gj
2p 1 (jf j + jgj ) ;
perciò se f; g 2 Lp ( ) anche f + g 2 Lp ; con
Z
Z
Z
p
p
p
jf + gj d
2p 1
jf j d +
jgj d
< 1:
(1.6)
Vorremmo renderli spazi vettoriali normati. E’chiaro che la norma naturale
è (se vogliamo soddisfare l’omogeneità):
kf kLp (
)
Z
=
1=p
p
jf j d
.
(Nel seguito scriveremo spesso kf kp per indicare kf kLp ( ) , quando non c’è pericolo di confusioni). Questa “candidata norma”soddisfa la proprietà di positività
(pur di identi…care come di consueto funzioni tra loro uguali quasi ovunque) e
quella di omogeneità della norma. La disuguaglianza triangolare non è però
immediata da dimostrare, perché dalla (1.6) segue
Z
1=p
p
jf + gj d
21
1=p
1 1=p
2
Z
p
" Z
jf j d +
Z
1=p
p
jgj d
1=p
p
jf j d
+
Z
1=p
p
jgj d
#
;
col che avremmo ottenuto una disuguaglianza di tipo triangolare ma con una
costante 21 1=p > 1 a secondo membro, che non è quello che vogliamo. Per
dimostrare una disuguaglianza triangolare “pulita” occorre un argomento più
ra¢ nato. Si può e¤ettivamente dimostrare il seguente
61
Teorema 1.114 (Disuguaglianza di Minkowski) Per ogni p 2 [1; +1); f; g 2
Lp ( ) vale la disuguaglianza
kf + gkp
kf kp + kgkp :
Dunque Lp ( ) è uno spazio vettoriale normato per tutti i p 2 [1; 1):
Ci si può chiedere se esista una ragione particolare per cui gli spazi Lp non
sono stati de…niti anche per 0 < p < 1. In e¤etti si può provare che per 0 < p < 1
la “candidata norma” kf kp non soddisfa la disuguaglianza triangolare.
Vale anche la seguente disuguaglianza, che mette in relazione spazi Lp di
esponenti diversi, e ha molte applicazioni:
Teorema 1.115 (Disuguaglianza di Hölder) Siano p; q 2 (1; 1) tali che
1 1
+ =1
p q
(due numeri con queste proprietà si dicono esponenti coniugati). Se f 2 Lp ( )
e g 2 Lq ( ) ; allora f g 2 L1 ( ) e vale la disuguaglianza (di Hölder)
Z
jf gj d
kf kp kgkq :
Prima di proseguire, prendiamo con…denza col concetto di esponenti coniugati. A¢ nché valga la relazione p1 + 1q = 1; più grande è p più piccolo dev’essere
q; in particolare, 2 è il coniugato di se stesso; se 1 < p < 2 il suo coniugato q
soddisfa 2 < q < 1. Ad esempio, il coniugato di p = 3 > 2 è q = 23 < 2: Per
p ! 1+ ; q ! +1. Dalla relazione 1q = 1 p1 ricaviamo:
q=
p
p
1
e anche
pq = p + q:
p
Tra tutti gli spazi L lo spazio L2 ha proprietà particolari (vedremo in seguito
che questo è uno “spazio di Hilbert”). Scriviamo esplicitamente cosa diventa la
disuguaglianza di Hölder per p = 2 (e quindi, come visto, q = 2):
Z
jf gj d
kf kL2 ( ) kgkL2 ( ) :
Questa prende il nome di disuguaglianza di Schwartz, ed è un analogo in…nito
dimensionale della proprietà del prodotto scalare elementare
jhx; yij
kxk kyk :
Torneremo sull’argomento nel contesto degli spazi di Hilbert.
Introduciamo ora uno spazio che in qualche senso completa la scala degli
spazi Lp .
62
De…nizione 1.116 Poniamo:
L1 ( ) = ff :
! R misurabile : 9K > 0 per cui è jf (x)j
K per q.o. x 2 g :
Le funzioni di questo spazio si dicono anche essenzialmente limitate. Esse
sono limitate salvo un insieme di misura nulla. Se f 2 L1 ( ) si de…nisce
kf kL1 (
)
= inf fK > 0 : jf (x)j
K per q.o. x 2 g .
Quindi in particolare risulta
jf (x)j
kf kL1 (
)
per q.o. x 2 :
Si presti attenzione a non equivocare la de…nizione di “limitatezza essenziale”. I prossimi esempi dovrebbero chiarire le idee.
Esempio 1.117 1. Se f è limitata in in particolare è essenzialmente limitata.
2. La funzione 1=x non è essenzialmente limitata in R. Attenzione: f non
1
K per ogni
è “limitata per x 6= 0”, in quanto per nessun K > 0 è vero che jxj
x 6= 0; o per ogni x appartenente a qualche altro insieme di misura nulla.
3. Un esempio di funzione essenzialmente limitata senza essere limitata è:
f (x) =
sin x per x 2 R n Q
x
per x 2 Q
E’ chiaro infatti che
jf (x)j
1 per q.o. x 2 R;
in quanto Q è un insieme di misura nulla. D’altro canto ovviamente f è
illimitata D’altro canto ovviamente f è illimitata.
4. f è essenzialmente limitata se e solo se f è uguale quasi ovunque ad
una funzione limitata. Ad esempio, la f dell’esempio precedente è uguale quasi
ovunque a sin x.
5. La funzione f (x) = log x appartiene in Lp (0; 1) per ogni p 2 [1; 1)
ma non appartiene a L1 (0; 1); la funzione f (x) = sin x appartiene a L1 (R)
ma non appartiene a Lp (R) per nessun p 2 [1; 1), quindi non c’è in generale
alcuna inclusione banale tra lo spazio L1 e gli altri spazi Lp .
Si veri…ca facilmente che L1 ( ) è uno spazio vettoriale normato (con la
solita identi…cazione tra funzioni uguali quasi ovunque). Inoltre:
Vale anche il prossimo fondamentale risultato:
Teorema 1.118 Gli spazi Lp ( ) per 1
spazi di Banach.
p
1 sono completi. Quindi sono
Notiamo che il concetto di coppia di esponenti coniugati e la disuguaglianza
di Hölder si estendono a comprendere anche lo spazio L1 , al seguente modo:
63
De…nizione 1.119 Diciamo che l’esponente coniugato di p = 1 è q = 1; e
l’esponente coniugato di p = 1 è q = 1.
Ora, se f 2 L1 ( ) e g 2 L1 ( ) si ha, essendo jg (x)j kgkL1 ( ) per q.o.
x2 ;
Z
Z
jf g (x)j d (x)
kgkL1 ( ) jf (x)j d (x) = kgkL1 ( ) kf kL1 ( ) :
Perciò la disuguaglianza di Hölder si estende anche ai casi estremi in cui p = 1
o 1.
Un’applicazione elementare della disuguaglianza di Hölder è il seguente risultato di inclusione tra spazi Lp su un dominio di misura …nita:
Teorema 1.120 Sia ( ; M; ) uno spazio di misura (con misura completa),
di misura …nita, cioè ( ) < 1. Se 1 p < r 1 allora Lr ( ) Lp ( ) e
vale la disuguaglianza:
1
kf kp
( )p
1
r
kf kr per ogni f 2 Lr ( )
1
dove nel caso r = 1 a secondo membro abbiamo
( ) p kf k1 .
Dimostrazione. Supponiamo prima r < 1: Applichiamo la disuguaglianza di
Hölder, scrivendo:
Z
p
p
kf kp =
jf (x)j 1d (x)
p
e osservando che se f 2 Lr ( ) ; allora jf j 2 Lr=p ( ) e la costante 1 appartiene
allo spazio Ls ( ) con s coniugato di r=p; quindi 1=s = 1 p=r: Perciò:
p
kf kp
Z
p
jf (x)j
r
p
p
r
d (x)
Z
1
s
p
r
1 d
p
1 p=r
= kf kr
( )
ed elevando ambo i membri alla 1=p si ha la tesi. Nel caso r = 1 si ha subito
Z
p
1
p
jf (x)j d (x)
kf k1
Z
1
p
1d (x)
=
1
( ) p kf k1 :
E’utile a volte sapere che le funzioni Lp si possono approssimare bene quanto
si vuole, in norma Lp , con funzioni regolari. Vale il seguente
Teorema 1.121 Lo spazio C 1
è denso in Lp ( ) per ogni p 2 [1; 1):
Esplicitamente, la densità signi…ca che per ogni f 2 Lp ( ) con p 2 [1; 1)
1
esiste una successione f'n gn=1 C 1
tale che k'n f kp ! 0 per n ! 1.
A maggior ragione, quindi, ogni funzione Lp ( ) con p 2 [1; 1) può essere
approssimata bene quanto vogliamo in norma Lp mediante funzioni continue in
.
64
1.4.8
Integrali doppi in Rn
Lavorando con l’integrale di Lebesgue in Rn , e in particolare quando si studiano
operatori integrali de…niti su spazi di funzioni integrabili, si possono incontrare
integrali del tipo:
Z
Z
f (x; y) dy dx
Rn
Rn
dove sia x che y rappresentano variabili in Rn . Le domande che si pongono
naturalmente sono:
1. E’lecito scambiare l’ordine di integrazione, scrivendo
Z
Z
Z
Z
f (x; y) dy dx =
f (x; y) dx dy ?
(1.7)
Rn
Rn
Rn
Rn
2. L’integrale iterato calcolato nella formula precedente, coicide con l’integrale
doppio
Z
f (x; y) dxdy
(1.8)
R2n
che si otterrebbe vedendo f (x; y) come funzione di 2n variabili e calcolandone
l’integrale di Lebesgue in R2n ?
La risposta a queste domande è contenuta nel prossimo teorema. In sostanza,
se almeno uno dei 3 integrali che compaiono nelle (1.7)-(1.8) converge assolutamente (cioè quando si sostituisca f con jf j), allora tutti e tre gli integrali
convergono ed entrambe le domande hanno risposta a¤ermativa.
Teorema 1.122 (di Fubini-Tonelli) Sia f : R2n ! R misurabile.
1. Se f
0; allora l’uguaglianza (1.7) è sempre vera, dove i due membri
possono essere entrambi …niti o entrambi in…niti.
2. Se f ha segno qualsiasi ma almeno uno degli integrali iterati che compaiono in (1.7) converge assolutamente (cioè converge uno degli integrali iterati
di jf j) allora la (1.7) vale, con entrambi i membri …niti. In particolare le funzioni
di una variabile
Z
Z
g (x) =
f (x; y) dy e h (y) =
f (x; y) dx
Rn
Rn
risultano Lebesgue integrabili in Rn , e in particolare …nite quasi ovunque. Inoltre
in questo caso f 2 L1 R2n e l’integrale doppio (1.8) di f coincide con gli
integrali iterati in (1.7).
3. Se è noto a priori che f 2 L1 R2n allora valgono tutte le conclusioni
del punto precedente.
Dal punto di vista operativo i punti più utili del teorema sono i primi due:
raramente si sa a priori che f 2 L1 R2n ; più spesso questa conclusione viene
conquistata grazie al fatto che uno degli integrali iterati converge assolutamente.
Spesso accade che l’integrale che nasce dal problema in esame sia uno dei due
integrali iterati, ma quello che si riesce a calcolare esplicitamente sia l’altro
65
integrale iterato. Risulta quindi utile sapere a priori che vale l’uguaglianza
(1.7). Questo è vero se l’integrale iterato che si sa più facilmente calcolare o
almeno stimare, converge assolutamente.
Esempio 1.123 1. Calcolare l’integrale di Lebesgue:
Z
1
se 0 < x < 1
x+y 2
f (x; y) dxdy con f (x; y) =
0
altrimenti.
2
R
L’integranda è non negativa, quindi è lecito calcolare l’integrale doppio come
integrale iterato in qualsiasi ordine. Calcoliamo:
Z
Z 1 Z
1
dy dx =
f (x; y) dxdy =
x
+
y2
2
R
0
R
!
Z 1
+1
1
y
=
2 p arctan p
dx
x
x 0
0
Z 1
p 1
p dx = 2 x 0 = 2 :
=
x
0
Si osservi in particolare che la funzione de…nita dall’integrale interno,
Z
g (x) =
f (x; y) dy = p
x
R
è …nita per quasi ogni x (ma non per ogni x).
2. Stabilire se f 2 L1 R2 , con
f (x; y) = e
x2 y 2
sin (xy) :
La funzione ha segno variabile, ma
jf (x; y)j
e
x2 y 2
:
Maggioriamo l’integrale iterato di f con l’integrale iterato di g (x; y) = e
Z Z
Z Z
2
2
jf (x; y)j dy dx
e x y dy dx
R
R
R
R
Z
Z
2
2
=
e x dx
e y dy < 1:
R
R
p
2
(E’ noto che R e x dx =
,
confronto, l’integrale iterato di
calcolo precedente non fornisce
3. Stabilire se f 2 L1 R2 ,
x2 y 2
:
R
ma il valore esatto qui non è importante). Per
jf j converge, quindi f 2 L1 R2 . Si noti che il
il valore dell’integrale doppio di f .
con
f (x; y) = e
66
jxyj
:
La funzione è positiva, calcoliamo l’integrale doppio come integrale iterato:
Z
Z +1
Z +1
f (x; y) dxdy = 2
2
e xy dy dx
R2
0
0
!
Z +1
+1
e xy
=4
dx
x 0
0
Z +1
dx
=4
= +1;
x
0
pertanto f 2
= L1 R2 .
1.4.9
Convoluzione in Rn
Un’operazione che riguarda gli spazi Lp (Rn ) è la convoluzione, di cui ci limitiamo a segnalare la de…nizione e un paio di proprietà.
Teorema 1.124 Se f; g 2 L1 (Rn ) ; allora l’integrale di convoluzione
Z
(f g) (x) =
f (x y) g (y) dy
Rn
è ben de…nito per q.o. x 2 Rn , e risulta:
kf
gkL1 (Rn )
kf kL1 (Rn ) kgkL1 (Rn ) :
Dimostrazione. Tralasciamo di dimostrare il fatto che la funzione di due
variabili f (x y) g (y) è misurabile. Posto questo, proviamo la disuguaglianza
delle norme, da cui in particolare segue che la convoluzione è de…nita per quasi
ogni x.
Z
Z
Z Z
kf gkL1 (Rn ) =
f (x y) g (y) dy dx
jf (x y) g (y)j dydx
Rn
Rn
Rn
Rn
scambiando l’ordine di integrazione nell’integrale iterato (operazione lecita per
il teorema di Fubini-Tonelli in quanto l’integranda è presa in valore assoluto)
Z
Z
=
jg (y)j
jf (x y)j dx dy:
Rn
Ora l’integrale interno è
Z
jf (x
Rn
y)j dx = (traslando x y = t)
Z
=
jf (t)j dt = kf kL1 (Rn ) ;
Rn
Rn
perciò
kf
gkL1 (Rn )
Z
Rn
jg (y)j kf kL1 (Rn ) dy = kf kL1 (Rn ) kgkL1 (Rn ) :
67
Qualche osservazione. Si noti anzitutto che la de…nizione di convoluzione ha
senso tra due funzioni de…nite su tutto lo spazio Rn . Si veri…ca con un cambio di
variabile che la convoluzione è commutativa, ossia (f g) = (g f ). Si noti che
l’integranda f (x y) g (y), per ogni x …ssato si può vedere come una funzione
di y che è il prodotto di due funzioni L1 , quindi in generale non è L1 . Tuttavia
il teorema appena dimostrato a¤erma che per quasi ogni x in e¤etti è L1 . Ad
esempio, se
1
f (x) = p
( 1;1) (x) ;
jxj
la funzione f 2 L1 (R) ; quindi f f 2 L1 (R) e in particolare l’integrale
Z
1
1
p
(f f ) (x) =
y) p
( 1;1) (y) dy
( 1;1) (x
jyj
jx yj
R
è …nito per q.o. x. Però per x = 0 si ha
Z
1
1
p
(f f ) (0) =
( 1;1) ( y) p
jyj
jyj
R
(
1;1) (y) dy =
Z
1
1
dy
= 1:
jyj
E’facile veri…care direttamente che per ogni x 6= 0 invece l’integrale converge.
Vale anche la seguente estensione del teorema precedente, che ci sarà utile:
Teorema 1.125 (Disuguaglianza di Young) Siano f 2 L1 (Rn ) e g 2 Lp (Rn )
per qualche p 2 [1; 1] : Allora è ben de…nita per q.o. x la convoluzione f g e
si ha:
kf gkLp (Rn ) kf kL1 (Rn ) kgkLp (Rn ) :
1.5
Richiami sulle serie di Fourier
In analisi 2 si sono studiati i primi elementi della teoria delle serie di Fourier.
Richiamiamo velocemente alcuni fatti noti, puntualizzando qualche aspetto che
in analisi 2 probabilmente non è stato toccato:
1.5.1
Serie di Fourier in L2
Dal punto di vista moderno, basato cioè sulla teoria della misura e dell’integrazione di Lebesgue (e che si potrà inquadrare in modo naturale nella teoria
degli spazi di Hilbert di cui parleremo in seguito), la teoria delle serie di Fourier
“funziona bene” nello spazio L2 .
Sia f : [0; L] ! R, f 2 L2 (0; L) : Risultano allora ben de…niti (come integrali
di Lebesgue) i coe¢ cienti di Fourier di f ,
Z
2 L
ak =
f (x) cos (k!x) dx per k = 0; 1; 2; 3; ::::
L 0
Z
2 L
bk =
f (x) sin (k!x) dx per k = 1; 2; 3; :::
L 0
68
con ! = 2L .
Infatti, notiamo che se f 2 L2 (0; L), a maggior ragione f 2 L1 (0; L) e quindi
anche f (x) cos (k!x) e f (x) sin (k!x) sono integrabili, perciò i coe¢ cienti di
Fourier sono ben de…niti.
Vale il seguente
Teorema 1.126 Per ogni f 2 L2 (0; L) la serie di Fourier
1
a0 X
+
fak cos (k!x) + bk sin (k!x)g
2
k=1
converge a f in norma L2 (0; T ), il che signi…ca, esplicitamente, che detta
n
a0 X
+
fak cos (k!x) + bk sin (k!x)g
2
sn (x) =
k=1
la somma parziale n-esima della serie di Fourier di f , risulta
ksn
f kL2 (0;T ) ! 0 per n ! 1:
Valgono inoltre le seguenti proprietà:
1. Uguaglianza di Perceval:
(
)
1
L a20 X 2
2
2
kf kL2 (0;T ) =
+
ak + bk ;
2
2
k=1
2. Lemma di Riemann-Lebesgue:
ak ! 0 e bk ! 0 per k ! 1:
Rispetto a quanto lo studente ha probabilmente studiato in analisi 2, si noti
che la tesi del teorema vale per qualsiasi funzione L2 (0; T ), in particolare anche
per funzioni illimitate o così discontinue da risultare non integrabili secondo
Riemann.
Si osservi tuttavia che il teorema non dice nulla sull’eventuale convergenza
puntuale della serie di Fourier.
Per il calcolo e¤ettivo dei coe¢ cienti di Fourier, valgono le solite osservazioni
sulle eventuali simmetrie di f :
L L
se f :
2 ; 2 ! R è una funzione pari, allora bk = 0 per ogni k e
4
ak =
L
se f :
L L
2; 2
Z
L
2
f (x) cos (k!x) dx per k = 0; 1; 2; 3; ::::
0
! R è una funzione dispari, allora ak = 0 per ogni k e
bk =
4
L
Z
L
2
f (x) sin (k!x) dx per k = 1; 2; 3; ::::
0
69
1.5.2
Convergenza puntuale delle serie di Fourier e rapidità di convergenza a zero dei coe¢ cienti
Ricordiamo anzitutto il teorema di convergenza puntuale delle serie di Fourier
che lo studente ha probabilmente studiato in analisi 2.
De…nizione 1.127 Una funzione f : [0; L] ! R si dice regolare a tratti se f è
limitata in [0; L] e l’intervallo [0; L] si può suddividere in un numero …nito di
intervallini [ k ; k ] tali che:
f è derivabile in ( k ; k ) ed esistono …niti
lim f (x) e
x!
k+
lim f 0 (x) e
x!
lim f (x) ;
x!
k+
k
lim f 0 (x) :
x!
k
Ad esempio, la f può avere un certo numero di punti di discontinuità a salto
e di punti angolosi, ma non asintoti verticali né punti a tangente verticale. Si
noti che una funzione regolare a tratti è automaticamente limitata e Riemann
integrabile, a maggior ragione appartiene a L2 (0; L) :
Vale il
Teorema 1.128 (di convergenza puntuale delle serie di Fourier) Sia f :
[0; L] ! R una funzione regolare a tratti. Allora la serie di Fourier di f converge
puntualmente per ogni x0 2 (0; L) alla somma
f x+
0 + f x0
;
2
mentre nei due estremi 0; L converge puntualmente a
f (0+ ) + f (L )
:
2
In particolare, la serie di Fourier converge puntualmente a f per ogni x 2
[0; L] se (oltre ad essere regolare a tratti) la funzione è continua in [0; L] e
soddisfa la condizione di raccordo f (0) = f (L).
Si osservi che le ultime due ipotesi (grazie alle quali la convergenza puntuale
è alla funzione f (x) in ogni punto) si possono sintetizzare dicendo che la periodizzata di f (cioè la funzione de…nita su tutto R, periodica di periodo L, che
coincide con f in [0; L]) è continua in R.
Un’altra informazione che ci sarà spesso utile è la conoscenza della velocità
con cui tendono a zero i coe¢ cienti di Fourier di f . L’idea è che più regolare
è f , più velocemente tendono a zero i suoi coe¢ cienti di Fourier. Occorre
prestare attenzione però al fatto che è importante in questo contesto la regolarità
della periodizzata di f , proprietà che richiede anche le opportune condizioni di
raccordo agli estremi dell’intervallo.
70
Per capire la situazione, consideriamo una funzione f 2 C 1 ([0; L]). Indichiamo con ak ; bk i coe¢ cienti di Fourier di f e con k ; k i coe¢ cienti di Fourier
di f 0 ; cerchiamo di esprimere k ; k in funzione di ak ; bk . Si ha (per k 1):
(
)
Z
Z L
2 L 0
2
L
f (x) cos (k!x) dx =
[f (x) cos (k!x)]0 + k!
f (x) sin (k!x) dx
k =
L 0
L
0
Z
2
2 L
= (f (L) f (0)) + k!
f (x) sin (k!x) dx:
L
L 0
Se supponiamo che f soddis… le condizioni di raccordo f (L) = f (0) otteniamo
la relazione semplice
k = k!bk :
Analogamente si trova
k
=
k!ak :
Notiamo anche la relazione
Z
2
2 L 0
f (x) dx = (f (L)
=
0
L 0
L
f (0)) = 0:
Possiamo sintetizzare queste relazioni nell’identità
j
kj
+j
kj
= k! (jak j + jbk j) per k = 1; 2; 3::::
(e
0 = 0)
Chiediamoci ora se questa relazione continua a valere chiedendo qualcosa
meno che f 2 C 1 ([0; L]). La dimostrazione è basata sulla formula di integrazione per parti.
Si può dimostrare facilmente la seguente
Proposizione 1.129 La formula di integrazione per parti
Z
Z
L
0
f g = f g (L)
f g (0)
0
L
f g0
0
vale se g 2 C 1 ([0; L]) e f soddisfa le ipotesi più deboli: f 2 C 0 ([0; L]) ; f
possiede derivata prima continua, ad eccezione di un numero …nito di punti in
cui comunque la derivata prima ha limiti destro e sinistro …niti.
In pratica, la g può anche avere un numero …nito di punti angolosi.
Dimostrazione. Proviamo la tesi supponendo che f 0 non esista in un unico
punto c 2 (0; L), con f 0 (c+ ) ; f 0 (c ) …niti, il discorso si estende a un numero
…nito qualsiasi di punti. Si ha:
Z
0
L
f 0g =
Z
c
f 0g +
0
Z
c
71
L
f 0 g:
Ora su ciascun intervallo [0; c] ; [c; L] la f è C 1 e si può integrare per parti, quindi
si ha:
Z L
Z c
Z L
f 0 g = (f g) (c) (f g) (0)
f g 0 + (f g) (L) (f g) (c)
f g0
0
0
= (f g) (L)
(f g) (0)
Z
c
L
f g0 :
0
Otteniamo così il seguente:
Teorema 1.130 (di convergenza totale) Sia f : [0; L] ! R una funzione:
a. continua in [0; L] e soddisfacente la condizione di raccordo f (0) = f (L);
b. derivabile e con derivata continua in [0; L], salvo al più un numero …nito
di punti di [0; L] nei quali comunque esistono …niti i limiti destro e sinistro di
f 0.
Allora la serie
1
X
(jak j + jbk j)
k=1
converge, ossia la serie di Fourier di f converge totalmente, quindi assolutamente e uniformemente. Le ipotesi del teorema sono veri…cate in particolare se
f : R ! R è una funzione T -periodica e C 1 (R).
Dimostrazione. Nelle ipotesi del teorema vale la relazione
j
kj
+j
kj
= k! (jak j + jbk j) per k = 1; 2; 3::::
(1.9)
tra i coe¢ cienti di Fourier ak ; bk di f e i coe¢ cienti k ; k di f 0 . Inoltre, la
funzione f 0 è limitata e continua a tratti, perciò certamente L2 ; il che implica
per l’uguaglianza di Perceval che
1
X
2
k
2
k
+
k=1
<1
ossia, per le (1.9),
1
X
k=1
k 2 a2k + b2k < 1:
(1.10)
Possiamo allora scrivere (applicando la disuguaglianza di Swchartz per le serie)
1
X
k=1
jak j =
1
X
k=1
1
X
1
k jak j
k
k 2 a2k
k=1
!1=2
1
X
1
k2
k=1
e analogamente
1
X
k=1
jbk j
1
X
k=1
k 2 b2k
!1=2
72
1
X
1
k2
k=1
!1=2
:
!1=2
P1
Poiché k=1 k12 < 1; la (1.10) implica la tesi.
L’argomentazione precedente può essere ora iterata alle derivate successive.
Teorema 1.131 (Velocità di convergenza a zero dei coe¢ cienti) Sia f una
funzione tale che:
a. f 2 C s 1 (R) e L-periodica (cioè C s 1 ([0; L]) e soddisfacente la condizione di raccordo f (0) = f (L), f 0 (0) = f 0 (L),...,f (s 1) (0) = f (s 1) (L)).
b. f (s 1) è derivabile e con derivata continua in [0; L], salvo al più un
numero …nito di punti di [0; L] nei quali comunque esistono …niti i limiti destro
e sinistro di f (s 1) .
(Queste ipotesi sono veri…cate in particolare se f 2 C s (R) e L-periodica,
o se f 2 C s ([0; L]) e soddisfa le condizioni raccordo su f; f 0 ; ::; f (s 1) , non
necessariamente su f (s) ).
Allora:
i) vale la relazione
j
kj
+j
kj
s
= (k!) (jak j + jbk j) per k = 1; 2; 3::::
tra i coe¢ cienti di Fourier ak ; bk di f e i coe¢ cienti
ii)
1
X
k 2s a2k + b2k < 1;
k;
k
(1.11)
di f (s) ;
(1.12)
k=1
da cui segue che
ak ; bk = o
1
ks
per k ! 1
e anche (informazione più precisa) che
1
X
k=1
(Si noti che se
k (jak j + jbk j) < 1 per ogni
<s
1
:
2
è un intero la relazione precedente signi…ca
s
1).
Dimostrazione. Il punto i) si ottiene applicando iterativamente il ragionamento visto nel teorema precedente. Ancora, poiché f (s 1) è regolare a tratti, in
particolare è limitata e integrabile, quindi anche L2 (0; L) e, per l’uguaglianza
di Perceval,
1
X
2
2
(1.13)
k + k < 1;
k=1
dalla (1.11) segue la (1.12), che a sua volta implica che k 2s a2k + b2k ! 0; quindi
k s (jak j + jbk j) ! 0, quindi ak ; bk = o k1s per k ! 1. Ancora con la disuguaglianza di Schwartz possiamo dimostrare l’ultima parte della tesi (ragioniamo
73
solo su ak , analogamente si tratta bk ):
1
X
k=1
k jak j =
1
X
k=1
k s jak j k
1
X
k 2s a2k
k=1
s
!1=2
1
X
k
2(
s)
k=1
!1=2
:
Ora la prima serie converge per (1.12), la seconda converge purché sia
2(
s) <
cioè
<s
1;
1
.
2
Ad esempio, per s = 2 il teorema dice che se f : [0; L] ! R, f 2 C 1 [0; L]
con f (0) = f (L) ; f 0 (0) = f 0 (L) e inoltre f 0 è regolare a tratti (il che accade se
ad es. è f 2 C 2 [0; L] e soddisfa le condizioni di raccordo scritte), allora
1
X
k=1
ad esempio, per
k (jak j + jbk j) < 1 per ogni
<
3
;
2
= 1, leggiamo che
1
X
k=1
k (jak j + jbk j) < 1;
a¤ermazione più forte rispetto a ak ; bk = o k12 ; da cui seguirebbe solo k (jak j + jbk j) =
o k1 , il che non implica la convergenza della serie.
74
2
2.1
Generalità su equazioni e problemi ai limiti
per equazioni a derivate parziali
Equazioni lineari del second’ordine
Le equazioni alle derivate parziali di cui ci occuperemo nel seguito, ossia quelle
di cui abbiamo discusso nel §2 il signi…cato modellistico, condividono diverse
importanti proprietà:
-sono tutte del second’ordine (occasionalmente si possono ridurre a equazioni
del prim’ordine);
-sono tutte lineari;
-sono (quasi) tutte a coe¢ cienti costanti.
Per …ssare le idee, scriviamo nuovamente qualcuna di queste equazioni, a
titolo d’esempio:
uxx + uyy = f
(2.1)
(equazione di Poisson in 2 variabili spaziali);
ut
Duxx + bux
cu = f
(2.2)
(equazione di di¤usione in una variabile spaziale, con termini di trasporto e
reazione);
utt c2 uxx + but = f
(2.3)
(equazione della corda vibrante smorzata).
Facciamo qualche osservazione sulla linearità dell’operatore.
Dire che un’equazione alle derivate parziali è lineare signi…ca che ha la forma
Lu = f
dove u è la funzione incognita, f un termine noto (se è zero diciamo che l’equazione è omogenea) e L è un operatore di¤ erenziale lineare, ossia tale che, se
u1 ; u2 sono funzioni per cui Lu1 e Lu2 sono ben de…nite e se c1 ; c2 sono costanti,
L (c1 u1 + c2 u2 ) = c1 Lu1 + c2 Lu2 :
Il più generale operatore di¤erenziale lineare del second’ordine in n variabili14 si può scrivere così:
Lu (x) =
n
X
aij (x) uxi xj (x) +
i;j=1
n
X
bk (x) uxk (x) + c (x) u (x)
(2.4)
k=1
(con x 2 Rn ). Si dice parte principale dell’operatore l’insieme dei termini nelle
derivate seconde, cioè l’operatore
n
X
aij (x) uxi xj (x) ;
i;j=1
1 4 Si osservi il linguaggio: L è un operatore di¤erenziale lineare del second’ordine; Lu = f è
un’equazione di¤erenziale lineare del second’ordine.
75
mentre
n
X
bk (x) uxk (x) + c (x) u (x)
k=1
si dicono termini di ordine inferiore.
Naturalmente occorre precisare uno spazio di funzioni su cui si considera
agire l’operatore L. Ad esempio, l’operatore L in (2.4), se i coe¢ cienti aij ; bk ; c
sono funzioni continue su un dominio
Rn , si può vedere come operatore
lineare tra i seguenti spazi vettoriali:
L : C2
! C0
:
Tra questi spazi, muniti delle rispettive norme, L risulta anche continuo, in
quanto
kLukC 0 ( )
n
X
aij uxi xj
i;j=1
0
@
C0(
n
X
)+
k=1
n
X
i;j=1
kaij kC 0 ( ) +
n
X
k=1
c kukC 2 ( ) :
kbk uxk kC 0 ( ) + kcukC 0 ( )
1
kbk kC 0 ( ) + kckC 0 ( ) A kukC 2 ( )
La linearità dell’equazione ha una serie di conseguenze, che lo studente ha già
incontrato nel corso dell’algebra lineare e dello studio delle equazioni di¤erenziali
ordinarie. Per cominciare:
-la generica soluzione dell’equazione completa si può ottenere sommando la
generica soluzione dell’equazione omogenea e una particolare soluzione dell’equazione completa;
-la totalità delle soluzioni dell’equazione omogenea è uno spazio vettoriale
(nelle ipotesi fatte sopra, un sottospazio di C 2
.
Altre proprietà conseguenze della linearità saranno illustrate in seguito in
relazione alle condizioni al contorno.
2.2
Equazioni ellittiche, paraboliche, iperboliche
Le equazioni a derivate parziali lineari del second’ordine possono presentare proprietà matematiche molto diverse le une dalle altre, coerentemente al signi…cato
…sico molto diverso che hanno le equazioni incontrate …n qui.
La proprietà matematica che discrimina queste situazioni è espressa dalla
seguente de…nizione.
De…nizione 2.1 (Equazioni ellittiche, paraboliche, iperboliche) Sia
Lu (x) =
n
X
aij (x) uxi xj (x) +
i;j=1
n
X
k=1
76
bk (x) uxk (x) + c (x) u (x)
un’equazione alle derivate parziali, lineare del second’ordine de…nita per x 2
Rn , e consideriamo, per un certo x0 2 …ssato, la forma quadratica;
q : Rn ! R
n
X
q : h 7!
aij (x0 ) hi hj
i;j=1
(si può sempre supporre che la matrice aij sia simmetrica). Si dice che:
l’operatore L è ellittico (in x0 ) se la forma quadratica q è de…nita (positiva
o negativa);
l’operatore L è iperbolico (in x0 ) se la forma quadratica q è inde…nita;
l’operatore L è parabolico (in x0 ) se la forma quadratica q è semide…nita
(positiva o negativa).
Diremo che l’operatore L è ellittico, o iperbolico, o parabolico in se lo è in
ogni punto di :
Analoga terminologia si usa per l’equazione Lu = f , cioè: qualunque sia il
termine noto f , diremo che l’equazione è ellittica, parabolica, iperbolica (in un
punto o in un dominio), se lo è l’operatore L.
Osservazione 2.2 Se L in particolare è a coe¢ cienti costanti, l’operatore è
di uno stesso tipo in tutto Rn ; se l’operatore ha coe¢ cienti variabili, può anche
essere di tipo diverso in punti diversi dello spazio, come vedremo con gli esempi.
Si noti che la de…nizione di operatore ellittico, parabolico, iperbolico dipende
solo dalla parte principale dell’operatore di¤ erenziale, cioè dai termini nelle
derivate seconde15 .
Esempio 2.3 (a). L’operatore di Laplace in Rn ;
u=
n
X
uxi xi
i=1
ha forma quadratica
q (h) =
n
X
i=1
2
h2i = jhj ;
che è de…nita positiva. Perciò
è un operatore ellittico in Rn .
(b) Di conseguenza sono operatori ellittici in Rn anche gli operatori
Lu =
u+
n
X
bk (x) uxk + c (x) u
k=1
in quanto, come già osservato, il tipo di operatore dipende solo dalla parte
principale, cioè del second’ordine.
1 5 Ma su questo preciseremo qualcosa più avanti per quanto riguarda le equazioni
paraboliche.
77
(c) L’operatore delle onde in n variabili spaziali (detto anche operatore di
D’Alembert o Dalembertiano e indicato con )
u = utt
c2 u
con
laplaciano in Rn ha forma quadratica (in Rn+1 ; chiamando xn+1 la
variabile t)
n
X
q (h) = h2n+1 c2
h2i
i=1
inde…nita, quindi è un operatore iperbolico in tutto Rn+1 .
(d) L’operatore del calore in n variabili spaziali
Hu = ut
D u
(con D > 0 e
laplaciano in Rn ) ha forma quadratica (in Rn+1 ; chiamando
xn+1 la variabile t)
n
X
q (h) = D
h2i
i=1
n+1
semide…nita negativa in R
(si ricordi che la forma quadratica q “non si accorge” dai termini del prim’ordine, in questo caso di ut ), quindi H è parabolico.
(e) L’operatore di Tricomi in R2
T u = yuxx + uyy
è ellittico nel semipiano y > 0, iperbolico nel semipiano y < 0, parabolico sulla
retta y = 0. Ecco un esempio signi…cativo di operatore che cambia tipo da punto
a punto (si dice “operatore di tipo misto”).16
Osservazione 2.4 Con riferimento all’esempio (d), osserviamo che solitamente
si riserva il nome di operatore parabolico, in n + 1 variabili, a un operatore che
si possa scrivere nella forma:
uxn+1 + Eu
con E operatore ellittico nelle prime n variabili. In altre parole, la forma
quadratica è semide…nita in Rn+1 ma è de…nita in Rn , e l’operatore di¤ erenziale
contiene la derivata prima nella variabile che manca nella parte del second’ordine.
L’operatore di Laplace è il prototipo di operatore ellittico; questi operatori dal punto di vista …sico si possono vedere come operatori stazionari che
1 6 Quest’equazione è stata studiata, per primo, da Tricomi nel 1923, e interviene nello studio
dei ‡uidi transonici. Nello studio dell’aerodinamica, la regione ellittica corrisponde ad un ‡usso
subsonico, la regione parabolica alla barriera del suono e la regione iperbolica alla propagazione
supersonica delle onde di shocks.
78
esprimono, tipicamente, lo stato di un sistema …sico in equilibrio, in qualche
senso.
L’operatore del calore è il prototipo di operatore parabolico; gli operatori parabolici17 dal punto di vista …sico si possono vedere come operatori di
evoluzione che esprimono, tipicamente, un fenomeno di di¤usuione (eventualmente accompagnato da fenomeni di trasporto e / o reazione).
L’operatore delle onde è il prototipo di operatore iperbolico; sono operatori
iperbolici quegli operatori d’evoluzione che, dal punto di vista …sico, esprimono
un fenomeno ondulatorio o vibratorio.
2.3
Condizioni al contorno
Ogni modello di¤erenziale che traduce un problema …sico speci…co, normalmente
a¢ anca all’equazione alle derivate parziali che esprime le leggi …siche che governano il sistema anche certe condizioni, inziali o al contorno, che contengono
dati del problema, ma esprimono anche certe ipotesi sul sistema stesso. Non
è mai l’equazione a derivate parziali da sola a determinare un’unica soluzione;
piuttosto possiamo sperare che una e una sola soluzione esista per il problema
costituito da equazione + condizioni.
Che tipo di condizioni si possono a¢ ancare a una certa equazione di¤erenziale? Questo dipende naturalmente dal signi…cato …sico del problema ma, come
al solito, la matematica aiuta a mettere ordine nella casistica: a un certo tipo
di equazione (ellittica, parabolica, iperbolica) corrispondono certi tipi naturali
di condizioni. Facciamo una prima panoramica su questi tipi di condizioni, che
ritroveremo poi caso per caso studiando nel seguito i vari problemi.
2.3.1
Equazioni ellittiche. Problemi al contorno
Consideriamo, come esempio di equazione ellittica, l’equazione di Poisson in R3 :
u
uxx + uyy + uzz = f in
R3 .
Immaginiamo di studiare il campo elettrostatico in una certa regione dello
spazio in cui sono posti alcuni corpi conduttori, su ciascuno dei quali è posta una
certa distribuzione di carica; inoltre nello spazio è assegnata una distribuzione
volumica di carica. Se
è la regione dello spazio tra i conduttori, possiamo
immaginare che sia noto il potenziale elettrostatico sulla super…cie di ciascun
conduttore (cioè sul bordo di ), e a partire da questo e dalla distribuzione di
carica f nello spazio vogliamo determinare il potenziale in tutto la regione :
Siamo così condotti al problema:
u = f in
u = g su @ :
(2.5)
Oppure, supponiamo che u sia la temperatura di un corpo tridimensionale
, omogeneo, sogggetto a sorgenti di calore interno (ad es. per irraggiamento)
17 o
più precisamente, quelli che soddisfano le ipotesi descritte nell’Osservazione precedente.
79
espresse dal termine di sorgente f , nell’ipotesi che il sistema abbia raggiunto
uno stato di equilibrio termico, ossia che la temperatura non cambi più nel
tempo (stato stazionario). Possiamo pensare di misurare la temperatura di u
sul bordo di (o anche di imporre una determinata temperatura sul bordo di
, termostatandolo), e a partire da queste informazioni possiamo pensare che
risulti determinata la temperatura in tutto il corpo. La u soddisferà ancora un
problema (2.5). Più in generale:
De…nizione 2.5 Si dice problema di Dirichlet per un’equazione Lu = f in
Rn un problema del tipo
Lu = f in
u = g su @ :
(2.6)
con g dato al bordo assegnato. Se g = 0 si dice problema di Dirichlet omogeneo.
Il problema di Dirichlet ha senso quando
ha un bordo, quando cioè l’equazione non si studia sullo spazio intero. In quest’ultimo caso, l’analogo del
problema di Dirichlet consiste nell’imporre che u soddis… una certa condizione
all’in…nito, ad esempio:
u = f in R3
u (x) ! 0 per x ! 1:
Torniamo all’interpretazione di u = f come equazione di di¤usione del
calore in stato stazionario. Invece di imporre una certa temperatura al bordo,
potremmo sapere che il corpo è termicamente isolato al contorno, cioè che non
c’è ‡usso di calore al bordo. Poiché la densità di ‡usso di calore è proporzionale
al gradiente della temperatura, l’assenza di ‡usso attraverso il bordo di
si
descrive con l’annullarsi della derivata di u nella direzione normale:
u = f in
= 0 su @
@u
@
dove
@u
= ru e ,
@
si dice derivata normale, e e è il versore normale uscente dalla super…cie. Più
in generale potremmo assegnare il ‡usso di calore (diverso da zero) uscente dalla
super…cie, imponendo:
u = f in
@u
@ = g su @ :
Il ‡usso sarà punto per punto uscente o entrante a seconda che sia g < 0 o
g > 0. (Ricordare che il gradiente della temperatura ha verso opposto al ‡usso
di calore).
80
De…nizione 2.6 Si dice problema di Neumann per un’equazione Lu = f in
Rn un problema del tipo
Lu = f in
@u
@ = g su @ :
(2.7)
con g dato al bordo assegnato. Se g = 0 si dice problema di Neumann omogeneo.
Continuando l’esempio della di¤usione del calore, un corpo potrebbe essere
lasciato libero di scambiare calore con l’ambiente esterno: in questo caso il
‡usso di calore sarà proporzionale al salto di temperatura, ossia, supponendo
che l’ambiente esterno abbia costante u0 , varrà
@u
= k (u0
@
u)
con k > 0 (costante o variabile da punto a punto). L’equazione esprime il fatto
che c’è un ‡usso di calore entrante (quindi @u
@ > 0) se l’ambiente esterno è più
caldo del corpo, cioè se u0 > u. In generale:
De…nizione 2.7 Si dice problema di Robin per un’equazione Lu = f in un
problema del tipo
Lu = f in
(2.8)
@u
@ + ku = g su @ :
con g dato al bordo assegnato, k > 0. Se g = 0 si dice problema di Robin
omogeneo.
In…ne:
De…nizione 2.8 Si dice problema misto per un’equazione Lu = f in
problema del tipo
8
< Lu = f in
u = g su 1
: @u
2
@ = h su
dove @
=
1
[
2;
1
\
2
un
= ?, con f; g assegnate.
In altre parole, un problema misto è un problema in cui si assegna una
condizione di tipo Dirichlet su una parte del bordo del dominio, e una condizione
di tipo Neumann su un’altra parte del bordo del dominio.
2.3.2
Equazioni paraboliche. Problemi al contorno e ai valori iniziali
Consideriamo, come esempio di equazione parabolica, l’equazione del calore in
R3 :
ut (t; x) D u (t; x)
ut D (uxx + uyy + uzz ) = f (t; x) per x 2
R3 ; t > 0:
Supponiamo quindi che u sia la temperatura di un corpo tridimensionale
, omogeneo, sogggetto a sorgenti di calore interno espresse dal termine di
81
sorgente f , eventualmente dipendente anche dal tempo, e ora non supponiamo
che il sistema abbia già raggiunto l’equilibrio (come nel caso dell’equazione di
Poisson). Come nel caso stazionario, possiamo pensare di imporre (o misurare)
la temperatura al bordo del dominio, oppure di imporre (o misurare) un certo
‡usso termico attraverso il bordo del dominio. In ogni caso, trattandosi di un
problema di evoluzione, per determinare la temperatura a qualunque istante
t > 0 dovremo anche conoscere la temperatura iniziale. Problemi sensati sono
quindi i seguenti:
De…nizione 2.9 Si dice problema di Cauchy-Dirichlet per un’equazione ut
Lu = f (con L operatore ellittico in
Rn ; del tipo L = D +termini di
ordine inferiore) in un dominio
ft > 0g un problema del tipo
8
< ut Lu = f per x 2 ; t > 0
u (t; x) = g (t; x) per x 2 @ ; t > 0
(2.9)
:
u (0; x) = h (x) per x 2 :
con g dato al bordo assegnato, h condizione iniziale assegnata. Se g = 0 o h = 0
si dice problema di Cauchy-Dirichlet con condizioni di Dirichlet (o di Cauchy,
rispettivamente) omogenee.
De…nizione 2.10 Si dice problema di Cauchy-Neumann per un’equazione ut
Lu = f (con L operatore ellittico in
Rn , del tipo L = D +termini di ordine
inferiore in x) in un dominio
ft > 0g un problema del tipo
8
< ut Lu = f per x 2 ; t > 0
@u
(2.10)
(t; x) = g (t; x) per x 2 @ ; t > 0
: @
u (0; x) = h (x) per x 2 :
con g dato al bordo assegnato, h condizione iniziale assegnata. Se g = 0 o h = 0
si dice problema di Cauchy-Neumann con condizioni di Neumann (o di Cauchy,
rispettivamente) omogenee.
Analogamente si può de…nire un problema di Cauchy-Robin o un problema
di Cauchy con condizioni miste di Dirichlet-Neumann.
Qualche osservazione.
Se per la natura del problema la regione spaziale è tutto lo spazio, si può
studiare il problema di Cauchy:
ut Lu = f per x 2 Rn ; t > 0
u (0; x) = h (x) per x 2 Rn :
In tutti i problemi precedenti, l’intervallo t > 0 può essere sostituito dall’intervallo t 2 (0; T ) : Un dominio di Rn+1 del tipo
(0; 1) o
(0; T ) si dice
dominio cilindrico.
Si noti che in un problema di Cauchy-Dirichlet o di Cauchy-Neumann su un
cilindro QT =
(0; T ), complessivamente i dati sono assegnati sull’insieme
f(x; 0) : x 2 g [ f(x; t) : x 2 @ ; t 2 [0; T ]g :
82
Questo insieme prende il nome di frontiera parabolica del cilindro QT , e talvolta indicato con @P QT . Si noti che la frontiera parabolica del cilindro è una
parte della frontiera del cilindro, precisamente è la sua frontiera privata del
“coperchio” del cilindro f(x; T ) : x 2 g :
2.3.3
Equazioni iperboliche. Problemi al contorno e ai valori iniziali
Consideriamo, come esempio di equazione iperbolica, l’equazione delle onde in
due variabili spaziali:
utt
c2 u = utt
c2 (uxx + uyy ) = f in
R2
che, come già discusso, si può vedere come l’equazione della membrana vibrante
(per piccole vibrazioni). Fissare la membrana al contorno signi…ca imporre il
valore di u, quindi una condizione di Dirichlet. Per determinare il moto della
membrana dovremo conoscere però anche le condizioni iniziali, ossia la posizione
e la velocità della membrana (trattandosi di un’equazione del second’ordine in
t, a di¤erenza dell’equazione del calore). Quindi:
De…nizione 2.11 Si dice problema di Cauchy-Dirichlet per un’equazione iperbolica utt Lu = f (con L operatore del tipo L = c2 +termini di ordine
inferiore in x e t; per x 2
Rn ; t > 0) un problema del tipo
8
utt Lu = f per x 2 ; t > 0
>
>
<
u (t; x) = g (t; x) per x 2 @ ; t > 0
(2.11)
u (0; x) = u0 (x) per x 2
>
>
:
ut (0; x) = v0 (x) per x 2
con g dato al bordo assegnato, u0 ; v0 condizioni iniziali assegnata. Se g = 0
oppure (u0 = 0 e v0 = 0) si dice problema di Cauchy-Dirichlet con condizioni
di Dirichlet (o di Cauchy, rispettivamente) omogenee.
Una condizione al contorno del tipo @u
@ = 0, nel modello della membrana
vibrante (o, più realisticamente, nel modello della corda vibrante, in una sola
variabile spaziale) ha il signi…cato di richiedere che la membrana al bordo sia
…ssata in modo da poter scorrere verticalmente senza attrito su una guida.
Diamo comunque una de…nizione generale:
De…nizione 2.12 Si dice problema di Cauchy-Neumann per un’equazione iperbolica utt Lu = f (con L operatore del tipo L = c2 +termini di ordine inferiore
in x e t; per x 2
Rn ; t > 0) un problema del tipo
8
utt Lu = f per x 2 ; t > 0
>
>
< @u
@ (t; x) = g (t; x) per x 2 @ ; t > 0
(2.12)
u
(0; x) = u0 (x) per x 2
>
>
:
ut (0; x) = v0 (x) per x 2
con g dato al bordo assegnato, u0 ; v0 condizioni iniziali assegnata. Se g = 0
oppure (u0 = 0 e v0 = 0) si dice problema di Cauchy-Neumann con condizioni
di Neumann (o di Cauchy, rispettivamente) omogenee.
83
Come per il problema parabolico, se per la natura del problema la regione
spaziale è tutto lo spazio, si può studiare anche il problema di Cauchy puro:
8
< ut Lu = f per x 2 Rn ; t > 0
u (0; x) = u0 (x) per x 2 Rn
:
ut (0; x) = v0 (x) per x 2 Rn
Ancora, in tutti i problemi precedenti, l’intervallo t > 0 può essere sostituito
dall’intervallo t 2 (0; T ) :
2.4
Principio di sovrapposizione
Osserviamo ora che tutte le condizioni al contorno e ai valori iniziali che abbiamo descritto nel paragrafo precedente sono anch’esse di tipo lineare. Questo
signi…ca che ciascuna condizione (di Cauchy, Dirichlet, Neumann...) è espressa
da un’equazione del tipo
Bu = f
con u funzione incognita, f dato assegnato, B operatore lineare tra opportuni
spazi di funzioni. Ad esempio, il problema (2.11), si può scrivere astrattamente
in questa forma
8
Lu = f per x 2 ; t > 0
>
>
<
B1 u (t; x) = g (t; x) per x 2 @ ; t > 0
B2 u (0; x) = u0 (x) per x 2
>
>
:
B3 u (0; x) = v0 (x) per x 2
dove, se la funzione incognita si cerca nello spazio
X = C2 (
[0; 1) \ C 1 (
(0; 1)) \ C 0
[0; 1))
(ossia: chiediamo due derivate continue all’interno del dominio, dov’è soddisfatta la condizione; chiediamo che la u sia continua …no al bordo del dominio
spaziale, per assumere il dato al bordo di Dirichlet, e chiediamo che sia C 1 …no
a t = 0 per poter assumere il dato di Cauchy) avremo:
L : X ! C0 (
(0; 1))
L : u 7! utt Lu
B1 : X ! C 0 (@
B1 : u 7! u=@
[0; 1))
B2 : X ! C 1 ( )
B2 : u 7! u (0; )
B3 : X ! C 0 ( )
B3 : u 7! ut (0; )
84
dove L; B1 ; B2 ; B3 sono operatori lineari tra gli spazi vettoriali indicati18 . Questo
ha un’utile conseguenza, che prende il nome di principio di sovrapposizione. Invece di darne subito un’enunciazione astratta, lo spieghiamo prima sull’esempio
precedente.
Esempio 2.13 Supponiamo di voler risolvere il problema
8
Lu = f
per x 2 ; t > 0
>
>
<
B1 u (t; x) = g (t; x) per x 2 @ ; t > 0
(P ) :
B2 u (0; x) = u0 (x) per x 2
>
>
:
B3 u (0; x) = v0 (x) per x 2 :
Consideriamo i 4 problemi, simili ma più semplici (ognuno ha 3 dati nulli
su 4):
8
Lu1 = f
per x 2 ; t > 0
>
>
<
B1 u1 (t; x) = 0 per x 2 @ ; t > 0
(P 1) :
B2 u1 (0; x) = 0 per x 2
>
>
:
B3 u1 (0; x) = 0 per x 2 :
8
Lu2 = 0
per x 2 ; t > 0
>
>
<
B1 u2 (t; x) = g (t; x) per x 2 @ ; t > 0
(P 2) :
B2 u2 (0; x) = 0
per x 2
>
>
:
B3 u2 (0; x) = 0
per x 2 :
8
per x 2 ; t > 0
>
> Lu3 = 0
<
B1 u3 (t; x) = 0
per x 2 @ ; t > 0
(P 3) :
B
u
(0;
x)
=
u
(x)
per x 2
>
2
3
0
>
:
B3 u3 (0; x) = 0
per x 2 :
8
Lu4 = 0
per x 2 ; t > 0
>
>
<
B1 u4 (t; x) = 0
per x 2 @ ; t > 0
(P 4) :
B
u
(0;
x)
=
0
per x 2
>
2 4
>
:
B3 u4 (0; x) = v0 (x) per x 2 :
Supponiamo che u1 ; u2 ; u3 ; u4 siano rispettivamente soluzioni di (P 1), (P 2),
(P 3), (P 4) : Allora u = u1 + u2 + u3 + u4 è soluzione di (P ). Questo fatto è
un’ovvia conseguenza della linearità di tutti gli operatori coinvolti.
L’a¤ermazione appena fatta sull’esempio speci…co costituisce appunto il principio di sovrapposizione (che vale per un problema del tipo di cui stiamo parlando, ossia per un’equazione linerare, con condizioni iniziali e al contorno
lineari):
La soluzione di un problema avente più dati non nulli (intendendo per “dati”
sia il termine noto dell’equazione che le condizioni iniziali e il dato al bordo) si
può ottenere per sovrapposizione delle soluzioni di più problemi, ciascuno avente
un solo dato non nullo.
1 8 Sono anche operatori lineari continui, come lo studente può facilmente controllare; tuttavia
in questo momento l’informazione che ci interessa è solo la linearità.
85
Questo è utile sia dal punto di vista pratico (spezzare la soluzione di un
problema complesso nella soluzione di più sottoproblemi semplici) sia dal punto
di vista teorico (spezzare la dimostrazione di teoremi di esistenza per la soluzione
di un problema in sottoteoremi più semplici).
A volte, inoltre, la soluzione di qualcuno dei sottoproblemi più semplici si
può indovinare facilmente:
Esempio 2.14 Si vuole risolvere:
u = f in
u = 1 su @ :
La soluzione si può ottenere nella forma u = u1 + u2 dove
u1 = f in
u1 = 0 su @
(2.13)
u2 = 0 in
u2 = 1 su @ :
Ma la soluzione di quest’ultimo problema è u2 1 (la funzione costante = 1 ha
laplaciano nullo e soddisfa la condizione al contorno 1), quindi u (x) = u1 (x) +
1; con u1 soluzione del problema di Dirichlet omogeneo (2.13). Questo è il
sottoproblema interessante da risolvere, mentre il secondo era banale.
2.5
Problemi ben posti
Discutendo i tipi di problemi iniziali e al contorno ci siamo appellati soprattutto
al signi…cato …sico dei problemi. Dal punto di vista matematico, può restare la
domanda se questi problemi siano formulati in modo tale che sia ragionevole poi
poter ottenere una soluzione, e una sola. Perché, ad esempio, per l’equazione
della corda vibrante dobbiamo prescrivere sia il valore iniziale di u che il valore iniziale di ut mentre per l’equazione del calore prescriviamo solo il valore
di u? Non sarà “chiedere troppo” la prima richiesta (e così magari cade l’esistenza di soluzione), oppure “chiedere troppo poco”la seconda (e così magari
cade l’unicità)? Come accennato, quale sia il tipo giusto di condizioni al contorno dipende dalle proprietà matematiche di un’equazione. C’è poi un’altra
questione importante. Ci piacerebbe che, assegnati i dati in certi spazi di funzioni, non solo la soluzione corrispondente esistesse e fosse unica, ma variasse
di poco se qualcuno dei dati varia di poco (“dipendenza continua dai dati”).
Infatti nelle applicazioni …siche i dati sono sempre conosciuti con una certa approssimazione, quindi se non sappiamo che un piccolo errore nei dati porta un
piccolo errore nella soluzione, questo rende di scarso interesse pratico il calcolo della soluzione. Quest’insieme di “proprietà desiderabili” per un problema
di¤erenziale è sintetizzato in una de…nizione ben precisa:
86
De…nizione 2.15 (Problema ben posto) Si dice che un problema
8
Lu = f
>
>
<
B1 u = g1
:::
>
>
:
Bk u = gk
(2.14)
(dove L è l’operatore di¤ erenziale, f il termine noto, g1 ; :::; gk i dati iniziali e /
o al bordo) è ben posto quando sono de…niti: uno spazio vettoriale normato S in
cui cerchiamo la soluzione, spazi vettoriali D0 ; D1 ; D2 ; :::; Dk in cui assegnamo,
rispettivamente, il termine noto f e i dati g1 ; :::; gk , e si ha che:
1. Per ogni scelta di f 2 D0 ; g1 2 D1 ; :::; gk 2 Dk esiste u 2 S soluzione del
problema;
2. tale soluzione è unica;
3. tale soluzione dipende con continuità dai dati, il che signi…ca che l’operatore lineare che ai dati associa la soluzione è continuo, ossia esiste una costante
c > 0 tale che per ogni scelta di f 2 D0 ; g1 2 D1 ; :::; gk 2 Dk la soluzione
corrispondente u soddisfa:
kukS
c kf kD0 + kg1 kD1 + ::: + kgk kDk :
Notiamo che l’ultima disuguaglianza, normalmente detta “stima a priori sulla soluzione” o “stima di stabilità” garantisce e¤ettivamente che un piccolo errore sui dati porti un piccolo errore sulla soluzione, per la linearità dell’operatore.
Supponiamo che u1 ; u2 siano, rispettivamente, le soluzioni dei problemi relativi
(1)
(1)
(2)
(2)
ai dati f (1) ; g1 ; :::; gk e f (2) ; g1 ; :::; gk : Allora per la linearità del problema
(1)
(2)
(1)
(2)
u1 u2 è soluzione del problema relativo ai dati f (1) f (2) ; g1
g1 ; :::; gk gk
e per la stima di stabilità
ku1
u2 kS
c
f (1)
f (2)
(1)
D0
+ g1
(1)
(2)
g1
D1
+ ::: + gk
(2)
gk
Dk
:
Il secondo membro è piccolo se lo scarto tra i due insiemi di dati è piccolo
(piccolo errore nei dati), quindi sarà piccolo (o comunque controllato) il primo
membro, ossia l’errore nella soluzione.
Facciamo ora qualche osservazione in più sulla questione dell’unicità.
1. Dimostrare l’unicità della soluzione di un problema signi…ca dimostrare
che due eventuali soluzioni u1 ; u2 dello stesso problema devono coincidere. Ma
per la linearità del problema, se u1 ; u2 risolvono entrambe il problema (2.14), la
di¤erenza u = u1 u2 soddisferà l’analogo problema con dati omogenei, ossia:
8
Lu = 0
>
>
<
B1 u = 0
(2.15)
:::
>
>
:
Bk u = 0
Questo allora detta la strategia tipica per dimostrare l’unicità della soluzione:
si suppone che u risolva il corrispondente problema con termine noto e dati tutti
87
nulli, e si mostra che questa u necessariamente è la funzione identicamente nulla.
Lo faremo varie volte in seguito.
2. Un teorema di unicità ha una grande utilità pratica, contrariamente a
quanto si potrebbe credere. Nel risolvere un problema per equazioni a derivate
parziali, quasi mai si riesce, come per le equazioni di¤erenziali ordinarie, a determinare in un primo tempo l’integrale generale per poi imporre le condizioni.
Di solito si cerca a priori una soluzione di qualche forma speciale che: (a) è
più semplice, consentendo calcoli espliciti; (b) tiene già conto di qualcuna delle
condizioni, ad esempio l’annullarsi al bordo. Se procedendo così si arriva a
determinare una soluzione, come possiamo essere certi di non aver “perso per
strada” qualche altra soluzione? Dopo tutto il nostro procedimento risolutivo
non è stato sistematico, ma ha fatto a priori l’ipotesi che la soluzione si potesse
scrivere in un certo modo. Se ci fossero soluzioni di altro tipo? Ma se sappiamo che vale un teorema di unicità, sappiamo di non aver perso nulla: se (con
qualunque procedimento) abbiamo trovato una soluzione, certamente altre non
ce ne sono. Questa è un’informazione molto utile, quindi.
Solitamente noi procederemo così.
1. Prima si stabilisce, con la strategia detta, l’unicità per il problema. Questo
si saprà fare spesso sotto ipotesi piuttosto generali.
2. Poi a¤ronteremo il problema in situazioni speci…che: tipicamente, su
domini di forma piuttosto semplice ed esplicitamente noti, e con condizioni al
contorno o iniziali di tipo semplice. In queste condizioni, cercheremo di ottenere
esplicitamente una soluzione, con metodi di separazione delle variabili, serie di
Fourier, trasformate, funzioni speciali...
3. A partire dalla formula di rappresentazione esplicita ottenuta per la
soluzione, cercheremo di provare sotto quali ipotesi precise sui dati il risultato
ottenuto è valido; quindi il quadro di spazi funzionali sarà in parte precisato a
posteriori.
4. Sempre dalla formula di rappresentazione trovata, talvolta dedurremo
una stima di stabilità per la soluzione.
Riguardo al punto 2, notiamo che le tecniche di risoluzione esplicita di un
problema di¤erenziale in geometria semplice rappresentano la prima strada che
storicamente si è seguita. Naturalmente, quando il dominio
ha una forma
complicata (o non nota esplicitamente), o quando l’equazione contiene termini con coe¢ cienti variabili (generici), questo approccio esplicito non può essere
seguito. Sono stati messi a punto quindi strumenti teorici molto astratti e so…sticati per dimostrare ancora la buona posizione del problema, e poi per mettere
a punto strumenti di risoluzione numerica approssimata dei problemi stessi. In
questo corso però non ci occuperemo di questi aspetti, che richiederebbero un
investimento ben superiore nello studio di teorie astratte.
88
3
3.1
Metodo di separazione di variabili e sviluppi
di Fourier per problemi ai limiti
Equazione di Laplace e di Poisson
Abbiamo già incontrato (§2) l’equazione di Poisson
u=f
(detta equazione di Laplace quando f = 0), dove il laplaciano
di¤erenziale
=
è l’operatore
@2
@2
@2
+
+
(o l’analogo in solo una o due dimensioni),
@x2
@y 2
@z 2
e abbiamo descritto alcuni dei suoi signi…cati …sici:
1. u potenziale elettrostatico (o gravitazionale) generato da un campo dovuto
a una distribuzione continua di cariche (rispettivamente, di masse) di densità f
(rispettivamente, f );
2. u temperatura in un corpo omogeneo, in stato stazionario, in regime di
sola di¤usione, in presenza di sorgenti o pozzi di calore di densità f ;
3. u concentrazione di una sostanza disciolta in soluzione, in stato stazionario,
in regime di sola di¤usione, in presenza di sorgenti o pozzi (di questa sostanza)
di densità f ;
4. (per n = 2) altezza di una membrana in equilibrio.
Abbiamo anche discusso (§4.3.1) alcuni tipici problemi ai limiti che si affrontano per quest’equazione, e visto il signi…cato …sico delle varie condizioni
(di Dirichlet, Neumann, Robin o miste).
Vediamo ora di stabilire alcuni risultati molto generali per questi problemi,
utili ad inquadrare i problemi ai limiti che poi studieremo. Successivamente
a¤ronteremo esplicitamente alcuni di questi problemi ai limiti, su domini di
geometria semplice.
3.1.1
Unicità, principio di massimo, dipendenza continua
Risultati di unicità per problemi ai limiti
In tutta questa sezione ci limitiamo a trattare problemi ai limiti nel caso tridimensionale (che contiene come casi particolari quelli bi e mono dimensionali),
ma tutta questa discussione si potrebbe fare per il laplaciano in n dimensioni,
con n qualsiasi.
Sia
R3 un dominio (cioè un insieme aperto e connesso) limitato, dalla
frontiera regolare a pezzi (quanto basta perché si possa applicare su il teorema
della divergenza). Consideriamo un problema al contorno per l’equazione di
Poisson u = f in , con condizione al contorno di uno dei tipi visti nel §4.3.1,
quindi:
condizione di Dirichlet u = f su @ , oppure
condizione di Neumann @u
@ = f su @ , oppure
89
condizione di Robin @u
(con k > 0),
@ + ku = f su @
o eventualmente condizioni miste (cioè su due parti della frontiera sono assegnate
due diverse condizioni di questi tipi).
Vogliamo dimostrare che per un problema di questi tipi la soluzione, se esiste,
è unica (con un’importante precisazione nel caso della condizione di Neumann).
Un enunciato preciso è il seguente:
Teorema 3.1 (di unicità) Sia
R3 un dominio come sopra speci…cato. La
2
1
funzione u 2 C ( ) \ C
che risolve il problema di Dirichlet
u = f in
u = g su @
con f 2 C 0 ( ) ; g 2 C 0 (@ ) assegnate, se esiste è unica. Lo stesso vale nel
caso di una condizione al contorno di Robin. Per la condizione al contorno di
Neumann, la soluzione, se esiste, è unica a meno di costante additiva. L’unicità
vale anche per i problemi misti.
Osservazione 3.2 Notiamo che l’ipotesi u 2 C 1
(cioè C 1 …no al bordo
dell’insieme) è naturale per le condizioni di Neumann e di Robin, che coinvolgono la derivata di u sul bordo, mentre è un po’ troppo forte per il problema di
Dirichlet, per cui ci aspetteremmo u 2 C 0
(oltre ovviamente alla condizione
u 2 C 2 ( ), se vogliamo che u risolva all’interno di l’equazione di¤ erenziale).
Vedremo poi come nel caso del problema di Dirichlet si possa e¤ ettivamente
migliorare questo risultato stabilendo l’unicità nella classe C 2 ( ) \ C 0
.
Dimostrazione. Come abbiamo visto nel §4.5, dimostrare l’unicità equivale
a provare il seguente enunciato: se u 2 C 2 ( ) \ C 1
risolve l’equazione
omogenea u = 0 in
con condizione di Dirichlet (o degli altri tipi) nulla,
allora u è identicamente nulla in :
Utilizziamo la prima identità di Green (v. §1.2)
ZZZ
ZZZ
ZZ
@g
f gdxdydz +
rf rgdxdydz =
f
dS
@n
e
@
valida per ogni coppia di funzioni:
f 2 C1 ( ) \ C
; g 2 C2 ( ) \ C1
:
Applichiamola a f = g = u e abbiamo
ZZZ
ZZZ
ZZ
2
u udxdydz +
jruj dxdydz =
@
che, essendo
u = 0; dà
ZZZ
2
jruj dxdydz =
90
ZZ
@
u
@u
dS:
@ne
u
@u
dS
@ne
Ora: se u soddisfa una condizione di Dirichlet o di Neumann nulla, su @
@u
u = 0 o @n
= 0; in ogni caso l’integrale a secondo membro è nullo, quindi
e
ZZZ
è
2
jruj dxdydz = 0:
2
Questo implica che jruj = 0 in cioè u =costante in . Se vale la condizione di
Dirichlet, essendo u zero al bordo la u è identicamente nulla; se vale la condizione
di Neumann possiamo concludere solo che u è costante, cioè la soluzione del
problema di partenza è determinata a meno di costante arbitraria additiva. Se
poi vale la condizione di Robin omogenea, cioè
@u
+ ku = 0 su @
@
deduciamo
da cui di nuovo
ZZZ
2
jruj dxdydz =
ZZZ
(con k > 0)
ZZ
ku2 dS
0;
@
2
jruj dxdydz = 0
e la condizione di Robin implica
e u costante. Di conseguenza @u
@ = 0 su @
perciò u = 0 su @ , e perciò u identicamente nulla in . Dai ragionamenti
precedenti si ottiene anche l’unicità per i problemi misti (Dirichlet / Neumann
o Robin / Dirichlet o Numann / Robin).
Osservazioni sul problema di Neumann
Il fatto che la soluzione di un problema di Neumann sia determinata a meno di
costante additiva si capisce se si ri‡ette sul fatto che in un problema
u = f in
= g su @
@u
@
(3.1)
la u compare solo mediante le sue derivate, quindi è chiaro che se u (x) è
soluzione anche u (x) + c lo è.
Il problema di Neumann ha anche un’altra particolarità19 . Non solo la
soluzione, se esiste, non è unica, ma la la soluzione non può esistere se i dati
1 9 Si ri‡etta sulla seguente analogia con l’algebra lineare. Per un sistema lineare di n
equazioni in n incognite possono capitare due situazioni diverse. O il determinante della
matrice è diverso da zero, e allora (teorema di Cramer) per ogni scelta dei termini noti c’è
soluzione, e la soluzione è unica. Oppure il determinante della matrice è uguale a zero, e allora
la soluzione esiste solo per certi termini noti (teorema di Rouché-Capelli) e se esiste non è
unica, ma ne esistono in…nite. I problemi di Dirichlet e di Neumann sono problemi lineari
in cui nel primo caso c’è esistenza e unicità per ogni scelta del dato, nel secondo caso non
c’è esistenza per ogni dato, e quando c’è non c’è unicità. L’analogia non è casuale ma ha le
sue radici nella teoria degli operatori lineari tra spazi di Banach (teorema dell’alternativa di
Fredholm ), di cui però in questo corso non ci occupiamo.
91
non soddisfano un’opportuna condizione di compatibilità. Per capire questo fatto, sia u soluzione del problema di Neumann (3.1); integriamo ambo i membri
dell’equazione in e applichiamo il teorema della divergenza:
ZZZ
ZZZ
ZZ
ZZ
@u
f dxdydz =
udxdydz =
dS =
gdS:
@ @
@
L’uguaglianza ottenuta
ZZZ
f dxdydz =
ZZ
gdS
@
coinvolge solo i dati del problema, non la soluzione che cerchiamo: assegnati i
dati, si può veri…care se è soddisfatta oppure no; se non è soddisfatta, certamente
non potrà esistere soluzione del problema.
Un’interpretazione …sica facilmente comprensibile di questa condizione si
ha quando g
0; interpretando l’equazione come equazione del calore in stato stazionario, signi…ca che il corpo è termicamente isolato. La condizione di
compatibilità richiede che
ZZZ
f dxdydz = 0;
il che signi…ca che il bilancio complessivo di pozzi e sorgenti di calore interni
al corpo è nullo: una condizione ragionevole, se vogliamo che la temperatura
possa stabilizzarsi su un equilibrio, rimanendo il corpo isolato (se ad esempio il
corpo è isolato e f > 0 in , la temperatura non può che salire nel tempo). Se
poi
RR g 6= 0, il corpo non è isolato ma il ‡usso entrante o uscente di calore (cioè
gdS) è comunque assegnato, quindi è naturale che questoRRR
debba uguagliare
@
il bilancio totale di pozzi e soregenti di calore interni (cioè
f dxdydz): se
all’interno, ad esempio, complessivamente si fornisce più calore di quanto il corpo ne cede all’ambiente attraverso il ‡usso termico dal bordo, complessivamente
la temperatura interna salirà, e non potrà soddisfare un’equazione di¤erenziale
stazionaria.
Principio di massimo e dipendenza continua della soluzione dai dati
Si può migliorare l’informazione contenuta nel teorema di unicità, arrivando a
stabilire la dipendenza continua della (eventuale) soluzione dai dati, almeno per
il problema di Dirichlet. Questa è una conseguenza del seguente principio di
massimo, che ha anche un interesse indipendente:
Teorema 3.3 (Principio di massimo per il laplaciano) Sia
R3 un
2
0
aperto connesso e limitato, e u 2 C ( ) \ C
soluzione dell’equazione
u = f in
Allora:
i) Se f
0 in
:
; allora il massimo di u è assunto su @ ; ossia
max u (x)
x2
max u (x) :
x2@
92
ii) Se f
0 in
(cioè u è armonica), allora u assume massimi e minimi
su @ , e vale la disuguaglianza
max ju (x)j
x2
max ju (x)j :
x2@
Osservazione 3.4 Interpretazione bidimensionale del teorema precedente: si
ricordi che l’equazione di una membrana in equilibrio sotto l’azione di una forza
f nella direzione dell’asse z è
u = f.
Il punto i) dice quindi che se f 0; cioè non agisce nessuna forza verso l’alto,
la membrana in equilibrio non avere punti più in alto del suo bordo. Se poi non
agisce alcuna forza, non possono esserci punti né più in alto né più in basso dei
massimi e minimi sul bordo.
Dimostrazione. Notiamo che poiché u 2 C 0
, per il teorema di Weierstrass
u avrà massimo e minimo nell’insieme chiuso e limitato . Il punto è dimostrare
che punti di massimo assoluto (nel caso i ) e punti di massimo e minimo assoluto
(nel caso ii ) stanno sul bordo.
i ) Facciamo prima l’ipotesi più forte che sia f > 0 in , e supponiamo per
assurdo che x0 2 sia un punto di massimo interno. Allora, essendo u 2 C 2 ( )
2
si ha @@xu2 (x0 ) 0 per ogni i = 1; 2; 3, come si capisce ragionando sulla funzione
i
di una variabile
g (t) = u (x0 + tei )
che deve avere un punto di massimo relativo per t = 0, quindi dalla formula di
2
Taylor con resto secondo Peano si legge g 00 (0) 0, da cui @@xu2 (x0 ) è 0. Ne
i
segue u (x0 )
0, che contraddice f (x0 ) > 0. Giusti…chiamo l’a¤ermazione
g 00 (0) 0. Sia per assurdo g 00 (0) > 0; allora dalla formula di Taylor (ricordando
g 0 (0) = 0)
1 00
g (t) g (0) = t2
g (0) + o (1)
2
si deduce g (t) g (0) < 0 per jtj abbastanza piccolo, da cui t = 0 sarebbe punto
di minimo relativo stretto, non di massimo relativo.
Consideriamo ora il caso più generale in cui f
0 in , e proviamo che il
massimo di u è ancora assunto solo su @ . Sia
2
v (x) = u (x) + " jxj
(x 2 R3 ) con " > 0 che sceglieremo.
v=
u + 2n" = f + 2n" > 0.
Allora applicando il punto precedente (caso f > 0) alla funzione v otteniamo
che v assume il massimo su @ ; cioè, per ogni y 2 ; scegliendo una sfera BR (0)
contenente ,
2
u (y) + " jyj = v (y)
2
max u (x) + " jxj
x2@
93
max u (x) + "R2 :
x2@
Facendo tendere a zero " e prendendo poi maxy2 otteniamo
max u (y)
y2
max u (x) ;
x2@
che dice appunto che il massimo è assunto sul bordo.
ii ) Se u = 0 in ; allora possiamo applicare il punto i a u e poi a
ottenendo che u assume massimo e minimo su @ e
max ju (x)j
x2
u,
max ju (x)j :
x2@
Osservazione 3.5 Questo principio di massimo consente di migliorare il risultato di unicità dimostrato per il problema di Dirichlet (come preannunciato nell’osservazione dopo il teorema di unicità). In base al principio di massimo,
infatti, se u 2 C 2 ( ) \ C 0
è soluzione di
u = 0 in
u = 0 su @
ne segue che u
0. Perciò l’unicità della soluzione del problema di Dirichlet
vale nella classe “naturale” C 2 ( ) \ C 0
e non solo nella più ristretta classe
in cui lo si era stabilito in precedenza.
C2 ( ) \ C1
Osservazione 3.6 Vale in realtà anche un principio di massimo più forte, che
non dimostreremo, e stabilisce che una funzione armonica non solo assume massimi e minimi sul bordo, ma non può assumere massimi e minimi anche in punti
interni, a meno che sia costante. Ad esempio, una membrana in equilibrio non
può formare “gobbe verso l’alto” o il basso all’interno.
Deduciamo dal principio di massimo dimostrato anche il prossimo
Teorema 3.7 (Dipendenza continua dai dati per il problema di Dirichlet)
Sia
un dominio limitato di Rn (n 3) e sia u 2 C 2 ( ) \ C 0
soluzione
del problema di Dirichlet
u = f in
u = g su @ :
Allora
R2
max jf j
@
2n
dove R è il raggio di una sfera BR (0) contenente :
max juj
max jgj +
Si noti che questa è una stima a priori di dipendenza continua della soluzione
u di un problema di Dirichlet dai dati f; g.
Dimostrazione. La funzione
2
v (x) = u (x) +
94
jxj
max jf j
2n
soddisfa
v (x) =
u (x) + max jf j = f (x) + max jf j
0
perciò per il principio di massimo (punto i ) assume il suo massimo su @ ; ossia,
per ogni x 2 ;
2
2
u (x)
u (x) +
jxj
max jf j
2n
max u +
@
jxj
max jf j
2n
max g +
@
R2
max jf j
2n
cioè
R2
max jf j :
@
2n
Ora applichiamo lo stesso ragionamento a u che è soluzione di
max u
max g +
( u) = f in
u = g su @
e otteniamo
max ( u)
max ( g) +
@
R2
max jf j
2n
che unita alla precedente dà
max juj
3.1.2
max jgj +
@
R2
max jf j :
2n
L’equazione di Laplace sul cerchio
Considereremo il problema di Dirichlet per l’equazione di Laplace sul cerchio;
la risoluzione esplicita di questo problema è un punto di partenza fondamentale
per la teoria del potenziale (in due variabili). Essendo il primo problema che
trattiamo, lo svilupperemo in dettaglio, utilizzandolo come esempio guida anche
per situazioni diverse.
Per risolvere l’equazione di Laplace sul cerchio, la prima cosa è riscriverla in
coordinate polari ( ; #). Si trova20 , per l’equazione sul cerchio di centro (0; 0) e
raggio r0 ; con dato al bordo f assegnato:
8 2
1 @2u
< @ u 1 @u
+
+ 2 2 = 0 per 2 [0; r0 ); # 2 [0; 2 ]
2
(3.2)
@
@
@#
:
u (r0 ; #) = f (#)
per # 2 [0; 2 ] :
Cerchiamo soluzioni a variabili separate, del tipo:
u ( ; #) = R ( )
2 0 v.
[An2, Cap.4, §5.2]
95
(#) :
Sostituendo nell’equazione si ha
R00 ( )
1
(#) + R0 ( )
1
(#) +
R0 ( )
R00 ( )
+
=
R( )
R( )
2
00
R( )
(#) = 0
00
2
(#)
:
(#)
L’ultima uguaglianza scritta è un’identità tra una funzione della sola e una
funzione della sola #, che quindi forza ciascun membro ad essere costante21 .
Quindi per qualche 2 R dev’essere:
R0 ( )
R00 ( )
+
=
R( )
R( )
00
2
(#)
(#)
=
ossia:
2
R00 ( ) + R0 ( ) = R ( ) per 2 (0; r0 )
00
(#) =
(#) per # 2 [0; 2 ] :
Bisogna anche richiedere che
sia 2 periodica: per il signi…cato geometrico delle coordinate polari, se non è così la funzione u ( ; #) = R ( ) (#)
risulterebbe discontinua. Questo impone
= n2 e
n
(#) = an cos (n#) + bn sin (n#) per n = 0; 1; 2; 3; :::
Con ciò l’equazione in R diventa
2
R00 ( ) + R0 ( )
n2 R ( ) = 0 per
2 [0; r0 ] :
Per n 6= 0 è un’equazione di Eulero22 ; si possono quindi cercare soluzioni del
tipo R ( ) = ; con da determinarsi:
2
(
1)
2
1
+
(
n2
=0
2
1) +
n =0
= n;
che dà
Rn ( ) = c1
2 1 Si
n
+ c2
n
;
ri‡etta su questo ragionamento, che useremo altre volte: se
f ( ) = g (#)
per ogni ; # in certi intervalli, in particolare …ssando un valore # = #0 si legge che il primo
membro è costante al variare di ; …ssando invece un valore = 0 si legge che il secondo
membro è costante al variare di #.
2 2 v. [EsAn2], §1.2.D. Si dice equazione di Eulero un’equazione del tipo
ax2 y 00 (x) + bxy 0 (x) + cy (x) = 0
per a; b; c costanti. Di quest’equazione si possono cercare due soluzioni del tipo y (x) = x con
da determinarsi. Se esistono due numeri 1 ; 2 reali distinti per cui l’equazione di¤erenziale
è soddisfatta, l’integrale generale di quest’equazione sarà c1 x 1 + c2 x 2 :
96
ma poiché vogliamo soluzioni regolari in [0; r0 ] dobbiamo escludere le soluzioni
c2 n , illimitate nell’origine.
Per n = 0 l’equazione
2
è di Eulero in R0 ( ) =
R00 ( ) + R0 ( ) = 0
;
2
1
+
=0
+1
( + 1)
=0
= 1
1
R0 ( ) =
R ( ) = d1 + d2 log :
Escludendo ancora le soluzioni d2 log
…nitiva
Rn ( ) = c
R0 ( ) = d
n
illimitate nell’origine, otteniamo in deper n = 1; 2; 3; :::
Si trovano in de…nitiva le soluzioni a variabili separate:
un ( ; #) = n [an cos (n#) + bn sin (n#)]
u0 ( ; #) = d:
Per linearità, qualsiasi somma …nita di queste soluzioni soddisfa ancora l’equazione di¤erenziale. L’idea è scrivere una soluzione che soddis… anche la
condizione al contorno sommando le in…nite soluzioni a variabili separate:
u ( ; #) = d +
1
X
n
[an cos (n#) + bn sin (n#)] :
n=1
Imporre la condizione al contorno signi…ca quindi scrivere:
u (r0 ; #) = d +
1
X
r0n [an cos (n#) + bn sin (n#)] = f (#)
n=1
il che signi…ca che quello scritto dev’essere lo sviluppo di Fourier di f (#) in
[0; 2 ], quindi posto
1
A0 X
+
[An cos (n#) + Bn sin (n#)] , ossia
2
n=1
Z
Z
1 2
1 2
An =
f (#) cos (n#) d#; Bn =
f (#) sin (n#) d#
f (#) =
0
0
97
(3.3)
si ha
A0
; r0n an = An ; r0n bn = Bn .
2
In conclusione la soluzione del problema (3.2) è assegnata dalla formula:
d=
u ( ; #) =
1
A0 X
+
2
n=1
n
[An cos (n#) + Bn sin (n#)]
r0
(3.4)
con An ; Bn assegnati dalle (3.3).
Naturalmente in questo procedimento abbiamo fatto vari passaggi senza
giusti…cazione rigorosa, dovremo ora dimostrare che sotto opportune ipotesi
la u ha la regolarità richiesta e soddisfa e¤ettivamente equazione di¤erenziale
e condizioni al contorno. Una formula risolutiva esplicita è comunque sempre
un buon punto di partenza per la discussione successiva. Prima di giusti…care
teoricamente la formula (3.4) cominciamo comunque a prendere con…denza con
essa e il suo utilizzo.
Osservazione 3.8 (Armoniche elementari) Notiamo che la soluzione ottenuta è una sovrapposizione delle in…nite funzioni
n
cos (n#) ;
n
sin (n#) ;
dette armoniche elementari. E’interessante osservare che scrivendo, nel campo
complesso
z = (cos # + i sin #)
z = n (cos (n#) + i sin (n#))
n
(formule di De Moivre), le armoniche elementari si possono vedere come le parti
reali e immaginarie delle potenze z n :
n
cos (n#) = Re (
n
cos (n#) = Im (
n
(cos (n#) + i sin (n#))) = Re (z n )
n
(cos (n#) + i sin (n#))) = Im (z n )
e questo fatto23 può essere utile per riscrivere in coordinate cartesiane queste
funzioni. Ad esempio:
3
= x3
2
= 2xy
3
cos (3#) = Re z 3 = Re (x + iy)
2
sin (2#) = Im z 2 = Im (x + iy)
3xy 2
ecc.
In particolare, da queste relazioni leggiamo che le armoniche elementari
n
cos (n#), n sin (n#) sono polinomi omogenei di grado (complessivo) n in
x; y.
2 3 che non è casuale, ma una semplice conseguenza della teoria delle funzioni derivabili di
variabile complessa (“la parte reale o immaginaria di una funzione olomorfa è una funzione
armonica”), di cui però in questo corso non ci occupiamo.
98
Qualche gra…co delle armoniche elementari mostra la loro caratteristica tipica di funzioni dotate di “selle” ma non di punti di massimo e minimo locale,
come prescritto dal principio di massimo che abbiamo dimostrato.
3
4
3
cos 3# = Re (x + iy)
4
cos 4# = Re (x + iy)
99
= x3
= x4
3xy 2
6x2 y 2 + y 4
7
7
sin 7# = Im (x + iy)
= 7x6 y
35x4 y 3 + 21x2 y 5
y7
Esempio 3.9 Risolviamo:
u = 0 per < 1
u (1; #) = cos2 #:
Da identità trigonometriche abbiamo
cos2 # =
1 1
+ cos 2#;
2 2
che è lo sviluppo di Fourier del dato al bordo. Quindi la formula di rappresentazione dà:
1 1
u ( ; #) = + 2 cos 2#
2 2
in coordinate cartesiane, calcolando
=
2
2
cos 2# = Re (x + iy)
1
1 + x2
2
y2 :
Esempio 3.10 Risolviamo:
u = 0 per x2 + y 2 < 4
u (x; y) = x4 per x2 + y 2 = 4
Per
= 2;
4
x4 = (2 cos #) = 16 cos4 #
100
,
Da identità trigonometriche abbiamo
16 cos4 # = 6 + 8 cos 2# + 2 cos 4#;
che è lo sviluppo di Fourier del dato al bordo. Quindi la formula di rappresentazione dà:
2
4
u ( ; #) = 6 + 8
cos 2# + 2
cos 4#
2
2
2
in coordinate cartesiane, calcolando
2
cos 2# = Re (x + iy)
4
,
cos 4# =
4
Re (x + iy)
= 6 + 2 x2
y2 +
1 4
x
8
6x2 y 2 + y 4 :
Discussione delle formula di rappresentazione trovata - regolarità
all’interno
Come preannunciato, dobbiamo ora discutere sotto quali ipotesi la formula risolutiva (3.4) assegna e¤ettivamente una soluzione del problema. Dimostriamo
anzitutto il seguente:
Teorema 3.11 Nella sola ipotesi che i coe¢ cienti An ; Bn nella (3.4) siano
successioni limitate, ossia per qualche costante c > 0 sia
jAn j + jBn j
c per ogni n;
la funzione u assegnata dalla (3.4):
a) è derivabile in…nite volte termine a termine in ogni cerchio
< r0 ;
b) è derivabile in…nite volte nel cerchio < r0 ;
c) soddisfa l’equazione di Laplace (in polari) nel cerchio < r0 .
Dimostrazione. Fissiamo < r0 e consideriamo il cerchio
cerchio la serie (3.4) converge totalmente, infatti:
con
. In questo
n
r0
[An cos (n#) + Bn sin (n#)]
n
r0
e la serie numerica
n
(jAn j + jBn j)
X
c
r0
;
n
c
r0
è una serie geometrica convergente perché
e u è continua nel cerchio
.
101
< r0 , quindi c’è convergenza totale
Consideriamo la serie delle derivate prime rispetto a :
n
@
@
n 1
n
=
[An cos (n#) + Bn sin (n#)]
r0
[An cos (n#) + Bn sin (n#)]
r0n
n 1
n
r0
1
(jAn j + jBn j)
r0
c
n
r0
n 1
r0
e la serie numerica
n 1
X c
n
r0
r0
è una serie convergente perché < r0 , quindi c’è convergenza totale della serie
ed è calcolabile derivando termine a termine.
delle derivate, perciò esiste @u
@
Si capisce che il ragionamento si può iterare alla derivata di qualunque ordine
rispetto a . Per la serie delle derivate rispetto a # si ha:
@
@#
n
[An cos (n#) + Bn sin (n#)]
r0
n
=
r0
[ nAn sin (n#) + nBn sin (n#)]
n
n
e la serie numerica
r0
n
(jAn j + jBn j)
X
cn
r0
n
cn
r0
è ancora una serie convergente perché < r0 , quindi c’è convergenza totale
@u
ed è calcolabile derivando termine a
della serie delle derivate, perciò esiste @#
termine. Si capisce che il ragionamento si può iterare alla derivata di ordine
qualsiasi rispetto a #; ed anche a derivate miste rispetto a e #.
Si conclude che u è in…nitamente derivabile in ogni cerchio
con < r0 ,
e quindi nel cerchio aperto < r0 .
Inoltre, poiché ogni addendo della serie risolve l’equazione di Laplace (la
serie è stata costruita proprio a quel modo, sovrapponendo soluzioni a variabili
separate), in ogni cerchio
con < r0 , in cui u è derivabile termine a
termine, si ha:
!
1
n
@2
1 @
1 @2
A0 X
u=
+
+ 2 2
+
[An cos (n#) + Bn sin (n#)]
@ 2
@
@#
2
r0
n=1
=
=
1
X
n=1
1
X
@2
1 @
1 @2
+ 2 2
+
2
@
@
@#
n
r0
0 = 0:
n=1
102
[An cos (n#) + Bn sin (n#)]
L’equazione perciò è soddisfatta in ogni cerchio
cerchio aperto < r0 .
con
< r0 e quindi nel
Il teorema precedente contiene un’a¤ermazione molto forte:
supponiamo che f sia una qualsiasi funzione L2 (0; 2 ), allora per il Lemma
di Riemann-Lebesgue le successioni An ; Bn tendono a zero, in particolare sono
limitate, e si applica la conclusione del teorema precedente: non solo la u risolve
l’equazione u = 0 nel cerchio, ma è in…nitamente derivabile.
Discussione della formula di rappresentazione trovata - condizione al
bordo classica
Vogliamo mostrare che, sotto opportune ipotesi sul dato al bordo f , la u assegnata dalla (3.4) assume il dato al bordo. Occorre capire qual è il problema.
E’ chiaro che se sostituiamo = r0 nella (3.4) otteniamo (proprio per come
abbiamo costruito la soluzione) la serie di Fourier di f che rappresenta f , ad
sotto le seguenti ipotesi:
f continua, regolare a tratti, f (0) = f (2 ) (l’ultima condizione è ovvia, se
vogliamo che f sia una funzione continua sul bordo del cerchio).
Tuttavia, noi vogliamo anche sapere che la u è continua sul cerchio chiuso
r0 , in modo da sapere che quando ci avviciniamo a un punto del bordo del
cerchio provenendo dall’interno, la u tende proprio al dato al bordo o, come si
dice solitamente, “il dato al bordo è assunto con continuità”.
Con questa premessa, dimostriamo il
Teorema 3.12 (condizione al contorno classica) Supponiamo che f soddis… delle ipotesi sotto cui la sua serie di Fourier converge totalmente (teorema
1.130): f è continua e soddisfa la condizione di raccordo f (0) = f (2 ); inoltre
f è derivabile e con derivata continua in [0; 2 ], salvo al più un numero …nito
di punti di [0; 2 ] nei quali comunque esistono …niti i limiti destro e sinistro di
f 0.
Allora la u de…nita dalla (3.4) è continua …no al bordo del cerchio, in
particolare
lim
( ;#)!(r0 ;#0 )
u ( ; #) = f (#0 ) per ogni #0 2 [0; 2 ] .
Dimostrazione. Dimostriamo che la serie (3.4) converge uniformemente nel
cerchio
r0 ; # 2 [0; 2 ], da cui seguirà la continuità di u in tutto il cerchio
(Teorema 3.55, §3.2.3). Per far questo, scriviamo:
k
r0
[Ak cos (n#) + Bk sin (n#)]
j[Ak cos (n#) + Bk sin (n#)]j
Poiché sotto le nostre ipotesi, in base al teorema 1.130 si ha
1
X
k=1
(jAk j + jBk j) < 1;
103
jAk j+jBk j :
la serie che assegna la u ( ; #) converge totalmente nel cerchio
r0 ; # 2
[0; 2 ] e quindi (criterio della convergenza totale, Proposizione 1.54) converge
uniformenente nel cerchio.
Ora che sappiamo che la u assegnata dalla formula (3.4) assume con continuità il dato al bordo, quindi è l’unica soluzione del problema di Dirichlet,
possiamo trarre dal risultato precedente di regolarità all’interno della funzione
assegnata da (3.4) un’importante conseguenza:
Corollario 3.13 (Regolarità delle funzioni armoniche in due variabili)
Sia
R2 un aperto e u 2 C 2 ( ) soluzione di u = 0 in : Allora u 2
1
C ( ).
Dimostrazione. Sia u 2 C 2 ( ) soluzione di u = 0 in e …ssiamo un cerchio
Br (x0 )
: Per ogni < r la funzione u si può vedere come soluzione (l’unica
soluzione) del problema di Dirichlet
u = 0 in B (x0 )
u = u su @B (x0 )
e quindi u si rappresenta con la formula (3.4) con i coe¢ cienti An ; Bn calcolati a
partire da u; in particolare limitati perché u è limitata e integrabile in @B (x0 ) ;
essendo continua. Per la discussione precedente, allora, u è in…nitamente derivabile nel cerchio B (x0 ) ; e quindi nel cerchio Br (x0 ). Poiché questo si può
ripetere per ogni cerchio Br (x0 )
, u 2 C1 ( ) :
Osservazione 3.14 Segnaliamo che la proprietà di regolarità delle funzioni
armoniche è vera in dimensione n qualsiasi, con un’altra dimostrazione.
Dai fatti precedenti possiamo in particolare raccogliere il seguente
Teorema 3.15 Detto Br0 (0) il cerchio di centro l’origine e raggio r0 , se f 2
C 1 (@Br0 (0)) esiste una e una sola u 2 C 2 (Br0 (0)) \ C 0 Br0 (0) soluzione
del problema di Dirichlet
u = 0 in Br0 (0)
u = f su @Br0 (0) ;
assegnata dalla (3.4). La u assume il dato al bordo con continuità, e all’interno
del cerchio è in…nitamente derivabile. Inoltre il principio di massimo
max juj
Br0 (0)
max jf j
@Br0 (0)
è in questo caso una stima di dipendenza continua della soluzione dal dato.
Quindi il problema è ben posto.
104
Osservazione 3.16 Notare che la richiesta f 2 C 1 (@Br0 (0)) signi…ca che,
pensata come funzione f (#), non solo f 2 C 1 ([0; 2 ]), ma f e f 0 soddisfano le
condizioni di raccordo tra 0 e 2 .
L’ipotesi f 2 C 1 (@Br0 (0)) può sembrare un po’ troppo forte, visto che
vogliamo ottenere una u continua …no al bordo (e non più regolare di così).
Questo in parte è un “difetto” della tecnica dimostrativa utilizzata: la teoria
classica, passando attraverso la nozione di convergenza uniforme delle serie di
Fourier, richiede ipotesi un po’ sovrabbondanti. Con una tecnica dimostrativa
più ra¢ nata si può provare che il problema di Dirichlet sul cerchio è risolubile in senso classico per ogni dato al bordo continuo; torneremo poi su questo
problema.
Discussione della formula di rappresentazione trovata - dato al bordo
L2
Proviamo ora un diverso risultato che garantisce che il dato al bordo possa essere
assunto in un senso più debole sotto ipotesi molto più generali sul dato:
Teorema 3.17 Supponiamo che f 2 L2 [0; 2 ], allora la u assegnata dalla (3.4)
assume il dato al bordo in senso L2 ; il che signi…ca che
ku ( ; )
f kL2 (0;2
! 0 per
)
! r0 :
Dimostrazione. Poiché f 2 L2 [0; 2 ] ; sappiamo che
(uguaglianza di Perceval, v. §3.5.1). Ora dalle identità:
u ( ; #) =
f (#) =
1
A0 X
+
2
n=1
P1
n=1
A2n + Bn2 < 1
n
[An cos (n#) + Bn sin (n#)]
r0
1
A0 X
+
[An cos (n#) + Bn sin (n#)]
2
n=1
abbiamo
f (#)
u ( ; #) =
1
X
n
1
[An cos (n#) + Bn sin (n#)] ;
r0
n=1
e per l’uguaglianza di Perceval
ku ( ; )
2
f kL2 (0;2
)
=
1
X
n=1
n 2
1
r0
A2n + Bn2 :
h
n i2
Osserviamo la serie a secondo membro. Per ! r0 si ha 1
! 0; tutr0
tavia questa convergenza è sempre più lenta quanto più grande è n (che rimpicn
ciolisce il quoziente
r0
, rallentando la sua convergenza a 1). Per passare al
105
h
n i2
limite bisogna allora spezzare la serie. Utilizziamo il fatto che 1
<1
r0
perciò la serie è totalemente convergente in 2 [0; r0 ] ; e …ssato " > 0 esiste n0
tale che
1
n 2
X
1
A2n + Bn2 < "
r
0
n=n +1
0
mentre
n0
X
n=1
n 2
1
n0 2
A2n + Bn2
r0
1
r0
per
A2n + Bn2
n=1
n0 2
1
n0
X
r0
2
kf kL2 (0;2
)
<"
abbastanza vicino a r0 . Perciò
ku ( ; )
2
f kL2 (0;2
)
< 2"
per
abbastanza vicino a r0 , ossia ku ( ; ) f kL2 (0;2 ) ! 0 per ! r0 :
Notiamo che l’ipotesi f 2 L2 [0; 2 ] consente a f di essere discontinua, addirittura illimitata, eppure è su¢ ciente a garantire che il dato al bordo sia
assunto in questo senso debole; inoltre poiché le successioni An ; Bn sono in…nitesime e quindi limitate, vale anche il teorema di regolarità all’interno della u;
che risolve l’equazione.
Formula del valor medio
La formula (3.4) mette in evidenza anche un’altra proprietà delle soluzioni
dell’equazione di Laplace (funzioni armoniche): sostituendo = 0 si trova
A0
1
=
u (0; #) =
2
2
Z
2
f (#) d#;
(3.5)
0
da cui si deduce il seguente
Teorema 3.18 (Proprietà di media delle funzioni armoniche) Sia
R2 un aperto e u una funzione armonica in : Per ogni cerchio Br (x0 ; y0 ) la
cui chiusura è contenuta in valgono le seguenti proprietà di media:
Z 2
1
u (x0 ; y0 ) =
u (x0 + r cos #; y0 + r sin #) d#
(3.6)
2 0
Z
1
u (x0 ; y0 ) =
u (x; y) ds
(3.7)
2 r @Br (x0 ;y0 )
Z
1
u (x0 ; y0 ) = 2
u (x; y) dxdy:
(3.8)
r Br (x0 ;y0 )
106
Notare che la seconda uguaglianza dice che il valore di u nel centro del
cerchio è la media integrale dei valori di u sul bordo del cerchio (in questo caso
l’integrale è un integrale di linea); la terza uguaglianza dice che il valore di u
nel centro del cerchio è la media integrale dei valori di u sul cerchio (in questo
caso l’integrale è un integrale doppio). Segnaliamo che anche la proprietà di
media delle funzioni armoniche, con una diversa dimostrazione, si può stabilire
in dimensione n 3 qualunque.
, u si può vedere
Dimostrazione. Poiché u è armonica in e Br (x0 ; y0 )
come soluzione del problema di Dirichlet avente come dato assegnato sul bordo
del cerchio la u stessa. Quindi la (3.5), dopo averla traslata nel cerchio di centro
(x0 ; y0 ), si può riscrivere nella forma (3.6). D’altro canto il secondo membro
della (3.7) è un integrale di linea che, parametrizzando la circonferenza come
x = x0 + r cos #
# 2 [0; 2 ]
y = y0 + r sin #
ds = rd#
dà
1
2 r
Z
@Br (x0 ;y0 )
u (x; y) ds =
1
Z
2
u (x0 + r cos #; y0 + r sin #) rd#
2 r 0
Z 2
1
u (x0 + r cos #; y0 + r sin #) d# = u (x0 ; y0 )
=
2 0
perciò dalla (3.6) segue la (3.7). In…ne, riscriviamo il secondo membro della
(3.8) calcolando l’integrale in coordinate polari:
Z
Z r
Z 2
1
1
u
(x;
y)
dxdy
=
u (x0 + r cos #; y0 + r sin #) d# d
r2 Br (x0 ;y0 )
r2 0
0
utilizzando nell’integrale interno la (3.6)
Z r
1
1 r2
= 2
2 u (x0 ; y0 ) d = 2 u (x0 ; y0 ) 2
= u (x0 ; y0 )
r 0
r 2
e anche la (3.8) è dimostrata.
Osservazione 3.19 La proprietà di media approfondisce la descrizione della
geometria del gra…co delle funzioni armoniche, di cui il principio di massimo
era un primo elemento. Si noti che entrambe le proprietà corrispondono all’intuizione …sica, se interpretiamo la funzione u; armonica in due variabili, per
uno dei signi…cati …sici che può avere, ad esempio membrana in equilibrio o
temperatura di una piastra in equilibrio termico.
Dalla proprietà di media segue facilmente una dimostrazione, nel caso bidimensionale, del principio di massimo forte per le funzioni armoniche che abbiamo solo enunciato in precedenza:
107
Teorema 3.20 (Principio di massimo forte) Se u = 0 in
aperto connesso del piano, allora u non può avere in punti di massimo o minimo assoluti
interni senza essere costante in .
Si osservi che questo enunciato non dice solo che massimi e minimi sono
assunti sul bordo del dominio (se u è continua …no al bordo) ma sono assunti
solo sul bordo, tranne nel caso banale in cui u è costante. Questa proprietà non
era contenuta nel principio di massimo dimostrato in precedenza in dimensione
qualunque.
Dimostrazione. Infatti, se (x0 ; y0 ) fosse un punto (ad es.) di massimo assoluto
per u; scegliendo un cerchio Br (x0 ; y0 )
, si avrebbe:
Z
1
u (x; y) dxdy
max u = u (x0 ; y0 ) = 2
r Br (x0 ;y0 )
Z
1
max u dxdy = u (x0 ; y0 ) = max u ,
r2 Br (x0 ;y0 )
dove l’uguaglianza può valere solo se in tutto il cerchio Br (x0 ; y0 ) è u (x; y) =
u (x0 ; y0 ). Poiché è un aperto connesso, allora, ripetendo il discorso iterativamente a partire da un punto (x1 ; y1 ) qualsiasi di questo cerchio, possiamo per
passi successivi invadere tutto con cerchi in cui è u (x; y) = u (x0 ; y0 ), perciò
u è costante in . Analogo discorso per i punti di minimo assoluti.
La formula integrale di Poisson
Ci interessa ora trasformare la formula risolutiva “per serie” in una formula
di rappresentazione “integrale”, da cui si potranno leggere altre informazioni.
Sostituendo nella (3.4) le espressioni per i coe¢ cienti (conviene cambiare nome
alla variabile di integrazione)
Z
Z
1 2
1 2
An =
f (s) cos (ns) ds; Bn =
f (s) sin (ns) ds
0
0
108
si ha
Z 2
1
u ( ; #) =
f (s) ds+
2 0
Z
Z
1
n
X
1 2
1 2
f (s) cos (ns) ds cos (n#) +
f (s) sin (ns) ds sin (n#)
+
r0
0
0
n=1
=
Z
2
f (s)
0
(
1
1X
1
+
2
n=1
)
n
[cos (ns) cos (n#) + sin (ns) sin (n#)] ds:
r0
Vediamo di sommare esplicitamente il nucleo integrale f:::g. Anzitutto le formule di addizione e quelle di Eulero danno:
cos (ns) cos (n#) + sin (ns) sin (n#) = cos n (#
s) =
ein(#
s)
+e
2
in(# s)
;
quindi ci si può ricondurre a sommare delle serie geometriche:
1
n
1X
1
+
[cos (ns) cos (n#) + sin (ns) sin (n#)]
2
r0
n=1
(
)
1
n
n
1 1 1X
in(# s)
in(# s)
=
+
e
+
e
2 2 n=1
r0
r0
(
)
1
1
n
n
X
X
1
=
1+
ei(# s)
+
e n(# s)
2
2
r0
r0
n=0
n=0
(
)
1
1
1
=
+
1
2
1 r0 ei(# s)
1 r0 e i(# s)
e qualche calcolo coi numeri complessi dà
=
1
2
1
=
2
=
1
2
(
r0
cos (#
2r0 [r0
[r0
r02
cos (#
r0
s)
i sin (#
cos (#
2
s)] +
2
r02
2r0 cos (# s) +
s)
+
r0
s)]
2
sin2 (#
2
s)
)
cos (#
r0
s) + i sin (#
s)
1
:
Abbiamo ottenuto una formula di rappresentazione della soluzione del problema
mediante un integrale:
Z 2
2
1
r02
u ( ; #) =
f (s)
ds:
(3.9)
2 0
r02 2r0 cos (# s) + 2
Il nucleo integrale trovato si chiama nucleo di Poisson, e la formula ottenuta,
detta formula integrale di Poisson, è molto importante, per vari motivi.
109
1
1. Anzitutto, spesso è più comodo calcolare la soluzione a partire dal dato
al bordo, in modo esatto o approssimato, direttamente con questo integrale
anziché con il doppio passaggio che consiste nel calcolare gli in…niti coe¢ cienti
di Fourier di f e poi sommare la serie (3.4).
2. In secondo luogo, formule di rappresentazione mediante operatori integrali sono più adatte a mettere in evidenza le ipotesi minime sul dato f che
garantiscono opportune proprietà della soluzione. Cominciamo ad osservare che
per ogni < r0 e per ogni # il denominatore è discosto da zero, il che signi…ca che stando strettamente all’interno del cerchio < r0 si può derivare
in…nite volte sotto il segno di integrale. Quindi (come già avevamo osservato)
la soluzione dell’equazione di Laplace è in…nitamente derivabile all’interno del
cerchio. Ma questa formula consente anche di provare risultati precisi di convergenza di u ( ; #) al dato f (#) avvicindandosi al bordo. Precisamente, si può
dimostrare il seguente:
Teorema 3.21 Se f è continua sul bordo del cerchio, la u de…nita da (3.9)
assume il dato al bordo con continuità, cioè
lim
(r;#)!(R;#0 )
u (r; #) = f (#0 )
quindi è soluzione classica del problema di Dirichlet, che pertanto è risolubile
sotto la sola ipotesi di continuità del dato.
Dimostrazione. Per sempli…care leggermente la dimostrazione ci limiteremo
a provare che
lim u (r; #0 ) = f (#0 )
r!R
(il che equivale a far tendere il punto alla circonferenza lungo un raggio). La
dimostrazione generale è simile, con una piccola complicazione tecnica24 .
Cominciamo a osservare che, poiché la soluzione del problema di Dirichlet
con dato al bordo f 1 è la funzione costante 1, si ha:
Z 2
2
r02
1
ds = 1:
2 0
r02 2r0 cos (# s) + 2
Notiamo anche che il nucleo di Poisson è positivo, perché r02
cerchio e
r02
2r0 cos (#
s) +
Possiamo allora scrivere:
Z 2
1
u (r; #0 ) f (#0 ) =
(f (s)
2 0
2 4 Si
2
r02
f (#0 ))
può trovare in [Weinberger pp.105-6].
110
2r0 +
r02
2
2r0
= (r0
2
r02
cos (#0
2
> 0 nel
2
) :
s) +
2
ds:
Per un numero
somma:
u (r; #0 )
> 0 da …ssarsi poi, spezziamo l’integrale precedente nella
f (#0 ) =
1
2
Z
(:::) ds +
s2(0;2 );js #0 j<
1
2
Z
(:::) ds
s2(0;2 );js #0 j
=A +B :
Poiché f è continua in #0 , …ssato " > 0 esiste un
js
Per questa scelta di
e ha integrale 1)
jA j
=) jf (#)
f (#0 )j < ":
si ha allora (ricordando che il nucleo di Poisson è positivo
1
"
2
"
#0 j <
> 0 tale che
1
2
Z
s2(0;2 );js #0 j<
Z
s2(0;2 )
r02
2
r02
2r0 cos (# s) +
r02
r02
ds
2
2
2r0 cos (#
s) +
ds = ":
2
D’altro canto
js
#0 j
=) cos (#
s)
cos
e quindi
r02
2r0
1
cos (#0
s) +
1
2r0 cos +
r02
2
(cioè è una funzione limitata), perciò
Z
1
jf (s)
jB j
2 s2(0;2 );js #0 j
2
c (r0 ; )
f (#0 )j c (r0 ; ) r02
2 max jf (s)j c (r0 ; ) r02
2
s2(0;2 )
2
ds
<"
purché r0
sia abbastanza piccolo. Perciò per ogni " > 0; se r0
piccolo si ha
ju (r; #0 ) f (#0 )j < 2";
è abbastanza
il che prova la tesi.
3. Notiamo che sostituendo
= 0 nella (3.9) si trova
u (0; #) =
1
2
Z
2
f (s) ds;
0
ossia ritroviamo la formula di valor medio, già discussa.
Le osservazioni fatte riguardo alla formula integrale di Poisson sono solo un
assaggio dei metodi della teoria del potenziale, con cui a partire da una formula
111
di rappresentazione semplice ed esplicita si dimostrano proprietà generali delle
funzioni armoniche.
Alla luce della formula …nale ottenuta, il procedimento di separazione di
variabili appare un procedimento elaborato il cui ruolo …nale è quello di permetterci di ottenere una formula di rappresentazione integrale utile. Ogni volta che,
con opportuni scambi tra serie numeriche e integrali che assegnano coe¢ cienti
di Fourier, è possibile scrivere esplicitamente una formula di rappresentazione
integrale, può essere interessante farlo. Non sempre però è agevole.
Problema di Neumann sul cerchio
Consideriamo ora il problema di Neumann per l’equazione di Laplace sul cerchio:
8 2
1 @2u
< @ u 1 @u
+
+ 2 2 = 0 per 2 [0; r0 ); # 2 [0; 2 ]
2
(3.10)
@
@
@#
: @u (r ; #) = f (#)
per # 2 [0; 2 ] :
@
0
(Notare che sul bordo del cerchio la derivata normale uscente è semplicemente
@
@ ). Cerchiamo soluzioni a variabili separate, del tipo:
u ( ; #) = R ( )
(#) :
Si possono utilizzare parte delle conclusioni del ragionamento fatto per il problema di Dirichlet. Cerchiamo di imporre la condizione al contorno alla soluzione:
u ( ; #) = d +
1
X
n
[an cos (n#) + bn sin (n#)] :
n=1
Imporre la condizione al contorno signi…ca quindi scrivere:
1
X
@u
(r0 ; #) =
nr0n
@
n=1
1
[an cos (n#) + bn sin (n#)] = f (#)
il che signi…ca che quello scritto dev’essere lo sviluppo di Fourier di f (#) in
[0; 2 ], quindi posto
1
A0 X
+
[An cos (n#) + Bn sin (n#)] , ossia
2
n=1
Z
Z
1 2
1 2
An =
f (#) cos (n#) d#; Bn =
f (#) sin (n#) d#
f (#) =
0
0
si ha
nr0n
1
an = An ;
nr0n
1
bn = B n
inoltre (coerentemente a quanto osservato sul problema di Neumann nel §5.1.1)
A0 dev’essere nullo (condizione di compatibilità del dato):
Z 2
f (#) d# = 0
0
112
mentre
d è indeterminato (la soluzione è determinata a meno di costante additiva).
In conclusione la soluzione del problema (3.10), nell’ipotesi A0 = 0, è assegnata
dalla formula:
u ( ; #) =
1
X
n=1
n
nr0n
1
[An cos (n#) + Bn sin (n#)] + d:
(3.11)
con An ; Bn assegnati dalle (3.3).
Si tratta ora, come nel caso della formula di rappresentazione ottenuta per
la soluzione del problema di Dirichlet, di dimostrare che sotto opportune ipotesi su f essa fornisce una soluzione e¤ettiva del problema. Procediamo più
sinteticamente di quanto fatto in precedenza:
1. La u assegnata dalla (3.11) è ancora in…nitamente derivabile all’interno
del cerchio, e risolve all’interno del cerchio l’equazione di Laplace, non appena
i coe¢ cienti An ; Bn siano limitati.
2. A¤ermare che il dato al bordo è assunto con continuità signi…ca a¤ermare
che la funzione (a priori de…nita per < r0 )
1
X
@u
( ; #) =
@
n=1
in e¤etti è continua per
n 1
r0
[An cos (n#) + Bn sin (n#)]
r0 . D’altro canto,
n 1
r0
[An cos (n#) + Bn sin (n#)]
jAn j + jBn j
perciò se la serie di Fourier del dato al bordo converge totalmente, il che accade
ad esempio se f 2 C 1 [0; 2 ], con f (0) = f (2 ) (Teorema 1.130), anche la
serie che assegna @u
@ ( ; #) all’interno del cerchio, in e¤etti converge totalmente
in tutto il cerchio. Perciò converge ivi uniformemente, e @u
@ è continua …no al
bordo del cerchio. Come nel caso del problema di Dirichlet, l’ipotesi sul dato è
un po’forte, non è certo quella ottimale.
Esercizio 3.22 Risolvere il seguente problema di Dirichlet per il laplaciano
sulla corona circolare:
8 2
@ u 1 @u
1 @2u
>
>
<
+
+
= 0 per 2 (1; r0 ) ; # 2 [0; 2 ]
2 @#2
@ 2
@
u (1; #) = 0
per # 2 [0; 2 ]
>
>
:
u (r0 ; #) = f (#)
per # 2 [0; 2 ]
Suggerimento: utilizzare i passaggi di partenza del metodo di separazione
delle variabili sul cerchio. Attenzione però al fatto che ora le soluzioni R ( )
illimitate per ! 0 non vanno più scartate, perché lavoriamo sull’intervallo
2 (1; r0 ).
113
3.1.3
Equazione di Poisson sul cerchio
Abbiamo considerato …nora l’equazione omogenea, u = 0. Se il termine noto non è zero, cioè u = f; il metodo di separazione delle variabili non è più
applicabile. Un’idea che talvolta si utilizza per a¤rontare un’equazione non omogenea, suggerita da certe procedure che si seguono per risolvere equazioni differenziali ordinarie non omogenee, è quella di cercare una soluzione la cui espressione analitica sia formalmente simile a quella della corrispondente equazione
omogenea, con certe costanti sostituite da coe¢ cienti variabili, che si cerca di
determinare in modo da soddisfare l’equazione. Illustriamo quest’idea nel caso
dell’equaizone di Poisson sul cerchio:
8 2
1 @2u
< @ u 1 @u
+
+ 2 2 = F ( ; #) per 2 [0; r0 ); # 2 [0; 2 ]
2
@
@
@#
:
u (r0 ; #) = 0
per # 2 [0; 2 ]
Notiamo che, in base al principio di sovrapposizione (§4.4), possiamo supporre
che il dato al bordo ora sia nullo: se non lo fosse, la soluzione che cerchiamo
si potrebbe ottenere sommando la soluzione di un problema come questo e un
problema di Dirichlet per l’equazione omogenea (che già sappiamo risolvere).
Partiamo dalla formula che assegna le soluzioni dell’equazione omogenea
u ( ; #) = a0 +
1
X
n
[an cos (n#) + bn sin (n#)]
n=1
e sostituiamo nella formula, alle particolari funzioni di
delle generiche funzioni (incognite) di :
date da an
1
a0 ( ) X
+
[an ( ) cos (n#) + bn ( ) sin (n#)] :
u ( ; #) =
2
n=1
n
; bn
n
,
(3.12)
Quest’idea è suggerita anche dal fatto che il termine noto F ( ; #) in e¤etti si può
sviluppare in questa forma: è su¢ ciente, per ogni 2 [0; r0 ) …ssato, sviluppare
in serie di Fourier la funzione
# 7! F ( ; #) :
Si ha:
F ( ; #) =
con
1
A0 ( ) X
+
2
n=1
An ( ) =
1
n
Z
[An ( ) cos (n#) + Bn ( ) sin (n#)]
2
F ( ; #) cos (n#) d#
0
Bn ( ) =
1
Z
2
F ( ; #) sin (n#) d#:
0
114
Calcoliamo quindi, formalmente25 l’operatore laplaciano in coordinate polari
sulla serie (3.12):
u ( ; #)
1 @
1 @2
@2
+
+
2 @#2
@ 2
@
=
=
+
1
2
1
!
1
a0 ( ) X
+
[an ( ) cos (n#) + bn ( ) sin (n#)]
2
n=1
X
1
a000 ( ) + a00 ( ) +
1
a00n ( ) + a0n ( )
n2
2
an ( ) cos (n#)
n=1
1
b00n ( ) + a0n ( )
n2
2
an ( ) sin (n#) :
Ora, quest’espressione coincide con lo sviluppo di F ( ; #) se valgono le seguenti
identità:
1
a000 ( ) + a00 ( ) = A0 ( )
1
a00n ( ) + a0n ( )
n2
1
b00n ( ) + a0n ( )
n2
2
2
an ( ) = An ( )
an ( ) = Bn ( )
per n = 1; 2; 3; :::: Si tratta di un sistema di in…nite equazioni di¤erenziali ordinarie nelle funzioni incognite an ( ) ; bn ( ), lineari del second’ordine non omogenee (le funzioni An ( ) ; Bn ( ) sono termini noti, si calcolano dal termine noto
F dell’equazione di Poisson). Per essere più precisi, è qualcosa di più semplice
di un sistema in quanto ogni funzione incognita compare in un’equazione sola: si possono quindi risolvere simultaneamente, in parallelo, tutte le equazioni.
Prima di risolvere le equazioni, osserviamo che la condizione u (r0 ; #) = 0 risulta
soddisfatta se imponiamo
an (r0 ) = bn (r0 ) = 0 per ogni n.
Veniamo alla risoluzione delle equazioni. L’equazione
n2
1
a00n ( ) + a0n ( )
2
an ( ) = An ( )
è lineare del second’ordine non omogenea. L’omogenea associata non è a coe¢ cienti costanti ma è un’equazione di Eulero:
1
a00n ( ) + a0n ( )
n2
2
an ( ) = 0
2 5 Questo “formalmente” signi…ca: calcoliamo le derivate della serie derivando termine
a termine, senza preoccuparci per il momento di formulare delle ipotesi precise sotto cui
quest’operazione sia lecita.
115
di cui possiamo cercare soluzioni del tipo
an ( ) =
e si trova, a conti fatti, che ha integrale generale
an ( ) = cn
n
n
+ dn
:
Ora una soluzione particolare dell’equazione non omogenea si può cercare, col
metodo di variazione delle costanti 26 , nella forma
an ( ) = cn ( )
n
n
+ dn ( )
:
Il metodo prescrive di risolvere il seguente sistema lineare nelle derivate c0n ( ) ; d0n ( ):
c0n n + d0n n = 0
nc0n n 1 nd0n n
Risolvendo si trova:
(
c0n =
d0n =
1
= An ( ) :
An ( )
2n n 1
An ( ) n+1
2n
e integrando (con una scelta degli estremi che renda gli integrali certamente
convergenti) abbiamo
(
R An (s)
cn ( ) = r0 2ns
n 1 ds
R An (s)sn+1
dn ( ) =
ds
2n
0
e quindi
an ( ) =
n
Z
r0
An (s)
ds
2nsn 1
n
Z
0
An (s) sn+1
ds
2n
è una soluzione particolare dell’omogenea, mentre l’integrale generale è
Z
Z
An (s)
An (s) sn+1
n
n
n
n
an ( ) = cn + dn
+
ds
ds:
n 1
2n
r0 2ns
0
2 6 v.
[An2, pp.32-4]. Ricapitoliamo il metodo. Supponiamo di voler trovare una soluzione
particolare dell’equazione di¤erenziale lineare del second’ordine completa
y 00 (t) + a (t) y 0 (t) + b (t) y (t) = f (t)
conoscendo già, però, due soluzioni linearmente indipendenti y1 (t) ; y2 (t) dell’equazione
omogenea. Il metodo consiste nel cercare una soluzione dell’equazione completa della forma
y (t) = c1 (t) y1 (t) + c2 (t) y2 (t)
dove i coe¢ cienti c1 (t) ; c2 (t) incogniti si determinando risolvendo prima il seguente sistema
lineare nelle incognite c01 (t) ; c02 (t)
c01 (t) y1 (t) + c02 (t) y2 (t) = 0
c01 (t) y10 (t) + c02 (t) y20 (t) = f (t)
e poi calcolando le primitive c1 (t) ; c2 (t) e sostituendole nell’espressione di y (t).
116
La funzione deve mantenersi limitata per ! 0; il che implica la scelta dn = 0,
mentre la condizione an (r0 ) = 0 dà
Z r0
An (s) sn+1
0 = cn r0n r0 n
ds:
2n
0
quindi
cn = r0 2n
Z
r0
An (s) sn+1
ds
2n
0
e
an ( ) =
1
2n
n
r0 2n
Z
r0
An (s) sn+1 ds +
Z
n
0
An (s) s1
n
ds
n
r0
Z
An (s) sn+1 ds :
0
(3.13)
Analogamente
1
bn ( ) =
2n
n
r0
2n
Z
r0
n+1
Bn (s) s
ds +
0
n
Z
1 n
Bn (s) s
ds
r0
n
Z
Bn (s) sn+1 ds :
0
(3.14)
Rimane l’equazione in a0 ( ) ;
1
a000 ( ) + a00 ( ) = A0 ( )
che ponendo a00 = v dà
1
v 0 ( ) + v ( ) = A0 ( ) ;
equazione lineare del prim’ordine che si integra così:
Z
1
c
sA0 (s) ds
v( ) = +
0
Z
Z
1 t
sA0 (s) ds dt;
a0 ( ) = c log + d +
t 0
r0
imponendo a0 (r0 ) = 0;
0 = c log r0 + d
d = c log r0
e quindi
a0 ( ) = c log
r0
+
Z
r0
1
t
Z
t
sA0 (s) ds dt
0
e imponendo che a0 ( ) sia limitata in 0; c = 0; da cui
Z
Z
1 t
a0 ( ) =
sA0 (s) ds dt
t 0
r0
117
(3.15)
La funzione u assegnata dalla (3.12) con i coe¢ cienti a0 ( ) ; an ( ) ; bn ( ) assegnati dalle (3.13), (3.14), (3.14) è la soluzione cercata. Il tutto, naturalmente,
andrebbe ora giusti…cato rigorosamente, cosa che ora non faremo. Se poi nella
(3.12) si sostituiscono le espressioni dei coe¢ cienti a0 ( ) ; an ( ) ; bn ( ) e, a loro
volta, al posto dei coe¢ cienti An ; Bn si sostituiscono gli integrali che li de…niscono, calcoli laboriosi permettono di riscrivere la formula di rappresentazione
sotto forma di integrale del termine noto F contro un opportuno nucleo, formula
più indicata per discutere le ipotesi sotto le quali il procedimento è lecito.
La tecnica che abbiamo visto all’opera in questo esempio è nota come metodo
degli sviluppi di Fourier, per indicare che si sviluppa termine noto e funzione in
uno sviluppo che imita quello di Fourier, con coe¢ cienti però variabili anziché
costanti.
Z
Z
1 t
1
u ( ; #) =
sA0 (s) ds dt
2 r0 t 0
Z r0
Z
Z
1
1 X
n
n
+
r0 2n
An (s) sn+1 ds + n
An (s) s1 n ds
An (s) sn+1 ds cos (n#)
2n n=1
0
r0
0
Z r0
Z
Z
n
n
+
r0 2n
Bn (s) sn+1 ds + n
Bn (s) s1 n ds
Bn (s) sn+1 ds sin (n#) :
0
3.2
r0
0
Equazione di di¤usione
Consideriamo ora l’equazione di di¤usione
ut
D u=f
con laplaciano in n variabili (sarà n = 1; 2; 3), D costante positiva, f termine
noto (sorgente). Abbiamo visto tra i suoi signi…cati …sici:
1. u temperatura in un corpo (variabile nel tempo), in regime di sola
di¤usione; f indica le sorgenti o i pozzi di calore interni al corpo.
2. u concentrazione (variabile nel tempo) di una sostanza in soluzione, in
regime di sola di¤usione; f indica le sorgenti o i pozzi di quella sostanza interni
al corpo.
Abbiamo discusso (§4.3.2) alcuni tipici problemi ai limiti che si a¤rontano
per quest’equazione, e visto il signi…cato …sico delle varie condizioni (di CauchyDirichlet, Cauchy-Neumann, Cauchy-Robin).
Anche per questa equazione, vediamo prima di stabilire alcuni risultati molto
generali per questi problemi, utili ad inquadrare i problemi ai limiti che poi
studieremo. Successivamente a¤ronteremo esplicitamente alcuni di questi problemi ai limiti, su domini di geometria semplice.
3.2.1
Unicità e principio di massimo parabolico
Per la linearità del problema, anche in questo caso stabilire un risultato di unicità
per un problema di Cauchy-Dirichlet o di Cauchy-Neumann per l’equazione di
118
di¤usione equivale a stabilire che ogni eventuale soluzione dell’equazione omogenea con condizioni di Cauchy-Dirichlet o di Cauchy-Neumann nulle è la funzione
identicamente nulla.
Sia
R3 un aperto connesso limitato e, per un certo T > 0; sia QT =
(0; T ). Diciamo che u 2 C 1;2 (QT ) se è C 1 nel tempo e C 2 nelle variabili
spaziali.
Teorema 3.23 (di unicità) Supponiamo che u 2 C 1;2 (QT )\C 0 QT \C 1
sia soluzione del problema di Cauchy-Dirichlet
8
< ut D u = f per x 2 ; t 2 (0; T )
u (x; t) = g (x; t) per x 2 @ ; t 2 (0; T )
:
u (x; 0) = h (x) per x 2 :
o del problema di Cauchy-Neumann
8
< ut D u = f per x 2 ; t 2 (0; T )
@u
(x; t) = g (x; t) per x 2 @ ; t 2 (0; T )
: @
u (x; 0) = h (x) per x 2
o di Cauchy-Robin
8
< ut D u = f per x 2 ; t 2 (0; T )
@u
(x; t) + ku (x; t) = g (x; t) per x 2 @ ; t 2 (0; T )
: @
u (x; 0) = h (x) per x 2
con k > 0. Allora u è identicamente nulla in QT .
Osservazione 3.24 L’ipotesi u 2 C 1
(0; T ) è naturale per il problema di
Cauchy-Neumann e Cauchy-Robin, ma non per il problema di Dirichlet. Anche
in questo caso come per l’equazione di Laplace, mostreremo in seguito come un
opportuno principio di massimo consenta di rimuovere quest’ipotesi.
Si noti che la soluzione del problema di Cauchy-Neumann è unica e non,
come nel caso del problema di Neumann per il laplaciano, determinata solo a
meno di costanti additive. Infatti in questo caso una funzione costante non zero
soddisfa il problema con f = 0 e g = 0, ma non con h = 0: è la condizione
iniziale a dare un controllo sulla u e non solo sulle sue derivate.
Dimostrazione. Per il principio di sovrapposizione, mostrare l’unicità per
i problemi scritti equivale a mostrare che se u risolve i problemi con f; g; h
nulli allora u è identicamente nulla in QT . Supponiamo quindi che u soddis…
quest’ipotesi, moltiplichiamo per u l’equazione e integriamo in QT :
Z T Z
0=
(u ut D (u u)) (x; t) dx dt
0
!
Z
Z
Z T Z
1 T d 2
=
u (x; t) dt dx D
u udx dt
2 0 dt
0
119
(0; T )
perciò
D
Z
T
0
Z
u udx dt =
Z
1
2
Z
T
0
!
Z
d 2
1
u (x; t) dt dx =
dt
2
u2 (x; T )
u2 (x; 0) dx
e poiché u soddisfa condizione iniziale nulla,
Z T Z
Z
1
D
u udx dt =
u2 (x; T ) dx
2
0
Poiché (per la prima identità di Green, v. §1.2)
Z
Z
Z
2
u udx +
jruj dx =
u
@
si ha
Z
@
u
@u
dS
@
Z
2
jruj dx =
1
2
Z
@u
dS;
@
u2 (x; T ) dx:
(3.16)
Ora, se u soddisfa condizioni di Dirichlet o di Neumann nulle si ha
Z
@u
u dS = 0
@
@
perciò
D
Z
0
T
Z
1
jruj dxdt =
2
2
Z
u2 (x; T ) dx
che (per i segni dei due membri) implica che entrambi i membri sono nulli.
L’annullarsi del primo membro implica che u è costante in QT ; e poiché si
annulla per t = 0 è identicamente nulla.
Se invece u soddisfa la condizione di Robin nulla, @u
@ + ku = 0 si ha
Z
Z
@u
ku2 dS 0
u dS =
@
@
@
e il primo membro nella (3.16) è ancora
0, per cui si conclude come in
precedenza.
Nello studio dei principi di massimo per un’equazione parabolica su un
dominio di tipo cilindrico, è importante la nozione di frontiera parabolica:
De…nizione 3.25 Si dice frontiera parabolica del dominio
QT =
per
(0; T )
Rn dominio limitato e T 2 (0; +1], l’insieme
@p QT = @
(0; T ) [
f0g :
In altre parole, la frontiera parabolica di un cilindro è costituita dalla sua
super…cie laterale e dalla base inferiore, ma non dalla base superiore.
Veniamo ora al seguente:
120
Teorema 3.26 (Principio di massimo parabolico) Sia u 2 C 1;2 (QT )\C 0 QT
soluzione di
ut D u = f in QT .
Allora:
i) Se f
0, u assume il suo massimo sulla frontiera parabolica di QT , cioè
max u (x; t)
max u (x; t) :
QT
@p QT
ii) Se f 0, allora u assume il suo massimo e il suo minimo sulla frontiera
parabolica di QT , e in particolare
max ju (x; t)j
max ju (x; t)j :
QT
@p QT
Il signi…cato …sico del principio di massimo è piuttosto trasparente: se f 0,
cioè il calore viene eventualmente sottratto al corpo ma mai fornito ad esso, la
temperatura in ogni punto e istante non può superare quella che aveva all’inizio
o ha sul suo bordo: non può esserci a un istante positivo un punto di massimo
stretto della temperatura, all’interno del dominio.
Se poi f 0, siamo in assenza di pozzi e sorgenti di calore; il calore di¤onderà
semplicemente, il che signi…ca che nel tempo il gra…co della temperatura tende
a “appiattirsi”sempre più, con massimi e minimi assunti all’istante iniziale o al
bordo.
Il diverso ruolo che hanno l’istante t = 0 e l’istante t = T nelle proprietà della
soluzione ri‡ettono la freccia del tempo nell’interpretazione …sica del modello: il
calore passa (al passare del tempo) dal corpo più caldo al corpo più freddo, il che
dà alla variabile tempo, nell’equazione, un verso privilegiato: non c’è simmetria
quindi tra lo scorrere in avanti o all’indietro del tempo.
Dimostrazione. Il secondo punto segue dal primo (come nel caso del principio
di massimo per il laplaciano), applicando il primo punto a u.
Per provare il primo punto, consideriamo un cilindro QT " (con " > T ), in
modo che anche sulla sua base superiore
fT "g la u sia regolare, e poniamo
w (x; t) = u (x; t)
"t:
Si ha:
wt
D w=f
" < 0 in QT :
Proviamo che questa w, che è continua in QT " quindi ha massimo su quest’insieme, assume il suo massimo sulla frontiera parabolica di QT " . Per assurdo,
abbia un massimo in
(x0 ; t0 ) 2
(0; T "]:
In questo punto di massimo risulta certamente w (x0 ; t0 ) 0 (come visto nella
dimostrazione del principio di massimo per il laplaciano; è qui che ci serve il fatto
di essere su un cilindro più corto QT " ; altrimenti, nel caso fosse t0 = T non
potremmo garantire l’esistenza di w (x0 ; t0 )). Quanto al valore di wt (x0 ; t0 ),
121
dobbiamo distinguere due casi. Se t0 < T " allora il massimo è interno a QT "
e per il teorema di Fermat wt (x0 ; t0 ) = 0: Se invece t0 = T " la derivata può
non essere nulla ma (ragionare sulla geometria del dominio: il punto (x0 ; t0 ) sta
sulla base superiore del cilindro) wt (x0 ; t0 ) 0. In ogni caso si avrebbe
(wt
D w) (x0 ; t0 )
contro il fatto che già sappiamo che wt
Abbiamo quindi provato che
max w
QT
quindi
max u
QT
"
!
"T
D w < 0 in QT .
max w
@p QT
"
max (u
QT
0;
"
"t) = max w
QT
"
"
max u
@p QT
"
e per " ! 0 (essendo u 2 C 0 QT ) si ha
max u
max u:
@p QT
QT
Osservazione 3.27 Come preannunciato, il principio di massimo migliora l’enunciato del teorema di unicità per il problema di Cauchy-Dirichlet: la soluzione
è unica nella classe naturale C 1;2 (QT ) \ C 0 QT e non solo in quella, più
ristretta, C 1;2 (QT ) \ C 0 QT \ C 1
(0; T ) in cui l’abbiamo inizialmente
dimostrata.
Il principio di massimo consente di provare una stima di stabilità per il
problema di Cauchy-Dirichlet su un dominio cilindrico:
Corollario 3.28 Sia QT =
(0; T ) con
Rn dominio limitato e T > 0; e
1;2
0
sia u 2 C (QT ) \ C QT soluzione di
8
< ut D u = f in QT
u = g su @
(0; T )
:
u (x; 0) = h (x) in :
Allora
max juj
QT
@
max jgj + max jhj +
(0;T )
dove R > 0 è un numero per cui si ha
R2
max jf j
2nD QT
BR (0) :
Dimostrazione. Sia
2
w (x; t) = u (x; t) +
122
jxj
max jf j :
2nD QT
Allora
2
wt
D w = ut
D u
D max jf j
QT
=f
max jf j
jxj
2nD
!
0 in QT ;
QT
quindi per il principio di massimo parabolico si ha
max w
QT
max w
@p QT
e quindi
2
max u
QT
max w
max w
QT
@p QT
max u + max
@p QT
@p QT
jxj
max jf j
2nD QT
2
R
max jf j :
2nD QT
max u +
@p QT
Ora si applica lo stesso argomento a
max juj
QT
max juj +
@p QT
@
3.2.2
u e si conclude che
R2
max jf j
2nD QT
max jgj + max jhj +
(0;T )
R2
max jf j :
2nD QT
Equazione di di¤usione sul segmento
Consideriamo una sbarra omogenea, rappresentata dal segmento [0; L], la cui
temperatura al punto x e all’istante t è u (x; t). Se la temperatura iniziale ha un
pro…lo noto u0 (x), la sbarra è termicamente isolata sulla sua super…cie laterale,
non ci sono sorgenti o pozzi di calore interni, e la temperatura agli estremi
è tenuta costante uguale a zero, ci aspettiamo che la temperatura nel tempo
raggiungerà ovunque la temperatura costante zero. Studiamo come avviene nel
tempo questo fenomeno. Come abbiamo visto nel § 2.2.1, in questo caso u
soddisfa l’equazione del calore omogenea
8
< ut = cuxx per 0 < x < L; t > 0
u (0; t) = u (L; t) = 0
(3.17)
:
u (x; 0) = u0 (x)
(dove c > 0, costante, è il coe¢ ciente di di¤usione27 ) che abbiamo accompagnato
con le condizioni ai limiti e iniziali (problema di Cauchy-Dirichlet per l’equazione
del calore omogenea unidimensionale).
2 7 in
precedenza indicato con D.
123
Veniamo ora alla soluzione e¤ettiva di questo problema. Il metodo di separazione delle variabili è ancora applicabile. Cerchiamo soluzioni a variabili
separate:
U (x; t) = X (x) T (t) :
Sostituendo nell’equazione di¤erenziale si ha:
X (x) T 0 (t) = cX 00 (x) T (t)
T 0 (t)
X 00 (x)
=
:
X (x)
cT (t)
Questa uguaglianza dev’essere identicamente veri…cata per 0 < x < L; t > 0.
D’altro canto il primo membro è una funzione della sola x, il secondo membro
è una funzione della sola t, quindi l’unica possibilità perché l’identità sussista è
che ciascun membro sia costante. Si ha quindi, per qualche 2 R,
X 00 (x)
=
X (x)
T 0 (t)
=
cT (t)
per 0 < x < L
per t > 0:
(3.18)
Ricordiamo ora che devono valere le condizioni ai contorno u (0; t) = u (L; t) = 0
che si traducono in X (0) = X (L) = 0. Dunque l’equazione in X e quella in T
assumono un ruolo asimmetrico, perché la prima (e solo la prima) è corredata
di condizioni al contorno:
X 00 (x) = X (x) per 0 < x < L
X (0) = X (L) = 0:
(3.19)
Con ciò abbiamo ottenuto un problema agli autovalori per l’operatore di¤erend2
ziale dx
2 R (autovalori) e soluzioni X (x) non identica2 : si cercano numeri
mente nulle (autofunzioni) del problema (3.19). Si ri‡etta sul fatto che per ogni
possiamo scrivere l’integrale generale dell’equazione di¤erenziale, dipendente
da due costanti arbitrarie, ma non per ogni è possibile determinare le costanti
di integrazione in modo da soddisfare le condizioni nulle agli estremi:
se = 0; X (x) = c1 x +pc2 si annulla
in x = 0; x = L solo per c1 = c2 = 0;
p
x
x
se > 0; X (x) = c1 e
+ c2 e
si annulla in x = 0; x = L solo per
c1 = c2 = 0;
p
p
se < 0; X (x) = c1 cos
x + c2 sin
x si annulla in x = 0; x = L
p
2 2
per c1 = 0 e per qualsiasi c2 purché sia sin
L = 0; cioè = nL2 , con
n = 1; 2; 3; :::
Abbiamo dunque ricavato autovalori e autofunzioni del problema (3.19):
=
n2 2
n x
; Xn (x) = cn sin
, per n = 1; 2; 3; :::
L2
L
124
(cn costante arbitraria). Possiamo ora risolvere l’equazione (3.18) per questi
valori di :
T 0 (t) =
n2 2 c
T (t)
L2
Tn (t) = cn e
n2 2 c
t
L2
e in de…nitiva le soluzioni a variabili separate dell’equazione a derivate parziali
e delle condizioni al contorno:
n2 2 c
n x
un (x; t) = Xn (x) Tn (t) = cn sin
e L2 t :
L
Nessuna di queste soluzioni in generale soddisferà anche la condizione iniziale,
perché un (x; 0) = cn sin (n x). L’idea allora è la seguente: essendo l’equazione
di¤erenziale lineare e omogenea, con condizioni agli estremi omogenee, ogni
combinazione lineare …nita delle un soddisferà ancora equazione e condizioni
al contorno. Possiamo cercare una serie in…nita di queste soluzioni che per
un’opportuna scelta dei coe¢ cienti cn converga ed assuma anche la condizione
iniziale. Scriviamo dunque
u (x; t) =
1
X
cn sin
n=1
n x
e
L
n2 2 c
t
L2
(3.20)
e imponiamo la condizione iniziale:
u (x; 0) =
1
X
n=1
cn sin
n x
= u0 (x) per 0 < x < L
L
Si tratta dunque di scegliere i coe¢ cienti cn come i coe¢ cienti di Fourier dello
sviluppo di u0 in serie di soli seni in (0; L). Ricapitoliamo come si fa.
1. Considerata u0 (x) de…nita in [0; L], si de…nisce u
e0 : [ L; L] ! R ottenuta
da u prolungandola in [ L; 0] in modo che risulti una funzione dispari:
u
e0 (x) =
u0 (x)
u0 ( x)
per x 2 [0; L]
per x 2 [ L; 0] :
Notiamo che se u0 è continua in [0; L] e u0 (0) = u0 (L) = 0 (ipotesi ragionevole
visto che questa è la temperatura iniziale, e noi vogliamo che a tutti gli istanti
t > 0 la temperatura sia nulla agli estremi), la u
e0 sarà continua in [ L; L] e
soddsferà la condizione di raccordo u
e0 ( L) = u
e0 (L) (= 0).
2. Ora scriviamo lo sviluppo di Fourier di u
e0 (x) in [ L; L]; il sistema
trigonometrico adattato a quest’intervallo è
n
n x
n x o
cos
; sin
;
L
L
d’altro canto u
e0 (x) è una funzione dispari, quindi avrà coe¢ cienti an nulli e
Z
Z
1 L
n x
2 L
n x
bn =
u
e0 (x) sin
dx =
u
e0 (x) sin
dx:
L L
L
L 0
L
125
Poiché d’altro canto in [0; L] è u
e0 (x) = u0 (x), si avrà (supponendo anche u0
regolare a tratti)
u0 (x) =
1
X
bn sin
n=1
2
bn =
L
Z
n x
L
L
u0 (y) sin
0
per x 2 [0; L] ; con
n y
dy:
L
Se quindi nella (3.20) scegliamo i coe¢ cienti cn uguali a questi coe¢ cienti
bn dovremmo avere una soluzione del problema di Cauchy-Dirichlet. Al solito,
si tratta ora di provare che sotto opportune ipotesi su u0 il tutto è rigoroso.
Discussione delle proprietà della soluzione ottenuta
Vedremo che la situazione in questo caso ha forti analogie con quanto accade
per il problema di Dirichlet per il laplaciano sul cerchio.
Infatti, notiamo anzitutto che
sin
n x
e
L
n2 2 c
t
L2
e
n2 2 c
t
L2
;
dove l’ultima espressione scritta, per qualunque t > 0 (…ssato) e per ogni x 2
[0; L] tende a zero esponenzialmente al tendere di n a in…nito. Perciò, non
appena la successione fcn g dei coe¢ cienti è limitata (il che accade non appena
u0 è integrabile in [0; L]), non solo la serie (3.20) converge, ma anche la sua serie
derivata rispetto a x o t (qualunque numero di volte) continua a convergere.
Più precisamente:
1. Se la successione fcn g dei coe¢ cienti è limitata, allora in ogni dominio
Qt0 = f(x; t) : x 2 [0; L] ; t
t0 g
(per t0 > 0 …ssato), la serie che assegna u e quelle che si ottengono da questa
derivando un numero qualsiasi di volte rispetto a t o a x risultano convergenti
totalmente e quindi uniformemente. In particolare, la serie rappresenta una
funzione u che è derivabile in…nite volte in ogni insieme Qt0 e quindi in de…nitiva
per ogni t > 0. Non è, …nora, garantita, la regolarità della soluzione …no a t = 0.
In altre parole, la funzione rappresentata dalla (3.20) è in…nitamente derivabile
per t > 0. L’equazione del calore, dunque, è fortemente regolarizzante, come
l’equazione di Laplace.
2. Poiché le derivate di u si possono calcolare derivando la serie termine
a termine, e poiché ogni termine della serie soddisfa l’equazione di¤erenziale
(proprio per come è stata ottenuta: è una soluzione a variabili separate), anche
la u rappresentata dalla (3.20) soddisfa l’equazione di¤erenziale.
3. Poiché, per il punto 1, in particolare, la funzione u è continua in Qt0 , per
x ! 0 e x ! L (e t t0 > 0) la u tende al suo valore negli estremi, che è zero:
quindi le condizioni agli estremi sono assunte con continuità, per ogni t > 0.
4. Chiediamoci ora in che senso è assunto il dato iniziale. Anche in questo
caso si può distinguere il quadro “classico”da quello L2 . Proviamo due risultati.
126
Teorema 3.29 (condizione iniziale classica) Supponiamo che u0 soddis… delle
ipotesi sotto cui la sua serie di Fourier28 converge totalmente, ad es. (v. §3.5.2),
u0 2 C 1 ([0; L]) e soddisfa la condizione di raccordo
u0 (0) = u0 (L) = 0:
Allora la u de…nita dalla ( 3.20) è continua in [0; L]
lim
(x;t)!(x0 ;0)
[0; 1), in particolare
u (x; t) = u0 (x0 ) per ogni x0 2 [0; L] .
Dimostrazione. Nelle ipotesi fatte su u0 , la funzione u
e0 (ri‡essa dispari di u0
su [ L; L], come sopra) soddisfa le ipotesi della convergenza totale della serie
di Fourier di u
e0 , ossia
1
X
jck j < 1:
k=1
Poiché d’altro canto per (x; t) 2 [0; L]
k x
L
ck sin
[0; 1) si ha
e
k2 2 c
t
L2
jck j ;
la serie che assegna u (x; t) converge totalmente in [0; L]
formemente, perciò u è continua in questo dominio.
[0; 1), quindi uni-
Teorema 3.30 (Condizione iniziale L2 ) Se u0 2 L2 (0; L), allora il dato
iniziale è assunto in senso L2 , ossia
u0 kL2 (0;L) ! 0 per t ! 0+ :
ku ( ; t)
Dimostrazione. Sappiamo che per ogni t > 0 è
u (x; t)
u0 (x) =
1
X
cn sin
n=1
n x
L
e
n2 2 c
t
L2
1
e quindi, per l’uguaglianza di Perceval,
ku ( ; t)
2
u0 kL2 (0;L) =
1
X
L 2
c e
2 n
n=1
n2 2 c
t
L2
2
1
:
P1
Ora ragioniamo così: poiché la serie n=1 c2n converge, per ogni " > 0 esiste n0
tale che
L X 2
c < ";
2 n>n n
0
28 o
meglio il suo sviluppo di Fourier in serie di soli seni, quindi lo sviluppo di Fourier
standard della funzione u
e0 ri‡essa dispari di u.
127
quindi
ku ( ; t)
2
u0 kL2 (0;L)
n0
X
L 2
=
c e
2 n
n=1
=
e
e
2c
n2
0
t
L2
1
e
2c
n2
0
t
L2
1
e
1
+
X L
c2 e
2 n
n>n
n2 2 c
t
L2
2
1
0
2c
n2
0
t
L2
Ora, essendo n0 e " …ssati, esiste
2
n2 2 c
t
L2
1
n0
2X
X L
L 2
cn +
c2n
2
2
n>n
n=1
0
1
2X
L 2
c +"
2 n
n=1
2
2
ku0 kL2 (0;L) + ":
> 0 tale che per 0 < t <
risulta
2
2c
n2
0
t
L2
1
<"
e quindi
ku ( ; t)
2
2
u0 kL2 (0;L) < " ku0 kL2 (0;L) + 1
per 0 < t < ;
da cui la convergenza voluta.
In particolare grazie al teorema sull’assunzione della condizione iniziale in
senso classico possiamo a¤ermare il seguente
Teorema 3.31 Sia u0 2 C 1 ([0; L]) soddisfacente le condizioni
u0 (0) = u0 (L) = 0:
Allora, detto Q = (0; L) (0; 1) esiste una e una sola funzione u 2 C 1;2 (Q) \
C 0 Q soluzione del problema di Cauchy-Dirichlet
8
< ut = cuxx per 0 < x < L; t > 0
u (0; t) = u (L; t) = 0
:
u (x; 0) = u0 (x)
in senso classico (ossia con condizioni iniziali e agli estremi assunte con continuità). Questa soluzione è assegnata dalla ( 3.20) e soddisfa inoltre il principio
di massimo parabolico
max ju (x; t)j
(x;t)2Q
max ju0 (x)j ;
x2[0;L]
che è in questo caso una stima di dipendenza continua della soluzione dalla
condizione iniziale.
128
Nucleo del calore sul segmento
Consideriamo ancora la formula di rappresentazione della soluzione e, utilizzando l’espressione esplicita dei coe¢ cienti cn che in essa compaiono, trasformiamola in una formula di rappresentazione integrale:
u (x; t) =
1
X
cn sin
n=1
2
cn =
L
Z
n x
e
L
L
u0 (y) sin
0
n2 2 c
t
L2
n y
dy:
L
Allora,
!
Z L
1
X
n2 2 c
n y
n x
2
u0 (y) sin
dy sin
e L2 t
u (x; t) =
L
L
L
0
n=1
!
Z L
1
n2 2 c
2 X
n y
n x
t
=
u0 (y)
sin
sin
e L2
dy
L n=1
L
L
0
Z L
=
u0 (y) K (x; y; t) dy
0
con
K (x; y; t) =
1
n y
n x
2 X
sin
sin
e
L n=1
L
L
n2 2 c
t
L2
,
espressione che de…nisce una funzione molto regolare per ogni t > 0, ma perde
signi…cato per t = 0.
Anche se questa serie non si può facilmente sommare (ottenendo un’espressione più esplicita del nucleo K), utilizzando quest’espressione è ancora possibile,
analogamente a quanto accade per il nucleo di Poisson sul cerchio (v. § 5.1.3)
dimostrare il seguente risultato:
Teorema 3.32 Supponiamo che la funzione u0 sia continua in [0; L] e soddis…
la condizione u0 (0) = u0 (L) = 0. Allora la soluzione u (x; t) de…nita come
sopra assume con continuità la condizione iniziale, ossia:
lim
(x;t)!(x0 ;0)
u (x; t) = u0 (x0 ) per ogni x0 2 [0; L] .
(Se u0 non soddisfa la condizione u0 (0) = u0 (L) = 0 la conclusione precedente
vale comunque per ogni x0 2 (0; L)). Pertanto, il problema di Cauchy-Dirichlet
(3.17) può essere risolto in senso classico per ogni dato iniziale continuo.
Per la dimostrazione, si rimanda a [Weinberger, pp.108-110].
Esercizio 3.33 Risolvere per separazione di variabili il problema di CauchyNeumann
8
< ut = cuxx per 0 < x < L; t > 0
ux (0; t) = ux (L; t) = 0
:
u (x; 0) = u0 (x) :
129
Signi…cato …sico: una sbarra è termicamente isolata, priva di sorgenti o pozzi di
calore interni, ed è nota la temperatura iniziale. Studiare l’andamento nel tempo
(ci aspettiamo che la temperatura tenda a una costante non zero). Discutere
quindi la validità della formula risolutiva trovata, analogamente a quanto fatto
nel caso di Cauchy-Dirichlet.
L’equazione del calore retrograda. Un esempio di problema mal posto
Le funzioni
n x n2 22 c t
1
sin
e L
n
L
(per n = 1; 2; 3; :::) soddisfano i problemi di Cauchy-Dirichlet
8
< ut + cuxx = 0 per 0 < x < L; t > 0
u (0; t) = u (L; t) = 0
(Pn ) :
:
u (x; 0) = n1 sin nLx
un (x; t) =
(cioè: per ogni n, un soddisfa (Pn )). Si osservi che abbiamo cambiato il segno
davanti al termine cuxx , rispetto all’equazione del calore. Quest’equazione si
chiama equazione del calore retrograda, o all’indietro, o backward. Notiamo la
particolarità di questa situazione: per una stessa equazione di¤erenziale, con
condizioni agli estremi nulli, abbiamo una successione di condizioni iniziali
vn (x) =
1
n x
sin
n
L
che tende uniformemente a zero in [0; L]. Invece la famiglia delle corrispondenti
soluzioni un , per (x; t) …ssati non tende a¤atto a zero, ma oscilla con ampiezza
illimitata, in quanto
1 n2 22 c t
e L
! 1 per n ! 0 e t > 0:
n
I gra…ci delle soluzioni un (x; t)per n = 1; 2; 3.Come si vede, per t = 0
(condizione iniziale) il gra…co è via via più piccolo, mentre per t > 0
oscilla sempre più al crescere di n: la soluzione è instabile rispetto ai dati.
130
Il problema è quindi mal posto, in quanto viene a cadere la dipendenza
continua della soluzione dalla condizione iniziale. Intepretazione …sica: è un’equazione del calore retrograda, quindi il problema con condizione iniziale assegnata equivale a un problema con condizione …nale assegnata per l’equazione
standard del calore. La morale è che, nello studio della di¤usione del calore,
dallo stato presente del sistema non si può risalire con precisione al suo passato. L’evoluzione del sistema “liscia”rapidamente le eventuali oscillazioni della condizione iniziale, cancellando le informazioni, che non si riescono più a
ricostruire.
3.3
3.3.1
L’equazione della corda vibrante
La corda vibrante …ssata agli estremi
Come abbiamo visto nel §2.3.1, una corda elastica omogenea …ssata ai due estremi, pizzicata in modo da eseguire piccole oscillazioni rispetto all’equilibrio, e
soggetta eventualmente a una forza di carico f , soddisfa l’equazione di¤erenziale
utt
c2 uxx = f
dove u (x; t) rappresenta l’altezza al tempo t del punto della corda che a riposo si
trova nel punto x, e c è una costante positiva con le dimensioni di una velocità;
precisamente,
0
c2 =
0
dove 0 è la tensione della corda a riposo e 0 la densità della corda a riposo,
supposte entrambe costanti.
Se la corda è …ssata agli estremi e sono note la sua con…gurazione iniziale
u0 (x) e la sua velocità iniziale v0 (x), la u (x; t) soddisferà il problema di CauchyDirichlet:
8
utt c2 uxx = f
per 0 < x < L; t > 0
>
>
<
u (0; t) = u (L; t) = 0 per t > 0
(3.21)
u (x; 0) = u0 (x)
per 0 < x < L
>
>
:
ut (x; 0) = v0 (x)
per 0 < x < L:
Invece delle condizioni di Dirichlet u (0; t) = u (L; t) = 0 si potrebbero
assegnare condizioni di Neumann omogenee
ux (0; t) = ux (L; t) = 0;
il cui signi…cato …sico è: ciascun estremo della corda non è …sso, ma può scorrere
verticalmente senza attrito su una guida verticale. Cominciamo a stabilire un
risultato di unicità, poi a¤ronteremo la risoluzione del problema.
Energia e risultati di unicità
Calcoliamo l’energia meccanica totale della corda al tempo t nelle ipotesi precedenti.
131
Per l’energia cinetica si ha:
Ecin =
1
2
Z
L
u2t dm =
0
1
2
Z
L
2
0 ut dx:
0
Per l’energia potenziale dovuta alle forze di tensione, iniziamo a considerare
il contributo di un tratto di lunghezza x. L’allungamento di questo tratto
quando non è a riposo sarà:
Z x+ x p
Z x+ x
Z x+ x p
1 2
1
2
2
1 + ux dx
x=
1 + ux 1 dx '
ux dx ' u2x x
2
2
x
x
x
e il lavoro elementare delle forze elastiche per produrre questo allungamento
sarà
1
dW = 0 u2x x:
2
L’energia potenziale totale è l’integrale di questo lavoro elementare su tutto il
segmento di corda, quindi
Z
1 L
2
Epot =
0 ux dx
2 0
e in de…nitiva l’energia totale all’istante t è
Z
Z
Z
1 L
1 L
1 L
2
2
E (t) =
0 ut dx +
0 ux dx =
2 0
2 0
2 0
2
0 ut
+
2
0 ux
dx:
(3.22)
Calcoliamo ora la variazione di energia nel tempo. Derivando sotto il segno
di integrale si ha (sempre supponendo 0 ; 0 costanti)
E 0 (t) =
Z
L
( 0 ut utt +
0 ux uxt ) dx:
0
Integriamo per parti il secondo addendo:
Z L
ux (0; t) ut (0; t)]
0 ux uxt dx = 0 [ux (L; t) ut (L; t)
0
Z
L
0 uxx ut dx
0
perciò, usando anche l’equazione di¤erenziale soddisfatta da u;
Z L
0
E (t) = 0 [ux (L; t) ut (L; t) ux (0; t) ut (0; t)] +
( 0 utt
0 uxx ) ut dx
0
=
0
[ux (L; t) ut (L; t)
ux (0; t) ut (0; t)] +
Z
L
( 0 f ) ut dx
(3.23)
0
La relazione trovata permette ora di dimostrare facilmente il seguente
Teorema 3.34 (di unicità) Il problema di Cauchy-Dirichlet (3.21), o l’analogo problema di Cauchy-Neumann, ha al più una soluzione regolare.
132
Dimostrazione. Come già sappiamo, provare l’unicità signi…ca, per la linearità
del problema, provare che l’analogo problema con termine noto f = 0 e condizioni iniziali u0 ; v0 = 0 ha solo la soluzione identicamente nulla. Applichiamo
a questa situazione la relazione (3.23). Poiché f = 0 avremo
E 0 (t) =
0
[ux (L; t) ut (L; t)
ux (0; t) ut (0; t)] :
Ora nel caso del problema di Neumann si ha ux (0; t) = ux (L; t) = 0 e quindi
E 0 (t) = 0; nel caso del problema di Dirichlet, dal fatto che u (0; t) = u (L; t) = 0
per ogni t > 0 deduciamo anche, derivando rispetto a t, che ut (0; t) = ut (L; t) =
0, quindi ancora E 0 (t) = 0:
In ogni caso quindi l’energia totale è costante, quindi per ogni t > 0 è:
E (t) = E (0) =
=
1
2
Z
L
1
2
Z
L
2
0 ut
(x; 0) +
2
0 ux
(x; 0) dx
0
2
0 v0
2
(x) +
0
0
(u0 )x (x) dx = 0;
cioè l’energia è identicamente nulla, ossia per ogni t > 0
Z
L
2
0 ut
+
2
0 ux
dx = 0:
0
Questo implica che per ogni t è ux (x; t)
nulla agli estremi, u (x; t) 0.
0, quindi u ( ; t) costante, ed essendo
Risoluzione del problema di Cauchy-Dirichlet per l’equazione omogenea
Consideriamo ora il problema (con termine noto nullo)
8
utt c2 uxx = 0
per 0 < x < L; t > 0
>
>
<
u (0; t) = u (L; t) = 0 per t > 0
(3.24)
per 0 < x < L
> u (x; 0) = u0 (x)
>
:
ut (x; 0) = v0 (x)
per 0 < x < L:
Anche questo si può a¤rontare per separazione delle variabili: si cerca
u (x; t) = X (x) T (t)
e questo con un ragionamento analogo ai precedenti porta come sottoproblemi:
X 00 (x) = X (x) per 0 < x < L
X (0) = X (L) = 0
(dove si è già tenuto conto delle condizioni agli estremi), e
T 00 (t) = c2 T (t) :
133
Il primo problema è lo stesso che abbiamo incontrato risolvendo l’equazione del
calore sulla sbarra, perciò avrà le stesse soluzioni:
Xn (x) = sin
n
Sostituendo
=
n
=
n x
L
n 2
:
L
nell’equazione in t si ha
2
n
L
T 00 (t) =
c2 T (t)
e quindi
n ct
L
Tn (t) = an cos
+ bn sin
n ct
L
:
Le soluzioni a variabili separate sono perciò
n x
L
un (x; t) = sin
n ct
L
an cos
+ bn sin
n ct
L
:
Ciascuna di queste un soddisfa l’equazione di¤erenziale e le condizioni agli
estremi, ma non, in generale, le condizioni iniziali.
Per soddisfare le condizioni iniziali cerchiamo una u (x; t) data dalla serie
(combinazione lineare) delle in…nite un :
u (x; t) =
1
X
n=1
sin
n x
L
an cos
n ct
L
n ct
L
+ bn sin
:
(3.25)
Imponendo la condizione u (x; 0) = u0 (x) si ha
u0 (x) =
1
X
an sin
n=1
n x
L
ossia i coe¢ cienti an devono essere quelli che danno lo sviluppo di Fourier in
serie di soli seni della funzione u0 sull’intervallo [0; L], ossia (come già visto nel
caso del calore)
Z
2 L
n y
an =
u0 (y) sin
dy:
(3.26)
L 0
L
Per imporre la condizione iniziale sulla derivata ut calcoliamo prima (derivando formalmente termine a termine la serie)
1
@u (x; t) X
n x
=
sin
@t
L
n=1
=
1
X
n=1
sin
n x
L
@
an cos
@t
an
n ct
L
n c
sin
L
134
+ bn sin
n ct
L
n ct
L
+ bn
n c
cos
L
n ct
L
quindi
1
n c
n x
@u (x; 0) X
=
bn
sin
= v0 (x)
@t
L
L
n=1
quindi l’ultima serie scritta dev’essere lo sviluppo in serie di soli seni del dato
v0 (x) ; da cui
Z
2 L
n y
n c
=
v0 (y) sin
dy;
bn
L
L 0
L
e in de…nitiva
bn =
2
n c
Z
L
v0 (y) sin
0
n y
dy:
L
(3.27)
Perciò: la funzione (3.25), con i coe¢ cienti an ; bn assegnati dalle (3.26)
(3.27), rappresenta la soluzione del problema di Cauchy-Dirichlet (3.21).
Discussione delle proprietà della soluzione ottenuta
Tutto ciò è per ora puramente formale: occorre capire sotto quali condizioni
la serie (3.26) converge ed è derivabile termine a termine quanto occorre per
veri…care che soddisfa l’equazione di¤erenziale. Le funzioni di t che compaiono
nella serie, cos n Lct , a di¤ erenza dell’esempio dell’equazione del calore, (in cui
erano gli esponenziali rapidamente decrescenti exp
n2 2 ct =L2 ) in questo
caso non aiutano la convergenza della serie stessa per t > 0. Precisamente:
poiché derivando due volte rispetto a x o rispetto a t compare un coe¢ ciente
n2 , se vogliamo che la serie delle derivate seconde converga uniformemente, e
quindi la derivazione termine a termine sia lecita, dobbiamo assicurarci che sia
1
X
n=1
n2 (jan j + jbn j) < 1:
Questo, in base ai risultati sulla velocità a zero dei coe¢ cienti di Fourier discussi
nel § 3.5.2 (Teorema 1.131), si traduce nelle seguenti richieste sui dati iniziali:
u0 2 C 3 (0; L) ; con u0 (0) = u0 (L), u00 (0) = u00 (L), u000 (0) = u000 (L);
v0 2 C 2 (0; L) ; con v0 (0) = v0 (L), v00 (0) = v00 (L).
Si osservi che i coe¢ cienti bn sono i coe¢ cienti di Fourier di v0 divisi per
n; questa è la ragione per cui le richieste su v0 sono meno forti (di un grado di
derivabilità) rispetto a quelle per u0 .
Sotto queste ipotesi in particolare le serie che assegnano sia u che ut sono
uniformemente convergenti per t 0, quindi le condizioni iniziali sono assunte
con continuità.
L’analisi precedente mostra che, a di¤erenza dell’equazione del calore e di
Laplace, l’equazione delle onde non è regolarizzante: la soluzione per t > 0 non
diventa automaticamente molto regolare (all’interno del dominio cilindrico) indipendentemente dalla regolarità dei dati iniziali (come accadeva per l’equazione
del calore o -sostituendo “dato iniziale” con “dato al bordo”- per l’equazione
di Laplace). Questo si può interpretare dicendo che l’equazione “non ci regala
135
nulla”: se vogliamo che sia C 2 per t > 0; dovrà essere C 2 anche per t = 0; il che
signi…ca che le ipotesi minime sotto cui possiamo sperare ci sia soluzione sono:
u0 2 C 2 (0; L) e v0 2 C 1 (0; L) (perché v0 è una derivata di u). Rispetto
a queste ipotesi, quelle che abbiamo dovuto fare sono più pesanti, richiedendo
sostanzialmente un grado di derivabilità in più rispetto a ciò che ci si poteva aspettare. Evidentemente la strada degli sviluppi di Fourier non è quella migliore
per ottenere sotto ipotesi minime un risultato di esistenza per il problema di
Cauchy-Dirichlet. E’comunque signi…cativo il fatto che il procedimento precedente, sia pur sotto ipotesi un po’ forti, si possa rendere totalmente rigoroso.
Abbiamo infatti dimostrato il seguente
Teorema 3.35 Supponiamo assegnate le funzioni u0 ; v0 soddisfacenti le condizioni:
u0 2 C 3 (0; L) ; con u0 (0) = u0 (L), u00 (0) = u00 (L), u000 (0) = u000 (L);
v0 2 C 2 (0; L) ; con v0 (0) = v0 (L), v00 (0) = v00 (L).
Allora esiste una e una sola u (x; t) 2 C 2 ([0; L] [0; +1)) soluzione del
problema (3.24).
Discussione delle proprietà della soluzioni stazionarie
Ci interessa ora esaminare le proprietà delle singole funzioni un (x; t). Ognuna
di esse rappresenta un possibile moto di vibrazione della corda, particolarmente
semplice, detta vibrazione stazionaria: ogni punto della corda descrive un moto
periodico (nel tempo) di tipo armonico, avente
pulsazione
n c
L
periodo
2L
nc
frequenza
c
n 2L
in particolare la frequenza di un è n volte la frequenza di u1 , detta frequenza
fondamentale di vibrazione della corda. Immaginiamo che la corda vibrante sia
una corda di chitarra. Dal punto di vista musicale, la frequenza fondamentale
di vibrazione della corda rappresenta l’altezza della nota che noi percepiamo; le
frequenze doppia, tripla, ecc. rappresentano le armoniche superiori, e un si dice
perciò n-esima armonica. Se ad esempio la frequenza fondamentale rappresenta
la nota do di una certa ottava che chiamiamo convenzionalmente ottava 1, le
armoniche successive rappresenteranno:
n=1
do1
2
do2
3
sol2
4
do3
5
mi3
6
sol3
7
sib3
8
do4
(dove l’indice indica l’ottava), e così via. In particolare: ogni raddoppio di
frequenza equivale a un salto di ottava. Assegnata una condizione iniziale, il
moto reale della corda è sovrapposizione di un numero teoricamente in…nito
di vibrazioni stazionarie, ma (poiché i coe¢ cienti di Fourier tendono a zero) è
136
ben approssimata dalla somma di un numero …nito di vibrazioni stazionarie.
Questo signi…ca che una corda pizzicata vibra emettendo un suono dato da una
certa frequenza fondamentale, che però è arricchito dalla presenza di un certo
numero di armoniche successive (generalmente di ampiezza molto inferiore), che
compelssivamente formano quello che chiamiamo il timbro di quel suono, o di
quello strumento musicale. Torniamo ad una singola vibrazione stazionaria. Ad
ogni istante la funzione un (x; t) ha un gra…co che è multiplo di
un (x; 0) = sin
n x
L
quindi ha la stessa “forma” di questo gra…co: la corda vibra “su e giù” mantenendo immobili in ogni istante i punti in cui un (x; 0) = 0, cioè i due estremi,
più (n 1) nodi interni. Ad esempio, per n = 3 le vibrazioni hanno la forma:
con due nodi interni, oltre ai due estremi …ssati. In generale, un ha (n 1) nodi
interni, e (n + 1) nodi complessivi (considerando anche gli estremi).
Come vedremo più avanti, alcune caratteristiche …siche del moto della corda
vibrante si ritrovano per le membrane vibranti (cioè in dimensione due) mentre
altre sono di¤erenti.
Esercizio 3.36 Si risolva, analogamente a quanto fatto per la corda vibrante
…ssata agli estremi, il caso della corda che vibra soggetta ad attrito:
8
utt c2 uxx + aut = 0 per 0 < x < L; t > 0
>
>
<
u (0; t) = u (L; t) = 0 per t > 0
u (x; 0) = u0 (x)
per 0 < x < L
>
>
:
ut (x; 0) = 0
per 0 < x < L:
per qualche a > 0 (costante, per semplicità; abbiamo anche supposto, per semplicità, la velocità iniziale nulla). Ci aspettiamo vibrazioni smorzate nel tempo.
Per la trattazione, v. [Weinberger] pp.112-4.
137
3.3.2
La corda vibrante illimitata
Consideriamo ora l’equazione della corda vibrante su tutto R, ossia una “corda
vibrante illimitata”. E’ ovviamente un’idealizzazione matematica, ma è interessante perché il problema viene da un certo punto di vista sempli…cato, permettendo di determinare direttamente l’integrale generale dell’equazione (cosa
abbastanza unica, tra le equazioni a derivate parziali) e imporre solo dopo le condizioni iniziali; il tutto, anzi, si riesce a fare anche per l’equazione non omogenea
(cioè in presenza di una forza esterna di carico che agisce sulla corda), caso che
…nora non avevamo trattato. La formula trovata, dovuta a D’Alembert, intorno
al 1750, mette in evidenza alcune caratteristiche importanti dell’equazione della
corda vibrante (e più in generale, dell’equazione delle onde anche in dimensione
maggiore) che la soluzione per separazione di variabili nascondeva un po’. Il
problema è quindi:
8
< utt c2 uxx = f per x 2 R; t > 0
u (x; 0) = u0 (x) per x 2 R
(3.28)
:
ut (x; 0) = v0 (x) per x 2 R:
La formula di D’Alembert per l’equazione omogenea.
sizione del problema di Cauchy-Dirichlet
Trattiamo prima il caso omogeneo:
Buona po-
c2 uxx = 0
utt
con c costante. Si consideri ora la trasformazione di coordinate nel piano:
= x + ct
= x ct:
Vogliamo esprimere in funzione di ; gli operatori di¤erenziali @x ; @t ; @xx ; @tt
e riscrivere quindi l’equazione della corda vibrante rispetto alle variabili ; .
Per il teorema di di¤erenziazione delle funzioni composte si ha:
@
=u +u
@x
@
ut = u
= cu
cu
@x
@
@
@
uxx =
(u + u ) = (
+
)(u + u ) = u + 2u
@x
@
@
@
@
@
utt = (cu
cu ) = c2 (
)(u
u ) = c2 (u
@t
@
@
ux = u
@
+u
@x
@
+u
@t
+u
2u
+u
):
4u
:
Di conseguenza:
utt
c2 uxx = c2 (u
2u
+u
)
138
c2 (u
+ 2u
+u
)=
Perciò l’equazione della corda vibrante nelle nuove variabili ;
u
si scrive:
= 0:
Quest’equazione può essere risolta facilmente. Infatti
@
@
signi…ca che
@u
@
@u
@
=0
non dipende da , cioè è una funzione di
soltanto:
@u
= f1 ( )
@
con f1 funzione arbitraria. Integrando rispetto a
si trova:
u = f ( ) + g( )
dove f ( ) è una primitiva di f1 ( ) (perciò, essendo f1 arbitraria, è una funzione
arbitraria) e g( ) è la “costante di integrazione”, che non dipende da , perciò
è funzione (arbitraria) di . Sostituendo in…ne ad ; le loro espressioni in
funzione di x; t si trova:
u(x; t) = f (x
ct) + g(x + ct):
Questa rappresenta l’integrale generale dell’equazione della corda vibrante, con
f; g arbitrarie funzioni di una sola variabile, due volte derivabili. La u così
ottenuta è dunque la sovrapposizione di due onde che viaggiano a velocità c in
versi opposti, un’onda progressiva e un’onda regressiva.
Imponiamo ora le condizioni iniziali:
u0 (x) = u (x; 0) = f (x) + g(x)
v0 (x) = ut (x; 0) = cf 0 (x) + cg 0 (x):
Quello che abbiamo ottenuto si può vedere come un sistema di due equazioni
in due funzioni incognite, f; g; che però solo nella seconda equazione compaiono
derivate. Se deriviamo anche la prima equazione otteniamo un sistema lineare
di due equazioni in due incognite:
f 0 (x) + g 0 (x) = u00 (x)
f 0 (x) + g 0 (x) = v0c(x)
che si risolve subito in f 0 ; g 0 :
1
2
1
g 0 (x) =
2
f 0 (x) =
v0 (x)
c
v0 (x)
u00 (x) +
c
u00 (x)
139
da cui per integrazione
Z
1 x
v0 (s) ds + c1
c 0
Z
1 x
u0 (x) +
v0 (s) ds + c2
c 0
1
2
1
g (x) =
2
f (x) =
u0 (x)
e quindi
u(x; t) = f (x
=
=
1
2
ct) + g(x + ct):
Z
1 x
u0 (x ct)
c 0
1
(u0 (x + ct) + u0 (x
2
ct
v0 (s) ds + c1 +
ct)) +
1
2c
Z
1
2
u0 (x + ct) +
x+ct
1
c
Z
x+ct
v0 (s) ds + c2
0
v0 (s) ds + c:
x ct
La costante c, somma delle due costanti arbitrarie, si elimina risostituendo t = 0
nell’identità precedente, che diventa
u (x; 0) = u0 (x) + c;
dunque c = 0 e la soluzione del problema di Cauchy-Dirichlet è:
Z x+ct
1
1
v0 (s) ds;
u(x; t) = (u0 (x + ct) + u0 (x ct)) +
2
2c x ct
(3.29)
nota come formula di D’Alembert.
Non deve sfuggire la particolarità di questo procedimento rispetto a quelli seguiti …n qui per altri problemi: senza bisogno di alcuna teoria-quadro
preesistente (ad esempio, un teorema di unicità), lavorando direttamente sull’equazione di¤erenziale abbiamo determinato che ogni eventuale soluzione ha effettivamente questa forma (unicità). Infatti, a di¤erenza dei metodi di soluzione
per separazione delle variabili, qui non abbiamo supposto a priori che la u
avesse una particolare forma. D’altro canto sotto ipotesi ragionevoli sui dati
iniziali la formula (3.29) fornisce e¤ettivamente la soluzione del problema di
Cauchy-Dirichlet; abbiamo cioè il seguente:
Teorema 3.37 Per ogni u0 2 C 2 (R) e v0 2 C 1 (R) la funzione u (x; t) assegnata da (3.29) è soluzione (unica) del problema (3.28) con f = 0. Vale inoltre
la seguente stima di dipendenza continua (per tempi …niti): per ogni T > 0 si
ha:
max ju (x; t)j max ju0 (y)j + T max jv0 (y)j
x2R;t2[0;T ]
y2R
y2R
Dimostrazione. E’immediato veri…care che se u0 2 C 2 (R) e v0 2 C 1 (R) la
funzione u (x; t) assegnata da (3.29) è C 2 R2 . Vale forse solo la pena osservare
140
come si calcolano le derivate prime della funzione integrale che compare in (3.29):
Z x+ct
@
v0 (s) ds = v0 (x + ct) v0 (x ct)
@x
x ct
Z x+ct
@
v0 (s) ds = cv0 (x + ct) + cv0 (x ct) :
@t
x ct
Che questa u soddis… l’equazione di¤erenziale e le condizioni iniziali si può
veri…care, ma segue dal procedimento stesso con cui l’abbiamo determinata,
così come dal procedimento seguito segue l’unicità della soluzione. Quanto alla
stima di dipendenza continua, dalla (3.29) possiamo maggiorare:
Z x+ct
1
1
(ju0 (x + ct)j + ju0 (x ct)j) +
jv0 (s)j ds
ju(x; t)j
2
2c x ct
1
1
2 max ju0 j +
max jv0 j 2ct
R
2
2c R
= max ju0 j + t max jv0 j
R
R
da cui prendendo il massimo per x 2 R; t 2 [0; T ] si ha la tesi.
Si noti che la stima di dipendenza continua controlla (uniformemente) solo
la u e non le sue derivate; inoltre vale per tempi …niti (il massimo di u per t > 0
qualsiasi non è controllato).
La formula di D’Alembert per l’equazione non omogenea
Il procedimento precedente si adatta anche al caso non omogeneo
utt
c2 uxx = f;
solo con qualche calcolo più pesante. Il risultato che si ottiene è:
1
(u0 (x + ct) + u0 (x ct))
2
Z x+ct
Z t Z x+c(t
1
1
+
v0 (s) ds +
2c x ct
2c 0
x c(t
(3.30)
u(x; t) =
!
)
F (s; ) ds d :
)
Per i passaggi si rimanda a [Weinberger], pp. 24-26.
Dalla formula precedente (e dal fatto che questa sia stabilita con un procedimento simile a quello già visto, che quindi fornisce l’unicità della soluzione) si
ricava facilmente il seguente
0
Teorema 3.38 Per ogni u0 2 C 2 (R), v0 2 C 1 (R), F; @F
R2 la fun@x 2 C
zione u (x; t) assegnata da (3.29) è soluzione (unica) del problema (3.28). Vale
inoltre la seguente stima di dipendenza continua (per tempi …niti): per ogni
T > 0 si ha:
max
x2R;t2[0;T ]
ju (x; t)j
max ju0 (y)j + T max jv0 (y)j + T 2
y2R
y2R
141
max
s2R; 2[0;T ]
jF (s; )j
Dimostrazione. La dimostrazione è analoga alla precedente. Mostriamo come
si calcolano le derivate della funzione integrale29 che coinvolge F , e come si
stima quel termine per ottenere la stima di dipendenza continua.
! ! Z
!
Z t Z x+c(t )
Z x+c(t )
t
@
@
F (s; ) ds d
=
F (s; ) ds d
@x
0
x c(t
)
0 @x
x c(t
)
Z t
=
(F (x + c (t
) ; ) F (x + c (t
) ; )) d
0
!
!
Z t Z x+c(t )
Z t
@F
@F
@2
F (s; ) ds d
=
(x + c (t
); )
(x + c (t
); ) d
@x2
@x
@x
0
x c(t
)
0
! ! Z
!
Z t Z x+c(t )
Z x+c(t )
t
@
@
F (s; ) ds d
=
F (s; ) ds d
@t
0
x c(t
)
0 @t
x c(t
)
Z
@2
@t2
1
2c
Z
t
0
Z
0
t
x+c(t
F (s; ) ds d
x c(t
Z
x+c(t
x c(t
!
)
)
)
!
!
0
1
2c
=
3.4
2
=c
1
2c
F (s; ) ds d
)
= 2cF (x; t)
Z t
+
(cF (x + c (t
Z
t
@F
(x + c (t
@x
0
Z
t
0
Z
0
Z
x+c(t
x c(t
T
) ; ) + cF (x
Z
x+c(T
x c(T
); )
@F
(x
@x
!
)
)
c (t
jF (s; )j ds d
)
max
) s2R; 2[0;T ]
) ; )) d
c (t
); ) d
!
jF (s; )j ds d
1
max jF (s; )j 2cT 2 = T 2
max jF (s; )j
2c s2R; 2[0;T ]
s2R; 2[0;T ]
Equazione delle onde in dimensione superiore
Qualche risultato generale di unicità che abbiamo dimostrato per l’equazione
della corda vibrante si estende all’equazione delle onde in dimensione spaziale
n > 1,
utt c2 u = f
(3.31)
2 9 Forse vale la pena ricordare la formula per il calcolo della derivata di una funzione integrale
in cui la variabile rispetto a cui si deriva compaia sia nell’integranda che negli estremi di
integrazione:
!
Z b(x)
d
f (x; t) dt = f (x; b (x)) b0 (x) f (x; a (x)) a0 (x)
dx
a(x)
Z b(x)
@f
+
(x; t) dt:
a(x) @x
142
che si può studiare in Rn+1 o in un dominio cilindrico QT =
(0; T ) con
Rn dominio limitato (v. §4.3.3 per la descrizione dei problemi iniziali e al
contorno che è interessante studiare, e i loro signi…cati …sici).
3.4.1
Energia e risultato di unicità
Anche in questo caso si può calcolare l’energia meccanica totale del sistema, che
è proporzionale a:
Z
1
2
E (t) =
u2t + c2 jruj dx:
2
Apriamo una parentesi. Si potrebbe obiettare: non abbiamo neppure precisato se stiamo studiando l’equazione pensando a una membrana vibrante
(n = 2), a onde sonore nell’aria (n = 3) o a un altro fenomeno: come possiamo a¤ermare che “l’energia del sistema è data da questa espressione”? Di
quale sistema …sico si parla? In realtà, come vedremo in seguito, dal punto di
vista del rigore del ragionamento che seguirà, questo non ha alcuna importanza: E (t) è semplicemente una funzione matematica, lavorando sulla quale con
opportuni passaggi dimostreremo un risultato di unicità per i problemi iniziali e
al contorno per l’equazione delle onde. E’istruttivo però il fatto che l’intuizione
…sica di quale sia una quantità rilevante per il problema in esame (in almeno
qualcuna delle possibili interpretazioni …siche) suggerisce quale sia la funzione
matematica su cui lavorare.
Calcoliamo ora la derivata rispetto al tempo
Z
0
E (t) =
ut utt + c2 ru rut dx =
applicando la prima identità di Green al secondo integrale
Z
Z
Z
@u
ut dS
=
ut utt dx c2
( u) ut dx + c2
@ @
Z
Z
@u
=
ut f dx + c2
ut dS:
@ @
Possiamo ora provare il seguente:
Teorema 3.39 Consideriamo un problema di Cauchy-Dirichlet o NeumannDirichlet per l’equazione (3.31) su un dominio QT =
(0; T ) con
Rn
su¢ cientemente regolare da potervi applicare il teorema della divergenza. La
soluzione regolare di tale problema, se esiste, è unica.
Dimostrazione. Come al solito, si tratta di provare che la soluzione di un
analogo problema con termine noto f , condizioni iniziali u (x; 0) ; ut (x; 0) e
condizioni al contorno tutte nulle, è identicamente nulla. Partiamo dall’identità
Z
Z
@u
E 0 (t) =
ut f dx + c2
ut dS = 0
@ @
143
perché f = 0 e, nel secondo integrale, se il problema è di Neumann @u
= 0
@
mentre se è di Dirichlet u ( ; t) = 0 su @ per ogni t; da cui t-derivando è anche
ut ( ; t) = 0 su @ . Dunque E 0 (t) = 0; quindi
Z
1
2
u2t (x; 0) + c2 jru (x; 0)j dx = 0
E (t) = E (0) =
2
per le condizioni iniziali nulle. Ne segue
Z
2
u2t + c2 jruj dx = 0 per ogni t;
da cui u =cost.= 0, con i soliti ragionamenti.
3.4.2
Onde sferiche tridimensionali
Ci occuperemo in seguito, un po’ alla volta, di vari problemi ai limiti per l’equazione delle onde in dimensione spaziale 2 o 3. Vediamo adesso un solo caso particolare, perché come vedremo la sua risoluzione si riconduce a quella
dell’equazione della corda vibrante illimitata, che abbiamo appena studiato.
Cerchiamo di determinare le onde sferiche, cioè le soluzioni dell’equazione
delle onde in 3 dimensioni spaziali, in tutto lo spazio, aventi simmetria radiale.
Per mettere meglio in evidenza la particolarità del caso tridimensionale, iniziamo
il nostro discorso in dimensione spaziale n qualsiasi. E’noto che se u (x) = f (jxj)
è una funzione radiale,
u (x) = f 00 ( ) +
(n
1)
f0 ( ) ;
quindi per un’onda radiale
u (x; t) = w ( ; t)
si ha
wtt
c2 w
+
(n
1)
w
=0
che si può riscrivere
2
wtt
c2
2
w
+ (n
1) w
=0
e, osservando che
( w)
= ( w + w) = w
+ 2w ;
notiamo che, solo per n = 3, si può riscrivere l’equazione nella forma
( w)tt
c2 ( w)
=0
cioè w in queso caso è soluzione dell’equazione della corda vibrante illimitata,
pertanto la più generale soluzione radiale (nello spazio) dell’equazione delle onde
tridimensionale in tutto lo spazio è:
w ( ; t) =
f ( + ct) + g (
144
ct)
;
(3.32)
ossia è la sovrapposizione di un’onda che si allontana dall’origine e una che si
avvicina, entrambe smorzate dal fattore 1 .
Si noti che, non ostante la presenza del fattore 1 , l’onda non è necessariamente singolare nell’origine, ad esempio:
w ( ; t) =
sin ( + ct) + sin (
ct)
=
2 sin cos (ct)
! 2 cos (ct) per
! 0:
Più in generale, si può dimostrare che se nella (3.32) si sceglie f = g con f
funzione dispari e regolare, si ha che per ! 0
w ( ; t) =
f ( + ct) + f (
ct)
Se invece f = g con f funzione pari, allora per
w ( ; t) =
3.5
f ( + ct) + f (
ct)
! 2f 0 (ct) :
!0
2f (ct)
! 1:
Esercizi sul metodo di separazione di variabili e sviluppi di Fourier
Esercizio 3.40 Risolvere col metodo di separazione delle variabili il seguente
problema di Cauchy-Dirichlet per l’equazione del calore omogenea sul segmento:
8
< ut = 3uxx per 0 < x < 1; t > 0
u (0; t) = u (1; t) = 0
:
u (x; 0) = sin3 ( x)
Esercizio 3.41 Risolvere col metodo di separazione delle variabili il seguente
problema di Cauchy-Dirichlet per l’equazione della corda vibrante:
8
utt = 4uxx per 0 < x < ; t > 0
>
>
<
u (0; t) = u ( ; t) = 0
u (x; 0) = sin 2x cos 3x
>
>
:
ut (x; 0) = 0:
Esercizio 3.42 Risolvere col metodo di separazione delle variabili il seguente
problema di Dirichlet per l’equazione di Laplace sul cerchio:
8 2
1 @2u
< @ u 1 @u
+
+ 2 2 = 0 per 2 [0; 1); # 2 [0; 2 ]
2
@
@
@#
:
u (R; #) = # (2
#)
per # 2 [0; 2 ] :
Esercizio 3.43 Risolvere col metodo di separazione delle variabili il seguente
problema di Dirichlet per l’equazione di Laplace sulla corona circolare:
8 2
@ u 1 @u
1 @2u
>
>
<
+
+ 2 2 = 0 per 2 (1; 2) ; # 2 [0; 2 ]
2
@
@
@#
u
(1;
#)
=
1
per # 2 [0; 2 ]
>
>
:
u (2; #) = 3
per # 2 [0; 2 ]
145
Esercizio 3.44 Si risolva, col metodo di separazione delle variabili, il seguente
problema di Dirichlet per l’equazione di Laplace sul rettangolo:
8
< uxx + uyy = 0 per x 2 (0; A) ; y 2 (0; B)
u (x; 0) = u (x; B) = u (A; y) = 0
:
u (0; y) = f (y) :
In altre parole, il dato al contorno assegnato sul bordo del rettangolo è diverso
da zero solo su uno dei 4 lati (per semplicità).
Suggerimento: cercare soluzioni a variabili separate u (x; y) = X (x) Y (y)
coi metodi visti sopra. Il problema agli autovalori è quello nella Y (y) ; che deve
annullarsi a entrambi gli estremi. Scrivere la formula risolutiva nel modo più
semplice e compatto. Si trova:
u (x; y) =
1
X
bn
n=1
bn =
2
B
Z
Sh [n (A x)]
n y
sin
, con
Sh (n A)
B
B
f (s) sin
0
n s
ds:
B
Esercizio 3.45 Risolvere col metodo di separazione delle variabili il problema
di Dirichlet per l’equazione di Laplace sul rettangolo:
8
< uxx + uyy = 0 per x 2 (0; 1) ; y 2 (0; 2)
u (x; 0) = u (x; 2) = u (1; y) = 0
:
u (0; y) = sin y cos 2 y:
Esercizio 3.46 Risolvere col metodo di separazione delle variabili il seguente
problema agli autovalori per il Laplaciano sul rettangolo:
8
0 x 1; 0 y 2
< uxx + uyy + u = 0
u (0; y) = u (1; y) = 0 0 y 2
:
u (x; 0) = u (x; 2) = 0 0 x 1:
Esercizio 3.47 Risolvere esplicitamente mediante separazione di variabili il
seguente problema di Cauchy-Dirichlet per un’equazione di di¤ usione e trasporto
sul segmento:
8
< ut = uxx + 2ux per x 2 [0; L] ; t > 0
u (0; t) = u (L; t) = 0 per t > 0
:
u (x; 0) = 2e x sin 3Lx per x 2 [0; L] :
Esercizio 3.48 Risolvere mediante separazione di variabili il seguente problema
di Dirichlet per il laplaciano su una corona circolare (il problema è già scritto
in coordinate polari):
8
1
1
< u + u + 2 u## = 0 per 1 < < 2; # 2 [0; 2 ]
u (1; #) = 0
:
u (2; #) = 1 + sin # + 3 cos 2#:
146
Esercizio 3.49 Risolvere esplicitamente, mediante separazione di variabili il
seguente problema di Dirichlet per un’equazione di Laplace con termine di ordine
zero, sul quadrato Q = [0; 1] [0; 1]:
8
uxx uyy + u = 0 per (x; y) 2 [0; 1] [0; 1]
>
>
<
u (0; y) = u (1; y) = 0 per y 2 [0; 1]
u (x; 1) = 0 per x 2 [0; 1]
>
>
:
u (x; 0) = sin (5 x) per x 2 [0; 1] :
Soluzioni di alcuni esercizi
Soluzione Es. 3.47. Cerchiamo u (x; t) = X (x) T (t) : L’equazione diventa:
T 0 X = T X 00 + 2T X 0
T0
X 00 + 2X 0
(t) =
(x)
T
X
da cui
per qualche
T0
X 00 + 2X 0
=
=
T
X
costante. Si deve avere quindi:
X 00 (x) + 2X 0 (x) = X (x) per x 2 (0; L)
X (0) = X (L) = 0
T 0 (t) = T (t) per t > 0:
Risolviamo:
X 00 + 2X 0
X = 0 in (0; L)
X (0) = X (L) = 0
che porta:
+ 1 < 0;
x
X (x) = e
p
j1 + jx
sin
con
p
j1 + jL = n
e quindi
un (x; t) = cn e
h
2
( nL )
2
n
L
=
i
+1 t
e
1
x
sin
n
x :
L
Cerchiamo ora la soluzione
u (x; t) =
1
X
n=1
cn e
h
2
( nL )
147
i
+1 t
e
x
sin
n
x
L
x
che soddis… u (x; 0) = 2e
2e
x
3 x
L
sin
sin
: A¢ nché sia:
3 x
L
1
X
=
cn e
x
n
x
L
sin
n=1
si dovrà avere:
c3 = 2; cn = 0 per n 6= 3;
e in de…nitiva la soluzione cercata è:
h
2
( 3L )
u (x; t) = 2e
i
+1 t
e
x
sin
3
x :
L
Soluzione Es. 3.49. Cercando u (x; y) = X (x) Y (y) si trova:
Y 00
=
Y
X 00
=1
X
= cost.
Le condizioni u (0; y) = u (1; y) = 0 portano al problema agli autovalori:
X 00 = X
X (0) = X (1) = 0
che dà
Xn (x) = sin (n x)
n
=
n2
2
; n = 1; 2; 3; :::
Quindi si ha:
Y 00 = 1 + n2
2
Y
che ha integrale generale
p
Yn (y) = an e
1+n2
2y
+ bn e
p
1+n2
2y
:
Imponendo anche la condizione Yn (1) = 0 si trova (dopo qualche calcolo)
p
Sh 1 + n2 2 (1 y)
p
Yn (y) = cn
Sh 1 + n2 2
quindi
u (x; y) =
1
X
n=1
cn
Sh
p
1 + n2 2 (1 y)
p
sin (n x)
Sh 1 + n2 2
e imponendo u (x; 0) = sin (5 x) si ha c5 = 1; gli altri coe¢ cienti nulli. Perciò:
p
Sh 1 + 25 2 (1 y)
p
u (x; y) =
sin (5 x) :
Sh 1 + 25 2
148
4
4.1
4.1.1
Trasformata di Fourier e problemi ai limiti
La trasformata di Fourier in L1 (Rn )
De…nizione e proprietà elementari
Per motivare la de…nizione di trasformata di Fourier, consideriamo una funzione
T T
f:
2 ; 2 ! R che sia sviluppabile in serie di Fourier, e scriviamo, utilizzando
ora la notazione complessa delle serie di Fourier30 :
f (x) =
+1
X
n= 1
con
1
fb(n) =
T
Z
fb(n) ein!x
T =2
f (y) e
in!y
dy e ! =
T =2
2
:
T
A partire da queste identità, vogliamo immaginare un modo per rappresentare
una funzione f che sia de…nita su tutta la retta R anziché su un segmento. Ci
chiediamo quindi cosa diventano le relazioni precedenti quando T ! 1 e perciò
! ! 0. I prossimi passaggi hanno il semplice scopo di suggerire una de…nizione
appropriata. Non serve quindi esplicitare delle ipotesi precise sotto cui sono
corretti. Cominciamo con lo scrivere lo sviluppo di f sostituendo a fb(n) la sua
espressione analitica:
!
Z
+1
X
1 T =2
in!y
f (y) e
dy ein!x :
f (x) =
T
T
=2
n= 1
Se ora de…niamo la funzione
g( ) =
Z
T =2
f (y) e
T =2
i y
!
dy ei x ;
la precedente identità si può riscrivere nella forma:
!
Z
+1
X
1 T =2
1
in!y
f (x) =
f (y) e
dy ein!x =
T
2
T =2
n= 1
+1
X
!g (n!) :
n= 1
Immaginando di suddividere l’asse delle P
x, mediante i punti n! (per n 2 Z),
+1
in in…niti intervallini di ampiezza !, la serie n= 1 !g (n!) si può vedere come
una sorta di somma integrale di Riemann (su tutta la retta, però) che, al tendere
di ! a zero, dà l’integrale
Z
g( )d :
R
3 0 v.
[An2], cap.7 §3.5.
149
Tuttavia, al tendere di ! a zero si ha T ! 1; quindi nella de…nizione di g ( )
R T =2
R
l’integrale T =2 va sostituito con R . Arriviamo così all’identità
f (x) =
1
2
Z
R
Z
f (y) e
i y
dy ei x d :
R
In…ne ci liberiamo del fattore 21 davanti agli integrali eseguendo, nell’integrale
esterno, in d , il cambio di variabile = 2 . Si ottiene
Z Z
f (x) =
f (y) e i2 y dy ei2 x d :
R
R
Questo signi…ca che se, per una funzione f : R ! R, de…niamo la trasformata
integrale di f (che si chiamerà trasformata di Fourier)
Z
fb( ) =
f (y) e i2 y dy;
R
(dovrà essere ovviamente f 2 L1 (R)) è plausibile che si possa poi dimostrare la
formula (inversa, in un certo senso)
Z
f (x) =
fb( ) ei2 x d ;
R
che ricostruisce f dalla sua trasformata. Tutto ciò ha …nora poco di rigoroso; è
un ragionamento euristico, che suggerisce la seguente de…nizione, che generalizza
il discorso precedente al contesto di Rn :
De…nizione 4.1 Per f 2 L1 (Rn ) poniamo
Z
b
f( )=
f (y) e 2 i y dy per ogni
Rn
con
di f .
y=
Pn
j=1 j yj .
2 Rn ,
La funzione fb : Rn ! C si dice trasformata di Fourier
Quando la funzione da trasformare ha un’espressione analitica “lunga”scriverd
emo anche F (:::) invece che (:::):
Si noti che
Z
b
f (0) =
f (y) dy;
Rn
una relazione che talvolta ci sarà utile.
Osservazione 4.2 (La trasformata è ben de…nita per f 2 L1 (Rn )) Poiché
la teoria dell’integrale di Lebesgue è stata sviluppata per funzioni a valori reali,
è necessaria qualche precisazione. Nella de…nizione precedente, l’integranda è
150
una funzione a valori complessi. Per de…nizione, se g : Rn ! C con g = g1 +ig2
e g1 ; g2 a valori reali, si pone
Z
1
n
g 2 L (R ) () g1 ; g2 misurabili e
jg (y)j dy < 1
Rn
e in tal caso si pone
Z
Z
g (y) dy =
Rn
g1 (y) dy + i
Rn
Se f 2 L1 (Rn ),
f (y) e
2 i y
Z
g2 (y) dy:
Rn
= jf (y)j 2 L1 (Rn )
perciò la trasformata di Fourier è ben de…nita per ogni
2 Rn .
Osservazione 4.3 (Valori reali o complessi della trasformata di Fourier)
Nella de…nizione di trasformata di Fourier di f , la funzione f può avere valori
reali o complessi; in ogni caso la sua trasformata in generale ha valori complessi.
Nel caso particolare n = 1 e f a valori reali, cioè f : R ! R, si ha
Z
Z
fb( ) =
f (y) cos (2 y ) dy + i
f (y) sin (2 y ) dy;
Rn
Rn
da cui leggiamo in particolare che:
se f è pari, allora fb è reale e pari;
se f è dispari, allora fb è immaginaria pura e dispari.
Teorema 4.4 (Proprietà della trasformata di Fourier) Sia f 2 L1 (Rn ).
Allora:
i) fb 2 C 0 (Rn ), con
fb
kf kL1 (Rn ) ;
C 0 (Rn )
in particolare, l’operatore trasformata di Fourier,
F : L1 (Rn ) ! C 0 (Rn )
F : f 7! fb
è lineare continuo.
ii) se anche g 2 L1 (Rn ) allora
\
(f
g) = fb gb:
iii) se per un intero k
1 è x f 2 L1 (Rn ) per ogni multiindice31
j j k; allora fb 2 C k (Rn ) e
3 1 Signi…ca:
=(
1;
2 ; :::;
@ fb = F (( 2 ix) f ) :
n)
con
j
2 N, j j =
1
+
n
x = x1 1 x2 2 :::xa
n
@ f =
@j jf
n
@x1 1 @x2 2 :::@xa
n
151
2
+ ::: +
n;
con
iv) se f 2 C k (Rn ) ; @ f 2 L1 (Rn ) per j j
k e @ f 2 C0 (Rn )32 per
j j k 1, allora
\
(@
f ) ( ) = (2 i ) fb( ) :
v) fb 2 C0 (Rn ) :
vi) Posto, per " > 0,
f " (x) = f ("x)
f" (x) = "
n
x
;
"
f
si ha, per ogni f 2 L1 (Rn ) e " > 0;
d
" ) ( ) = fb
(f
d
b
(f
") ( ) = f
vii) Se anche g 2 L1 (Rn ), allora
Z
Z
f gb =
Rn
viii) Per ogni
Rn
2 Rn …ssato si ha:
F f (x) e2
"
"
ix
( )
( ):
fbg:
( ) = fb(
)
Osservazione 4.5 Osserviamo le iii) e iv). A parte i dettagli delle ipotesi,
in sostanza la iii) ci dice che: più velocemente la f tende a zero all’in…nito
(condizione espressa dall’integrabilità di x f ), più regolare è fb; viceversa, la
iv) ci dice che: più regolare è f , più velocemente fb tende a zero all’in…nito
(condizione espressa dal fatto che (2 i ) fb; essendo una trasformata (di @ f )
per il punto i) è limitata e anzi per il punto v) tende a zero all’in…nito.
La iv) (unito alla linearità) dice anche che la trasformata di Fourier trasforma un operatore di¤ erenziale lineare a coe¢ cienti costanti nell’operatore di
moltiplicazione per un polinomio, una proprietà che la rende preziosa nel risolvere equazioni di¤ erenziali su tutto Rn .
La ii) dice che la trasformata di Fourier trasforma il prodotto di convoluzione
in un prodotto puntuale, una proprietà che come vedremo sarà utile nel ricavare
formule di rappresentazione integrali di soluzioni di problemi di¤ erenziali.
Dimostrazione. i) La continuità di fb è un’applicazione immediata del teorema
di continuità degli integrali dipendenti da un parametro (v. §3.4.6), infatti per
y …ssato la funzione
7! f (y) e 2 i y
è continua, e
f (y) e
3 2 Diciamo
2 i y
jf (y)j 2 L1 (Rn ) ,
che f 2 C0 (Rn ) se f 2 C 0 (Rn ) e f (x) ! 0 per jxj ! 1:
152
perciò fb 2 C 0 (Rn ). La disuguaglianza fb
1
C 0 (Rn )
n
kf kL1 (Rn ) è allora ovvia.
ii) Se f; g 2 L (R ) sappiamo già che f g 2 L1 (Rn ), quindi possiamo
calcolare
Z
\
(f
g) ( ) =
(f g) (y) e 2 i y dy
Rn
Z
Z
=
f (y z) g (z) dz e 2 i y dy
Rn
Rn
scambiando l’ordine di integrazione, passaggio che si giusti…ca in base al teorema
di Fubini-Tonelli pensando che l’integrale iterato dei valori assoluti converge
Z
Z
=
g (z)
f (y z) e 2 i y dy dz
Rn
Rn
con traslazione nell’integrale interno
Z
Z
=
g (z)
f (y) e 2 i
n
n
R
R
Z
Z
=
g (z) e 2 i z dz
Rn
(y+z)
dy dz
f (y) e
2 i y
Rn
dy
= fb( ) gb ( ) :
iii) Derivando (per ora formalmente) sotto il segno di integrale si ha:
Z
Z
@ fb( ) = @
f (y) e 2 i y dy =
@ f (y) e 2 i y dy
Rn
Rn
Z
=
f (y) ( 2 iy) e 2 i y dy
Rn
= F (( 2 ix) f ) ( ) ;
che è la tesi. Per giusti…care la derivazione, osserviamo che
f (y) ( 2 iy) e
2 i y
j j
= (2 )
jf (y) y j ;
perciò sotto l’ipotesi y f (y) 2 L1 (Rn ) il teorema di derivazione sotto il segno
di integrale (v. §3.4.6) è applicabile.
iv) Procediamo iterativamente. Per k = 1: supponiamo f 2 C 1 (Rn ) ; @xi f 2
1
L (Rn ) per i = 1; 2; :::; n e calcoliamo (per semplicità di notazione supponiamo
i = 1 e poniamo y 0 = (y2 ; :::; yn ))
Z
Z
Z
2 i y
2 i 0 y0
\
(@x1 f ) ( ) =
@y1 f (y) e
dy =
e
@y1 f (y) e 2 i 1 y1 dy1 dy 0
Rn
Rn
1
R
integrando per parti in y1 nell’integrale interno, supponendo che f (y) tenda a
153
zero all’in…nito,
=
Z
e
Rn
=
Z
=2 i
1
y0
1
0
2 i
y0
1
Z
Z
f (y) @y1 e
2 i
1 y1
dy1 dy 0
R
e
Rn
0
2 i
Z
2 i 1 f (y) e
2 i
1 y1
dy1 dy 0
R
2 i y
f (y) e
Rn
dy = (2 i 1 ) fb( ) :
Il discorso si può ora iterare. Ad ogni derivata @xj che agisce su f e noi
trasformiamo, corrisponde un fattore del tipo 2 i j nel risultato …nale; il passaggio di integrazione per parti richiede, per l’annullamento del termine all’in…nito, che tenda a zero all’in…nito la funzione che viene derivata, quindi,
complessivamente, che tendano a zero all’in…nito tutte le derivate …no all’ordine
k 1.
v) Sappiamo già che fb 2 C 0 (Rn ), si tratta di dimostrare che fb( ) ! 0
per j j ! 1. Utilizziamo il risultato del punto iv). Supponiamo prima che sia
f 2 C 1 (Rn ) ; @xj f 2 L1 (Rn ) per j = 1; 2; :::; n, allora
\
@xj f ( ) = (2 i j ) fb( )
[) ( ) = (2 i ) fb( )
(rf
fb( ) =
[) ( )
(rf
2 j j
:
Poiché @xj f 2 L1 (Rn ) ; per il punto i) la sua trasformata di Fourier è limitata
quindi
c
fb( )
! 0 per j j ! 1:
2 j j
1
Sia ora f 2 L1 (Rn ) qualsiasi. Esiste una successione ffk gk=1 di funzioni
C (Rn ), ognuna nulla fuori da un insieme limitato (quindi per le quali @xj fk 2
L1 (Rn ) e pertanto si può applicare la conclusione precedente), che approssima
f in norma L1 ; cioè tali che33
1
kf
fk kL1 ! 0 per k ! 1.
D’altro canto per il punto i),
fb
fbk
C 0 (Rn )
kf
fk kL1 (Rn ) ! 0:
In altre parole, fb( ) è approssimata uniformemente in Rn da fbk ( ). Fissato
" > 0; esiste allora k0 tale che
fb
fbk0
C 0 (Rn )
< ":
3 3 Questo è un teorema di approssimazione di funzioni integrabili con funzioni regolari (un
risultato di questo tipo è detto teorema di densità ), che non abbiamo dimostrato ma si può
dimostrare, nella teoria di Lebesgue.
154
Fissata questa fbk0 , che sappiamo tendere a zero all’in…nito (per la prima parte
della dimostrazione), esiste R tale che per j j > R è fbk0 ( ) < ". Ma allora per
j j > R si avrà
fb( )
fbk0 ( ) + fb fbk0 ( ) < 2"
e questo dimostra che fb( ) ! 0 per j j ! 1.
vi) Calcoliamo
Z
d
") ( ) =
(f
f ("y) e
2 i y
dy
Rn
col cambio di variabili "y = z, dy = " n dz
Z
=
f (z) e 2 i z=" " n dz = fb
Rn
"
( ):
L’altra relazione si veri…ca in modo analogo.
vii) Ciascuno dei due integrali
Z
Z
f gb;
fbg;
Rn
Rn
scrivendo esplicitamente la trasformata, uguaglia (per il teorema di FubiniTonelli) l’integrale doppio
Z Z
f (x) g ( ) e 2 ix dxd
Rn
Rn
che è convergente perché f; g 2 L1 (Rn ). Perciò i due integrali sono uguali tra
loro.
viii) Per ogni 2 Rn …ssato si ha:
Z
F f (x) e2 ix ( ) =
f (y) e2 iy e 2 iy dy
Rn
Z
=
f (y) e 2 iy ( ) dy
Rn
= fb(
)
Calcolo di alcune trasformate di Fourier notevoli
Nel seguito del discorso ci servirà calcolare la trasformata di Fourier di poche
funzioni. Ci procuriamo quindi queste speci…che trasformate, come esercizio
sulla de…nizione e le proprietà, ma anche come prerequisito per quanto seguirà.
Esempio 4.6 Calcoliamo la trasformata di
f (x) = e
155
jxj
con x 2 R.
fb( ) =
Z
jyj
e
e
2 i y
dy:
R
Il calcolo si può fare con metodi di analisi 1:
Z
Z
Z
jyj
2 i y
jyj
e
e
dy =
e
cos (2 y) dy + i e
R
R
per le simmetrie
=2
jyj
sin (2
y) dy
R
Z
+1
y
e
cos (2
y) dy
0
con due integrazioni per parti si trova
=
2
:
1 + 4 2 y2
Oppure si può fare, con un procedimento più spiccio34
Z
Z +1
Z 0
e jyj e 2 i y dy =
e y e 2 i y dy +
ey e
R
y(1+2 i )
2 i y
1
0
+1
ey(1 2 i )
(1 + 2 i ) 0
(1 2 i )
1
1
2
=
+
=
:
1+2 i
1 2 i
1+4 2 2
e
=
dy
0
+
1
Esempio 4.7 Utilizzando il calcolo precedente e la proprietà vi) del teorema,
calcoliamo ora, per a > 0, la trasformata di
f (x) = e
ajxj
:
Si ha:
ajxj ( ) =
e\
2
1+4
2 2
1
a
( )=
a
2
1+4
2
2
=
2a
a2 + 4
2 2
:
a
Esempio 4.8 Calcoliamo la trasformata di
f (x) = e
x2
per x 2 R.
Un modo semplice consiste nell’osservare che
f 0 (x) =
2xe
x2
;
cioè f soddisfa l’equazione di¤ erenziale
f 0 (x) =
2xf (x) :
3 4 che si può giusti…care rigorosamente se si conosce la teoria delle funzioni olomorfe (funzioni
derivabili di variabile complessa), altrimenti sembra puramente formale.
156
Trasformando ambo i membri mediante le proprietà iii) e iv) si ha
(2 i ) fb( ) =
2
0
fb ( ) =
2
2
0
1
fb ( )
2 i
fb( ) ;
equazione di¤ erenziale simile a quella soddisfatta da f , risolta da
fb( ) = ce
con
c = fb(0) =
Quindi
Z
e
2 2
x2
dx =
p
.
R
p
fb( ) =
2 2
e
:
Esempio 4.9 Utilizzando il calcolo precedente e la vi), calcoliamo la trasformata di
2
f (x) = e ax per x 2 R, a > 0:
Si ha:
p
F e (
2
ax)
( )=
p
2 2
e
p
a
( )=
r
2 2
a
e
a
:
Esempio 4.10 Generalizziamo il calcolo della trasformata della gaussiana al
caso multidimensionale. Calcoliamo cioè la trasformata di
f (x) = e
jxj2
, con x 2 Rn .
Usando le proprietà degli esponenziali, l’integrale multidimensionale si fattorizza in e¤ etti nel prodotto di n integrali unidimensionali: scriviamo
Z
2
fb( ) =
e jxj e 2 ix dx
n
ZR
2
2
2
=
e x1 e x2 :::e xn e 2 ix1 1 e 2 ix1 1 :::e 2 ix1 1 dx1 dx2 :::dxn
Rn
Z
Z
Z
2
x21
2 ix1 1
x22
2 ix2 2
=
e
e
dx1
e
e
dx2 :::
e xn e 2 ixn n dxn
R
R
R
che è il prodotto delle trasformate di Fourier unidimensionali calcolate in precedenza, perciò:
=
p
e
2 2
1
p
e
2 2
2
:::
p
e
2 2
2
=
n=2
e
In de…nitiva:
jxj2 ( ) =
e\
n=2
e
157
2
j j2
per x; 2 Rn :
2
j j2
:
Si ha anche, quindi, per a > 0:
ajxj2 ( ) =
e\
In particolare, per a =
n=2
e
2
j j2
n=2
p
a
=
a
e
2 j j2
a
:
si ha:
jxj2 ( ) = e
e\
j j2
;
ossia troviamo una particolare gaussiana che è trasformata di Fourier di se
stessa. Si ha anche
Z
2
jxj2 (0) = 1:
e jxj dx = e\
Rn
Si osservi che il metodo dell’ultimo esempio non si potrebbe utilizzare invece
per calcolare la trasformata di e jxj per x 2 Rn : l’esponenziale
p 2
2
e x1 +:::+xn
non si fattorizza.
4.1.2
Approssimazioni dell’identità
Apriamo ora una parentesi che ci servirà sia a dimostrare la formula di inversione
della trasformata di Fourier, sia in seguito a trattare i problemi ai limiti per
equazioni a derivate parziali.
De…nizione 4.11 (Approssimazione dell’identità) Sia
funzione non negativa e integrabile, con
Z
(x) dx = 1
: Rn ! R una
Rn
e poniamo, per ogni " > 0,
"
(x) = "
La funzione (famiglia di funzioni) f
n
" g">0
(x=") :
si dice approssimazione dell’identità.
Anche se questo non è esplicitamente richiesto dalla de…nizione, intuitivamente conviene immaginare come una funzione con un gra…co a campana,
avente il suo unico massimo in x = 0 e tendente a zero per jxj ! 0: Ad esempio
(v. Esempio 4.10):
2
(x) = e jxj per x 2 Rn ;
oppure
(x) =
c
per x 2 R
1 + x2
158
con c > 0 scelto in modo da avere integrale 1 (in e¤etti, c = 1= ). Questi sono
due esempi che ci serviranno in seguito. Le corrispondenti famiglie di funzioni
" si chiamano, rispettivamente, nuclei di Gauss e nuclei di Poisson.
Osserviamo che
Z
Z
" n (x=") dx
" (x) dx =
Rn
Rn
con cambio di variabile x=" = y
Z
Z
n
n
=
"
(y) " dy =
Rn
(y) dy = 1:
Rn
Quindi le funzioni " hanno tutte lo stesso integrale ma, se è una funzione a
campana come negli esempi fatti, le " saranno sempre più “concentrate”:
Gra…ci di
"
(x) per
(x) = e
x2
e " = 1; " = 0:8; " = 0:5; " = 0:3
Vale il seguente:
Teorema 4.12 Sia f " g">0 un’approssimazione dell’identità e consideriamo,
per una certa f : Rn ! R, la convoluzione
Z
Z
x y
( " f ) (x) =
y) f (y) dy =
" n
f (y) dy:
" (x
"
n
n
R
R
Allora:
1. Se f 2 Lp (Rn ) per qualche p 2 [1; 1), allora " f 2 Lp (Rn ) per ogni
">0e
p
n
+
" f ! f in L (R ) , per " ! 0 .
2. Se f è limitata e uniformemente continua, allora
"
"
f ! f uniformemente, per " ! 0+ .
159
f è continua e
Non dimostriamo il teorema (si basa comunque su tecniche standard della
teoria di Lebesgue, più un risultato di approssimazione di funzioni integrabili
con funzioni continue). Diamo un’idea intuitiva del perché il teorema è vero.
Poiché " è non negativa e ha integrale 1, la convoluzione ( " f ) (x) si può
vedere come una media pesata dei valori di f , che, quanto più piccolo è ", tanto
più esalta solo i valori di f vicini a x: infatti se la funzione madre ha un
gra…co a campana con un massimo in x = 0, la funzione
y 7! "
n
x
y
"
ha un picco in y = x ed è trascurabile appena ci si sposta un po’da x. Quindi ci aspettiamo che la convoluzione " f sia sempre più vicina alla f di
partenza, come il teorema a¤erma in modo preciso. In questo senso " si dice
approssimazione dell’identità.
4.1.3
Il teorema di inversione
L’utilità della trasformata di Fourier dipende ovviamente anche dalla possibilità
di ricostruire f dalla sua trasformata, come anticipato nella discussione con cui
abbiamo aperto il paragrafo.
Vale il seguente risultato:
Teorema 4.13 (di inversione) Sia f 2 L1 (Rn ) : Se anche fb 2 L1 (Rn ) si ha:
Z
f (x) =
fb( ) e2 i x d per q.o.x 2 Rn .
Rn
In simboli:
d
f (x) = fb ( x) per q.o.x 2 Rn .
Prima di presentare la dimostrazione vera e propria, cerchiamo di capire
dov’è il problema.
d
Se scriviamo esplicitamente l’integrale iterato che rappresenta fb ( x) e
formalmente scambiamo l’ordine di integrazione, otteniamo
Z
Z
Z
2 i x
b
f ( )e
d =
f (y) e 2 i y dy e2 i x d
Rn
Rn
Rn
Z
Z
=
f (y)
e2 i (x y) d dy
Rn
Rn
dove l’integrale interno è ovviamente divergente (l’integranda ha modulo 1!).
Per riuscire a trattare l’integranda bisogna in qualche modo “smussarla” con
una funzione rapidamente decrescente all’in…nito. Utilizzeremo per questo un
nucleo regolarizzante opportuno.
160
Dimostrazione. Consideriamo, per t > 0 …ssato e x 2 Rn , l’integrale
Z
2
2
F (t; x) =
fb( ) e2 i x e t j j d :
(4.1)
Rn
2
2
(Abbiamo introdotto la gaussiana e t j j che “smussa” all’in…nito l’esponenziale complesso in ). Per t ! 0 l’integranda tende a fb( ) e2 i x ; d’altro
canto
2
2
fb( ) 2 L1 (Rn ) ;
fb( ) e2 i x e t j j
quindi per il teorema di Lebesgue, per t ! 0
Z
d
F (t; x) !
fb( ) e2 i x d = fb ( x)
Rn
1
n
dove la convergenza è in L (R ) (vedendo ogni integrale come funzione di x).
Mostreremo ora che, per un altro motivo, F (t; ) ! f in L1 (Rn ), per t ! 0,
d
da cui seguirà l’uguaglianza fb ( x) = f (x) in L1 e quindi puntualmente quasi
ovunque.
Sia
2
2
( ) = e2 i x e t j j
e consideriamo la catena di uguaglianze:
Z
F (t; x) =
fb( ) ( ) d
Rn
per il punto vii) del teorema 4.4
=
Z
Rn
f ( ) b( ) d
per il punto viii) del teorema 4.4 (applicato a )
Z
2
2
=
f ( )F e t j j (
x) d
Rn
2
2
2
2
2
d
t) = g
ponendo g ( ) = e j j , quindi e t j j = g t ( ) e F e t j j = (g
bt
(per il punto vi) del teorema 4.4), e ricordando che (v. Esempio 4.10), gb ( ) =
2
e j j = g( )
Z
Z
=
f ( ) gt (
x) d =
f ( ) gt (x
)d :
Rn
Rn
Come osservato nel paragrafo precedente, la famiglia di funzioni gt è un’approssimazione dell’identità. Perciò, per il teorema 4.12, si ha
Z
f ( ) gt (x
) d ! f (x) in L1 (Rn ) , per t ! 0;
Rn
e la tesi è dimostrata.
161
Esempio 4.14 Dalle trasformate di Fourier che abbiamo calcolato segue anche
la seguente, per il teorema di inversione:
F
a2
2a
+ 4 2 x2
( )=e
aj j
e quindi ad esempio (per a = 2 )
F
1
1 + x2
( )= e
2 j j
:
Corollario 4.15 (Iniettività della trasformata di Fourier) Se f 2 L1 (Rn )
e fb( )
0; allora f (x) = 0 per q.o. x. Quindi, si ha anche, per ogni
f; g 2 L1 (Rn )
fb( ) = gb ( ) =) f (x) = g (x) q.o.
E’una conseguenza ovvia del teorema precedente, perché la funzione fb( )
0 è L1 e quindi possiamo applicare la formula di inversione scrivendo (per q.o.x 2
Rn )
Z
0 e2
f (x) =
i x
d = 0.
Rn
Il corollario ci garantisce che la trasformata di Fourier cattura tutta l’informazione presente nella funzione: due funzioni diverse non possono avere la
stessa trasformata. Utilizzeremo questo principio nella risoluzione di problemi
di¤erenziali: trasformando il problema, otterremo che la trasformata u
b della
soluzione è uguale a una certa gb, e ne dedurremo che u = g.
Osservazione 4.16 (Limiti del teorema di inversione) Sappiamo che per
ogni f 2 L1 (Rn ) la trasformata fb è continua e tende a zero all’in…nito. Questo
non implica però che fb sia integrabile, ipotesi sotto cui vale il teorema di inversione. Quindi non è detto che ogni funzione integrabile si possa ricostruire
dalla sua trasformata mediante l’identità
d
f (x) = fb ( x) :
Approfondendo l’osservazione, notiamo che quando vale questa identità signi…ca
che f è la trasformata di una funzione L1 , dunque f è certamente continua.
d
Perciò se f è L1 (Rn ) ma discontinua, certamente l’identità f (x) = fb ( x)
non potrà valere, e fb non sarà integrabile. Quindi:
non tutte le funzioni integrabili si possono ottenere dalla loro trasformata di
Fourier mediante la formula di inversione;
non è facile caratterizzare l’insieme delle funzioni che sono la trasformata
di qualche funzione integrabile.
162
Esempio 4.17 Calcoliamo la trasformata di Fourier in R della seguente funzione:
e x se x > 0
f (x) =
0 se x 0:
Si ha:
fb( ) =
Z
+1
e
x
e
2 ix
e
dx =
(1 + 2 i )
0
1
=
1+4
2 2
2
1+4
Notiamo che
2 2
x(1+2 i )
1+4
=
0
1
1+2 i
i:
1
fb( ) = p
+1
2 2
2
= L1 (Rn ) ;
questo è quindi un esempio di funzione a cui non si può applicare il teorema di
inversione.
Osservazione 4.18 (Trasformata di Fourier di funzioni non L1 ) In questo
paragrafo si è trattata rapidamente la teoria della trasformata di Fourier sullo
spazio L1 (Rn ), su¢ ciente per gli scopi di questo corso. La teoria non si ferma
certo qui, ci sono buoni motivi per estenderla allo spazio L2 (Rn ) e a opportuni
spazi di distribuzioni. Queste estensioni della teoria permettono, in particolare,
di dare senso alla trasformata di Fourier anche di certe funzioni non integrabili (come ad esempio la costante 1, la funzione sin !x, ecc.). La de…nizione di
trasformata, però, in queste teorie più generali è diversa. Non si può a¤ermare
contemporaneamente che
esiste fb( ) anche per una certa f 2
= L1 (Rn ), e
R
2
i
x
fb( ) = Rn f (x) e
dx:
Lo studente ne tenga conto, se e quando in altri contesti troverà cenni alla
trasformata di Fourier di oggetti diversi da una funzione integrabile.
4.2
L’equazione di Laplace nel semipiano
Consideriamo il problema di Dirichlet per l’equazione di Laplace in due variabili
nel semipiano S = f(x; y) : x 2 R; y > 0g:
u = 0 per x 2 R; y > 0
u (x; 0) = f (x) per x 2 R.
Il signi…cato …sico può essere: temperatura in una lastra illimitata (semipiano) priva di sorgenti di calore; potenziale elettrostatico in un semipiano (o in
un semispazio, se supponiamo che il dato f sia indipendente dalla variabile z).
La “condizione al bordo” del semipiano S, oltre a consistere nell’assegnare
il valore di u sulla retta y = 0, dovrà imporre qualche condizione all’in…nito:
…sicamente, ad esempio, potremmo richiedere che il potenziale u sia nullo all’in…nito; matematicamente, il modo operativamente più “comodo” per richiedere
una sorta di annullamento all’in…nito sarà chiedere che la soluzione sia L1 (S).
163
Supponiamo quindi che u 2 L1 (S) risolva il problema e applichiamo la
trasformata di Fourier rispetto alla sola variabile x:
Ponendo
u
b ( ; y) = F [u ( ; y)] ( )
avremo
L’equazione
2
(2 i ) u
b+u
byy = 0 per 2 R; y > 0
b
u
b ( ; 0) = f ( ) per 2 R.
u
byy = 4
2 2
u
b
si può vedere come un’equazione di¤erenziale ordinaria (nella variabile y) contenente il parametro . Integrale generale:
u
b ( ; y) = c1 ( ) e2
y
+ c2 ( ) e
2
y
per
Come funzione di , u
b ( ; y) deve tendere a zero per
L’unica possibilità perché questo accada è che sia
c1 ( ) = 0 per
c2 ( ) = 0 per
2 R; y > 0:
!
1 per ogni y > 0.
>0e
< 0;
cioè
u
b ( ; y) = c ( ) e
2 j jy
per
2 R; y > 0;
che imponendo la condizione
u
b ( ; 0) = fb( )
dà
c ( ) = fb( )
u
b ( ; y) = fb( ) e
2 j jy
:
Ora la strategia è:
1. Cercare k (x; y) tale che
e
2 j jy
= F [k ( ; y)] ( ) ;
2. Riscrivere quindi
u
b ( ; y) = fb( ) F [k ( ; y)] ( )
e ricordando la formula per la trasformata della convoluzione (teorema 4.4,
punto ii )
F (f g) = fbgb;
scrivere
u
b ( ; y) = F [f
164
k ( ; y)] ( )
e quindi, identi…cando le funzioni che hanno uguale trasformata (v. Corollario
4.15)
Z
u (x; y) = [f k ( ; y)] (x) =
k (x z; y) f (z) dz:
R
3. Ricordiamo ora che, per ogni a > 0, è
F e
ajxj
( )=
2a
a2 + 4
2 2
;
funzione L1 (R), perciò per la formula di inversione
F
2a
a2 + 4 2 x2
( )=e
da cui
e
2 j jy
=F
4
4 y
+4
2 y2
aj j
2 x2
;
( )
perciò
k (x; y) =
1
y2
y
+ x2
e la formula di rappresentazione cercata per la soluzione del problema è
Z
y
f (z)
u (x; y) =
2 dz per x 2 R; y > 0:
2
z)
R y + (x
L’integrale scritto ha senso per ogni y > 0 e f 2 L1 (R) (oppure f 2 L1 (R)).
Al solito si tratta ora di mostrare che quella assegnata dalla formula è una
funzione su¢ cientemente regolare, risolve e¤ettivamente l’equazione e assume il
dato al bordo in qualche senso.
Discussione della soluzione ottenuta
La funzione k (x; y) si chiama nucleo di Poisson per il semispazio. Un calcolo
diretto mostra che
Z
1
y
dx = 1 per ogni y > 0;
(4.2)
2
y + x2
R
in particolare k ( ; y) 2 L1 (R) per ogni y > 0 perciò per il teorema di Young (v.
§3.4.9),
f 2 Lp (R) =) u 2 Lp (R) per p 2 [1; 1):
Mostriamo che si può derivare u sotto il segno di integrale:
0
!
Z
Z
y
y
@
f (z)
2 (x z)
B
dz =
@
2
2
@x
2
y + (x z)
R
R
y 2 + (x z)
165
2f
1
C
(z)A dz:
La funzione
2t
g (t) =
(y 2
2
+ t2 )
è limitata, quindi
2 (x
y2
z)
2
+ (x
2f
jf (z)j 2 L1 (R)
(z)
z)
e per il criterio di derivabilità visto nel §3.4.6 la derivazione sotto il segno di
integrale è lecita. Si capisce anzi che per ogni y > 0; le derivate della funzione
integranda rispetto a x di qualsiasi ordine sono limitate, perciò il discorso si
può ripetere. Lo stesso vale in e¤etti per la derivazione rispetto ad y. Troviamo
perciò un risultato analogo a quello visto per l’equazione di Laplace nel cerchio:
all’interno del dominio, la soluzione è C 1 . Una volta garantito che si può
e¤ettivamente derivare sotto il segno di integrale, la veri…ca del fatto che la u
soddis… l’equazione dipende dal fatto che
1
y2
y
+ x2
= 0 per (x; y) 6= (0; 0) ;
cosa che si può controllare con il calcolo diretto35 .
La veri…ca diretta che u assume il dato al bordo sarebbe più delicata (come
nel caso del cerchio). Invece che fare calcoli speci…ci per questa situazione, vale
la pena inquadrarla in una situazione generale che ci servirà ancora in seguito,
ossia riconoscere che il nucleo di Poisson si può vedere come una famiglia (al
variare di y) di funzioni (in x) approssimazioni dell’identità. Infatti, ponendo
1
1
1 + x2
11
1
" (x) =
" 1+ x
(x) =
2
=
1
"
"
"2 + x2
si riconosce che il nucleo di Poisson (4.2) è un’approssimazione dell’identità:
k (x; y) = ky (x) con k (x) =
1
1
:
1 + x2
Possiamo quindi trarre le nostre conclusioni:
3 5 Forse la veri…ca che dà calcoli meno laboriosi consiste nel riconoscere che in coordinate
polari è
y
sin #
=
;
y 2 + x2
un’espressione di cui è semplice calcolare il laplaciano in coordinate polari:
y
y 2 + x2
=
@2 +
1
@ +
166
1
2
2
@##
sin #
=0
Teorema 4.19 Sia f 2 L1 (R). La funzione
Z
y
f (z)
u (x; y) =
2 dz per x 2 R; y > 0
2
z)
R y + (x
è in…nitamente derivabile nel semipiano y > 0, risolve l’equazione di Laplace
nel semipiano e assume il dato al bordo in senso L1 :
ku ( ; y)
f kL1 (R) ! 0 per y ! 0+ :
Se inoltre f è uniformemente continua, allora
ku ( ; y)
f kC 0 (R) ! 0 per y ! 0+ :
In questo caso si può dire che u è soluzione classica del problema di Dirichlet.
Vale inoltre la stima di dipendenza continua:
sup ku ( ; y)kL1 (R)
y>0
kf kL1 (R) :
Dimostrazione. Abbiamo già dimostrato la regolarità di u e il fatto che risolva
l’equazione; le a¤ermazioni sul modo in cui è assunto il dato al bordo discendono dal teorema sulle approssimazioni dell’identità, in base alla discussione
precedente al teorema. La stima di dipendenza continua discende dal teorema
di Young:
u (x; y) = (ky f ) (x)
ku ( ; y)kL1 (R) kky kL1 (R) kf kL1 (R) = kf kL1 (R)
e passando al sup per y > 0 si ha la tesi.
Esempio 4.20 Gra…ci delle soluzioni dei problemi di Dirichlet con dato al
bordo:
f (x) = e
x2
;
f (x) =
1 se jxj < 1
;
0 altrimenti
167
f (x) =
sin x se jxj <
0 altrimenti
;
Come può suggerire il secondo esempio, se il dato iniziale ha qualche punto
di discontinuità, nei punti in cui è continuo, la soluzione assume ancora il dato
con continuità. In e¤etti, con una dimostrazione più diretta si potrebbe ra¢ nare
il secondo punto del teorema precedente, provando che:
Se f 2 L1 (R) \ L1 (R), in ogni punto x in cui f è continua si ha f " (x) !
f (x) per " ! 0+ .
Osservazione 4.21 Cosa si può dire sull’unicità della soluzione? Il metodo
risolutivo suppone a priori che u (oltre ad essere derivabile quanto basta da
soddisfare l’equazione) soddis… la condizione
u ( ; y) 2 L1 (R) per ogni y > 0:
Infatti, se così non fosse non potremmo calcolarne la trasformata rispetto a x.
Si consideri la funzione:
u (x; y) = ex sin y
che soddisfa
u = 0 per x 2 R; y > 0
u (x; 0) = 0 per x 2 R
eppure non è la funzione identicamente nulla. Questa funzione per y > 0 …ssato
non è integrabile in x e il procedimento risolutivo “non la trova”. D’altro canto,
come notato all’inizio della discussione di questo problema, trovandoci su un
dominio illimitato, qualche condizione all’in…nito dovremo porla per completare
le condizioni al contorno.
4.3
L’equazione del calore in tutto lo spazio
Consideriamo il problema di Cauchy per l’equazione del calore (omogenea) in
tutto lo spazio Rn . Come vedremo, il metodo della trasformata di Fourier consente di risolvere il problema per qualsiasi n, senza incontrare maggiori di¢ coltà
se n > 1.
Consideriamo quindi il problema:
ut D u = 0 per x 2 Rn ; t > 0
u (0; x) = f (x) per x 2 Rn :
(4.3)
e, supponendo che la soluzione u (t; x) che cerchiamo sia, per ogni t …ssato,
integrabile in Rn , applichiamo la trasformata di Fourier in Rn all’equazione.
Ponendo
u
b ( ; t) = F (u ( ; t)) ( )
e ricordando che (punto iv del teorema 4.4)
\
(@
f ) ( ) = (2 i ) fb( ) ;
168
possiamo calcolare
([
u) ( ; t) =
n
X
n
X
2
@\
xi xi u ( ; t) =
j=1
=
j=1
2
2
4
j j u
b ( ; t) :
2
(2 i i ) u
b ( ; t)
Si ha anche (sotto opportune ipotesi che consentano di derivare rispetto al
parametro t l’integrale che de…nisce u
b ( ; t))
d
(u
bt ( ; t)
t ) ( ; t) = u
perciò
2
u
bt ( ; t) + D4
2
j j u
b ( ; t) = 0
equazione di¤erenziale ordinaria in t (ora è a vedersi come parametro) che si
integra come
2
2
u
b ( ; t) = c ( ) e 4D j j t
e trasformando anche la condizione iniziale u (x; 0) = f (x) si ha
u
b ( ; 0) = fb( )
che imposta come condizione iniziale all’integrale generale precedente dà
u
b ( ; t) = fb( ) e
2
4D
j j2 t
:
(4.4)
Si tratta ora di riconoscere il nucleo gaussiano come la trasformata di Fourier
di un’opportuna funzione. Questo è facile, ricordando che (v. Esempio 4.10):
n=2
ajxj2 ( ) =
e\
2 j j2
a
e
a
:
Uguagliando gli esponenti
4D
2
2
2
j j t=
ricaviamo
a=
2
j j
a
1
4Dt
e quindi
\
jxj2
n=2
e 4Dt ( ) = (4D t)
e
e
F
1
n=2
(4D t)
jxj2
4Dt
e
!
2
4D
( )=e
4D
De…niamo quindi il nucleo del calore
k (x; t) =
1
n=2
(4D t)
169
e
jxj2
4Dt
:
j j2 t
2
j j2 t
:
(4.5)
Possiamo così riscrivere la (4.4) (indicando con b
k ( ; t) la trasformata di k (x; t)
rispetto ad x) come
u
b ( ; t) = fb( ) b
k ( ; t)
e utilizzando la regola di trasformazione della convoluzione,
u
b ( ; t) = F (f
k ( ; t)) ( )
e in…ne (per l’iniettività della trasformata, Corollario 4.15)
u (x; t) = (f
cioè
1
Z
k ( ; t)) (x) ;
jx yj2
4Dt
f (y) dy; per x 2 Rn ; t > 0
(4.6)
Rn
(4D t)
formula di rappresentazione integrale che “dovrebbe”assegnare la soluzione del
problema di Cauchy (4.3).
u (x; t) =
n=2
e
Discussione della formula di rappresentazione ottenuta
Al solito, anziché giusti…care i passaggi che ci hanno portato alla (4.6), conviene
mostrare direttamente che la u assegnata da tale formula risolve e¤ettivamente
il problema.
E’ facile mostrare che, per f 2 L1 (Rn ) e per ogni t > 0, si può derivare
sotto il segno di integrale un numero qualsiasi di volte, applicando il risultato
visto nel §3.4.6. La funzione u è quindi in…nitamente regolare per ogni t > 0.
Il fatto che u risolva l’equazione discende dalla derivazione sotto il segno di
integrale e dal fatto che il nucleo del calore la soddisfa, come si può veri…care
con calcolo diretto:
ponendo per semplicità = jxj e considerando t > 0;
!
2
jxj2
n
1
n=2 1
4Dt
@t (k (x; t)) = e
t
+
n=2
n=2 4Dt2
2 (4D )
(4D t)
2
n
+
2t 4Dt2
= k (x; t)
(k (x; t)) =
1
2
e
n=2
(4D t)
:
4Dt
Ricordando che per una funzione radiale u (x) = g (jxj) si ha
n
u = g 00 ( ) +
1
g0 ( )
e calcolando quest’espressione per
2
g( ) = e
g0 ( ) =
00
g ( )=e
4Dt
2
2Dt
e
4Dt
2
2
4Dt
2Dt
170
1
2Dt
si ha
2
(k (x; t)) = k (x; t)
2Dt
2
= k (x; t)
1
2Dt
n
1
2Dt
n
2Dt
4D2 t2
e quindi
(@t
D ) (k (x; t))
= k (x; t)
2
n
+
2t 4Dt2
2
D
n
2Dt
4D2 t2
=0
per ogni t > 0:
La prima conclusione quindi è:
per ogni f 2 L1 (Rn ) assegnata, la u data dalla formula (4.6) è in…nitamente
derivabile e risolve l’equazione del calore in Rn (0; +1) :
Come già accadeva nel caso dell’equazione del calore sul segmento, anche
in più dimensioni e in tutto lo spazio l’equazione del calore mostra di avere un
forte e¤etto regolarizzante.
Quanto alla condizione iniziale, osserviamo che, posto
k (x) =
1
e
n=2
(4D )
jxj2
4D
;
risulta per ogni t > 0
k (x; t) = kpt (x) :
Poiché k (x) > 0 e dalla (4.5) per t = 1 leggiamo
!
jxj2
1
F
e 4D ( ) = e
n=2
(4D )
4D
2
j j2
e quindi
Z
Rn
1
n=2
(4D )
e
jxj2
4D
dx = F
la famiglia di funzioni kpt (x)
amo concludere il seguente:
1
n=2
(4D )
t>0
e
jxj2
4D
!
(0) = e
4D
2
j j2
(0) = 1;
è un’approssimazione dell’identità, e possi-
Teorema 4.22 Per ogni f 2 L1 (Rn ), la u assegnata da (4.6) assume la condizione iniziale in senso L1 , ossia
ku ( ; t)
f kL1 (Rn ) ! 0 per t ! 0+ .
171
Vale inoltre la stima di dipendenza continua
sup ku ( ; t)kL1 (Rn )
kf kL1 (Rn ) :
t>0
Se inoltre f è limitata e uniformemente continua, allora
ku ( ; t)
f kC 0 (Rn ) ! 0 per t ! 0
"
f è continua e
+
(convergenza uniforme).
Vale in tal caso il principio di massimo
sup
x2Rn ;t>0
ju (x; t)j
max jf (x)j :
x2Rn
Dimostrazione. I due risultati di convergenza seguono dal teorema 4.12 perché
k (x; t) è un’approssimazione dell’identità.
La disuguaglianza di dipendenza continua è una conseguenza della proprietà
della convoluzione:
u ( ; t) = k ( ; t) f
ku ( ; t)kL1 (Rn ) kk ( ; t)kL1 (Rn ) kf kL1 (Rn ) = kf kL1 (Rn )
da cui prendendo il sup per t > 0 si ha la tesi.
In…ne, il principio di massimo si dimostra come nel caso di un dominio
limitato (§5.2.1).
Esempio 4.23 Rappresentiamo la soluzione del problema di Cauchy (in dimensione spaziale 1)
ut uxx = 0 per x 2 R; t > 0
u (0; x) = f (x) per x 2 R
con
1 se jxj < 1
f (x) =
0 altrimenti.
Si ha, per x 2 R; t > 0:
u (x; t) =
1
1=2
(4 t)
Z
che ha il seguente gra…co:
172
1
e
1
(x
y)2
4t
dy;
Si osserva l’e¤ etto regolarizzante dell’equazione per t > 0.
Equazione non omogenea
Mediante la trasformata di Fourier possiamo risolvere anche un problema di
Cauchy per l’equazione del calore non omogenea. Consideriamo il problema:
ut D u = F (x; t) per x 2 Rn ; t > 0
u (0; x) = 0 per x 2 Rn .
(4.7)
Non è restrittivo supporre la condizione iniziale nulla; se non lo fosse, per il
principio di sovrapposizione potremmo sommare le soluzioni del problema (4.3)
e (4.7).
Trasformando e procedendo come in precedenza si ha:
u
bt ( ; t) + D4
u
b ( ; 0) = 0
2
2
j j u
b ( ; t) = Fb ( ; t)
che è un problema di Cauchy per un’equazione di¤erenziale ordinaria del prim’ordine in t, lineare e non omogenea. Si integra così:
Z t
2
2
4D 2 j j2 t
c( ) +
e4D j j Fb ( ; ) d
u
b ( ; t) = e
0
e imponendo la condizione iniziale,
Z t
Z t
2
2
2
2
u
b ( ; t) = e 4D j j t
e4D j j Fb ( ; ) d =
e
0
4D
2
j j2 (t
0
)
Fb ( ; ) d :
Sfruttando ora il calcolo già fatto in precedenza, l’integranda si può vedere come
la trasformata di una convoluzione in x,
Z t
u
b ( ; t) =
F (k ( ; t
) F ( ; )) ( ) d
0
e scambiando la trasformata in x con l’integrazione in t,
Z t
u (x; t) =
k( ;t
) F ( ; ) (x) d
0
Z t Z
=
k (x y; t
) F (y; ) dy d
Rn
0
o, esplicitamente:
u (x; t) =
Z
0
t
1
(4D (t
n=2
))
Z
Rn
e
jx yj2
4D(t
)
!
F (y; ) dy d :
(4.8)
Si confrontino le formule (4.6) e (4.8), costruite con lo stesso nucleo del
calore, ma diversa struttura degli integrali.
173
Discutere le ipotesi sotto cui la (4.8) assegna e¤ettivamente la soluzione del
problema di Cauchy non è così semplce.
E’chiaro che, non appena F è una funzione limitata almeno per tempi …niti,
cioè
sup
jF (x; t)j MT < 1
x2Rn ;t2(0;T )
si può scrivere, per ogni t
ju (x; t)j
MT
T
Z
t
(4D (t
0
= MT
Z
1
t
n=2
))
Z
e
jx yj2
4D(t
)
!
dy d
Rn
1d = tMT
0
da cui
sup ju (x; t)j ! 0 per t ! 0+ :
x2Rn
La condizione iniziale è dunque assunta con continuità sotto la sola ipotesi di
limitatezza di F per tempi …niti.
Il problema questa volta è calcolare le derivate di u dalla formula di rappresentazione. Come in altri problemi per un’equazione non omogenea, questo
porta a “integrali singolari”. Lo studente provi a ri‡ettere su cosa succede
cercando di calcolare
! !
Z t
Z
jx yj2
1
e 4D(t ) F (y; ) dy d
:
@t
n=2
0
Rn
(4D (t
))
Ci limitiamo a segnalare che per F su¢ cientemente regolare (ad es., C 2 ) il
procedimento è giusti…cato.
4.4
Problemi unidimensionali per l’equazione di di¤usione
con trasporto e reazione
Consideriamo, in una sola variabile spaziale, l’equazione di di¤usione per la
concentrazione u di una sostanza in soluzione, con termini di trasporto e reazione
(v. § 2.2 per il signi…cato …sico):
ut Duxx + vux + u = 0 per x 2 R; t > 0
u (x; 0) = f (x) per x 2 R
dove D; v; sono costanti, D; > 0 per il loro signi…cato …sico, mentre il segno
di v non ha importanza.
Possiamo con un cambio di variabile ricondurci all’equazione di di¤usione
pura, di cui conosciamo la soluzione.
Poniamo:
u (x; t) = eax+bt w (x; t)
174
con a; b costanti da determinarsi e w nuova funzione incognita. Calcoliamo:
ut = eax+bt fbw + wt g
ux = eax+bt faw + wx g
uxx = eax+bt 2awx + wxx + a2 w
e sostituendo nell’equazione otteniamo:
eax+bt (bw + wt )
wt
D 2awx + wxx + a2 w + v (aw + wx ) + w = 0
Da2 + av +
Dwxx + w b
+ wx (v
2Da) = 0:
Scegliamo ora a; b in modo che sia
Da2 + av +
2Da = 0
b
v
=0
cioè
a=
v
2D
b = Da2
av
=
e in de…nitiva
v2
4D +
v
u (x; t) = e 2D x e
v2
4D
t
w (x; t)
con
wt
Dwxx = 0
e imponendo la condizione iniziale
v
f (x) = u (x; 0) = e 2D x w (x; 0)
otteniamo che w risolve il problema di Cauchy
wt Dwxx = 0 per x 2 R; t > 0
v
w (x; 0) = f (x) e 2D x per x 2 R
e quindi per la (4.6)
w (x; t) = p
1
4D t
Z
e
jx yj2
4Dt
f (y) e
v
2D y
dy
Rn
e
u (x; t) = e
=e
v2
4D +
v2
4D +
Z
jx yj2
v
1
e
e 4Dt f (y) e 2D y dy
n
4D t R
Z
jx yj2
v
1
t
p
e 4Dt e 2D (x y) f (y) dy:
4D t Rn
t
v
2D x
p
175
Troviamo quindi una formula di rappresentazione con una struttura simile alla
precedente, dove però:
il nucleo del calore che compare nell’integrale è sostituito da uno modi…cato
che tiene conto del trasporto;
il tutto è moltiplicato per un esponenziale decrescente nel tempo, che modellizza la reazione chimica (o decomposizione) che nel tempo tende a consumare
la sostanza.
4.5
L’equazione di Poisson nello spazio
Consideriamo l’equazione di Poisson in tutto lo spazio R3 :
u=f
e proponiamoci di risolverla con la trasformata di Fourier. Sia ha:
4
da cui
2
2
j j u
b ( ) = fb( )
u
b( ) =
4
fb( )
2
2:
j j
Ovviamente questa scrittura vale indi¤erentemente qualunque sia la dimensione
n dello spazio ambiente, tuttavia come vedremo nel seguito, nella risoluzione
giocherà un ruolo cruciale il fatto di supporre di trovarci in R3 . Notiamo subito
che, a di¤erenza di quanto abbiamo visto nell’applicare la trasformata di Fourier
all’equazione del calore o all’equazione di Laplace sul semipiano, non possiamo
pensare di antitrasformare la funzione
m( ) =
1
4
2
2
j j
=b
k( )
per poi ottenere una formula di rappresentazione della soluzione del tipo u =
f k, in quanto la funzione m ( ) è discontinua nell’origine e quindi certamente non è la trasformata di Fourier di una funzione L1 R3 . Dovremo invece
b
antitrasformare direttamente il prodotto 4 f2(j )j2 . Scriviamo, per ora un po’
formalmente
Z
Z
Z
e2 i x
fb( ) 2 i x
e
d
=
f (y) e 2 i y dy d
u (x) =
2
2
2
2
3
3
3
j j
j j
R 4
R 4
R
!
Z
Z
2 i (x y)
e
=
f (y)
dy
(4.9)
2 d
3
3
4 2j j
R
R
e studiamo anzitutto l’integrale interno, che riscriviamo (con x
Z
e2 i
d :
k ( ) = lim
L!1 j j<L 4 2 j j2
176
y = ) come
L’integranda in ha denominatore radiale, mentre a numeratore compare la
scrittura z; tenendo anche conto del fatto che l’integrale è esteso a una sfera,
viene l’idea di usare le coordinate sferiche ( ; ; ), orientando l’asse z verso la
variabile , in modo che risulti
d = 2 sin d d d
= j j cos :
Perciò
Z
e2
j j<L
4
i
2
2d
j j
=
Z
Z
2
0
=
Z
0
Z
L
0
=
Z
=
1
2
Z
Z
2
e2 i
2 2
L
4
i j j cos
0
L
e2
j j cos
2i
i j j
i2
0
L
i j j cos
e2
0
e2
0
=
Z
L
1
2
jzj
e 2
j j
2 2
sin d
sin d
!
2
d
!
d
d
d
0
i j j
d
sin (2 j j) d
j j
(t = 2 j j)
Z 2 Lj j
sin t
1
=
dt
2
2 j j 0
t
0
2
2
e utilizzando l’integrale generalizzato notevole (che si può dimostrare con tecniche di variabile complessa)
Z R
sin t
dt =
lim
R!1 0
t
2
otteniamo
k ( ) = lim
L!1
1
2
2
j j
Z
0
2 Lj j
sin t
1
dt =
t
2 2j j
2
=
1
:
4 j j
In…ne, utilizzando quest’espressione di k ( ) nella (4.9) otteniamo
Z
f (y)
u (x) =
dy = (f k) (x) ;
yj
R3 4 jx
(4.10)
formula che può avere senso se ad esempio f è nulla fuori da un insieme limitato
(si osservi che il nucleo k non è integrabile all’in…nito, quindi per una generica
funzione f 2 L1 R3 lintegrale può non esistere).
Si osservi che la funzione k ( ) è una soluzione radiale dell’equazione di
Laplace in R3 nf0g ; ossia è il potenziale generato da una carica puntiforme posta
177
nell’origine. Quindi l’integrale che de…nisce u si può vedere come la sovrapposizione degli in…niti potenziali generati da cariche puntiformi poste nel generico
punto x, di intensità pari alla densità di carica f .
Al solito, si tratta ora di dimostrare che sotto opportune ipotesi la funzione
u assegnata dalla (4.10) risolve l’equazione di Poisson. Tale soluzione evidentemente non può essere unica: sommando a u una qualsiasi funzione armonica in
tutto lo spazio, si trova un’altra soluzione dell’equazione di Poisson.
Prima di enunciare un teorema, cerchiamo di capire qual è il problema. Se
potessimo calcolare
u (x) derivando sotto il segno di integrale a partire dalla
formula così come è scritta, otterremmo
Z
1
f (y) dy:
u (x)? =?
4
jx
yj
3
R
Questa formula però non può essere vera per due ragioni:
1. Se fosse vera, poiché sappiamo che la funzione 1= jyj è armonica, otter1
remmo
= 0 e quindi
u = 0 e non, come vogliamo,
u =
4 jx yj
f.
2. D’altro canto se pensiamo ai singoli addendi che compongono il laplaciano
di 1= jyj ; cioè
@2
1
2
@xi 4 jx yj
3
troviamo una funzione che in x va a in…nito come 1= jx yj , quindi non integrabile. Perciò la derivazione sotto il segno di integrale non è giusti…cabile.
Per calcolare correttamente il laplaciano di u occorrerà riscrivere opportunamente l’integrale. Notando che
Z
Z
f (y)
f (x y)
dy =
dy;
4
jx
yj
4 jyj
R3
R3
il secondo integrale può essere derivato, portando le derivate sotto il segno di
integrale, “scaricando la derivata” sulla funzione f anziché sul nucleo 1= jyj.
Occorrerà però richiedere che la f sia derivabile due volte. A questo punto però
il problema è capire a cosa è uguale
Z
f (x y)
u (x) =
dy:
4
jyj
3
R
Per questo ci vorrà qualche altra astuzia...
Teorema 4.24 Per ogni f 2 C02 R3 (cioè C 2 e nulle fuori da un insieme
limitato), la u de…nita da (4.10) è C 2 R3 e soddisfa l’equazione
u = f in
R3 .
Dimostrazione. Consideriamo
Z
Z
f (y)
f (x y)
u (x) =
dy =
dy
4
jx
yj
4 jyj
3
3
R
R
178
e calcoliamo
u (x) =
Z
f (x y)
dy
4 jyj
Z
f (x y)
dy +
4 jyj
jyj
R3
=
Z
jyj>r
r
f (x y)
dy
4 jyj
Ir (x) + Jr (x)
per un certo numero r > 0 che poi faremo tendere a zero.
Notare che la funzione 1= jyj è integrabile in un intorno dell’origine, in R3
(passando in coordinate sferiche la funzione 1= viene moltiplicata per il fattore
2
proveniente dalla jacobiana), mentre la funzione
f (x y), per x …ssato, è
continua in y e nulla fuori da un insieme limitato. Perciò gli integrali convergono.
Ricordiamo anche che la funzione 1= jyj è armonica (fuori dall’origine) e
radiale, perciò nella regione fjyj > rg è
(1= jyj) = 0.
Applichiamo allora a Ir la seconda identità di Green
ZZZ
ZZ
@g
@f
[f g g f ] dxdydz =
f
g
dS,
@ne
@ne
@
1
calcolando, per = fjyj > rg e @ = fjyj = rg, @@ jyj
= r12 (derivata rispetto
a r, cambiata di segno perché la normale è uscente dalla regione fjyj > rg)
Z
Z
y)
y)
x f (x
y f (x
dy =
dy
Ir (x) =
4
jyj
4
jyj
jyj>r
jyj>r
Z
Z
1
1 @f
=
f (x y) dS
(x y) dS
4 r2 jyj=r
4
r@
jyj=r
= Ir1 (x) + Ir2 (x) :
Ora
Ir1
(x) =
mentre
Ir2 (x)
1
j@Br (x)j
Z
@Br (x)
f (y) dS ! f (x) per r ! 0
1
sup jrf j j@Br (x)j = r sup jrf j ! 0 per r ! 0;
4 r
perciò Ir (x) ! f (x) per r ! 0.
D’altro canto
Z
f (x y)
jJr (x)j =
dy
4 jyj
jyj r
Z
1
sup j f j
dy
4
jyj
jyj r
in coordinate sferiche
= sup j f j 4
Quindi
u = f.
Z
0
r
1
4
2
d = sup j f j
179
r2
! 0 per r ! 0:
2
4.6
L’equazione delle onde nello spazio
Consideriamo il problema di Cauchy per l’equazione delle onde omogenea nello
spazio R3 :
8
< utt c2 u = 0 per x 2 R3 ; t > 0
u (0; x) = g (x) per x 2 R3
(4.11)
:
ut (0; x) = h (x) per x 2 R3 .
Notiamo anzitutto che la soluzione di questo problema si può sempre ricondurre
a quella di un problema analogo, ma con g = 0. Si può dimostrare infatti:
Proposizione 4.25 Per f : R3 ! R assegnata, sia wf la soluzione del problema
8
< utt c2 u = 0 per x 2 R3 ; t > 0
u (0; x) = 0 per x 2 R3
(4.12)
:
ut (0; x) = f (x) per x 2 R3 .
Allora la soluzione di (4.11) è data da
u = @t wg + wh :
Il problema (4.12) si può a¤rontare con la trasformata di Fourier in R3 .
Trasformando l’equazione e le condizioni iniziali si ha (analogamente al caso
dell’equazione del calore nello spazio)
8
2
btt ( ; t) + 4 2 c2 j j u
b ( ; t) = 0
< u
u
b ( ; 0) = 0
:
u
bt ( ; 0) = fb( )
che si può vedere come problema di Cauchy per un’equazione di¤erenziale ordinaria in t (con come parametro), lineare del second’ordine a coe¢ cienti
costanti, omogenea. La soluzione è:
sin (2 c j j t)
u
b ( ; t) = fb( )
:
2 cj j
Diversamente da quanto abbiamo fatto con l’equazione di Laplace nel semipiano e l’equazione del calore nello spazio, questa volta non si riesce a determinare
un’espressione analitica semplice della funzione la cui trasformata di Fourier sia
sin (2 c j j t)
;
2 cj j
quindi non otterremo una formula di rappresentazione della soluzione con la
struttura
u ( ; t) = k ( ; t) f:
Scriviamo allora, applicando formalmente il teorema di inversione
Z
sin (2 c j j t) 2 i x
u (x; t) =
fb( )
e
d
2 cj j
3
R
180
introducendo, prudentemente, un passaggio al limite per avere integrali convergenti all’in…nito
Z
sin (2 c j j t) 2 i x
= lim
fb( )
e
d
L!1 j j<L
2 cj j
ed esprimendo la trasformata di f esplicitamente come integrale
Z
Z
sin (2 c j j t) 2 i x
e
d
= lim
f (y) e 2 i y dy
L!1 j j<L
2 cj j
3
R
scambiando l’ordine di integrazione
Z
Z
sin (2 c j j t) 2
e
= lim
f (y)
L!1 R3
2 cj j
j j<L
i (x y)
d
!
dy:
Ora lavoriamo sull’integrale interno. E’ un integrale triplo ( = ( 1 ; 2 ; 3 )),
sulla sfera di centro l’origine e raggio L. Se non ci fosse l’esponenziale complesso,
l’integranda sarebbe radiale; nella speranza di sfruttare al meglio le simmetrie,
utilizziamo delle coordinate sferiche orientate in modo che il vettore (x y)
punti verso il polo nord, cioè
8
< 1 = cos
2 = sin cos
:
3 = sin sin
con
=j je
(x
y) = jx
yj cos :
Ricordiamo che, per la formula del cambio di variabili nell’integrale triplo in
coordinate sferiche,
d 1 d 2 d 3 = 2 sin d d d :
Si ha, ponendo anche, per semplicità jx yj = r,
Z
sin (2 c j j t) 2 i (x y)
e
d
2 cj j
j j<L
Z L
Z 2 Z
sin (2 c t)
=
e2 i r cos sin d
2 c
0
0
0
Z L
Z
sin (2 c t)
=
e2 i r cos sin d
d
c
0
0
Z L
sin (2 c t)
e2 i r cos
=
d
c
2 i r 0
0
Z L
sin (2 c t) e2 i r e 2 i r
=
d
c
2 i r
0
Z L
sin (2 c t) e2 i r e 2 i r
=
d
cr
2i
0
Z L
1
=
sin (2 c t) sin (2 r) d :
cr 0
181
d
2
d
Otteniamo quindi la formula:
Z
u (x; t) = lim
L!1
f (y)
c jx yj
R3
Z
L
sin (2 c t) sin (2
jx
0
yj) d
!
dy:
Per calcolare l’integrale in dy trasformiamo anche questo in coordinate sferiche,
scegliendo l’origine in x, in modo che, ancora con jx yj = r, si abbia
8
< y1 x1 = r cos
y2 x2 = r sin cos
:
y3 x3 = r sin sin :
Quindi, lasciando scritto per ora
f (y) anziché f (x1 + r cos ; x2 + r sin cos ; x3 + r sin sin ) ;
si ha
u (x; t) = lim
L!1
= lim
L!1
Z
Z
+1
0
1
c
Z
2
0
Z
0
L
sin (2 c t)
0
f (y)
cr
Z +1
Z
L
sin (2 c t) sin (2
r) d
0
sin (2
r)
0
Z
Z
2
0
!
sin d
f (y) sin d
!
d
d
0
Riconosciamo ora il signi…cato geometrico dell’integrale interno nelle variabili
; : è multiplo dell’integrale di super…cie, sulla super…cie della sfera di centro
x e raggio r, di f . Precisamente, essendo, sulla super…cie della sfera di raggio r;
dS = r2 sin d d
si ha
g (r)
r
Z
0
2
Z
f (y) sin d
0
1
d =
r
Z Z
f dS
@S(x;r)
così che la formula precedente si riscrive
Z L
Z +1
1
u (x; t) = lim
sin (2 c t)
sin (2
L!1 c 0
0
r) g (r) dr d :
Si tratta ora di riconoscere la struttura di questo integrale.
La funzione g è de…nita solo per r 0. Immaginiamo di prolungarla dispari
per r < 0. Allora la sua trasformata di Fourier in R è
Z
Z +1
gb ( ) =
g (r) e 2 ir dr = 2i
g (r) sin (2 r) dr
R
ossia
Z L
Z +1
1
sin (2 c t)
sin (2
c 0
0
0
r) g (r) dr d =
182
1
2 ic
Z
0
L
sin (2 c t) gb ( ) d :
!
r2 dr
rdr d :
D’altro canto la trasformata di Fourier gb ( ) di una funzione reale e dispari è
una funzione immaginaria pura e dispari, quindi
Z
Z +1
c
(b
g ) ( s) =
gb ( ) e2 i s d = 2i
gb ( ) sin (2 s) d
R
0
da cui leggiamo, per il teorema di inversione,
Z L
1
1 c
lim
sin (2 c t) gb ( ) d = (b
g ) ( ct) = g (ct)
L!1 0
2i
2i
e in…ne
u (x; t) =
1
1 1
g (ct) =
2 ic 2i
4 c2 t
Z Z
f dS
@S(x;ct)
Abbiamo così ottenuto la formula di Kirchho¤ :
Z Z
1
f dS;
u (x; t) =
4 c2 t
@S(x;ct)
che esprime il fatto che la soluzione u (x; t) è proporzionale a 1=t volte l’integrale
di super…cie del dato f sulla sfera @S (x; ct). Poiché l’area di tale sfera vale
4 c2 t2 , si può anche esprimere la stessa formula come
Z Z
1
u (x; t) = t
f dS;
j@S (x; ct)j
@S(x;ct)
e dire che u (x; t) è uguale t volte la media integrale di f sul bordo della sfera.
Tenendo conto anche della Proposizione 4.25 abbiamo il seguente risultato
preciso:
Teorema 4.26 (Formula di Kirchho¤) Per g 2 C 3 R3 e h 2 C 2 R3
assegnate, l’unica soluzione del problema (4.11) è assegnata dalla formula
!
Z Z
Z Z
1
1
u (x; t) = @t
gdS
+
hdS:
4 c2 t
4 c2 t
@S(x;ct)
@S(x;ct)
Non dimostriamo questo teorema (occorrerebbe provare che nelle ipotesi
enunciate la formula precedente si può e¤ettivamente derivare due volte e assegna la soluzione del problema di Cauchy), accontentandoci di commentare la
formula …nale ottenuta.
Le onde tridimensionali si propagano secondo questa legge: il valore di u nel
punto x all’istante t dipende solo dai valori dei dati iniziali g; h sulla super…cie
della sfera di centro x e raggio ct. Questa super…cie costituisce quindi il dominio
di dipendenza di u (x; t).
Ad esempio: una perturbazione puntiforme nei dati, concentrata nel punto
x0 all’istante t = 0, sarà visibile nel punto x solo all’istante t0 = jx x0 j =c.
Questo signi…ca che in tre dimensioni una sorgente puntiforme produce segnali
istantanei.
183
Per contro, abbiamo visto che per un’onda unidimensionale la formula di
D’Alembert dà:
Z x+ct
1
1
u(x; t) = (u0 (x + ct) + u0 (x ct)) +
v0 (s) ds;
2
2c x ct
da cui leggiamo che il valore u (x; t) dipende dai valori che il dato v0 assume in
tutto l’intervallo (x ct; x + ct); questo signi…ca anche che una perturbazione
puntiforme nei dati, concentrata nel punto x0 all’istante t = 0, sarà visibile in
un punto x per ogni tempo t > jx x0 j =c. La propagazione ondosa in una
dimensione o in tre dimensioni ha quindi un comportamento ben diverso.
Non ci occuperemo qui dell’equazione delle onde in dimensione spaziale due,
ma segnaliamo a titolo di confronto che dal punto di vista di cui stiamo discutendo il caso bidimensionale assomiglia a quello unidimensionale e non a quello
tridimensionale: il dominio di dipendenza di u (x; t) è costituito in due variabili
dal cerchio pieno di centro x e raggio ct. In due variabili quindi (come in una)
una perturbazione istantanea produce un’onda teoricamente perenne, mentre in
tre variabili ne produce una istantanea.
Si pensi al fenomeno di un sasso lanciato nell’acqua, che possiamo vedere sia
dal punto di vista delle onde meccaniche approssimativamente bidimensionali
prodotte nell’acqua (i “cerchi nell’acqua”), sia delle onde sonore tridimensionali
(rumore): a fronte di un unico fenomeno approssimativamente “istantaneo e
puntiforme” del sasso che cade, l’e¤etto sonoro (tridimensionale) è istantaneo
mentre l’e¤etto meccanico (onde d’acqua) produce un “treno” di cerchi che si
allargano, virtualmente senza termine (se non ci fosse attrito).
A titolo di confronto si ri‡etta sul fatto che, nello studio dell’equazione
del calore, non abbiamo incontrato di¤erenze qualitativamente rilevanti al variare della dimensione spaziale. E’una caratteristica dell’equazione delle onde e
dei fenomeni ondulatori quella di presentare rilevanti di¤erenze al variare della
dimensione spaziale.
184
5
Spazi di Hilbert
Gli spazi vettoriali dotati di un prodotto scalare sono ambienti astratti in cui si
può de…nire un concetto di ortogonalità analogo a quello euclideo in Rn . Questo
mette a disposizione un sistema di riferimento privilegiato in cui i calcoli sono
particolarmente comodi e semplici, un concetto di proiezione ortogonale che
diventa strumento per approssimare un elemento generico di uno spazio vettoriale (che nelle applicazioni all’analisi è una funzione) mediante elementi di
un particolare sottospazio (che nelle applicazioni sono funzioni di qualche tipo
particolarmente semplice). In dimensione in…nita, come abitualmente si è in
analisi, l’ortogonalità da sola non basterebbe però a garantire il “buon funzionamento” di questo tipo di teoria: la validità della proprietà di completezza (nel
senso degli spazi di Banach) è essenziale a¢ nché si possano dimostrare teoremi signi…cativamente simili a quelli che valgono in Rn . Da questa sintesi di
idee nasce il concetto di spazio di Hilbert, uno spazio di Banach in cui c’è un
prodotto scalare e quindi un concetto di ortogonalità. L’esempio più naturale
di spazio di Hilbert utile in analisi, in un certo senso prototipo di tutti gli altri,
è lo spazio L2 ( ) delle funzioni a quadrato sommabile in qualche dominio
di Rn . Perciò la teoria degli spazi di Hilbert, pur essendo di per sé una teoria
astratta che utilizza solo i concetti propri degli spazi vettoriali normati, nelle sue
applicazioni interessanti ha bisogno della teoria della misura e dell’integrazione
di Lebesgue. E’ una teoria che nasce quindi dall’incontro tra gli sviluppi dell’analisi funzionale astratta con la teoria della misura moderna. A sua volta,
l’applicazione della teoria astratta degli spazi di Hilbert al contesto concreto
dello spazio L2 ( ) richiede, come vedremo, la conoscenza di particolari “sistemi ortonormali completi”di funzioni. Il sistema trigonometrico fsin nx; cos nxg
comunemente usato nell’analisi di Fourier è il primo fondamentale esempio di
sistemi di questo tipo. A seconda del problema in esame (problemi di approssimazione di funzioni in analisi armonica, problemi ai limiti per equazioni differenziali ordinarie o alle derivate parziali), occorre a volte cercare altri tipi di
sistemi ortonormali completi di funzioni speciali, adattati in qualche senso al
problema in esame.
5.1
Spazi vettoriali con prodotto interno
De…nizione 5.1 Sia V uno spazio vettoriale sul campo K (= R o C). Si dice
che V è uno spazio vettoriale dotato di prodotto interno, o di prodotto scalare, o
anche che V è uno spazio pre-Hilbertiano, se (oltre alle due operazioni proprie
dello spazio vettoriale, cioè la somma di vettori e il prodotto tra un vettore e
uno scalare) è de…nita una (terza) operazione, che chiamiamo prodotto scalare
o prodotto interno,
(; ):V V !K
con le seguenti proprietà:
1. lineare sulla prima componente:
( x + y; z) =
(x; z) + (y; z)
185
8x; y; z 2 V; ;
2 K;
2.a. se K = R (caso che maggiormente considereremo in seguito): commutativo
(x; y) = (y; x) 8x; y 2 V ;
2.b. se K = C:
(x; y) = (y; x)
8x; y 2 V
dove indica il coniugato nel campo complesso. Si noti che se K = R dalla
commutatività segue anche la linearità sulla seconda componente, per cui in tal
caso diciamo semplicemente che il prodotto scalare è bilineare; se invece K = C
da 1 e 2.b segue
(z; x + y) =
(z; x) + (z; y)
8x; y; z 2 V; ;
2C
e si dice che il prodotto scalare complesso è sesquilineare. Notiamo anche che
nel caso complesso essendo (x; x) = (x; x), risulta (x; x) reale per ogni x 2 V ,
il che dà senso alla prossima richiesta.
3. Positività:
(x; x)
0 8x 2 V e (x; x) = 0 () x = 0:
Esempio 5.2 Sono spazi vettoriali con prodotto interno i seguenti:
1. Lo spazio Rn col prodotto scalare
(x; y) =
n
X
xj yj :
j=1
2. Lo spazio Cn (su C) col prodotto scalare
(x; y) =
n
X
xj yj :
j=1
3. Lo spazio Rn col prodotto scalare
n
X
(x; y) =
aij xj yj
i;j=1
n
dove A = (aij )i;j=1 è una qualsiasi matrice simmetrica e de…nita positiva.
4. Lo spazio C [a; b] (funzioni a valori reali) con
(f; g) =
Z
b
f (t) g (t) dt:
a
5. Lo spazio C [a; b] (funzioni a valori complessi) con
(f; g) =
Z
b
f (t) g (t)dt:
a
186
6. Lo spazio L2 ( ) (funzioni a valori reali o complessi),
misurabile di Rn con
Z
(f; g) =
f (x) g (x)dx:
sottoinsieme
Questo sarà l’esempio più importante nel seguito. Se le funzioni hanno valori
reali ovviamente non c’è bisogno di mettere il coniugato sopra g.
1
7. Lo spazio `2 delle successioni x = fxn gn=1 a valori reali o complessi per
le quali si abbia
1
X
2
jxj j < 1;
j=1
col prodotto scalare
(x; y) =
1
X
xj y j .
j=1
Questo è in un certo senso l’analogo discreto dell’esempio precedente. Si noti
l’analogia con il prodotto scalare usuale di Rn .
In tutto il seguito, per sempli…care le notazioni e le dimostrazioni, tratteremo
sempre spazi vettoriali su R. Quello che diremo vale comunque anche per spazi
complessi, con qualche modi…ca di notazione o nelle dimostrazioni.
Teorema 5.3 Sia V uno spazio pre-Hilbertiano. Allora:
1. Vale la disuguaglianza di Cauchy-Schwarz:
p
p
j(x; y)j
(x; x)
(y; y) 8x; y 2 V:
2. Ponendo
kxk =
p
(x; x)
si ottiene che k k è una norma, che si dice “norma del prodotto interno”. Si
noti che la disuguaglianza di Cauchy-Schwarz si riscrive quindi
j(x; y)j
kxk kyk 8x; y 2 V:
(5.1)
3. La norma del prodotto interno soddisfa l’uguaglianza del parallelogramma:
2
2
2
2
kx + yk + kx yk = 2 kxk + kyk
8x; y 2 V:
Dimostrazione. Dimostriamo il teorema lavorando per semplicità con uno
spazio pre-Hilbertiano reale. La dimostrazione di tutti i punti si basa sulle
proprietà assiomatiche del prodotto interno.
1. Per ogni 2 R possiamo scrivere: per la positività del prodotto scalare:
0
( x + y; x + y) =
187
per la bilinearità del prodotto scalare
2
=
(x; x) + 2 (x; y) + (y; y) =
per de…nizione di norma del prodotto scalare
=
2
2
2
kxk + 2 (x; y) + kyk :
Dunque abbiamo
2
2
kxk + 2 (x; y) + kyk
2
0 8 2 R,
il che implica che il discriminante del trinomio di secondo grado in
ossia
2
2
2
(x; y)
kxk kyk
0
sia
0,
da cui (5.1).
p
2. Ponendo kxk = (x; x) si ha, per la positività del prodotto scalare, la
proprietà di positività della norma. Vale l’omogeneità perché
p
p
p
2 (x; x) = j j
k xk = ( x; x) =
(x; x) = j j kxk :
Vale la disuguaglianza triangolare perché per de…nizione di norma e bilinearità
del prodotto scalare
2
2
2
kx + yk = (x + y; x + y) = (x; x) + 2 (x; y) + (y; y) = kxk + 2 (x; y) + kyk
per la (5.1)
2
2
2
kxk + 2 kxk kyk + kyk = (kxk + kyk)
da cui kx + yk kxk + kyk.
3. Per de…nizione di norma e bilinearità del prodotto scalare si ha:
2
kx + yk + kx
2
yk = (x + y; x + y) + (x y; x y)
= (x; x) + 2 (x; y) + (y; y) + (x; x)
2
2 (x; y) + 2 (y; y)
2
= 2 [(x; x) + (y; y)] = 2 kxk + kyk
:
Ogni spazio pre-Hilbertiano è dunque uno spazio vettoriale normato, la cui
norma “proviene da un prodotto scalare” e soddisfa l’uguaglianza del parallelogramma.
Viceversa, potremmo avere uno spazio vettoriale normato (qualsiasi) e chiederci se esista un prodotto scalare che induca quella norma. Da questo punto di
vista, il fatto che valga l’uguaglianza del parallelogramma risulta una condizione
necessaria, come mostra il prossimo
Esempio 5.4 Dimostriamo che la norma di L1 [a; b] non proviene da un prodotto scalare. Si faccia attenzione: è chiaro che il prodotto scalare
Z b
(f; g) =
f (t) g (t) dt
a
188
non induce la norma L1 (perché induce la norma L2 ); noi stiamo a¤ ermando
però che non esiste alcun prodotto scalare (f; g) per cui si abbia
!2
Z
b
(f; f ) =
a
jf (t)j dt
:
Se un tale prodotto scalare esistesse, la norma L1 dovrebbe soddisfare l’uguaglianza del parallelogramma, cosa che non accade, come ora mostriamo. Consideriamo, in L1 [0; 2]:
f (t) = [0;1] (t) ; g (t) = [1;2] (t) :
Poiché j(f
g) (t)j = 1 in [0; 2], si ha:
Z 2
2
2
kf + gkL1 + kf gkL1 =
dt
2
+
0
2
2
Z
2
2
dt
= 4 + 4 = 8;
0
2 kf kL1 + kgkL1 = 2 (1 + 1) = 4
e l’uguaglianza non vale. Pertanto L1 non è uno spazio pre-Hilbertiano.
Si può dimostrare (v. Esercizio 5.21) che se V è uno spazio vettoriale normato
la cui norma soddisfa l’uguaglianza del parallelogramma, allora il prodotto
i
1h
2
2
2
(x; y) =
kx + yk
kxk
kyk
2
è e¤ettivamente un prodotto scalare, che induce la norma k k. Di conseguenza
l’uguaglianza del parallelogramma caratterizza le norme degli spazi pre-hilbertiani.
Questo fa capire che tutta la geometria degli spazi con prodotto scalare è scritta,
implicitamente, nella semplice uguaglianza del parallelogramma. Difatti, come
vedremo, quest’uguaglianza giocherà un ruolo centrale nella dimostrazione di
un risultato fondamentale.
Una conseguenza della disuguaglianza di Cauchy-Schwarz che ci sarà utile
talvolta è la seguente:
Teorema 5.5 Sia V uno spazio vettoriale pre-hilbertiano. Allora il prodotto
1
1
scalare è continuo, cioè se x; y 2 V e fxn gn=1 ; fyn gn=1 V , si ha:
yn ! y =) (x; yn ) ! (x; y) ;
xn ! x; yn ! y =) (xn ; yn ) ! (x; y) :
Dimostrazione.
j(x; yn )
(x; y)j = j(x; yn
y)j
kxk kyn
yk ! 0 per yn ! y,
che mostra la prima relazione. Per la seconda, scriviamo
j(xn ; yn )
(x; y)j = j(xn ; yn ) (xn ; y) + (xn ; y) (x; y)j
= j(xn ; yn y) + (xn x; y)j
j(xn ; yn y)j + j(xn x; y)j
kxn k kyn yk + kyk kxn xk
189
e l’ultima espressione scritta tende a zero poiché kyn yk ; kxn xk tendono a
zero, mentre la successione xn essendo convergente è limitata, perciò esiste c
tale che kxn k c per ogni n.
In uno spazio vettoriale con prodotto interno si può de…nire in maniera
naturale un concetto di ortogonalità:
De…nizione 5.6 Si dice che x; y 2 V sono ortogonali tra loro, e si scrive x ? y,
se (x; y) = 0:
Vale allora il seguente
Teorema 5.7 (di Pitagora) Siano x1 ; x2 ; :::; xn 2 V elementi a due a due
ortogonali. Allora
n
X
2
xj
j=1
=
n
X
j=1
2
kxj k :
Dimostrazione. Si ha, per de…nizione di norma e bilinearità del prodotto
scalare:
0
1
2
n
n
n
n
X
X
X
X
xj = @
xj ;
xi A =
(xi ; xj )
j=1
j=1
i;j=1
i=1
poiché i vettori sono a due a due ortogonali (xi ; xj ) = 0 per i 6= j, perciò
=
n
X
(xj ; xj ) =
j=1
n
X
j=1
2
kxj k :
De…nizione 5.8 Sia S
V un insieme qualsiasi di vettori. Si dice complemento ortogonale di S, e si indica con S ? , l’insieme
S ? = fx 2 V : (x; s) = 0 8s 2 Sg :
Teorema 5.9 L’insieme S ? è un sottospazio vettoriale chiuso di V (anche se
S non è un sottospazio).
Dimostrazione. Che sia un sottospazio segue dalla bilinearità del prodotto
scalare: se x; y 2 S ? e ; 2 R si ha, per ogni s 2 S;
( x + y; s) =
(x; s) + (y; s) =
0+
0 = 0:
Che sia chiuso segue dalla continuità del prodotto scalare (Teorema 5.5). Infatti
1
sia fxn gn=1
S ? tale che xn ! x 2 V; e proviamo che x 2 S ? . Infatti per
ogni s 2 S si ha
(x; s) = lim (xn ; s) = lim 0 = 0;
n!1
quindi x 2 S
?
eS
?
n!1
è chiuso.
190
5.2
Spazi di Hilbert
De…nizione 5.10 Si dice spazio di Hilbert uno spazio pre-Hilbertiano completo
(rispetto alla norma del prodotto scalare).
Quindi uno spazio di Hilbert è uno spazio di Banach la cui norma proviene
da un prodotto interno.
Esempio 5.11 Passiamo in rassegna agli Esempi 5.2 di spazi vettoriali con
prodotto interno e vediamo quali di essi sono spazi di Hilbert.
Gli esempi 1, 2, 3, 4 sono …nito dimensionali. Questi sono tutti spazi di
Hilbert, per la completezza di Rn .
Gli esempi 4-5 (funzioni continue, prodotto scalare integrale) danno spazi
non completi (sappiamo già che le norme integrali non rendono completo uno
spazio di funzioni continue), quindi non di Hilbert.
L’esempio 6 è L2 ( ), con il prodotto scalare integrale. Questo è di Hilbert
(completezza degli spazi Lp ), ed è l’esempio più importante per il seguito del
discorso. Si noti che stiamo parlando di L2 su un qualsiasi spazio di misura
astratto ( ; M; ), non solo un dominio di Rn con la misura di Lebesgue.
L’esempio 7 è un caso particolare del precedente quando la misura è quella
del conteggio su N. Si ottiene lo spazio `2 di successioni, col prodotto scalare
che generalizza quello usuale di Rn al caso in…nito dimensionale. In un certo
senso lo spazio `2 si può pensare come una sorta di “spazio R1 ”, dove però la
successione
delle coordinate è soggetta a un vincolo preciso, la convergenza della
P
2
serie
jxn j .
Nota storica. La teoria astratta degli spazi di Hilbert fu formulata da von
Neumann alla …ne degli anni 1920, come strumentazione matematica per la meccanica quantistica. In questa sua applicazione, è la teoria degli spazi di Hilbert
complessi quella che serve; questo è il motivo per cui abbiamo dato almeno le
de…nizioni iniziali nel caso complesso. Nel seguito del discorso, per semplicità,
considereremo quasi sempre spazi reali, soprattutto nelle dimostrazioni. Hilbert
fu il primo a introdurre lo spazio `2 , nei primi anni del 1900, e a gettare le
basi per l’interesse per questi tipi di spazi vettoriali in…nito dimensionali. Ricordiamo che la teoria degli spazi di Banach (di cui quelli di Hilbert sono un
caso particolare) ebbe il suo importante avvio con il lavoro di Banach del 1932
“Teoria degli operatori lineari”, quindi fu successiva alla teoria degli spazi di
Hilbert. Segnaliamo anche che gli sviluppi più signi…cativi della teoria degli
spazi di Hilbert (così come quella degli spazi di Banach, che non trattiamo)
riguardano la teoria degli operatori lineari de…niti su questi spazi, di cui noi
non ci occuperemo per nulla.
Lo studente curioso dell’applicazione della teoria degli spazi di Hilbert alla meccanica quantistica può leggere, per cominciare, il paragrafo molto elementare [Saxe, Chap. 6, §6.7]., che rimanda a testi più approfonditi. Avvertiamo comunque che la teoria degli spazi di Hilbert necessaria per comprenderne le applicazioni alla meccanica quantistica è molto più ampia di quella qui
sviluppata.
191
Negli spazi di Hilbert il teorema di Pitagora dimostrato in precedenza si
estende a somme in…nite, al modo seguente:
1
Teorema 5.12 (di Pitagora, 2a versione) Se fxj gj=1 è una successione di
elementi di
spazio di Hilbert H a due a due
Puno
P1ortogonali e tali che la serie
1
2
numerica j=1 kxj k converge, allora la serie j=1 xj converge in H e vale la
1
X
2
xj
=
j=1
1
X
j=1
2
kxj k :
Dimostrazione. Possiamo anzitutto applicare il teorema di Pitagora in versione …nita ad ogni somma parziale della serie, e scrivere
m
X
2
xj
=
j=n
m
X
j=n
2
kxj k :
(5.2)
P1
2
Poiché la serie numerica j=1 kxj k converge, le sue somme parziali sono una
Pm
2
successione di Cauchy, quindi j=n kxj k ! 0 per n; m ! 1: Per l’uguaglianza
Pm
(5.2) le somme parziali di j=n xj sono allora una successione di Cauchy in H,
ed essendo lo spazio completo la serie converge. Dunque esiste x 2 H tale che
n
X
j=1
n
X
xj ! x; perciò
2
2
xj
! kxk :
j=1
D’altro canto
Pn
j=1
2
xj
=
Pn
2
j=1
n
X
j=1
(5.3)
kxj k ; perciò
2
2
kxj k ! kxk .
(5.4)
Da (5.3) e (5.4) segue
1
X
j=1
2
kxj k =
1
X
2
xj
:
j=1
Il risultato fondamentale sulla geometria degli spazi di Hilbert è il seguente:
Teorema 5.13 (Distanza da un sottospazio chiuso, o Teorema della
proiezione). Sia H uno spazio di Hilbert e V un suo sottospazio vettoriale
192
chiuso. Allora per ogni x 2 H esiste un unico v 2 V di minima distanza da x,
ossia tale che
kx vk = inf kx vk :
v2V
Inoltre x
v è ortogonale a V . L’elemento v si dice proiezione di x su V .
Dimostrazione. Proviamo l’esistenza. Se x 2 V basta porre v = x, perciò
supponiamo x 2
= V . Sia d = inf v2V kx vk. (Questo inf esiste perché V non
1
è vuoto e kx vk 0). Sia fxn gn=1 V una successione minimizzante, ossia
tale che
kx xn k ! d:
(Tale successione esiste per de…nizione di estremo inferiore). Proviamo che
questa successione è di Cauchy. Si utilizza a questo scopo l’uguaglianza del
parallelogramma:
kxn
2
xm k = k(xn
x) + (x
=
x)
k(xn
2
xm )k
(x
2
2
xm )k + 2 kxn
2
xk + kx
xm k
:
Ora, per n; m ! 1 si ha:
2
xk ! d2 ;
kxn
k(xn
x)
(x
kx
2
xm k ! d2 ;
2
xm )k = kxn + xm
2
2xk = 4
xn + xm
2
perché, essendo V un sottospazio vettoriale, xn ; xm 2 V =)
segue che
2
lim kxn xm k
4d2 + 2 d2 + d2 = 0;
2
x
xn +xm
2
4d2
2 V: Ne
n;m!1
1
cioè kxn xm k ! 0, ossia fxn gn=1 è di Cauchy. Poiché H è completo, esiste
allora v 2 H tale che xn ! v; inoltre, poiché V è un sottospazio chiuso di H,
v 2 V . In…ne, poiché
kxn
kxn
xk ! kv
xk ! d;
xk e
si ha kv xk = d. Questo completa la dimostrazione dell’esistenza dell’elemento
di V di minima distanza da x.
Proviamo ora l’unicità. Siano dunque v1 ; v2 due elementi di V tali che
kvi
xk = d per i = 1; 2
193
e proviamo che allora v1 = v2 . Si usa ancora l’uguaglianza del parallelogramma,
in modo simile a quello già visto:
kv1
2
2
v2 k = k(v1
x) + (x
v2 )k
=
k(v1
x)
(x
=
4
v1 + v2
2
x
2
2
v2 )k + 2 kv1
xk + kx
v2 k
2
2
+ 2 d2 + d2
4d2 + 4d2 = 0
2
2
2 V ) v1 +v
x
d: Dunque kv1 v2 k = 0,
in quanto v1 ; v2 2 V ) v1 +v
2
2
ossia v1 = v2 :
Prima di dimostrare l’ultimo punto del teorema (ortogonalità di x v a V )
ragioniamo sul signi…cato geometrico di questa proprietà, lasciandoci guidare
dall’analogia con il caso …nito dimensionale. Se V è un sottospazio (chiuso) di
H e x è un elemento di H che non appartiene a V , dal punto di vista geometrico
chi sarà l’elemento v 2 V di minima distanza da x? Sarà la proiezione ortogonale
di x su V . Questo signi…ca appunto che x v è ortogonale a tutti gli elementi
di V .
Dimostriamolo. Sia w = x v, v 2 V qualsiasi, e proviamo che (w; v) = 0.
Per ogni 2 R, scriviamo (essendo v + v 2 V e kwk = d =distanza di V da x)
2
kwk
2
kx
(v + v)k = k(x
= (w
v; w
2
= kwk
v) = (w; w)
2 (v; w) +
2
kvk
da cui
2 (v; w)
Ponendo
v)
2
kvk
2
2
vk = kw
2 (v; w) +
2
vk
2
2
8 2 R:
= tsgn(v; w) con t > 0 la precedente si riscrive così
2t j(v; w)j
t2 kvk
194
2
8t > 0;
(v; v)
da cui dividendo per t e facendo tendere t a zero si ottiene (v; w) = 0, che è la
tesi.
Corollario 5.14 (Decomposizione ortogonale di H rispetto a un suo
sottospazio chiuso). Se H è uno spazio di Hilbert e V un suo sottospazio
chiuso si ha:
H = V V ?;
dove si legge “ somma diretta” e signi…ca quanto segue:
ogni elemento x 2 H si può scrivere come somma di un elemento v 2 V e
un elemento v 0 2 V ? , inoltre V \ V ? = f0g. Le due cose insieme implicano che
la scrittura x = v + v 0 con v 2 V e v 0 2 V ? è unica.
Dimostrazione. Sia V un sottospazio chiuso di H. Se V = H allora V ? = f0g
e la tesi è ovvia. Altrimenti, preso un x 2 H, per il Teorema della proiezione
possiamo scrivere x = v + (x v) con v 2 V e (x v) 2 V ? . E’ poi ovvio
che V \ V ? = f0g in quanto se x 2 V \ V ? si ha (x; x) = 0 e quindi x = 0.
Mostriamo anche che la scrittura di un elemento x 2 H nella forma x = v + v 0
con v 2 V e v 0 2 V ? è unica. Supponiamo che esistano due scritture
x = v1 + v10 = v2 + v20
con v1 ; v2 2 V; v10 ; v20 2 V ? . Allora si ha:
v1
v2 = v20
v10 :
Il primo membro è un elemento di V , il secondo membro è un elemento di V ? ,
allora poiché V \ V ? = f0g si ha v1 v2 = 0 = v20 v10 da cui v1 = v2 , v10 = v20
ossia la scrittura è unica.
5.3
Analisi di Fourier in spazi di Hilbert
Andremo ora più a fondo del concetto di ortogonalità, vedendo come opportuni
sistemi di vettori ortogonali possano costituire, in uno spazio di Hilbert astratto
così come avveniva in Rn , un buon “sistema di riferimento”.
n
1
De…nizione 5.15 Un insieme …nito fej gj=1 o numerabile fej gj=1 di elementi
di H si dice sistema ortonormale se
(ei ; ej ) =
0 se i 6= j
1 se i = j:
In altre parole, i vettori sono a due a due ortogonali, e ciascuno ha norma
unitaria.
Notazione. In questo paragrafo considereremo spesso combinazioni lineari di
vettori, ed è importante distinguere a colpo d’occhio i vettori dalle costanti che li
195
moltiplicano. Cambiando leggermente notazioni quindi, scriveremo ad esempio
n
ej j=1 per indicare i vettori e
n
X
cj ej
j=1
per indicare una loro combinazione lineare, dove le cj sono costanti.
Cominciamo con l’illustrare alcuni procedimenti e idee che riguardano i
sottospazi di dimensione …nita di uno spazio di Hilbert.
Ricordiamo anzitutto che in base al teorema di Pitagora in spazi di Hilbert
si può scrivere:
n
X
2
cj ej
=
j=1
n
X
cj ej
2
j=1
=
n
X
j=1
2
jcj j :
(5.5)
Quest’uguaglianza in particolare implica che vettori che costituiscono un
sistema ortonormale …nito sono sempre linearmente indipendenti. Infatti se
n
X
cj ej = 0
j=1
per certe costanti c1 ; c2 ; :::; cn , in base a (5.5) si ha
n
X
j=1
2
jcj j = 0
e quindi cj = 0 per j = 1; 2; :::; n; perciò i vettori sono indipendenti.
Un sistema ortonormale …nito costituisce quindi una base dello spazio vettoriale da essi generato. Viceversa, se V0 è un sottospazio …nito dimensionale di
n
H, data una qualsiasi base uj j=1 di V0 è sempre possibile a partire da questa
generarne un’altra che sia costituita da vettori ortonormali. E’su¢ ciente adoperare il procedimento di ortonormalizzazione di Gram-Schmidt, che illustriamo
iterativamente così:
e1 = vers (u1 )
(dove, qui e nel seguito, indichiamo vers (u) =
e2 = vers (u2
u
kuk );
(u2 ; e1 ) e1 )
(spiegazione: dopo aver normalizzato il primo vettore, consideriamo il secondo e
gli sottraiamo la sua componente nella direzione del primo; così u2 (u2 ; e1 ) e1
risulta ortogonale a e1 ; ora lo normalizziamo e abbiamo e2 );
e3 = vers (u3
(u3 ; e1 ) e1
(u3 ; e2 ) e2 )
e così via …no a ottenere una base ortonormale ej
196
n
j=1
di V0 .
Esplicitamente, l’algoritmo ricorsivo che de…nisce en è:
e1 = vers (u1 )
en = vers un
n
X1
(un ; ek ) ek
k=1
!
:
Supponiamo ora che V0 , sottospazio …nito dimensionale di H, sia dotato
n
di una base ortonormale ej j=1 (cosa che, come appena visto, si può sempre
supporre). Dato un elemento x2 H; il suo elemento di minima distanza da V0
(che sappiamo già esistere in base al teorema delle proiezioni) non è altro che:
PV0 x =
n
X
x; ej ej :
j=1
Infatti PV0 x 2 V0 e si veri…ca facilmente che x PV0 x 2 V0? . E’ su¢ ciente
calcolare per k = 1; 2; :::; n il prodotto scalare
(x
PV0 x; ek ) = (x; ek )
n
X
x; ej
ej ; ek = (x; ek )
(x; ek ) = 0:
j=1
Quindi la scrittura
x = PV0 x + (x
PV0 x)
mostra, in base al teorema delle proiezioni, che l’elemento di minima distanza di
x da V0 è proprio PV0 x: Ecco quindi che la conoscenza di una base ortonormale
in V0 dà un algoritmo semplice ed esplicito per calcolare l’elemento di minima
distanza di un vettore qualunque da V0 ; mediante la sua proiezione ortogonale.
Prima di proseguire sarà utile illustrare queste idee con un esempio concreto:
Esempio 5.16 Determinare il polinomio di grado
2 che approssima meglio
la funzione f (x) = sin ( x) in L2 (0; 1) :
Ragioniamo così: sia V0 lo spazio vettoriale dei polinomi di grado
2 su
[0; 1]. E’ uno spazio vettoriale di dimensione …nita (3), quindi chiuso; è un
sottospazio di L2 (0; 1) : Il polinomio di grado
2 che approssima meglio la
funzione f in L2 (0; 1) è la proiezione di f su V0 . Per calcolarla, dobbiamo prima costruire una base ortonormale in V0 . Per farlo, partiamo da una base
qualunque di V0 , sceglieremo quella più semplice, costituita da 1; x; x2 , e la
197
ortonormalizziamo in L2 (0; 1) mediante il procedimento di Gram-Schmidt:
1
e1 = vers (1) =
R1
0
Z
1
x
0
e2 = vers (x (x; e1 ) e1 ) ;
Z 1
1
(x; 1) =
xdx = ;
2
0
!1=2 r
2
1
1
1
dx
=
= p ;
2
12
2 3
p
1
e2 = 2 3 x
;
2
e3 = vers x2
x2 ; 1 =
Z
x2 ; e1 e1
1
x2 dx =
0
x2 ; e2 =
Z
1
1
;
3
x2 ; e1 e1
x2 ; e2 e2
L2
0
Z
@
=
1
1
3
x2
0
=
Z
1
1
x+
6
2
x
0
p
e3 = 6 5 x2
x+
x2 ; e2 e2 ;
p
1
3
dx =
;
2
6
p
3 p
2 3 x
6
p
x2 2 3 x
0
x2
= 1:
1=2
12 dx
1
6
2
!1=2
dx
=p
:
Ricapitoliamo: una base ortonormale di V0 è costituita dai 3 vettori:
e1 = 1;
p
e2 = 2 3 x
p
e3 = 6 5 x2
1
2
;
x+
1
6
:
Ora bisogna calcolare la proiezione di f su V0 ; cioè:
PV0 f = (f; e1 ) e1 + (f; e2 ) e2 + (f; e3 ) e3 :
198
1
2
!2
11=2
dxA
1
1
= p ;
180
6 5
Calcoliamo dunque:
Z 1
2
(f; e1 ) =
sin ( x) dx = ;
0
(f; e2 ) =
Z
1
p
sin ( x) 2 3 x
1
2
0
(f; e3 ) =
Z
1
p
sin ( x) 6 5 x2
1
x+
6
0
Perciò
PV0 f =
=
2
+
60
p
2 5
2
12
3
2
12
x2
3
dx = 0;
dx =
p
6 5 x2
x +
12
p
2 5
2
3
x+
2
:
1
6
120
3
12
:
Rappresentiamo la funzione f insieme alla sua approssimante:
Supponiamo ora di avere a disposizione (e vedremo in seguito che sarà pro1
prio così in molti esempi interessanti) una successione ej j=1 di vettori che
costituiscono un sistema ortonormale. I procedimenti illustrati precedentemente
si possono applicare iterativamente ai primi n vettori di questa successione, per
n crescente. Si ottiene allora il seguente importante risultato:
1
Teorema 5.17 (Disuguaglianza di Bessel) Se ej j=1 è un sistema ortonormale in uno spazio di Hilbert H; per ogni x2 H vale la disuguaglianza (di
Bessel):
1
X
2
2
x; ej
kxk :
j=1
In particolare, la serie a primo membro converge. Inoltre:
x
n
X
j=1
2
x; ej ej
= kxk
199
2
n
X
j=1
x; ej
2
:
(5.6)
Dimostrazione. Applichiamo il teorema delle proiezioni e quanto sopra ossern
vato al sottospazio V0 generato dai primi n vettori ej j=1 . Si ha:
n
X
x; ej
2
j=1
= kPV0 xk
2
2
kxk
per n = 1; 2; 3; ::: Passando al limite per n ! 1 si ha la tesi (ricordiamo che
una serie numerica a termini positivi con somme parziali superiormente limitate
è convergente).
D’altro canto la scomposizione
x = PV0 x + (x
PV0 x)
dà, per l’ortogonalità,
2
2
kxk = kPV0 xk + kx
PV0 xk
2
e quindi
x
n
X
j=1
2
x; ej ej
= kx
2
PV0 xk = kxk
2
2
kPV0 xk = kxk
2
n
X
x; ej
2
:
j=1
L’idea dell’analisi di Fourier in spazi di Hilbert è approssimare un elemento
x di H mediante la sua proiezione su opportuni sottospazi …nito dimensionali.
Pn
2
Poiché al crescere di n la somma j=1 x; ej
aumenta, dalla (5.6) del teore2
ma precedente leggiamo che la distanza kx PV0 xk diminuisce. Ci piacerebbe
poter a¤ermare che questa distanza non solo diminuisce ma tende a zero. Signi…cherebbe che abbiamo un metodo per approssimare bene quanto vogliamo
un generico elemento di uno spazio di Hilbert, mediante combinazioni lineari di
elementi del sistema ortonormale …ssato. D’altro canto a¢ nché questo accada è
1
necessario che il sistema ortonormale ej j=1 sia su¢ cientemente ricco da “catturare tutte le direzioni di H”: se ad esempio in R3 considerassimo un sistema
ortonormale costituito da soli due vettori, certamente non potremmo approssimare bene quanto vogliamo un generico elemento di R3 con combinazioni lineari
di questi due vettori. Questo porta alla seguente
De…nizione 5.18 Sia H uno spazio di Hilbert. Un sistema ortonormale ej
in H si dice completo se per ogni x2 H,
x; ej = 0
8j
1
j=1
=) x = 0:
Si usa spesso l’abbreviazione s.o.n.c. per “sistema ortonormale completo”.
Si osservi che nella de…nizione che abbiamo dato (e che non è l’unica che
si trova in letteratura), un s.o.n.c. è necessariamente numerabile, cioè consiste
200
in una successione di elementi (e non una famiglia in…nita più numerosa). Non
è ovvio che in uno spazio di Hilbert un s.o.n.c. esista. La cosa interessante,
tuttavia, non è dimostrare risultati astratti di esistenza di s.o.n.c., quanto esibire concretamente dei s.o.n.c. utili al problema in esame. Ad esempio, come
vedremo, in L2 [a; b] il classico sistema trigonometrico è l’esempio più noto di
sistema ortonormale completo. Nel seguito, incontreremo un certo numero di
s.o.n.c. espliciti.
Il prossimo teorema condensa i risultati fondamentali di analisi di Fourier in
spazi di Hilbert:
Teorema 5.19 (Serie e trasformata di Fourier in spazi di Hilbert) Sia H
1
uno spazio di Hilbert e ej j=1 un sistema ortonormale completo. Per ogni
x2 H; poniamo
x
bj = x; ej per j = 1; 2; 3; :::
Allora
1. La serie di Fourier di x converge in H ad x, cioè:
x=
1
X
j=1
2. L’operatore
x
bj ej
1
F : x 7! fb
xj gj=1
detto trasformata di Fourier su H, è lineare e continuo a valori nello spazio di
successioni `2 ; più precisamente, F è una isometria tra spazi di Hilbert, cioè è
biunivoca e conserva il prodotto scalare e la norma, ossia:
x; y =
1
X
j=1
x
bj ybj 8x; y 2 H (uguaglianza di Plancherel)
(il coniugato ybj è necessario se H è uno spazio di Hilbert complesso);
2
kxk =
1
X
j=1
2
jb
xj j
8x; y 2 H (uguaglianza di Perceval).
Osservazione 5.20 Il termine “trasformata di Fourier”in questo contesto può
confondere le idee. La trasformata di cui si parla qui è l’analogo astratto dell’operatore
F : L2 (
con
F : f 7! fb
1
fb(n) =
2
Z
; ) ! `2
f (y) e
201
iny
dy con n 2 Z
(e che de…nisce i coe¢ cienti che entrano nelle serie di Fourier) e non dell’operatore
con
fb( ) =
F : L1 (R) ! C0 (R)
F : f 7! fb
Z
f (y) e
i2
y
dy con
R
2 R.
Questi operatori possono essere chiamati, rispettivamente, “trasformata di
Fourier sulla circonferenza” e “trasformata di Fourier su R”. La trasformata
di Fourier in spazi di Hilbert è quindi l’analogo astratto della trasformata di
Fourier sulla circonferenza.
Dimostrazione.
L’operatore F è evidentemente lineare; per la disuguaglianza
P1
2
2
1
di Bessel, j=1 jb
xj j
kxk ; in particolare fb
xj gj=1 2 `2 .
1
Mostriamo che F è suriettiva. Data una successione fcj gj=1 2 `2 ; cioè tale
P1
P1
2
che j=1 jcj j < 1; per il Teorema di Pitagora 5.12 la serie j=1 cj ej converge
in H ad un certo elemento x; calcoliamo ora:
!
1
X
x
bj = x; ej =
ck ek ; ej =
k=1
per linearità e continuità del prodotto scalare
=
1
X
ck ek ; ej
k=1
per l’ortonormalità del sistema
= cj .
1
1
Dunque abbiamo costruito un elemento x2 H tale che fb
xj gj=1 = fcj gj=1 ;
perciò F è suriettiva.
1
L’iniettività di F segue dalla completezza del sistema ej j=1 : se x
bj = 0
8j ossia x; ej = 0 8j; allora x= 0; per de…nizione di sistema ortonormale
completo. Dunque F è lineare e biunivoca tra H e `2 . Mostriamo ora che la
serie di Fourier di x converge proprio a x. Segue ancora dalla completezza del
sistema, infatti:
!
1
X
x
(x; ek ) ek ; ej =
(5.7)
k=1
per la linearità e la continuità del prodotto scalare
= x; ej
1
X
k=1
(x; ek ) ek ; ej = x
bj
202
1
X
k=1
x
bk ek ; ej
per l’ortonormalità del sistema
=x
bj
x
bj = 0:
Dunque essendo il prodotto scalare (5.7) nullo per ogni j, per la completezza
del sistema segue che
1
X
x
(x; ek ) ek = 0; ossia
k=1
x=
1
X
k=1
x
bk ek ,
che è la convergenza della serie di Fourier.
Sapendo questo, l’uguaglianza di Plancherel segue dalla bilinearità e continuità del prodotto scalare:
0
1
1
1
1 X
1
X
X
X
x; y = @
x
bk ek ;
ybj ej A =
x
bk ybj ek ; ej =
k=1
j=1
e per l’ortonormalità
=
k=1 j=1
1
X
j=1
x
bk ybj :
In…ne, l’uguaglianza di Perceval segue dall’uguaglianza di Plancherel per y= x:
Come si vede, gli spazi di Hilbert dotati di un s.o.n.c. sono un ambiente
estremamente naturale per l’analisi di Fourier: i risultati del teorema precedente
sono infatti esaurienti e “puliti”: la serie di Fourier di qualsiasi elemento x
converge ad x, e la trasformata di Fourier è un’isometria tra spazi di Hilbert,
il che signi…ca che tutta l’informazione che identi…ca l’elemento x è codi…cata
1
nella successione numerica fb
xj gj=1 .
Si ri‡etta anche sul fatto che qualsiasi spazio di Hilbert dotato di un s.o.n.c.
risulta identi…cato, tramite la trasformata di Fourier, con lo spazio `2 ; dal punto
di vista della struttura astratta esiste quindi un solo spazio di Hilbert dotato di
s.o.n.c.!
5.4
Esercizi
Spazi di Hilbert
Esercizio 5.21 Sia X uno spazio vettoriale normato la cui norma soddisfa
l’uguaglianza del parallelogramma
2
kx + yk + kx
2
2
yk = 2 kxk + kyk
2
8x; y 2 X:
(NON si sta supponendo a priori che tale norma provenga da un prodotto
scalare).
203
a. Provare che allora vale l’uguaglianza del parallelepipedo:
2
2
2
2
kx1 + x2 + x3 k = kx1 + x2 k + kx1 + x3 k + kx2 + x3 k
2
2
8x1 ; x2 ; x3 2 X: (Perché si chiama così? Visualizzare il signi…cato geometrico
in R3 ).
b. Provare che se si de…nisce
i
1h
2
2
2
(x; y) =
kx + yk
kxk + kyk
;
(5.8)
2
questo “prodotto scalare” soddisfa e¤ ettivamente la proprietà
(u + v; w) = (u; w) + (v; w) :
c. Dal risultato del punto precedente dedurre, successivamente, le seguenti
proprietà
( u; v) = (u; v)
(nu; w) = n (u; w) per n = 1; 2; 3; :::
1
u; w
n
=
( u; v) =
1
(u; v) per n = 1; 2; 3; :::
n
(u; v) per ogni
2Q
d. Dalla de…nizione (5.8) dedurre la proprietà di continuità:
Se xn ! x in X; allora (xn ; y) ! (x; y) per ogni y 2 X:
e. Sfruttando il punto d e l’ultima proprietà del punto c, provare che:
( u; v) =
(u; v) per ogni
2 R:
Risulta così completamente dimostrato che: se in uno spazio vettoriale normato
la norma soddisfa l’uguaglianza del parallelogramma, allora necessariamente
tale norma deriva da un prodotto scalare.
Esercizio 5.22 In L2 ( 1; 1) ; si consideri il sottospazio V generato dalle funzioni:
1; x; x2 ; x3 :
Costruire una base ortonormale di V , applicando a queste 4 funzioni il metodo
di ortonormalizzazione di Gram-Schmidt.
[Osservazione: iterando questo metodo …no a una potenza n qualunque si
costruiscono i polinomi di Legendre, che studieremo in seguito].
2
Esercizio 5.23 In R si metta la misura Gaussiana d = e x dx: Si consideri
lo spazio di Hilbert H = L2 (R; d ), cioè lo spazio delle funzioni per cui si ha:
kf kL2 (R;d
)
=
Z
e
x2
R
204
1=2
2
f (x) dx
< 1:
2
kx1 k + kx2 k + kx3 k
Si consideri ora il sottospazio V generato dalle funzioni:
1; x; x2 ; x3 :
Costruire una base ortonormale di V , applicando a queste 4 funzioni il metodo
di ortonormalizzazione di Gram-Schmidt.
[Osservazione: iterando questo metodo …no a una potenza n qualunque si
costruiscono i polinomi di Hermite, che studieremo in seguito].
Esercizio 5.24 In R+ = (0; +1) si metta la misura d = e x dx: Si consideri
lo spazio di Hilbert H = L2 (R+ ; d ), cioè lo spazio delle funzioni per cui si ha:
kf kL2 (R+ ;d
)
=
Z
1=2
+1
e
x
2
f (x) dx
0
< 1:
Si consideri ora il sottospazio V generato dalle funzioni:
1; x; x2 ; x3 :
Costruire una base ortonormale di V , applicando a queste 4 funzioni il metodo
di ortonormalizzazione di Gram-Schmidt.
[Osservazione: iterando questo metodo …no a una potenza n qualunque si
costruiscono i polinomi di Laguerre, che studieremo in seguito].
Esercizio 5.25 Si supponga di eseguire i due procedimenti seguenti:
a. Nello spazio L2 (0; 1) si ortonormalizzano le funzioni 1; x; x2 ; x3 (in quest’ordine).
b. Nello spazio L2 (0; 1) si ortonormalizzano le funzioni x3 ; x2 ; x; 1; (in
quest’ordine).
Allora:
Si trovano gli stessi due insiemi di vettori. Vero o falso?
Si trovano due sistemi di vettori che generano lo stesso spazio vettoriale.
Vero o falso?
Esercizio 5.26 Esibire un sistema ortonormale completo nello spazio `2 delle
successioni reali a serie dei quadrati convergente.
Esercizio 5.27 Nello spazio di Hilbert H = L2 ((0; +1) ; e x dx), sia V0 il
sottospazio chiuso dei polinomi di grado
2. Dopo aver costruito una base
ortonormale di V0 , calcolare la proiezione su V0 della funzione f (t) = sin t.
5.5
5.5.1
Il sistema trigonometrico. Serie di Fourier in una o
più variabili
Completezza del sistema trigonometrico
Possiamo ora rivisitare con più consapevolezza alcuni concetti visti a suo tempo
nello studio delle serie di Fourier, inquadrandoli nel contesto naturale degli spazi
di Hilbert.
205
Teorema 5.28 Nello spazio L2 [
; ], il sistema trigonometrico
1 cos nx sin nx
p ; p ; p
per n = 1; 2; 3; :::
2
(5.9)
è ortonormale completo.
Questo teorema completa quindi la dimostrazione del fatto, enunciato nel
§3.5.1, che la serie di Fourier di una funzione L2 converge alla funzione stessa
in norma L2 , un fatto che è già stato usato varie volte. Ricordiamo che la
risoluzione di problemi ai limiti studiati nel §5 si è basata sulla possibilità di
sviluppare in serie di Fourier una funzione L2 (o più regolare). In un modo
o nell’altro, questi procedimenti sfruttavano tutti la completezza del sistema
trigonometrico.
Dimostrazione. L’ortonormalità si veri…ca elementarmente calcolando opportuni integrali (questo è stato fatto in Analisi 2). Proviamo la completezza. Si
tratta di dimostrare che se f 2 L2 [ ; ] è ortogonale a tutti gli elementi del
sistema trigonometrico (5.9) (il che è come dire: se f ha i coe¢ cienti di Fourier
tutti nulli) allora f è uguale a zero quasi ovunque in [ ; ] (cioè è l’elemento
nullo di L2 [ ; ]). La dimostrazione procede in due passi.
1. Prima si prova la tesi supponendo che f sia anche continua. Notiamo
anzitutto che se f è ortogonale a tutti gli elementi del sistema trigonometrico,
per linearità è ortogonale a tutte le combinazioni lineari …nite di questi elementi,
ossia: per ogni polinomio trigonometrico p (x) si ha:
Z
f (x) p (x) dx = 0:
(5.10)
Mostriamo che sotto quest’ipotesi f è identicamente nulla. Per assurdo, non lo
sia, e sia ad esempio f (x0 ) > 0 (se è < 0 il ragionamento è analogo). Per il
teorema di permanenza del segno esiste un > 0 tale che
f (x0 )
8x 2 (x0
2
Consideriamo ora il polinomio trigonometrico
f (x) >
t (x) = 1 + cos (x
; x0 + ) :
x0 )
cos :
Si veri…ca che
t (x) > 1 per jx
jt (x)j 1 per jx
x0 j <
x0 j
:
n
Inoltre se t (x) è un polinomio trigonometrico, anche t (x) lo è, per n =
1; 2; 3; :::. Perciò si ha:
Z
n
0=
f (x) t (x) dx
Z
Z
n
n
=
f (x) t (x) dx +
f (x) t (x) dx;
[
; ]\jx x0 j<
[
206
; ]\jx x0 j
ossia
Z
[
n
f (x) t (x) dx =
; ]\jx x0 j
Z
[
n
f (x) t (x) dx:
; ]\jx x0 j<
Ora, il primo membro dell’uguaglianza rimane limitato al crescere di n, perché:
Z
Z
n
n
f (x) t (x) dx
jf (x)j jt (x)j dx
[
; ]\jx x0 j
[
; ]\jx x0 j
[
; ]\jx x0 j
Z
jf (x)j dx;
Mostriamo invece che il secondo membro tende a 1 per n ! 1 (da cui l’assurdo). Scegliamo un intervallo [a; b] contenuto nell’insieme [ ; ] \ jx x0 j < ;
su [a; b] la funzione t (x) avrà minimo m > 1, perciò
Z
Z
f (x0 )
n
n
t (x) dx
f (x) t (x) dx
2
[
; ]\jx x0 j<
[
; ]\jx x0 j<
Z
Z b
f (x0 ) b
f
(x
)
f (x0 )
0
n
t (x) dx
mn dx =
(b a) mn ! 1 per n ! 1:
2
2
2
a
a
Questo dimostra il teorema nel caso f continua.
2. Sia ora f 2 L2 [ ; ] tale che per ogni polinomio trigonometrico p (x)
vale (5.10). De…niamo
Z
x
F (x) =
f (t) dt:
Per il Teorema fondamentale del calcolo integrale per l’integrale di Lebesgue (di
cui non abbiamo parlato in precedenza) la funzione F risulta essere continua,
derivabile quasi ovunque, con F 0 (x) = f (x) quasi ovunque; inoltre, un integrale
Rb
F g 0 si può calcolare per parti, se g 2 C 1 (a; b). Calcoliamo allora i coe¢ cienti
a
di Fourier di F .
Z
Z
sin (nx)
sin (nx)
F (x)
f (x) dx = 0
F (x) cos (nx) dx =
n
n
perché il primo addendo è nullo in quanto sin ( n ) = 0; il secondo è nullo
perché f ha coe¢ cienti di Fourier nulli.
Z
Z
cos (nx)
cos (nx)
F (x) sin (nx) dx =
+
F (x)
f (x) dx =
n
n
poiché f ha coe¢ cienti di Fourier nulli
=
perché: F (
cos (n )
cos (n )
F ( )+
F(
n
n
)=0
) = 0 per de…nizione di F come funzione integrale, e
Z
a0
F( )=
f (t) dt =
= 0:
2
207
In de…nitiva, la funzione F ha nulli i coe¢ cienti di Fourier Ak Re Bk per k 1,
mentre non è necessariamente vero che sia A0 = 0; cioè che sia
F (t) dt = 0.
Consideriamo però la funzione
Z
1
A0
= F (x)
F (t) dt:
F (x)
2
2
Questa funzione per de…nizione ha integrale nullo su [ ; ], e d’altro canto
continua ad avere gli altri coe¢ cienti di Fourier nulli. Ne segue che F (x) A20
ha tutti i coe¢ cienti di Fourier nulli, ed è una funzione continua; per la prima
parte della dimostrazione, allora, F (x) A20 è identicamente nulla. Ne segue
che
0
A0
f (x) = F (x)
= 0 quasi ovunque,
2
che è la tesi.
In base al teorema precedente e al Teorema 5.19, possiamo concludere il
risultato di convergenza in L2 [ ; ] delle serie di Fourier:
Teorema 5.29 Sia f 2 L2 [ ; ] ; de…niamo
Z
1
ak =
f (x) cos nxdx per n = 0; 1; 2; 3:::
2
Z
1
bk =
f (x) sin nxdx per n = 1; 2; 3; ::
2
Allora la serie di Fourier di f
1
a0 X
+
(an cos nx + bn sin nx)
2
n=1
converge ad f in L2 [ ; ] : Esplicitamente, questo signi…ca che:
"
#2
Z
n
a0 X
f (x)
+
(ak cos kx + bk sin kx)
dx ! 0 per n ! 1:
2
k=1
Naturalmente serie e coe¢ cienti di Fourier si possono adattare ad un intervallo [a; b] qualsiasi (v. [An2, Cap. 7, §3.4]).
La teoria degli spazi di Hilbert fornisce un risultato semplice e generale sulla
convergenza delle serie di Fourier in L2 . Naturalmente è anche interessante
sapere se la serie di Fourier converge puntualmente (cosa che non segue dalla
convergenza in L2 ). In realtà, il problema della convergenza puntuale è il primo
che si è posto, storicamente, col sorgere stesso della teoria delle serie di Fourier
(1822, Fourier, trattato “Teoria analitica del calore”). Il primo studio rigoroso
sulla convergenza puntuale delle serie di Fourier è dovuto a Dirichlet nel 1829.
Si tratta di un problema fondamentale per l’analisi armonica, di cui abbiamo
detto qualcosa nei richiami del §3.5. Per qualche dettaglio sullo studio della
convergenza puntuale delle serie di Fourier si rimanda a [An2, Cap. 7, §3.6] o a
[Fo, Chap.8, §8.5].
208
5.5.2
Serie di Fourier in più variabili
n
Si possono anche de…nire le serie di Fourier in n variabili, sull’insieme [ ; ] (e
quindi, riscalando il sistema trigonometrico, su qualunque “n-parallelepipedo”).
2
Ad esempio, in due variabili si può sviluppare una funzione f (x; y) 2 L2 [ ; ]
in serie di Fourier doppia. Vediamo prima il seguente risultato astratto:
1
Teorema 5.30 Sia fen (x)gn=1 un sistema ortonormale completo in L2 [
1
Allora fen (x) em (y)gn;n=1 è un sistema ortonormale completo in L2 [
; ]:
2
; ]
.
Dimostrazione. L’ortonormalità si veri…ca facilmente: per (n; m) 6= (n1 ; m1 )
risulta
Z Z
(en (x) em (y) en1 (x) em1 (y)) dxdy
Z
Z
=
en (x) en1 (x) dx
em (y) em1 (y) dy = 0
perché almeno uno dei due integrali è zero, essendo n 6= m o n1 6= m1 ; mentre
Z Z
Z
Z
2
2
jen (x) em (y)j dxdy =
jen (x)j dx
jem (y)j dy = 1 1 = 1:
Quanto alla completezza, sia f 2 L2 [
Z
Z
2
; ]
e supponiamo che sia
f (x; y) en (x) em (y) dxdy = 0 per ogni n; m:
Fissiamo m e consideriamo la funzione
Z
gm (x) =
f (x; y) em (y) dy:
Questa funzione sta in L2 [
Z
2
; ] ; perché
jgm (x)j dx =
Z
Z
2
f (x; y) em (y) dy dx
applicando nell’integrale interno la disuguaglianza di Cauchy-Schwarz
Z
Z
Z
2
2
jf (x; y)j dy
jem (y)j dy dx
Z Z
2
2
=
jf (x; y)j dydx = kf kL2 ([ ; ]2 ) < 1:
Inoltre gm ha tutti i coe¢ cienti di Fourier nulli rispetto al sistema fen (x)g,
dunque gm (x) = 0 quasi ovunque. Questo, per de…nizione di gm ; signi…ca che
209
per quasi ogni x …ssato la funzione y 7! f (x; y) ha tutti i coe¢ cienti di Fourier
nulli rispetto al sistema fem (y)g ; dunque per q.o. x e per q.o. y è f (x; y) = 0.
Questo prova la completezza del sistema.
La scrittura esplicita del sistema trigonometrico in due variabili è resa complicata dal fatto che occorre moltiplicare ognuna delle tre funzioni
1 cos nx sin nx
p ; p ; p
2
per ognuna delle tre funzioni
1 cos my sin my
p ; p ; p ;
2
mentre viene molto più semplice usando la scrittura complessa
einx
p
2
n2Z
e quindi, in due variabili,
ei(nx+my)
2
2
In questo caso si pone, per f 2 L2 [
fbn;m =
1
2
(2 )
Z
Z
:
n;m2Z
; ]
f (x; y) e
i(nx+my)
dxdy per n; m 2 Z
e si ha quindi
f (x; y) =
+1
X
n;m= 1
fbn;m ei(nx+my)
2
con convergenza della serie in L2 [ ; ] . Più esplicitamente, una nozione
di convergenza di una serie de…nita da due indici interi relativi richiede una
de…nizione precisa di somma parziale. Tale de…nizione non è univoca; ad esempio è corretto a¤ermare che, se de…niamo
X
sN (x; y) =
fbn;m ei(nx+my) per N = 0; 1; 2; :::
jnj+jmj N
allora risulta
kf
sN kL2 ([
; ]2 )
! 0 per N ! +1:
Una delle possibili applicazioni delle serie di Fourier in due variabili è alla
compressione delle immagini. Un’immagine in scala di grigi si può vedere come
una funzione f (x; y) de…nita in un rettangolo a valori in [0; 1], dove il valore
f (x; y) rappresenta l’intensità di grigio nel punto (pixel) (x; y), quindi f = 0
210
vuol dire punto bianco e f = 1 punto nero. Una somma di Fourier parziale
di f immagazzina (in modo approssimato) l’informazione dell’immagine in un
numero limitato di coe¢ cienti di Fourier.
Tutto questo si generalizza a funzioni di n variabili in modo naturale:
n
se f 2 L2 ([ ; ] ) possiamo de…nire, per ogni k = (k1 ; k2 ; :::; kn ) 2 Zn i
coe¢ cienti di Fourier
Z
b
fk =
f (y) e ik y dy
[
ossia, esplicitamente,
Z
b
f(k1 ;k2 ;:::;kn ) =
; ]n
[
; ]n
f (y1 ; :::; yn ) e
i(k1 y1 +k2 y2 +:::+kn yn )
La serie di Fourier di f sarà la serie (in n indici da
+1
X
k1 ;k2 ;:::;kn = 1
dy1 :::dyn :
1 a +1)
fb(k1 ;k2 ;:::;kn ) eik y
che converge in norma L2 a f nel seguente senso. Posto:
X
fb(k1 ;k2 ;:::;kn ) eik x
sN (x) =
jk1 j+jk2 j+:::+jkn j<N
risulta
ksN
5.6
f kL2 ([
; ]n )
! 0 per N ! 1:
Base di Haar e wavelets
Nell’utilizzo dell’analisi di Fourier per approssimare un segnale periodico, il
sistema trigonometrico ha, insieme a tanti pregi, un paio di difetti.
1. I polinomi trigonometrici sono funzioni continue e regolari, perciò una
serie di Fourier approssima male una funzione discontinua. L’approssimazione in
L2 rimane, ma non possiamo certamente aspettarci una buona approssimazione
puntuale vicino a un punto di discontinuità.
2. L’approssimazione con polinomi trigonometrici ha una natura globale:
supponiamo di voler approssimare una funzione f 2 L2 [ ; ] che ha un gra…co
“semplice e liscio”in [ ; 0] e piuttosto frastagliato in [0; ]. A¢ nché la somma
parziale di Fourier segua bene il gra…co di f in [0; ] noi dovremo aumentare il
numero di termini, i cui coe¢ cienti sono stati calcolati in base al comportamento
di f su tutto [ ; ]; questo signi…ca che l’unico modo di migliorare i dettagli
dell’approssimazione in [0; ] è quello di aumentare i dettagli in tutto [ ; ];
non possiamo ra¢ nare l’approssimazione su una sola parte dell’intervallo.
Per ovviare a questi due difetti, e in particolare al secondo, si possono utilizzare altri tipi di sistemi ortonormali completi di L2 [ ; ], che hanno la proprietà di permettere un’analisi su scale diverse in parti diverse dell’intervallo, o
211
come si dice, fare una “analisi multirisoluzione”. Sistemi di questo tipo sono le
wavelets. Ce ne sono di molti tipi, presentiamo qui il più semplice. Rimandiamo
a [HN, §7.6] per qualche dettaglio in più su quanto spiegato qui di seguito, e a
[BN] per una trattazione più approfondita.
Ci mettiamo ora nell’intervallo [0; 1]. De…niamo la “funzione madre”
8
per 0 x < 12
< 1
1 per 12 x < 1
(x) =
:
0
altrimenti
e la seguente famiglia di funzioni ottenute traslando e riscalando la funzione
madre:
n;k
(x) = 2n=2 (2n x
k) per k = 0; 1; 2; :::; 2n
1; n = 0; 1; 2; 3; :::
Visualizziamo i gra…ci di alcune di queste funzioni.
Ad esempio per n = 2 e quindi k = 0; 1; 2; 3 si ha:
Confrontiamo invece tra loro funzioni
212
n;k
per diversi valori di n. I gra…ci
di
n;k
per i valori n = 1; 2; 3; 4; sono:
Notiamo che per tutte le funzioni n;k si ha
Z 1
Z 1
2
n;k (x) dx = 0 e
n;k (x) dx = 1:
0
0
E’ facile rendersi conto che il prodotto tra due funzioni diverse tra le n;k o
è identicamente nullo oppure è una delle due moltiplicata per una costante;
perciò queste funzioni sono anche a due a due ortogonali. Poiché tutte queste
funzioni hanno media nulla, se vogliamo sperare di avere un sistema ortonormale
completo è necessario aggiungere almeno una funzione che non abbia media
nulla: la costante 1 va bene. Vale il seguente
Teorema 5.31 Il sistema di funzioni
f1;
n;k gk=0;1;2;:::;2n 1;n=0;1;2;3:::
è ortonormale completo in L2 [0; 1] :
Dimostrazione. L’ortonormalità è stata sostanzialmente dimostrata. Per la
completezza, ci limitiamo a segnalare che si può dimostrare che questo sistema
di funzioni è denso nell’insieme delle funzioni semplici (cioè misurabili e che
assumono un numero …nito di valori), che a sua volta è denso in L2 [0; 1].
Dalla completezza del sistema precedente segue:
Teorema 5.32 Per f 2 L2 [0; 1] de…niamo:
Z 1
fb0 =
f (x) dx
0
fbn;k =
Z
1
f (x)
n;k
(x) dx per n = 0; 1; 2; 3::: e k = 0; 1; 2; :::; 2n
0
213
1;
allora la serie
n
converge a f in L2 [0; 1].
fb0 +
1 2X1
X
n=0 k=0
fbn;k
n;k
(x)
Poiché le n;k ; e quindi ogni loro somma parziale, è una funzione discontinua,
ci aspettiamo che questo tipo di serie possa approssimare bene anche funzioni
con discontinuità; l’altra faccia della medaglia è che la somma parziale sarà
sempre discontinua, anche quando la funzione da approssimare è continua. Soprattutto però il pregio di questa approssimazione è la sua localizzabilità: ogni
n;k è diversa da zero solo su un intervallino, perciò scegliendo opportunamente
i termini n;k possiamo aumentare il dettaglio dell’approssimazione di f in un
tratto speci…co dell’intervallo [0; 1].
Esempio 5.33 Sia
f (x) =
per x 2 0; 14
per x 2 ( 14 ; 1]:
1 x2
log x
Allora il gra…co di f insieme a quello della sua somma parziale
n
fb0 +
3 2X1
X
n=0 k=0
fbn;k
n;k
(x)
(che in tutto ha 16 termini) è il seguente:
Si osserva che nel “gradino” di f l’approssimante segue il salto senza problemi.
D’altro canto l’approssimante è “a gradini” anche nei tratti continui di f . A
titolo di confronto il gra…co di f insieme alla sua somma parziale di Fourier
8
a0 X
+
(an cos (2 nx) + bn sin (2 nx))
2
n=0
214
(che ha in tutto 17 termini) è il seguente:
Un esempio signi…cativo di problema di compressione delle immagini in cui si
è rivelato utile l’uso di wavelets in due variabili è la digitalizzazione dell’archivio
di impronte digitali compiuto dall’FBI negli anni 1990. Una lettura interessante
in tal senso è il saggio [OY].
215
6
Applicazioni dei metodi di ortogonalità a problemi di¤erenziali
6.1
Problemi di Sturm-Liouville e polinomi ortogonali
Come sottoproblema di due problemi ai limiti risolti per separazione di variabili
nel §5 (equazione del calore sul segmento, equazione della corda vibrante …ssata
agli estremi), ci siamo trovati di fronte ad un problema agli autovalori del tipo36 :
y 00 (x) + y (x) = 0 per x 2 [0; L]
y (0) = 0 = y (L)
dove a priori sono incogniti sia la funzione y (x) che il numero . Si trova che
necessariamente dev’essere:
n2 2
per n = 1; 2; 3; :::
L2
n x
yn (x) = sin
:
L
n
=
Il problema agli autovalori ha quindi:
1
1) una successione di autovalori positivi f n gn=1 che tende a +1;
2) una successione di yn corrispondenti, che risultano formare un sistema
ortogonale completo di L2 [0; L].
Quest’a¤ermazione ci è familiare in quanto si tratta del “solito” sistema
trigonometrico. Ma ora è interessante vedere questo fenomeno sotto una luce
diversa: queste funzioni sono un sistema ortogonale completo proprio perché
sono il sistema delle autofunzioni di un problema di¤erenziale ai limiti di un certo
tipo. Esiste cioè una teoria generale di problemi agli autovalori per equazioni
di¤erenziali ordinarie, di cui l’esempio appena discusso è un caso particolare, che
porta a fabbricare sistemi ortonormali completi di L2 [a; b] costituiti da sistemi
di autofunzioni. Daremo ora qualche cenno di questa teoria.
De…nizione 6.1 (Problema di Sturm-Liouville) Si consideri il problema agli
autovalori, detto di Sturm-Liouville:
d
dx
p (x) du
q (x) u +
dx
u (a) = u (b) = 0
(x) u = 0 per x 2 (a; b)
(6.1)
dove a; b 2 R e le funzioni p; q; sono coe¢ cienti assegnati soddisfacenti le
ipotesi: p 2 C 1 (a; b) ; p (x) > 0 in [a; b] ; q 2 C 0 (a; b) ; q (x)
0 in [a; b] ; 2
C 0 (a; b) ; (x) > 0 in [a; b]. Sotto queste ipotesi il problema di Sturm-Liouville
si dice regolare.
Vale in proposito il seguente
3 6 Nel caso del Laplaciano sul cerchio invece la stessa equazione valeva su [0; 2 ] ; con
condizione di periodicità y (0) = y (2 ).
216
Teorema 6.2 Dato un problema di Sturm-Liouville regolare (6.1) esistono:
1
1) una successione di autovalori f n gn=1 tutti positivi, successione crescente
e tendente a +1;
1
2) una successione di autofunzioni fun gn=1 corrispondenti, che costituiscono
un sistema ortonormale completo dello spazio di Hilbert L2 ((a; b) ; (x) dx).
Esplicitamente, questo signi…ca che la misura è la misura pesata d
(x) dx; quindi ortogonalità signi…ca che
Z
b
=
0 per n 6= m
1 per n = m:
un (x) um (x) (x) dx =
a
Dimostriamo solo le più semplici delle a¤ermazioni fatte:
(i) gli autovalori sono tutti positivi;
(ii) due autofunzioni relative a due autovalori distinti sono tra loro ortogonali.
Per provare (i), sia (u; ) una coppia autofunzione-autovalore; moltiplichiamo l’equazione
0
(pu0 )
qu + u = 0
per u e integriamo in (a; b). Si ha:
Z
a
b
h
0
(pu0 ) u
qu2 +
Z
b
i
u2 dx = 0
u2 dx =
a
Z
b
0
(pu0 ) udx +
a
Z
b
qu2 dx
a
e calcolando per parti il primo integrale a secondo membro:
Z b
Z b
Z b
b
2
0 0
0
0
0
(pu ) udx = [ (pu ) u]a +
(pu ) u dx =
p (u0 ) dx
a
a
a
perché u (b) = u (a) = 0. Ne segue:
=
Rb
a
Rb
2
p (u0 ) dx + a qu2 dx
>0
Rb
u2 dx
a
essendo per ipotesi p e positive in [a; b], q 0 e u non identicamente nulla.
(ii) Supponiamo che (u; ) ; (v; ) siano due coppie autofunzione-autovalore,
e proviamo che u; v sono ortogonali in L2 ((a; b) ; (x) dx). Scriviamo perciò:
0
(pu0 )
0
(pv 0 )
qu +
qv +
u=0
v = 0:
Moltiplichiamo la prima equazione per v, la seconda per u e sottraiamo membro
a membro. Otteniamo:
0
(pu0 ) v
0
(pv 0 ) u + (
) uv = 0 in (a; b) ;
217
da cui
(
)
Z
b
uv dx =
a
integrando per parti
= [pv 0 u
Z
h
b
a
Z
b
pu0 v]a
0
(pv 0 ) u
i
0
(pu0 ) v dx =
b
[pu0 v 0
pv 0 u0 ] dx = 0
a
perché l’integrale ha integranda identicamente nulla e [pv 0 u
condizioni agli estremi su u e v. Quindi si ottiene
(
)
Z
b
pu0 v]a = 0 per le
b
uv dx = 0;
a
ed essendo per ipotesi
6=
si ha
Rb
a
uv dx = 0; che è l’ortogonalità voluta.
Il problema dell’esempio iniziale rientra evidentemente in questo caso, con
p = = 1; q = 0. Ci sono altri esempi di problemi di Sturm-Liouville che si
incontrano nelle applicazioni (ad esempio, ma non solo, risolvendo per separazione di variabili dei problemi ai limiti per equazioni a derivate parziali). Il
Teorema 6.2 descrive in un certo senso la “situazione ideale”. Purtroppo spesso
i problemi di Sturm-Liouville che nascono dalle applicazioni per un motivo o per
l’altro non soddisfano tutte le ipotesi di quel teorema (e si dicono allora problemi di Sturm-Liouville singolari ); in vari casi signi…cativi, comunque, si riesce
ancora a dimostrare, con tecniche ad hoc, che gli stessi risultati valgono ancora.
Presentiamo tre problemi di Sturm-Liouville singolari che hanno applicazioni
importanti.
1. Equazione di Legendre
E’l’equazione
1
x2 y 00
2xy 0 + y = 0
per x 2 ( 1; 1)
(6.2)
che si può riscrivere nella forma
1
x2 y 0
0
+ y = 0.
Si tratta di un problema di Sturm-Liouville su [ 1; 1] con p (x) = 1 x2 ; q (x) =
0; (x) = 1. Il problema è reso singolare dal fatto che il coe¢ ciente p (x) si annulla negli estremi del segmento. La funzione peso è 1, quindi lo spazio di
Hilbert da considerare è L2 ( 1; 1) (con la misura di Lebesgue dx). Rivisitando
la dimostrazione precedente di ortogonalità si osserva che in questo caso non
occorre imporre le condizioni y ( 1) = 0 = y (1) per ottenere l’ortogonalità
di autofunzioni relative ad autovalori diversi. Infatti il termine di integrazione
1
[pu0 v pv 0 u] 1 è nullo a grazie a p (x). Si dimostra il seguente teorema:
218
Teorema 6.3 L’equazione di Legendre ha soluzioni C 2 [ 1; 1] solo in corrispondenza di una successione di autovalori n = n (n + 1) per n = 0; 1; 2; 3; :::; detta
Pn (x) l’autofunzione corrispondente a n , normalizzata in L2 [ 1; 1], si ha che:
Pn (x) è un polinomio di grado n;
1
il sistema fPn (x)gn=0 è ortonormale completo in L2 ( 1; 1).
Dimostrazione. Cerchiamo soluzioni dell’equazione in forma di serie di potenze (metodo di Frobenius):
y (x) =
y 0 (x) =
y 00 (x) =
1
X
n=0
1
X
n=1
1
X
cn xn
ncn xn
1
1) cn xn
n (n
2
n=2
e sostituiamo nell’equazione:
0 = 1 x2 y 00 2xy 0 + y
1
1
X
X
n 2
=
n (n 1) cn x
n (n
=
n=2
1
X
n
1) cn x
n=2
(n + 2) (n + 1) cn+2 xn
2
1
X
n
ncn x +
n=1
1
X
n (n
1) cn xn
cn xn
n=0
2
1
X
ncn xn +
n=1
n=2
n=0
1
X
n
1
X
cn xn :
n=0
Uguagliando a zero il coe¢ ciente di x per ciascun n si ottengono le seguenti
(il modo in cui gli indici variano nelle diverse serie costringe a distinguere i casi
n = 0, n = 1, n 2):
(n + 2) (n + 1) cn+2
ossia
cn+2 =
n (n
2c2 + c0 = 0
6c3 2c1 + c1 = 0
1) cn 2ncn + cn = 0
[n (n + 1)
]
cn per n = 0; 1; 2; :::
(n + 2) (n + 1)
(6.3)
Questo mostra che possiamo scegliere liberamente i coe¢ cienti c0 ; c1 , dopo di
che la soluzione risulta determinata. Dunque per ciascun …ssato si può scrivere
l’integrale generale dell’equazione, dipendente da due costanti arbitrarie. Le due
soluzioni indipendenti saranno, rispettivamente, una serie di potenze dispari e
una serie di potenze pari.
Occorre però controllare che le serie di potenze che assegnano la soluzione
in e¤etti convergano. Poiché
cn+2
[n (n + 1)
]
=
! 1;
cn
(n + 2) (n + 1)
219
leggiamo due cose: le serie di potenze hanno raggio 1, quindi in e¤etti si è scritto
l’integrale generale in ( 1; 1); d’altro canto per x ! 1 in generale sarà y (x)
illimitata.
Il nostro problema agli autovalori, invece, per sua natura ci richiede di determinare soluzioni che siano regolari in tutto [ 1; 1] (come vedremo, è questo
quello che serve quando l’equazione di Legendre nasce nel risolvere un problema
di¤erenziale più complesso). Osservando ancora la formula (6.3) che assegna
i coe¢ cienti si vede che la serie termina se = n (n + 1). In questo caso si
trova una sola soluzione limitata, polinomio di grado n: il polinomio di Legendre Pn (x). Si può dimostrare che, se la serie non termina, la funzione y (x)
e¤ettivamente risulta illimitata (e quindi non accettabile come soluzione) per
x ! 1.
Abbiamo così determinato autovalori e autosoluzioni; l’ortogonalità segue
dalla dimostrazione generale già fatta per un problema di Sturm-Liouville regolare. La completezza segue dal seguente argomento. E’ noto che lo spazio
dei polinomi è denso nello spazio C 0 [ 1; 1] (teorema di Stone-Weierstrass); è
anche noto che lo spazio C 0 [ 1; 1] è denso in L2 [ 1; 1]; ne segue che lo spazio
dei polinomi è denso in L2 [ 1; 1]; dunque ogni funzione L2 [ 1; 1] può essere
approssimato bene quanto vogliamo mediante polinomi, e quindi combinazioni
lineari di polinomi di Legendre. Perciò il sistema dei polinomi di Legendre è
completo.
Sappiamo dunque che:
1
0
x2 Pn0 (x) + n (n + 1) Pn (x) = 0.
Sapendo che Pn sono polinomi e sono ortonormali in L2 ( 1; 1) possiamo
anche determinare esplicitamente questi polinomi, con una procedura iterativa,
ortonormalizzando il sistema di polinomi 1; x; x2 ; x3 ; ::: . Si trova:
1
P0 (x) = p ;
2
r
3
P1 (x) =
x;
2
r
1 5
P2 (x) =
3x2 1 ;
2 2
r
7
3
5
P3 (x) =
x + x3 ;
2
2
2
:::
Si può dimostrare anche la seguente formula generale:
q
n + 12 dn
n
x2 1 :
Pn (x) =
2n n! dxn
220
I polinomi di Legendre, come molte altre funzioni speciali, si trovano implementati in software di calcolo scienti…co oltre che riportati e tabulati su molti
testi.
Di seguito i gra…ci dei primi 6 polinomi Pn (x) (n = 0; 1; 2; 3; 4; 5). Si noti
che Pn (x) ha n zeri in [ 1; 1].
Il fatto di conoscere un sistema ortonormale completo in L2 [ 1; 1] costituito
da polinomi o¤re un metodo per approssimare una generica funzione L2 [ 1; 1]
mediante polinomi di grado n. Anche se l’approssimazione è in L2 [ 1; 1], quando la funzione da approssimare è continua o regolare ci aspettiamo una buona
approssimazione anche puntuale, che sarà di tipo globale sull’intervallo [ 1; 1],
anziché di tipo locale come ad esempio l’approssimazione mediante il polinomio
di Taylor. I polinomi di Legendre sono quindi importanti nella teoria dell’approssimazione di funzioni, oltre al fatto che l’equazione di Legendre compare
come sottoproblema nella risoluzione di certi problemi ai limiti per equazioni a
derivate parziali mediante separazione di variabili.
Data una funzione f 2 L2 [ 1; 1] ; i suoi coe¢ cienti di Fourier rispetto al
1
sistema fPn (x)gn=0 sono de…niti da:
cn =
Z
1
f (y) Pn (y) dy
1
221
e portano allo sviluppo
f (x) =
1
X
cn Pn (x) :
n=0
Esempio 6.4 Sia f (x) = ex sin x: Calcoliamo la somma parziale n = 4 della
serie di f (x) in polinomi di Legendre. Si trova:
Il ra¤ ronto tra i gra…ci di f e
P4
n=0 cn Pn
(x) è il seguente:
2. Equazione di Laguerre
E’l’equazione
xy 00 + (1
x) y 0 + y = 0
per x 2 (0; +1)
che si può riscrivere nella forma
xe
x 0 0
y
+ e
x
y = 0 per x 2 (0; +1) :
Si tratta di un problema di Sturm-Liouville su (0; +1) con p (x) = (xe x ) ; q (x) =
0; (x) = e x . Il problema è reso singolare dal fatto che l’equazione non è
su un segmento ma su una semiretta e il coe¢ ciente p (x) si annulla in 0 e
a +1. La funzione peso è e x , quindi lo spazio di Hilbert da considerare è
L2 ((0; +1) ; e x dx). Anche in questo caso non occorre imporre condizioni agli
estremi per ottenere l’ortogonalità di autofunzioni relative ad autovalori diversi.
Si dimostra il seguente teorema:
Teorema 6.5 L’equazione di Laguerre ha soluzioni in L2 ((0; +1) ; e x dx) (cioè:
che all’in…nito non vanno +1 troppo rapidamente) solo in corrispondenza di
una successione di autovalori n = n per n = 0; 1; 2; 3; ::: La soluzione Ln (x)
dell’equazione di Laguerre corrispondente a n = n è un polinomio di grado n;
1
il sistema fLn (x)gn=0 è ortonormale completo in L2 ((0; +1) ; e x dx).
222
Dimostrazione (traccia). La tecnica della dimostrazione, nella sua parte
costruttiva, è simile a quella vista per l’equazione di Legendre: si cerca una
soluzione per serie, si ottiene una legge ricorsiva sui coe¢ cienti, in questo caso:
cn+1 =
Poiché
n
2 cn :
(n + 1)
cn+1
cn
1
! 0;
n
la serie di potenze converge in tutto R, ossia una soluzione regolare su tutto
1
1
(0; +1) si trova per ogni ; però la stima cn+1
cn
n porta cn
n! e quindi una
x
2
soluzione con crescita del tipo e , che pertanto non sarebbe L ((0; +1) ; e x dx);
per ottenere l’appartenenza a questo spazio è necessario che la serie termini, il
che accade per = n intero non negativo. In questo caso la soluzione è un
polinomio di grado n. La dimostrazione già vista prova l’ortogonalità. Non
discutiamo del modo in cui si dimostra la completezza.
Esplicitamente, il teorema a¤erma che:
x
xe
con
Z
0
L0n (x) + ne
x
Ln (x) = 0 per x 2 (0; +1)
+1
Ln (x) Lm (x) e
x
1 se n = m
0 se n 6= m.
dx =
0
Anche in questo caso è possibile scrivere i primi polinomi di Laguerre ortonormalizzando le funzioni 1; x; x2 ; x3 ; ::: nello spazio L2 ((0; +1) ; e x dx). Si
trova:
L0 (x) = 1
L1 (x) = 1
x;
L2 (x) = 1
2x +
x2
;
2
3
3x + x2
2
L3 (x) = 1
x3
;
6
:::
Si dimostra anche la seguente formula esplicita:
Ln (x) =
ex dn
e
n! dxn
Data una funzione f 2 L2 ((0; +1) ; e
1
al sistema fLn (x)gn=0 sono dati da
cn =
Z
x
x n
x
.
dx) ; i suoi coe¢ cienti di Fourier rispetto
+1
f (x) Ln (x) e
0
223
x
dx
e portano allo sviluppo
f (x) =
1
X
cn Ln (x)
n=0
Si ri‡etta sul fatto che quando una funzione f viene approssimata in L2 ((0; +1) ; e
con la somma parziale Sn della sua serie di polinomi di Laguerre, ciò che viene
reso piccolo è l’integrale:
Z +1
2
jf (x) Sn (x)j e x dx
0
perciò dal punto di vista visivo è meglio confrontare il gra…co di f (x) e x=2 con
quello di Sn (x) e x=2 (il quadrato di questa di¤erenza è piccola). Le funzioni
(non polinomiali)
Ln (x) e x=2
si dicono funzioni di Laguerre. I loro gra…ci per i primi valori di n sono i seguenti.
Si osservi che Ln (x) ha n zeri in (0; +1):
Esempio 6.6 Sia f (x) = x sin x: Calcoliamo la somma parziale n = 10 della
serie di f in polinomi di Laguerre. Il ra¤ ronto tra il gra…co di f (x) e x=2 e
224
x
dx)
P10
n=0 cn Ln
(x) e
x=2
è il seguente:
3. Equazione di Hermite
E’l’equazione:
y 00 2xy 0 + y = 0 per x 2 R
che si può riscrivere nella forma
e
x2 0
y
0
+ e
x2
y=0
2
Si tratta di un problema di Sturm-Liouville su R con p (x) = e x ; (x) = e
reso singolare dal fatto che l’equazione non è sul segmento ma sulla retta.
x2
,
2
Teorema 6.7 L’equazione di Hermite ha soluzioni in L2 R; e x dx (cioè:
che all’in…nito non vanno a +1 troppo rapidamente) solo in corrispondenza
di una successione di autovalori n = 2n per n = 0; 1; 2; 3; ::: La soluzione
Hn (x) dell’equazione di Hermite corrispondente a n = 2n, normalizzata in
2
1
L2 R; e x dx , è un polinomio di grado n; il sistema fHn (x)gn=0 è ortonormale completo in L2 R; e
x2
dx .
Dimostrazione (traccia). La tecnica della dimostrazione è ancora simile: si
cercano soluzioni per serie di potenze, si arriva alla seguente legge ricorsiva sui
coe¢ cienti:
(2n
)
cn+2 =
cn .
(n + 2) (n + 1)
Poiché
cn+2
(2n
)
=
! 0;
cn
(n + 2) (n + 1)
per il criterio del rapporto la serie di potenze converge su tutto R. Quindi per
ogni esistono due soluzioni linearmente indipendenti de…nite su tutto R. Se
225
= 2n per n intero non negativo, allora la serie termina e diventa un polinomio
di grado k. Se la serie non termina, un’analisi dell’ordine di grandezza dei
coe¢ cienti mostra che la soluzione all’in…nito crescerebbe più velocemente di
2
2
ex =2 , quindi non apparterrebbe a L2 R; e x dx . Le uniche soluzioni in questo
spazio sono quindi quelle polinomiali corrispondenti a = 2n: L’ortogonalità
segue come nell’argomento generale, sfruttando il fatto che il coe¢ ciente p (x)
si annulla a 1. Non discutiamo la dimostrazione di completezza.
Esplicitamente, il teorema a¤erma che:
e
con
Z
x2
0
Hn0 (x)
+ 2ne
+1
x2
Hn (x) Hm (x) e
x2
Hn (x) = 0
dx =
1
1 se n = m
0 se n 6= m.
Anche in questo caso è possibile scrivere i primi polinomi di Hermite ortonor2
malizzando le funzioni 1; x; x2 ; x3 ; ::: nello spazio L2 R; e x dx . Si trova:
1
H0 (x) =
H1 (x) =
1=4
p
2
1=4
x;
2 + 4x2
p
;
2 2 1=4
12x + 8x3
p
H3 (x) =
;
4 3 1=4
:::
H2 (x) =
Si dimostra anche la seguente formula esplicita:
n
n
2 d
( 1)
Hn (x) = pp
ex
e
dxn
2n n!
Data una funzione f 2 L2 R; e
sistema
1
fHn (x)gn=0
x2
x2
dx ; i suoi coe¢ cienti di Fourier rispetto al
sono dati da
cn =
Z
.
+1
f (x) Hn (x) e
1
e portano allo sviluppo
f (x) =
1
X
cn Hn (x)
n=0
226
x2
dx
2
Ancora, quando una funzione f viene approssimata in L2 R; e x dx con la
somma parziale Sn della sua serie di polinomi di Hermite, ciò che viene reso
piccolo è l’integrale:
Z
+1
1
jf (x)
2
Sn (x)j e
x2
dx
2
perciò dal punto di vista visivo è meglio confrontare il gra…co di f (x) e x =2 con
2
quello di Sn (x) e x =2 (il quadrato di questa di¤erenza è piccola). Le funzioni
(non polinomiali)
2
Hn (x) e x =2
si dicono funzioni di Hermite. I loro gra…ci per i primi valori di n sono i seguenti.
Si osservi che Hn (x) ha n zeri in R.
Esempio 6.8 Sia f (x) = ex sin x. Calcoliamo la somma parziale Sn (x) per
n = 5 della serie di f (x) in polinomi di Hermite. Il ra¤ ronto tra i gra…ci di
227
f (x) e
6.2
x2 =2
e Sn (x) e
x2 =2
è il seguente:
Esercizi
Polinomi ortogonali e problemi di Sturm-Liouville
Esercizio 6.9 Determinare il polinomio di grado
3 che meglio approssima
sin x in L2 ( 1; 1). Suggerimento: usare i polinomi di Legendre, calcolandoli
dalla formula
q
n+
Pn (x) =
2n n!
1
2
dn
x2
dxn
1
n
:
Esercizio 6.10 Dimostrare l’ortogonalità delle autosoluzioni relative ad autovalori distinti per l’equazione di Laguerre:
xe
x 0 0
y
+ e
x
y = 0 per x 2 (0; +1) :
Esercizio 6.11 Risolvere il seguente problema di Sturm-Liouville regolare, determinando autovalori e autofunzioni:
0
(xy 0 ) + xy = 0 per x 2 (1; 2)
y (1) = y (2) = 0:
Suggerimento: per prima cosa scrivere per esteso l’equazione di¤ erenziale e determinare il suo integrale generale in funzione di . (E’un’equazione di Eulero...
Ricordare che per reale è xi = ei log x = cos ( log x)+i sin ( log x)). Quindi
imporre le condizioni agli estremi.
Esercizio 6.12 Nello spazio di Hilbert L2 (0; 1), ortonormalizzare le funzioni
x2 ; x; 1 (in quest’ordine).
228
Esercizio 6.13 I primi polinomi di Legendre sono:
q
P0 (x) = p12 ;
P1 (x) = 32 x;
q
q
P2 (x) = 12 52 3x2 1 ; P3 (x) = 72
3
2x
+ 52 x3 :
Tenendo presente questo, determinare il polinomio di grado
approssima in L2 [ 1; 1] la funzione f (x) = cos ( x) :
2 che meglio
Esercizio 6.14 I primi polinomi di Laguerre sono:
L0 (x) = 1;
L2 (x) = 1 2x +
Calcolare il polinomio di grado
ex=4 nello spazio L2 ((0; +1) ; e
x
L1 (x) = 1
:::
x2
2 ;
x;
2 che meglio approssima la funzione f (x) =
dx).
Soluzione di alcuni esercizi
Soluzione Es. 6.14. Calcoliamo anzitutto:
Z +1
f (x) xn e x dx per n = 0; 1; 2:
0
Z
Z
+1
ex=4 e
x
dx =
0
+1
Z
+1
4
e
3
dx =
0
x=4
e
xe
x
dx =
0
Z
+1
3x=4
xe
+1
x=4 2
e
x e
x
dx =
0
Z
2
4
3
dx =
+1
x e
0
=0+
8
3
Z
=
0
4
3
+1
3x=4
+
Z
3x=4
4 2
x e
3
dx =
+1
3x=4
xe
dx =
0
+1
0
0
16
9
=
2
+1
3x=4
4
xe
3
0
=0+
Z
3x=4
e
+1
3x=4
+
Z
+1
0
0
8 16
:
3 9
4
e
3
3x=4
4
2xe
3
Quindi:
hf; L0 i =
hf; L1 i =
hf; L2 i =
=
4
3
Z
+1
e
3x=4
e
3x=4
dx
0
Z
+1
xe
3x=4
dx =
0
+1
0
4
3
Z
dx
2
Z
+1
xe
0
2
4
3
16 1 8 16
4
+
=
9
2 3 9
27
229
3x=4
dx +
1
2
Z
16
=
9
0
4
9
+1
x2 e
3x=4
dx
dx
3x=4
dx
e la proiezione richiesta è:
P f (x) = hf; L0 i L0 + hf; L1 i L1 + hf; L2 i L2
4
4
(1 x) +
1
9
27
4 4
4
4
=
+
+x
3 9 27
9
28
4
2
=
+ x + x2 :
27 27
27
=
Gra…co di f (x) e
6.3
x=2
4
3
e P f (x) e
x=2
2x +
x2
2
8
27
+
2 2
x
27
:
Laplaciano in coordinate sferiche. Polinomi di Legendre e armoniche sferiche
Consideriamo il problema di Dirichlet per l’equazione di Laplace su una sfera
tridimensionale:
u uxx + uyy + uzz = 0 per x2 + y 2 + z 2 < r2
u (x; y; z) = f (x; y; z)
per x2 + y 2 + z 2 = r2 :
Tra i signi…cati …sici di quest’equazione: u può essere il potenziale (elettrostatico o gravitazionale) all’interno della sfera, …ssato il suo valore sul bordo, in
una situazione stazionaria in cui all’interno della sfera non ci sono pozzi o sorgenti del campo (cioè cariche o masse, rispettivamente); oppure u può essere la
temperatura, in stato stazionario, all’interno della sfera, nota la temperatura al
bordo, in assenza di sorgenti o pozzi di calore interni.
Data la geometria sferica, è naturale riscrivere l’operatore di¤erenziale in
coordinate sferiche ( ; #; ') e cercare poi soluzioni a variabili separate nelle
coordinate sferiche. Il laplaciano in coordinate sferiche
8
< x = sin # cos '
y = sin # sin '
:
z = cos #
230
assume la forma:
8
>
>
1
@
> @ 2 u 2 @u
>
+
+ 2
<
2
@
@
sin # @#
>
>
>
>
: u (r; #; ') = f (#; ')
sin #
@u
@#
1
@2u
=0
2 sin2 # @'
+
Dopo aver riscritto l’equazione (moltiplicando per
2@
2
u
2
@
+2
@u
1 @
+
@
sin # @#
sin #
@u
@#
+
2
per 0 < < r;
0<#< ;
0<'<2
per 0 < # < ;
0<'<2 :
) nella forma
1 @2u
= 0;
sin2 # @'
a¤rontiamo il problema per separazione delle variabili. In vista degli sviluppi
futuri, cominciamo a separare dalle variabili angolari, scrivendo
u ( ; #; ') = R ( ) S (#; ')
e ponendo
(#;')
=
1 @
sin # @#
sin #
@
@#
1 @2
:
sin2 # @'
+
Si ha:
2
2
R00 ( ) + 2 R0 ( ) S (#; ') + R ( )
00
0
R ( )+2 R ( )
=
R( )
(#; ') = 0
(#;') S
(#; ')
S (#; ')
da cui ricaviamo che per qualche costante
2
(#;') S
R00 ( ) + 2 R0 ( )
=
R( )
si ha
=
(#;') S
(#; ')
:
S (#; ')
Abbiamo messo in evidenza l’operatore (#;') (che si può vedere come operatore
di Laplace sulla super…cie della sfera) perché lo incontreremo ancora in seguito.
La prima equazione si riscrive
2
R00 + 2 R0
R=0
(6.4)
ed è un’equazione di Eulero, di cui si può determinare in corrispondenza di
ciascun l’integrale generale, cercando soluzioni del tipo R ( ) =
con da
determinarsi (v. [EsAn2, Cap.1, §1.2.D]); lo faremo dopo aver determinato .
Per risolvere la seconda equazione, cioè
(#;') S
(#; ') =
S (#; ')
procediamo ad un’ulteriore separazione di variabili, cercando
S (#; ') =
231
(#)
(')
quindi
1
1
0
(sin # 0 (#)) (') +
(#) 00 (') =
sin #
sin2 #
sin # (sin # 00 (#) + cos # 0 (#))
+ sin2 # =
(#)
(#)
(')
00
(')
(')
che dà, per qualche costante ;
00
sin # (sin #
(#) + cos #
(#)
0
(#))
+ sin2 # =
=
00
(')
:
(')
La seconda equazione dà
00
che, dovendo essere
m = 1; 2; 3; ::: e
(') =
(')
(') 2 -periodica (' è la longitudine), dà
= m2 per
(') = a cos (m') + b sin (m') :
Invece, la prima equazione diventa
sin #
00
(#) + cos #
0
(#) +
sin #
m2
sin #
(#) = 0 per # 2 [0; ] :
(6.5)
Si ricordi che l’angolo # ha il signi…cato di colatitudine. La (#) non deve
soddisfare condizioni di periodicità, ma dev’essere regolare su tutto [0; ] (in
particolare, limitata anche agli estremi). L’equazione (6.5) si può riscrivere in
una forma più familiare eseguendo il cambio di variabili:
(#) = P (cos #) ; cos # = t:
Si ha infatti:
0
00
(#) =
sin #P 0 (cos #)
(#) = sin2 #P 00 (cos #)
cos #P 0 (cos #)
e sostituendo nella (6.5)
sin # sin2 #P 00 (cos #)
cos #P 0 (cos #) +
m2
P (cos #) = 0
sin #
m2
sin3 #P 00 (cos #) 2 sin # cos #P 0 (cos #) +
sin #
P (cos #) = 0
sin #
m2
sin2 #P 00 (cos #) 2 cos #P 0 (cos #) +
P (cos #) = 0
sin2 #
m2
1 t2 P 00 (t) 2tP (t) +
P (t) = 0:
1 t2
+ cos # [ sin #P 0 (cos #)] +
232
sin #
Per m = 0 si tratta dell’equazione di Legendre su [ 1; 1] (si ricordi che
t = cos # 2 [ 1; 1]), che già conosciamo. Per gli altri valori di m è un’equazione
più complicata.
Questo suggerisce di trattare prima il caso particolare m = 0. Leggendo
a ritroso nei nostri passaggi, si vede che questo corrisponde a supporre che la
funzione (') sia costante, ossia la soluzione a variabili separate sia in realtà
indipendente dalla longitudine. Questo è un caso particolare che può avere un
suo interesse: se ad esempio il dato al bordo è indipendente da ', ci aspettiamo
che il problema abbia una soluzione indipendente da '. Comunque, per i motivi
di gradualità già spiegati, trattiamo prima questo caso.
6.3.1
Il dato indipendente dalla longitudine. Polinomi di Legendre
Consideriamo dunque la situazione sempli…cata in cui il dato al bordo f non
dipende dalla longitudine ' ma solo dalla colatitudine #. Conseguentemente, ci
aspettiamo che la soluzione u sia pure indipendente da '. Il problema precedente
si riscrive quindi nella seguente forma sempli…cata:
8 2
1
@
@u
< @ u 2 @u
+
+ 2
sin #
= 0 per 0 < < r; 0 < # <
2
@
@
sin # @#
@#
:
u (r; #) = f (#)
per 0 < # < :
(6.6)
In base all’analisi già fatta, abbiamo soluzioni a variabili separate del tipo
u ( ; #) = R ( )
(#)
con R ( ) soddisfacente (6.4) e (#) = P (cos #) dove P (t) soddisfa l’equazione
di Legendre
1 t2 P 00 (t) 2tP (t) + P (t) = 0
su ( 1; 1). Poiché vogliamo soluzioni limitate su tutto [ 1; 1] è necessario che
sia:
= n (n + 1) ; n = 0; 1; 2; :::
P (t) = Pn (t) ;
n-esimo polinomio di Legendre. Quindi abbiamo le soluzioni:
n
(#) = Pn (cos #) :
Risolviamo ora l’equazione di Eulero (6.4) per
2
Cerchiamo R ( ) =
2
(
1)
R00 + 2 R0
= n (n + 1):
n (n + 1) R = 0:
.
2
+2
(
1
n (n + 1)
=0
1) + 2
n (n + 1) = 0
( + 1) n (n + 1) = 0
= n;
233
=
(n + 1)
che dà soluzioni
n
R( ) =
;R( ) =
(n+1)
per n = 0; 1; 2; 3:::
Escludendo le soluzioni R ( ) = (n+1) illimitate nell’origine si ottengono in de…nitiva le seguenti soluzioni regolari a variabili separate dell’equazione di Laplace
indipendente dalla longitudine:
un ( ; #) = cn
n
Pn (cos #) ; per n = 0; 1; 2; 3:::
Si tratta ora, al solito, di formare una soluzione data da una serie in…nita di
queste soluzioni e cercare di imporre il dato al bordo scegliendo opportunamente
i coe¢ cienti:
u ( ; #) =
u (r; #) =
1
X
n=0
1
X
n=0
cn
n
Pn (cos #)
cn rn Pn (cos #) = f (#) per # 2 [0; ] .
Si tratta di sviluppare il dato f (#) in serie di Legendre a questo modo. C’è di
mezzo un cambio di variabile. Osserviamo infatti che:
Z 1
Z
Pn (t) Pm (t) dt = [t = cos #] =
Pn (cos #) Pm (cos #) sin #d#;
1
0
da cui leggiamo che:
1
il sistema fPn (cos #)gn=0 è ortonormale completo in L2 ([0; ] ; sin #d#) :
Quindi possiamo porre:
Z
Cn =
f (s) Pn (cos s) sin sds per n = 0; 1; 2; 3:::
f (#) =
0
1
X
Cn Pn (cos #) =
n=0
1
X
cn rn Pn (cos #) per cn =
n=0
(6.7)
Cn
.
rn
In de…nitiva, la soluzione del problema (6.6) è data da:
u ( ; #) =
1
X
n=0
n
Cn
r
Pn (cos #) con Cn dati da (6.7).
Non ci occupiamo per il momento delle necessarie veri…che della validità
della formula trovata. Torneremo più avanti sull’argomento. Invece, vediamo
un esempio concreto.
Esempio 6.15 Risolviamo il problema (6.6) con f (#) = sin2 #. Poiché ponendo t = cos # si ha:
r
2 2
2p
2
2P0 (t)
P2 (t) ;
f (t) = 1 t =
3 5
3
234
si ha
r
2
2 2
2p
u ( ; #) =
2P0
P2 (cos #)
3
3 5 r
2
2 2
1 3
=
+ cos2 # :
3 3 r
2 2
6.3.2
Il caso generale. Funzioni di Legendre associate e armoniche
sferiche
Abbiamo trattato …nora l’equazione di Laplace in coordinate sferiche supponendo per semplicità che la soluzione non dipenda dalla longitudine. Nel caso
generale l’integrazione del problema agli autovalori porta ad un sistema a due
indici di autofunzioni, dette funzioni di Legendre, e imparentate con i polinomi
di Legendre.
Ricordiamo che in questo caso fobbiamo risolvere per ogni intero m =
1; 2; 3; ::: assegnato il problema agli autovalori
1
t2 P 00 (t)
m
2tP (t) + P (t)
t2
1
= 0 t 2 ( 1; 1) ;
(6.8)
(l’autovalore, per ora incognito, è ). Si tratta di un’equazione più generale
dell’equazione di Legendre (si riduce a quella per m = 0). Riscrivendola nella
forma
m
0
1 t2 P 0 (t)
P (t) + P (t) = 0 t 2 ( 1; 1)
1 t2
si riconosce che si tratta di un altro problema di Sturm-Liouville singolare: con
le notazioni del §8.2,
p (t) = 1 t2
m
q (t) =
1 t2
(t) = 1
La solita dimostrazione prova che se esistono autovalori e autofunzioni, gli
autovalori sono positivi e autofunzioni relative a autovalori diversi sono ortogonali tra loro in L2 ( 1; 1).
Per risolvere l’equazione (6.8) si può dimostrare il seguente
Teorema 6.16 Se P (t) risolve per un certo
(cioè (6.8) con m = 0), allora la funzione
Q (t) = 1
t2
m=2
l’equazione di Legendre originale
P [m] (t)
dove P [m] (t) indica la derivata m-esima di P (t), risolve l’equazione (6.8) per
quell’intero m = 1; 2; :::
235
Si dimostra poi che le uniche soluzioni di (6.8) limitate in ( 1; 1) sono quelle
costruite in questo modo e che provengono da soluzioni P (t) dell’equazione di
Legendre limitate in ( 1; 1). Ma allora:
si parte dal polinomio di Legendre Pn (t) che risolve (6.8) con m = 0 e
= n (n + 1);
si calcola P [m] (t), e per trovare una funzione non identicamente nulla è
necessario che sia m = 1; 2; :::; n;
si costruiscono quindi le funzioni
Pnm (t) = 1
t2
m=2
Pn[m] (t) per m = 1; 2; :::; n
(per m = 0 possiamo porre Pn0 (t) = Pn (t)) che risolve (6.8) per
e il corrispondente m.
= n (n + 1)
De…nizione 6.17 Le funzioni
fPnm (t)gn=0;:::;1
m=0;:::;n
si dicono funzioni di Legendre associate, e sono quindi le uniche autofunzioni
limitate in ( 1; 1) del problema agli autovalori (6.8).
Si può dimostrare il seguente:
Teorema 6.18 Per ogni m = 0; 1; 2; :::: …ssato, le funzioni
1
fPnm (t)gm=n
sono un sistema ortogonale in L2 ( 1; 1). I coe¢ cienti di normalizzazione
valgono:
Z 1
(n + m)!
2
jPnm (t)j dt =
per m n.
(n m)!
1
Normalizzate, sono un sistema ortonormale completo in L2 ( 1; 1).
Quindi per ogni m = 0; 1; 2; :::: …ssato, le funzioni (normalizzate)
1
fPnm (cos #)gn=m
sono un sistema ortonormale completo in L2 ((0; ) ; sin #d#) :
Poiché gli autovalori trovati sono gli stessi del caso indipendente da ',
l’equazione di Eulero in R ( ) ha le stesse soluzioni del caso precedente. In
de…nitiva, le soluzioni dell’equazione di Helmholz sulla sfera a variabili separate
sono:
n
Pn (cos #)
Pnm (cos #) cos (m') per m = 1; 2; :::; n
n m
Pn (cos #) sin (m') per m = 1; 2; :::; n
n
236
e m = 0; 1; 2; :::
Il fatto che
(r
2 cos (m') sin (m')
; p
; p
)1
m=1
2
sia un s.o.n.c. in L (0; 2 ) e, per ogni m = 1; 2; 3; :::
1
fPnm (cos #)gm=n
siano un sistema ortonormale completo in L2 ((0; ) ; sin #d#) ; implica che il
sistema a due indici
)
(r
cos (m') m
sin (m')
2
m
Pn (cos #) ; Pn (cos #) p
; Pn (cos #) p
n=0;:::;1
m=1;:::;n
è un s.o.n.c. in
L2 ((0; )
(0; 2 ) ; sin #d#d')
2
ossia in L della super…cie della sfera unitaria.
Questo fatto segue da un criterio generale, ma lo illustriamo schematicamente in questo caso concreto al seguente modo.
Sia f 2 L2 ((0; ) (0; 2 ) ; sin #d#d'); per # …ssato, sviluppiamo f (#; ) in
serie di Fourier in '; scrivendo
1
a0 (#) X
+
fam (#) cos (m') + bm (#) sin (m')g
f (#; ') =
2
m=1
ora sviluppiamo
a0 (#)
am (#) e bm (#)
rispetto al s.o.n.c.
rispetto al s.o.n.c.
1
fPn (cos #)gn=0
1
fPnm (cos #)gn=m
e otteniamo così
f (#; ') =
+
1
X
m=1
(
1
1X
an Pn (cos #)
2 n=0
1
X
n=m
am;n Pnm
!
(cos #) cos (m') +
1
X
bm;n Pnm
n=m
!
)
(cos #) sin (m')
che prova la completezza del s.o.n.c. in due variabili.
Vediamo ora di capire meglio la struttura delle funzioni Pnm (t) e quindi
quella delle soluzioni a variabili separate appena scritte.
237
Esempio 6.19 Calcoliamo in base alla de…nizione le funzioni Pnm (t) per n =
0; 1; 2; 3 e 0 m n. Ricordiamo l’espressione dei primi polinomi di Legendre:
1
P0 (t) = p ;
2
r
3
P1 (t) =
t;
2
r
1 5
P2 (t) =
3t2 1 ;
2 2
r
7
3
5
P3 (t) =
t + t3 :
2
2
2
Quindi calcoliamo:
1
P00 (t) = P0 (t) = p
2
r
3
P10 (t) = P1 (t) =
t
2
P11
(t) = 1
P20 (t) = P2 (t) =
P21
P22
(t) = 1
(t) = 1
P30
t
t
t
1
2
2 1=2
r
P10
5
3t2
2
2 1=2
P20
2 2=2
P200
P32 (t) = 1
P33 (t) = 1
t
r
3
t
2
!0
=
r
3
1
2
t2
1=2
1
(t) = 1
(t) = 1
r
t
2 1=2
t
1
2
2
1
2
r
r
5
3t2
2
5
3t2
2
1
1
!0
!00
=
=3
r
r
5
3t 1
2
5
1
2
t2
1=2
t2
7
2
3
5
t + t3
2
2
r
7
3 15 2
1=2
1=2 0
t2
P3 (t) =
1 t2
+ t
2
2
2
r
7
2=2 00
t2
P3 (t) =
1 t2 15t
2
r
7
3=2
2 3=2 000
15 1 t2
t
P3 (t) =
2
(t) = P3 (t) =
P31 (t) = 1
(t) = 1
2 1=2
Osserviamo che ponendo t = cos # si ha
1
t2
m=2
m
= (sin #) :
Vale anche la prossima importante caratterizzazione delle soluzioni a variabili
separate dell’equazione di Laplace:
238
Teorema 6.20 Per ogni n = 0; 1; 2; :::; le funzioni
n
Pn (cos #)
Pnm (cos #) cos (m') per m = 1; 2; :::; n
n m
Pn (cos #) sin (m') per m = 1; 2; :::; n
n
espresse in coordinate cartesiane sono polinomi omogenei di grado n in x; y; z;
sono anche funzioni armoniche in tutto R3 .
Queste funzioni sono dunque polinomi omogenei ed armonici in tutto lo
spazio; sono detti armoniche sferiche solide, mentre si dicono armoniche sferiche
le loro restrizioni alla super…cie della sfera unitaria, cioè le funzioni che espresse
in funzioni di (#; ') si scrivono
Pn (cos #)
Pnm (cos #) cos (m') per m = 1; 2; :::; n
Pnm (cos #) sin (m') per m = 1; 2; :::; n
e che, come abbiamo già detto, costituiscono un s.o.n.c. in L2 della super…cie
sferica.
Queste funzioni hanno un’importanza che va oltre la risoluzione del problema
di Dirichlet per il laplaciano, difatti le ritroveremo in seguito.
Esempio 6.21 Scriviamo in coordinate cartesiane alcune armoniche sferiche.
Cominciamo a riscrivere in funzione di cos # le espressioni di Pnm (t) ; sempli…m=2
candole mediante l’identità 1 t2
= sinm #. Si ha:
1
P00 (cos #) = p
2
r
3
P10 (cos #) =
cos #
2
r
3
P11 (cos #) =
sin #
2
r
1 5
3 cos2 # 1
(cos #) =
2 2
r
5
1
3 cos # sin #
P2 (cos #) =
2
r
5
sin2 #
P22 (cos #) = 3
2
P20
239
P30
P31
(t) =
(t) =
r
r
r
7
2
3
5
cos # + cos3 #
2
2
7
sin #
2
3 15
+
cos2 #
2
2
7
15 sin2 # cos #
2
r
7
3
P3 (t) =
15 sin3 #
2
P32
(t) =
Ora, ricordando le espressioni delle coordinate sferiche
8
< x = sin # cos '
y = sin # sin '
:
z = cos #
riscriviamo le armoniche sferiche in coordinate cartesiane, così:
n
Pn (cos #)
Pnm (cos #) cos (m') per m = 1; 2; :::; n
n m
Pn (cos #) sin (m') per m = 1; 2; :::; n
n
1
P00 (cos #) = p
2
r
r
3
3
0
P1 (cos #) =
cos # =
z
2
2
r
r
3
3
1
P1 (cos #) cos ' =
sin # cos ' =
x
2
2
r
r
3
3
P11 (cos #) sin ' =
sin # sin ' =
y
2
2
r
1 5
(cos #) =
2 2
r
5
2 1
P2 (cos #) cos ' =
3
2
r
5
2 1
P2 (cos #) sin ' =
3
2
r
5
2 2
P2 (cos #) cos 2' = 3
2
r
5
2 2
P2 (cos #) sin 2' = 3
2
2
P20
2
3 cos #
240
1
1 =
2
r
5
2z 2 x2
2
r
5
2
cos # sin # cos ' = 3
xz
2
r
5
2
cos # sin # sin ' = 3
yz
2
r
5 2
2
x
y2
sin2 # cos 2' = 3
2
r
5
2
xy
sin2 # sin 2' = 6
2
2
y2
Esercizio 6.22 Proseguendo come sopra, calcolare in coordinate cartesiane le
seguenti armoniche sferiche:
r
7 3
3
5
3 0
cos # + cos3 # = :::
P3 (t) =
2
2
2
r
7 3
3 15
3 1
P3 (t) cos ' =
sin #
+
cos2 # cos ' =
2
2
2
r
7 3
3 15
3 1
P3 (t) sin ' =
sin #
+
cos2 # sin ' =
2
2
2
r
7
15
2
r
7
3 2
P3 (t) sin 2' =
15
2
r
7
3 3
15
P3 (t) cos 3' =
2
r
7
3 3
15
P3 (t) sin 3' =
2
3
6.3.3
P32
(t) cos 2' =
3
sin2 # cos # cos 2' =
3
sin2 # cos # sin 2' =
3
sin3 # cos 3' =
3
sin3 # sin 3' =
Soluzione del problema di Dirichlet per l’equazione di Laplace
sulla sfera
Arriviamo ora in fondo al percorso logico con cui siamo partiti e mostriamo
come mediante le armoniche sferiche si possa scrivere la soluzione del problema
di Dirichlet per il laplaciano sulla sfera.
Al solito, per imporre la condizione al bordo consideriamo una generica serie
delle soluzioni a variabili separate, e poi cerchiamo di determinare i coe¢ cienti
a¢ nché questa assuma il dato al bordo. Sia:
1
1X
an n Pn (cos #)
2 n=0
( 1
!
1
X
X
n m
+
am;n Pn (cos #) cos (m')
u ( ; #; ') =
+
m=1
1
X
n=m
bm;n
n
!
)
Pnm (cos #) sin (m')
n=m
Imponendo la condizione
u (r; #; ') = f (#; ')
241
si trova
1
1X
an rn Pn (cos #)
2 n=0
f (#; ') =
(
1
X
+
m=1
1
X
+
1
X
am;n rn Pnm (cos #) cos (m')
n=m
bm;n r
!
n
Pnm
!
)
(cos #) sin (m')
n=m
da cui, sviluppando
1
1X
An Pn (cos #)
2 n=0
( 1
!
1
X
X
m
+
Am;n Pn (cos #) cos (m') +
f (#; ') =
n=m
m=1
1
X
Bm;n Pnm
!
)
(cos #) sin (m')
n=m
con
An =
1
Z
0
Am;n =
Bm;n
2
Z
0
(n m)! 1
(n + m)!
(n m)! 1
=
(n + m)!
f (#; ') Pn (cos #) sin #d# d'
Z
Z
2
0
Z
f (#; ') Pnm (cos #) sin #d# cos (m') d'
0
Z
2
0
f (#; ') Pnm (cos #) sin #d# sin (m') d'
0
si trova che la soluzione è assegnata da
u ( ; #; ') =
+
1
1X
An
2 n=0
r
( 1
1
X
X
m=1
n=m
n
Pn (cos #)
n
Am;n
r
Pnm
!
(cos #) cos (m') +
1
X
n=m
n
Bm;n
r
Pnm
Si tratterebbe ora di dimostrare che sotto opportune ipotesi su f la formula
è e¤ettivamente derivabile due volte e assegna la soluzione del problema.
Non facciamo questa veri…ca, ma ci limitiamo a segnalare come, analogamente a quanto accadeva in due variabili per il laplaciano sul cerchio, si può
trasformare la formula di rappresentazione per serie in una formula di rappresentazione integrale, estremamente più semplice37 . Vale il seguente:
3 7 Il risultato …nale del calcolo è semplice, il calcolo stesso è laborioso e non lo presentiamo;
si rimanda per i passaggi a [Weinberger p.196]
242
!
)
(cos #) sin (m') :
Teorema 6.23 La formula di rappresentazione per serie precedente si può riscrivere in forma integrale come segue:
!
Z
2 Z 2
r r2
f #; ' sin #
u ( ; #; ') =
d# d'
3=2
4
0
0 (r 2 + 2
2r cos )
con cos = cos # cos # + sin # sin # cos ('
')
Questa formula è detta formula integrale di Poisson in 3 variabili, ed è l’analoga
di quella che abbiamo visto valere in due variabili sul cerchio. Per ogni dato f
continuo, questa formula integrale assegna la soluzione del problema di Dirichlet,
che all’interno della sfera risulta in…nitamente derivabile.
Notiamo anche che ponendo = 0 nella formula integrale di Poisson si ha:
!
Z
Z
Z 2 Z
f #; ' sin #
r3 2
1
u (0; #; ') =
d# d' =
f #; ' sin #d# d'
4 0
r3
4 0
0
0
Z 2 Z
Z Z
1
1
2
f #; ' r sin #d# d' =
f dS;
=
4 r2 0
4 r2
@S(0;r)
0
che signi…ca: il valore di una funzione armonica nel centro di una sfera è uguale
alla media integrale dei valori del dato sul bordo della sfera. Con ragionamenti
analoghi a quelli visti nel caso bidimensionale, da questo fatto si deduce anche
nel caso tridimensionale la formula di media per le funzioni armoniche: una
funzione armonica in un dominio tridimensionale, in ogni punto ha come valore
la media integrale dei valori assunti su una qualsiasi sferetta centrata in quel
punto e contenuta nel dominio. La proprietà è vera sia facendo medie integrali
su sfere piene, sia facendo medie integrali su super…ci sferiche.
6.4
Oscillatore armonico quantistico e polinomi di Hermite
In meccanica quantistica una particella di massa m in moto lungo una retta è descritta da una funzione di stato (x; t), nota la quale si può calcolare
la probabilità che la particella si trovi all’istante t nell’intervallo (a; b) come
l’integrale
Z b
2
j (x; t)j dx:
a
Per il suo signi…cato di probabilità, (x; t) deve soddisfare la condizione di
normalizzazione
Z
2
j (x; t)j dx = 1 per ogni t:
R
La funzione (x; t) soddisfa l’equazione di Schrödinger che, nel caso la particella
di massa m sia soggetta ad un campo di forze di potenziale V (x), è:
i~
@
(x; t) =
@t
~2 @ 2
(x; t) + V (x)
2m @x2
243
(x; t) per x 2 R; t 2 R
(dove ~ = h=2
separate:
e h è la costante di Planck). Cerchiamo soluzioni a variabili
(x; t) = X (x) T (t)
i~XT 0 =
i~
T0
=
T
~2 00
X T + V (x) XT
2m
~2 X 00
+ V (x)
2m X
da cui dev’essere
i~
T0
= E = cost.
T
~2 X 00
+ V (x) = E = cost.
2m X
per qualche costante E 2 R; che dimensionalmente ha il signi…cato di energia.
L’equazione in T si risolve direttamente
T (t) = ce
iE
~ t
:
Poiché jT (t)j = c, la condizione di normalizzazione si traduce in
Z
2
jX (x)j dx = cost.
R
Ci interessa quindi determinare le autosoluzioni L2 (R) dell’equazione:
X 00 +
2m
(E
~2
V (x)) X = 0 in R.
Sottolineiamo il fatto che l’appartenenza a L2 (R) della soluzione X (x) che
stiamo cercando è una condizione necessaria per la sensatezza …sica del problema
così impostato.
Consideriamo ora il caso particolare dell’oscillatore armonico (quantistico,
unidimensionale), per il quale
V (x) =
1
m! 2 x2 :
2
Il modello dell’oscillatore armonico quantistico si applica ad esempio al moto di
agitazione termica degli atomi formanti un reticolo cristallino. Più in generale,
il modello descrive in prima approssimazione le oscillazioni di un sistema vicino
a un punto di equilibrio stabile; si tratta perciò di un modello molto studiato.
L’equazione diventa:
X 00 (x) +
2m
E
~2
m2 ! 2 2
x X (x) = 0:
~2
(6.9)
Per risolverla, l’idea è ricondursi all’equazione di Hermite. Si procede in due
passi.
244
1. Per prima cosa vogliamo fare un cambio di variabile che renda uguale a
1 il coe¢ ciente di x2 . Sia X (x) = Z ( x) con da determinarsi, allora
2
Z 00 ( x) +
2m
E
~2
m2 ! 2 2
x Z ( x) = 0:
~2
2m
E
~2
m2 ! 2 2
y Z (y) = 0:
2 ~2
Poniamo x = y e abbiamo
2
Z 00 (y) +
Ora vogliamo che sia
2
4
m2 ! 2
2 ~2
m2 ! 2
=
2
r~
m!
:
=
~
=
Perciò
r
m!
x
~
risolve l’equazione (6.9) se e solo se Z (y) risolve l’equazione:
X (x) = Z
m! 00
Z (y) +
~
2m
E
~2
Z 00 (y) +
m! 2
y Z (y) = 0
~
2
E
!~
y 2 Z (y) = 0:
(6.10)
2. Ora trasformiamo questa equazione in quella di Hermite ponendo:
Z (y) = e
Z 0 (y) = e
Z 00 (t) = e
e
y2
2
y2 Y
y2
2
y2
2
y2
2
2yY 0
Y (y) :
( yY + Y 0 )
y2 Y
yY 0
Y
yY 0 + Y 00
2
E y2 Y = 0
!~
2
2yY 0 +
E 1 Y = 0:
!~
Y + Y 00 +
Y 00
(6.11)
Dunque Z (y) risolve (6.10) se e solo se Y (y) risolve (6.11). La condizione di
normalizzazione su Y si legge al modo seguente: dev’essere …nito l’integrale
r
r
Z
Z
Z
2
~
m!
2
2
jZ (y)j dy =
jX (x)j dx =
Z
x
dx =
m! R
~
R
R
r
Z
2
~
2
=
e y jY (y)j dy:
m! R
245
Quindi siamo interessati a individuare autosoluzioni Y e autovalori
di Hermite
Y 00 2yY 0 + Y = 0
per cui si abbia
Z
e
y2
R
dell’equazione
2
jY (y)j dy < 1:
Abbiamo visto (Teorema 6.7) che questa condizione può essere soddisfatta solo
per = 2n e Y (y) = Hn (y) ; n-esimo polinomio di Hermite. Questo signi…ca
che i possibili valori dell’energia sono:
2
E
!~
1 = 2n
En =
n+
1
2
!~ con n = 0; 1; 2; 3; :::
e le autosoluzioni corrispondenti sono
Yn (y) = Hn (y) ; corrispondenti a
Zn (y) = e
y2
2
Hn (y) ;
e quindi per l’equazione iniziale:
Xn (x) = e
m!x2
2~
Hn
r
m!
x :
~
Se i polinomi di Hermite Hn sono quelli normalizzati in modo da avere norma
2
1 in L2 R; e y dy , allora l’autofunzione normalizzata sarà:
Xn (x) =
r
4
m!
e
~
m!x2
2~
Hn
r
m!
x
~
per n = 0; 1; 2; :::
Si trova quindi che l’oscillatore possiede una successione di possibili livelli energetici En e corrispondenti stati stazionari Xn (x), che vanno dallo stato fondamentale n = 0;
r
!~
m! m!x2
E0 =
; X0 (x) = 4
e 2~
2
~
ai successivi “stati eccitati” per n
1, ad esempio
p
2 m! 3=4
3
xe
E1 = !~; X1 (x) = 1=4
~
2
m!x2
2~
:
2
E’signi…cativo osservare anche i gra…ci delle funzioni jXn (x)j , che rappresentano le densità di probabilità del sistema nei vari stati stazionari:
246
E’interessante osservare queste densità di probabilità tenendo presente l’equazione che gli stati Xn risolvono:
Xn00 +
2m
~2
En
1
m! 2 x2 Xn = 0 in R.
2
Classicamente, un oscillatore armonico compie oscillazioni la cui ampiezza è
determinata dall’energia del sistema: le oscillazioni sono “con…nate”. Analogamente nell’equazione precedente, nella regione spaziale in cui il termine En 12 m! 2 x2
è positivo Xn soddisfa un’equazione del tipo Xn00 + c2 (x) Xn = 0 che ha l’aspetto dell’equazione classica del moto armonico e quindi tende a con…nare il moto
nella regione stessa. Fissato un livello energetico En ; le condizioni
En
1
m! 2 x2
2
jxj
0, cioè
r
2En
=
m! 2
s
2 n + 12 !~
=
m! 2
r
(2n + 1) ~
m!
si dicono “limiti classici” del sistema. Nel caso quantistico, tuttavia, …ssato un
livello energetico En , nessuno impedisce che la quantità En 12 m! 2 x2 diventi
negativa. Il gra…co della densità di probabilità si estende oltre tali limiti, a
signi…care che l’oscillatore armonico quantistico può superare i limiti classici.
Le prossime …gure mostrano i gra…ci delle densità di probabilità dei primi
1
2 2
4 stati (n = 0; 1; 2; 3), con sovrapposta la parabola y = En
2 m! x le cui
intersezioni con l’asse x segnano i limiti classici. L’area in grigio sotto la curva
della densità probabilità indica la probabilità che il sistema si trovi in uno stato
247
classicamente proibito.
Tornando all’equazione di Schrödinger, l’equazione in t è risolta da
1
T (t) = ce i(n+ 2 )!t :
L’equazione in (x; t) ha quindi soluzioni a variabili separate
r
r
m! m!x2
m!
i(n+ 12 )!t
2~
e
Hn
x
n (x; t) = e
~
~
e la soluzione dell’equazione di Schrödinger con dato iniziale 0 (x) è data allora
da una serie:
r
r
1
X
1
m! m!x2
m!
(x; t) =
cn e i(n+ 2 )!t
e 2~ Hn
x
~
~
n=0
con
0 (x) =
cn =
1
X
cn
n=0
Z +1
1
r
r
m! m!x2
m!
e 2~ Hn
x , quindi
~
~
r
r
m! m!z2
m!
2~ H
(z)
e
z dz:
n
0
~
~
248
6.5
Il problema agli autovalori per il laplaciano (equazione
di Helmholz) e le sue applicazioni
Supponiamo di voler studiare l’equazione della di¤usione del calore, in assenza
di sorgenti, in una regione limitata del piano o dello spazio. Come già discusso, questo può condurre a un problema di Cauchy-Dirichlet per l’equazione del
calore:
8
per x 2 ; t > 0
< ut = k u
u (x; t) = 0
per x 2 @ ; t > 0
(6.12)
:
u (x; 0) = u0 (x) per x 2
oppure di problema di Cauchy-Neumann per l’equazione del calore:
8
per x 2 ; t > 0
< ut = k u
@u
(x;
t)
=
0
per
x 2 @ ;t > 0
: @
u (x; 0) = u0 (x) per x 2 :
(6.13)
Problemi analoghi si possono considerare per l’equazione delle onde in due o tre
variabili. In due variabili l’equazione rappresenta le vibrazioni di una membrana
elastica, mentre in tre variabili potrebbe rappresentare le vibrazioni sonore nell’aria, o simili. Stando, per …ssare le idee, sull’interpretazione bidimensionale
come membrana vibrante, se la membrana è …ssata al bordo e sono note posizione e velocità iniziali avremo un problema di Cauchy-Dirichlet per l’equazione
delle onde:
8
utt = c2 u
per x 2 ; t > 0
>
>
<
u (x; t) = 0
per x 2 @ ; t > 0
(6.14)
u
(x;
0)
=
u
(x)
per x 2
>
0
>
:
ut (x; 0) = v0 (x) per x 2 :
I problemi (6.12), (6.13), (6.14) hanno alcune caratteristiche matematiche comuni: l’equazione di¤erenziale è lineare omogenea e le condizioni al contorno
sono omogenee, quindi sovrapposizione di soluzioni di equazione+condizioni al
bordo risolve ancora entrambe; inoltre, le variabili spazio e tempo si possono
assumere variabili in domini separati: x 2 ; t > 0. Tutto ciò suggerisce che si
possono cercare soluzioni a variabili separate in spazio e tempo, cioè del tipo:
u (x; t) = X (x) T (t) :
Sostituendo ad esempio in (6.12) si trova:
XT 0 = kT X
T0
X
(t) =
(x)
kT
X
da cui ogni membro dev’essere costante. Abbiamo allora:
T0 =
kT per t > 0
X + X = 0 in ;
X = 0 su @ :
249
Vediamo cioè che il problema (6.12) si spezza in un problema agli autovalori
X (x) + X (x) = 0
X (x) = 0
x2
x2@
(6.15)
e un’equazione in T;
T 0 (t) =
k T (t) ,
elementarmente integrabile una volta noto
(6.13) porta al problema agli autovalori
. In modo analogo, il problema
X (x) + X (x) = 0
(x) = 0
@X
@
x2
x2@
(6.16)
e alla stessa equazione in T , e il problema (6.14) porta ancora al problema agli
autovalori (6.15), e questa volta all’equazione in T
T 00 (t) =
c2 T (t) .
In conclusione: problemi di Cauchy-Dirichlet o di Cauchy-Neumann per l’equazione del calore o delle onde portano, impostandone la risoluzione per separazione di variabili, a studiare come sottoproblema un problema agli autovalori
per l’equazione di Laplace, su un dominio del piano o dello spazio, con condizioni
al contorno di tipo Dirichlet o di tipo Neumann, cioè (6.15) o (6.16). Vale la
pena quindi dedicare un po’ di attenzione a questo problema agli autovalori
di per sé, che si può vedere come un analogo in più variabili di quello che in
una sola variabile sono i problemi di Sturm-Liouville che abbiamo considerato
in precedenza. Si noti che per ora non abbiamo detto niente sul dominio
(dimensioni, forma, regolarità...), tuttavia alcune proprietà di base si possono
stabilire molto in generale.
Teorema 6.24 Sia
un dominio limitato del piano o dello spazio, regolare
quanto basta perché ci si possa applicare il teorema della divergenza. Supponiamo che (X; ) e (Y; ) siano due coppie autofunzione-autovalore (X; Y
non identicamente nulle e C 2
) che risolvono il problema (6.15) oppure il
problema (6.16). Allora:
Z
6= =)
X (x) Y (x) dx = 0:
cioè: autofunzioni relative ad autovalori distinti sono tra loro ortogonali in
L2 ( ). Inoltre gli autovalori sono positivi.
Dimostrazione. Consideriamo le identità
X (x) + X (x) = 0
Y (x) + Y (x) = 0:
250
Moltiplichiamo la prima per Y; la seconda per X, sottraiamo e integriamo in
Z
Z
(
)
X (x) Y (x) dx =
(Y X X Y ) dx:
:
Ora trasformiamo l’ultimo integrale mediante la seconda identità di Green (v.
(??), §1.2) e otteniamo:
Z
Z
@X
@Y
(
)
X (x) Y (x) dx =
Y
X
d =0
@
@
@
perché, a seconda delle condizioni al contorno che sto considerando, o X e Y
@Y
(problema
sono nulle su @ (problema di Dirichlet) o @X
@ ; @ sono nulle su @
di Neumann). Ne segue, essendo 6= ; che
Z
X (x) Y (x) dx = 0:
Proviamo la positività degli autovalori. Moltiplichiamo l’equazione X (x) +
X (x) = 0 per X e integriamo in :
Z
Z
Z
Z
2
2
X (x) dx =
X X (x) dx =
jrX (x)j dx
r (XrX) dx
Z
Z
Z
@X
2
2
=
jrX (x)j dx
X
d =
jrX (x)j dx
@
@
di nuovo per le condizioni al contorno, che comportano l’annullarsi dell’integrale
di bordo. Quindi:
R
2
jrX (x)j dx
= R
> 0:
2
X (x) dx
I risultati appena visti e l’analogia con quanto accade per i problemi di
Sturm-Liouville suggeriscono che ci si possa aspettare, almeno per domini
“buoni”, l’esistenza di una successione di autovalori e una famiglia di autofunzioni corrispondenti, che risultino formare un sistema ortonormale completo di
L2 ( ). Se e quando così accade, il problema (6.12), ad esempio, avrà soluzioni
a variabili separate del tipo:
un (x; t) = Xn (x) e
k
nt
e quindi potremo cercare una soluzione
u (x; t) =
1
X
cn Xn (x) e
k
n=0
imponendo
u0 (x) =
1
X
n=0
251
cn Xn (x)
nt
(6.17)
ossia pur di saper sviluppare u0 in serie di autofunzioni del laplaciano. Analoghi
procedimenti valgono per l’equazione delle onde: il problema (6.14) avrà soluzioni
a variabili separate del tipo:
h
i
p
p
un (x; t) = Xn (x) an cos c
t
+
b
sin
c
t
(6.18)
n
n
n
e quindi potremo cercare una soluzione
u (x; t) = X0 (x) +
1
X
n=1
h
p
Xn (x) an cos c
nt
p
+ bn sin c
nt
i
imponendo
u0 (x) = X0 (x) +
1
X
an Xn (x)
n=1
v0 (x) =
1
X
n=1
p
bn c
n Xn
(x)
ossia pur di saper sviluppare u0 e v0 in serie di autofunzioni del laplaciano.
Tutta la discussione precedente mostra quindi che è utile studiare il problema
agli autovalori per il laplaciano su vari domini del piano e dello spazio e stabilire
se e quando questo possiede un sistema ortonormale completo di autosoluzioni.
Quando la geometria di è semplice, il problema agli autovalori può essere a
sua volta impostato mediante separazione di variabili. In un piccolo numero
di geometrie semplici questi problemi sono stati sviscerati classicamente: se
è un rettangolo, un cerchio, una sfera, un cilindro, di questi problemi si
sa tutto; le autofunzioni sono scritte esplicitamente in termini di opportune
funzioni speciali, gli autovalori sono noti. Per domini più generali ciò che è
possibile fare è da una parte dimostrare teoremi di esistenza sotto opportune
ipotesi, d’altro canto sviluppare metodi di calcolo numerico approssimato di
autofunzioni e autovalori. Nel seguito di questo paragrafo tratteremo le due
situazioni geometricamente più semplici: rettangolo e cerchio.
6.6
L’equazione di Helmholz sul rettangolo
L’equazione
u+ u=0
è detta anche equazione di Helmholz. Studiamola sul rettangolo, con condizione
al contorno di Dirichlet nulla:
8
0 x a; 0 y b
< uxx + uyy + u = 0
u (0; y) = u (a; y) = 0 0 y b
:
u (x; 0) = u (x; b) = 0 0 x a:
252
Impostiamo il problema per separazione delle variabili, cercando
u (x; y) = X (x) Y (y) :
Si trova:
X 00 Y + XY 00 + XY = 0
X 00
=
X
+
Y 00
Y
e ciascuno dei due membri dev’essere costante, poiché il primo è funzione di x
e il secondo di y. Quindi per qualche reale si ha, tenendo conto anche delle
condizioni al contorno:
X 00 = X
X (0) = X (a) = 0
Y 00 = (
+ )Y
Y (0) = Y (b) = 0:
Si tratta di due problemi agli autovalori, distinti e simili. Il primo, in X;
come soluzioni:
Xn (x) = sin
n x
;
a
=
n
a
ha
2
, n = 1; 2; 3; :::
Il secondo, in Y; , ha come soluzioni
Ym (x) = sin
m y
;
b
=
m
b
2
il che porta in de…nitiva a una successione a due indici di autovalori e autofunzioni:
m y
n x
sin
a
b
n 2
m 2
=
+
=
a
b
un;m (x; y) = sin
n;m
2
n2
m2
+ 2
2
a
b
.
Si noti che abbiamo e¤ettivamente ottenuto una successione di autofunzioni
che costituisce un sistema ortonormale completo di L2 ([0; a] [0; b]) con una
successione di autovalori che tende a +1.
Per risolvere il problema di Cauchy-Dirichlet occorrerà sviluppare il dato
iniziale in serie di Fourier in due variabili.
6.6.1
Membrana vibrante rettangolare
Se ad esempio stessimo risolvendo questo problema per risolvere poi il problema di Cauchy-Dirichlet (6.14) per l’equazione delle onde (membrana vibrante
253
rettangolare) avremmo, in base alla discussione fatta in precedenza e alla (6.18)
1
X
n x
m y
sin
a
b
n;m=1
"
!
!#
r
r
n2
m2
n2
m2
an;m cos c
+ 2 t + bn;m sin c
+ 2t
;
a2
b
a2
b
u (x; y; t) =
sin
nella quale potremmo determinare i coe¢ cienti an;m ; bn;m per soddisfare le condizioni iniziali. Se imponiamo che la velocità iniziale sia nulla troviamo ancora
bn;m = 0 e
1
X
u (x; y; t) =
cn;m un;m (x; y; t)
n;m=1
con
m y
n x
sin
cos c
un;m (x; y; t) = sin
a
b
r
n2
m2
+ 2t
2
a
b
!
e i coe¢ cienti cn;m si determinano sviluppando il dato iniziale in serie di Fourier
(sviluppo in serie di soli seni) in due variabili:
n x
m y
u0 (x; y) = cn;m sin
sin
a
b
Z Z
4
n x
m y
cn;m =
u0 (x; y) sin
sin
dxdy
ab
a
b
[0;a] [0;b]
Ci sono interessanti analogie e di¤erenze tra la membrana vibrante e la
corda vibrante …ssata agli estremi, studiata nel § 5.3.1. Anche qui la generica
vibrazione è sovrapposizione di in…nite vibrazioni stazionarie: in ogni vibrazione
stazionaria un;m (x; y; t) ogni punto della membrana oscilla su e giù di moto
armonico. Tutti i punti della membrana in cui
sin
n x
m y
sin
a
b
=0
sono immobili in ogni istante. Questi punti costituiscono le linee nodali, che sono
(oltre ai lati del rettangolo) gli (n 1) + (m 1) segmenti interni al rettangolo
dati da:
k
a con k = 1; 2; :::; n 1
n
h
y = b con h = 1; 2; :::; m 1:
m
x=
Ad esempio, per n = 2; m = 3 la vibrazione avviene come suggerito da questa
254
sequenza di immagini per istanti successivi:
Notiamo che per la membrana vibrante rettangolare, diversamente dalla corda vibrante …ssata agli estremi, le frequenze della vibrazioni stazionarie non sono
multiple intere della frequenza fondamentale, in quanto i numeri
r
m2
c n2
+ 2
2
b
2 a
non sono in generale multipli interi di
r
c
1
1
+ 2:
2
2 a
b
Dal punto di vista musicale, le frequenze più alte non sono “armoniche”rispetto
alla frequenza fondamentale. Questo è il motivo per cui di¢ cilmente il suono
emesso da un tamburo viene percepito come una nota ben de…nita.
Il caso della membrana quadrata (a = b) ha una particolarità interessante.
Consideriamo due interi positivi n; m diversi tra loro, e consideriamo le due
255
vibrazioni stazionarie
n x
m y
c p 2
sin
cos
n + m2 t
a
a
a
m y
c p 2
m x
sin
cos
n + m2 t :
um;n (x; y; t) = sin
a
a
a
p
Si noti che la parte temporale è la stessa: cos ca n2 + m2 t ; in particolare,
le due funzioni hanno la stessa frequenza, lo stesso periodo, e ogni loro combinazione lineare ha di conseguenza lo stesso periodo. Ciò signi…ca che anche le
funzioni
c1 un;m (x; y; t) + c2 um;n (x; y; t)
un;m (x; y; t) = sin
sono vibrazioni periodiche (stazionarie). Tuttavia, queste possono avere forme
molto complicate, come si capisce ad esempio chiedendosi quali sono le loro linee
nodali, che sono le linee interne al rettangolo, soluzioni dell’equazione:
m y
m x
m y
n x
c1 sin
sin
+ c2 sin
sin
= 0:
a
a
a
a
Questo è il fenomeno della degenerazione della membrana quadrata, consistente
nell’esistenza di vibrazioni stazionarie complicate. Ad esempio, rappresentiamo
(per a = 1) le funzioni
c1 u2;3 (x; y; 0) + c2 u3;2 (x; y; 0) = c1 sin (2 x) sin (3 y) + c2 sin (3 x) sin (2 y)
e le loro linee di livello per alcune scelte dei coe¢ cienti c1 ; c2 :
Per c1 = 0:1; c2 = 0:9 gra…co e linee di livello sono:
Per c1 = 0:3; c2 = 0:7 gra…co e linee di livello sono:
256
Per c1 = 0:5; c2 = 0:5 gra…co e linee di livello sono:
6.6.2
Equazione del calore sul rettangolo
Segnaliamo anche che se stessimo risolvendo il problema agli autovalori per
risolvere poi il problema di Cauchy-Dirichlet (6.12) per l’equazione del calore
avremmo, in base alla discussione fatta in precedenza e alla (6.17)
u (x; y; t) =
1
X
n;m=1
cn;m sin
m y
n x
sin
e
a
b
k
2
n2
a2
2
+m
b2
t
;
nella quale potremmo determinare i coe¢ cienti cn;m per soddisfare la condizione
iniziale.
6.7
L’equazione di Helmholz sul cerchio. Funzioni di Bessel
di ordine intero
Studiamo ora l’equazione di Helmholz sul cerchio unitario, con condizione al
contorno di Dirichlet nulla. Scrivendo il laplaciano in coordinate polari si ha:
8 2
1 @2u
< @ u 1 @u
+
+ 2
+ u = 0 0 < < 1; 0 # 2
2
(6.19)
@
@
@#
:
u (1; #) = 0
0 # 2 :
Si noti che abbiamo posto, per semplicità, il raggio del cerchio r = 1. Infatti se
u risolve
u + u = 0 per < 1
u = 0 per = 1
la funzione
v ( ; #) = u
r
;#
risolverà
v + r2 v = 0 per
v = 0 per = r
257
<r
quindi l’equazione di Helmholz sul cerchio di raggio qualsiasi si risolve prendendo
le opportune dilatazioni di autofunzioni e autovalori del laplaciano sul cerchio
unitario.
Per risolvere il problema (6.19), separiamo le variabili cercando
u ( ; #) = R ( )
1
+ R0
R00
+
2
1
2
00
R
(#) :
+ R
R0
R00
+
+
R
R
=0
2
=
00
che porta a:
00
2
00
0
R + R +
2
=
R = 0:
La prima equazione, unita alla condizione di periodicità su
n
; porta a
(#) = an cos (n#) + bn sin (n#)
= n2 ; n = 0; 1; 2; :::
e la seconda diventa
2
R00 + R0 +
2
n2 R = 0;
problema agli autovalori in da risolversi per
dizione al contorno nulla), e R (0) …nita.
6.7.1
(6.20)
2 [0; 1], con R (1) = 0 (con-
Equazione di Bessel ed autofunzioni del laplaciano sul cerchio
Riscrivendo l’equazione (6.20) nella forma
n2
R00 + R0 +
R=0
e quindi
0
( R0 ) +
n2
R = 0 per
2 (0; 1) ,
si vede che si tratta di un problema di Sturm-Liouville singolare (il coe¢ ciente
p ( ) = si annulla in 0). Da questa forma dell’equazione si legge che per
autosoluzioni relative ad autovalori distinti sono ortogonali in L2 ((0; 1) ; d ).
Si osservi che in questa equazione l’intero n = 0; 1; 2; ::: è …ssato (cioè: per ogni n
stiamo studiando una diversa equazione); il numero che cerchiamo è senz’altro
positivo perché per come è stato impostato il problema è un autovalore del
Laplaciano. Siamo interessati a determinare le soluzioni R ( ) dell’equazione in
(0; 1) che siano limitate in 0 e si annullino in 1.
258
Si procede così: poniamo
ponendo
= ! 2 ed eseguiamo il cambio di variabili ! = x,
R( ) = R
x
!
= X (x) ;
1 0 x
1
R
= R0 ( )
!
!
!
1
X 00 (x) = 2 R00 ( )
!
X 0 (x) =
si ha:
2
! 2 R00 + !R0 + ! 2
2
x2 R00 + xR0 + x2
n2 R = 0;
n2 R = 0 per x 2 (0; !) , con
R (!) = 0; R (0) limitata.
L’equazione
x2 R00 + xR0 + x2
n2 R = 0 per x 2 (0; +1)
(6.21)
si dice equazione di Bessel di ordine n = 0; 1; 2; 3; ::: A noi interessa risolverla
in (0; !) imponendo la condizione R (!) = 0 (e la limitatezza in 0), ma poiché
! è ancora incognita, diciamo che ci interessa risolverla in (0; +1).
Enunciamo senza dimostrazione una serie di proprietà che riguardano l’equazione di Bessel.
1. L’integrale generale dell’equazione di Bessel di ordine n = 0; 1; 2; ::: ha la
forma
c1 Jn (x) + c2 Yn (x)
dove Jn (x), detta funzione di Bessel di prima specie di ordine n = 0; 1; 2; :::; è
regolare in [0; +1), mentre Yn (x), detta funzione di Bessel di seconda specie
di ordine n = 0; 1; 2; :::; è regolare in (0; +1) ma illimitata in 0. Quindi la
soluzione che ci interessa della (6.21) è R (x) = Jn (x).
2. L’espressione analitica di Jn (x), che si può ricavare col metodo di Frobenius, cercando una soluzione dell’equazione (6.21) in forma di serie di potenze
(come abbiamo fatto per l’equazione di Legendre), ricavandone una relazione di
ricorrenza sui coe¢ cienti e quindi risalendo all’espressione esplicita dei coe¢ cienti stessi, è la seguente:
Jn (x) =
1
X
k=0
k
( 1)
k! (n + k)!
x
2
2k+n
;
da cui in particolare si legge che per x ! 0 è Jn (x) cxn .
3. La funzione Jn (x) ha in…nite oscillazioni in (0; +1) ; in particolare ha
1
una successione di zeri fkn;m gm=1 che tende a in…nito.
259
Gra…ci delle funzioni Jn (x) per n da 0 a 5
1
2
3
4
Jn (x) ; n !
kn;m ; m #
0
1
2
3
4
5
2:405
5:520
8:654
11:792
3:832
7:016
10:173
13:324
5:136
8:417
11:620
14:796
6:380
9:761
13:015
16:223
7:588
11:065
14:372
17:616
8:771
12:339
15:700
18:980
Valori di alcuni zeri delle funzioni di Bessel
Poiché vogliamo R (!) = 0 dovrà essere
! = kn;m per qualche m;
2
kn;m
.
ossia =
Quindi, per ogni intero n = 0; 1; 2; :::; l’equazione (6.20) ha
1
2
soluzioni solo se è uno dei valori kn;m
, e in tal caso la soluzione è
m=1
R ( ) = Jn (kn;m ) .
260
Gra…ci di J0 (k0;m x) per m = 1; 2; 3; 4:
Gra…ci di J1 (k1;m x) per m = 1; 2; 3; 4:
Gra…ci di J2 (k2;m x) per m = 1; 2; 3; 4:
261
1
Per ciascun n …ssato il sistema (a un solo indice) fJn (kn;m )gm=1 è ortogonale completo in L2 ([0; 1] ; d ). L’ortogonalità è già stata dimostrata. Non
dimostriamo la completezza.
4. Si hanno quindi le seguenti autosoluzioni a variabili separate di (6.19):
Jn (kn;m ) cos (n#) per n = 1; 2; 3; ::: m = 1; 2; 3; :::
Jn (kn;m ) sin (n#) per n = 1; 2; 3; ::: m = 1; 2; 3; :::
J0 (k0;m )
per
m = 1; 2; 3; :::
(6.22)
1
2
corrispondenti alla successione a due indici di autovalori kn;m
.
n=0;1;2;:::m=1;2;:::
Gli autovalori sono i quadrati di tutti gli zeri di tutte le funzioni di Bessel di
prima specie. Le autofunzioni (6.22) costituiscono un sistema ortogonale completo in L2 ([0; 1] [0; 2 ] ; d d#) ossia, passando in coordinate cartesiane, in
L2 del cerchio unitario. Questo discende dal seguente argomento generale.
1
Sappiamo già che per ogni n …ssato fJn (kn;m )gm=1 è ortogonale completo
2
in L ([0; 1] ; d );
1
sappiamo che fcos (n#) ; sin (n#) ; 1gn=1 è ortogonale completo in L2 ([0; 2 ] ; d#);
2
allora presa una funzione f 2 L ([0; 1] [0; 2 ] ; d d#) possiamo:
1. per …ssato sviluppare f in serie di Fourier rispetto a #:
f ( ; #) =
1
A0 ( ) X
+
fAn ( ) cos (n#) + Bn ( ) sin (n#)g ;
2
n=1
1
ora per ogni n sviluppiamo An e Bn in serie rispetto al sistema fJn (kn;m )gm=1 ,
1
e sviluppiamo A0 in serie rispetto al sistema fJ0 (k0;m )gm=1 . Otteniamo:
1
1 X
a0;m J0 (k0;m ) +
(6.23)
2 m=1
( 1
)
1
1
X
X
X
+
an;m Jn (kn;m ) cos (n#) +
bn;m Jn (kn;m ) sin (n#)
f ( ; #) =
n=1
m=1
m=1
che è esattamente uno sviluppo rispetto al sistema (6.22), che pertanto risulta
completo.
Le funzioni (6.22) sono ortogonali complete ma non normalizzate.
calcolare i coe¢ cienti di normalizzazione occorre sapere che:
Z 1
1 2
2
Jn (kn;m ) d = Jn+1
(kn;m ) :
2
0
262
Per
Tenuto conto di questo, i coe¢ cienti dello sviluppo (6.23) si calcolano così:
Z 2
Z 1
2
an;m =
cos
(n#)
f ( ; #) Jn (kn;m ) d d#
2
Jn+1
(kn;m ) 0
0
per n = 0; 1; 2; :::; m = 1; 2; :::
Z 2
Z 1
2
sin (n#)
f ( ; #) Jn (kn;m ) d d#
bn;m =
2
Jn+1
(kn;m ) 0
0
per n = 1; 2; :::; m = 1; 2; :::
Si possono ora trarre conseguenze sulla soluzione di un problema di CauchyDirichlet per l’equazione del calore o delle onde sul cerchio.
6.7.2
La membrana vibrante circolare
Per la membrana vibrante circolare con velocità iniziale nulla e posizione iniziale
f ( ; #) si troverà soluzione:
1
1 X
a0;m J0 (k0;m ) cos (k0;m ct)
u (t; ; #) =
2 m=1
+
1
X
n=1
Jn (kn;m )
1
X
[an;m cos (n#) + bn;m sin (n#)] cos (kn;m ct) :
m=1
Si può dimostrare che questa formula assegna e¤ettivamente una funzione
due volte derivabile e soluzione del problema di Cauchy-Dirichlet se si suppone
che la condizione iniziale f ( ; #) è C 4 e sia f che f + 1 f si annullano sul
bordo. Per questa discussione si rimanda a [Weinberger p.184].
Le soluzioni stazionarie sono le seguenti:
J0 (k0;m ) cos (k0;m ct)
Jn (kn;m ) cos (n#) cos (kn;m ct)
Jn (kn;m ) sin (n#) cos (kn;m ct)
In particolare, le frequenze proprie di vibrazione della membrana circolare
(di raggio unitario) …ssata al bordo risultano essere
kn;m c
2
e, come nel caso del rettangolo, non sono multiple intere della frequenza fondamentale (un tamburo circolare non è in generale più musicale di un tamburo
quadrato).
Ricordando la discussione fatta all’inizio del paragrafo, se invece di essere
sul cerchio di raggio 1 fossimo sul cerchio di raggio r gli autovalori andrebbero
divisi per r2 , ossia
2
kn;m
=
n;m
r2
263
e quindi le frequenze risulterebbero:
n;m
=
kn;m c
:
2 r
Dal punto di vista musicale: un tamburo più grande ha una frequenza fondamentale corrispondente a una nota più grave, a parità di altre condizioni; per
raddoppiare la frequenza occorre dimezzare il raggio del tamburo.
Le linee nodali delle soluzioni stazionarie sono:
-le circonferenze interne al cerchio, lungo cui si ha Jn (kn;m ) = 0, ossia
kn;j
= kn;m
per j = 1; 2; :::; m 1 (sono m 1 circonferenze interne, più il bordo
del cerchio);
-i raggi lungo cui si ha cos (n#) = 0 oppure sin (n#) = 0, ad es. per sin sono
# = nk ; con k = 0; 1; :::; 2n 1: (Sono 2n raggi, cioè n diametri; per J0 queste
linee nodali non compaiono).
Mostriamo qualche gra…co delle funzioni J0 (k0;m ) (m = 1; 2; 3; 4):
Qualche gra…co delle funzioni Jn (kn;m ) cos (n#) ; con le relative linee di
livello (tra cui si vedono i raggi e le circonferenze che costituiscono le linee
264
nodali):
J1 (k1;1 ) cos (#)
J1 (k1;2 ) cos (#)
265
J2 (k2;1 ) cos (2#)
J2 (k2;2 ) cos (2#)
Un caso particolarmente semplice ma interessante è quando la condizione
iniziale è di tipo radiale. Si ha in tal caso:
u (t; ; #) =
1
1 X
a0;m J0 (k0;m ) cos (k0;m ct)
2 m=1
dove
f( )=
6.8
1
1 X
a0;m J0 (k0;m ) :
2 m=1
Equazione di Helmholz sul cilindro
Consideriamo l’equazione di Helmholz sul cilindro di raggio 1 e altezza l, con condizioni di Dirichlet nulle sul bordo. In coordinate cilindriche ( ; #; z) il problema
agli autovalori si scrive:
8
u + 1 u + 12 u## + uzz + u = 0 per 2 (0; 1) ; # 2 (0; 2 ) ; z 2 (0; l)
>
>
<
u (r; #; z) = 0
>
u ( ; #; 0) = 0
>
:
u ( ; #; l) = 0:
266
Se il raggio del cilindro non è 1 ma r, come nel caso del cerchio le autofunzioni
si ottengono da queste per cambiamento di scala v ( ; #; z) = u r ; #; z , e gli
autovalori vanno divisi per r2 .
Impostando il problema per separazione di variabili,
u ( ; #; z) = R ( )
si trova
R00
R0
1
+
+ 2
R
R
00
(#) Z (z)
+
Z 00
+
Z
=0
e ragionando al solito modo, tenuto conto anche delle condizioni al bordo e della
periodicità di si ha:
Z 00 = Z
Z (0) = Z (l) = 0
da cui
Z (z) = sin
k z
l
;
2
k
l
=
;
00
=
2 -periodica
da cui
(#) = a cos (n#) + b sin (n#) ;
=
n2
e quindi
2
R00
R0
1
k
n2 2
+
+
R
R
l
(
0
n2
k
R00 + R
2 R +
l
R (1) = 0; R (0) limitata
=0
2
R=0
che è un’equazione di Bessel di ordine n; le cui soluzioni sono quindi, per ogni
n …ssato,
R ( ) = Jn (kn;m )
con autovalori
k
l
2
kn;m
=
2
da cui ricaviamo che gli autovalori del problema iniziale sono la successione a
tre indici interi
2
k
2
n;m;k = kn;m +
l
per n = 0; 1; 2; ; m = 1; 2; :::; k = 1; 2; :::
267
Le soluzioni a variabili separate sono quindi:
k z
l
k z
l
u ( ; #; z) = Jn (kn;m ) sin
u ( ; #; z) = Jn (kn;m ) sin
cos (n#)
sin (n#)
mediante le quali possiamo poi esprimere la soluzione di un problema di CauchyDirichlet per l’equazione del calore o delle onde sul cilindro. Ad esempio:
6.8.1
L’equazione del calore sul cilindro
La soluzione del problema di Cauchy-Dirichlet per l’equazione del calore sul
cilindro:
8
>
ut D u + 1 u + 12 u## + uzz = 0 per 2 (0; 1) ; # 2 (0; 2 ) ; z 2 (0; l)
>
>
>
>
< u (t; r; #; z) = 0
u (t; ; #; 0) = 0
>
>
>
u (t; ; #; l) = 0
>
>
:
u (0; ; #; z) = f ( ; #; z)
si può esprimere mediante la serie
u (t; ; #; z) =
1 X
1
X
a0;m;k e
2
D k0;m
+( kl
2
)
t
J0 (k0;m ) sin
m=1 k=1
+
1 X
1 X
1
X
e
2
2
D kn;m
+( kl
)
t
Jn (kn;m ) sin
n=1 m=1 k=1
k z
l
k z
l
fan;m;k cos (n#) + bn;m;k sin (n#)g
dove i coe¢ cienti an;m;k ; bn;m;k sono quelli dello sviluppo del dato iniziale f in
serie di funzioni ortonormali:
f ( ; #; z) =
1 X
1
X
k z
l
a0;m;k J0 (k0;m ) sin
m=1 k=1
+
1 X
1 X
1
X
k z
l
Jn (kn;m ) sin
n=1 m=1 k=1
fan;m;k cos (n#) + bn;m;k sin (n#)g
e di conseguenza hanno queste espressioni
an;m;k
bn;m;k
2
= 2
Jn+1 (kn;m )
2
= 2
Jn+1 (kn;m )
Z
1
0
Z
0
1
2
l
2
l
Z
l
1
0
Z
0
Z
2
f ( ; #; z) cos (n#) d# sin
k z
l
f ( ; #; z) sin (n#) d# sin
k z
l
0
l
1
Z
2
0
268
dz
dz
!
!
Jn (kn;m ) d
Jn (kn;m ) d
6.9
Equazione di Helmholz sulla sfera. Funzioni di Bessel
sferiche
Consideriamo l’equazione di Helmholz sulla sfera di raggio unitario, che in
coordinate sferiche
8
< x = sin # cos '
y = sin # sin '
:
z = cos #
assume la forma:
8
>
>
@ 2 u 2 @u
>
>
+
+
<
@ 2
@
>
>
>
>
: u (1; #; ') = 0
1
@
2 sin # @#
sin #
@u
@#
+
1
@2u
+ u=0
2 sin2 # @'
per 0 < < 1;
0<#< ;
0<'<2
per 0 < # < ;
0<'<2 :
Analogamente a quanto visto nel caso del cerchio o del cilindro, se la sfera avesse
raggio r ci si riconduce a questo caso col cambiamento di scala v ( ; #; ') =
u r ; #; ' e dividendo per r3 gli autovalori che troveremo per la sfera di raggio
unitario.
Cercando soluzioni a variabili separate
u ( ; #; ') = R ( ) S (#; ') ;
ponendo
(#;')
=
1 @
sin # @#
sin #
@
@#
+
1 @2
sin2 # @'
e sfruttando i calcoli già fatti nello studio del laplaciano sulla sfera (v. §8.3.1)
si ha:
2
2
R00 ( ) + 2 R0 ( ) S (#; ') + R ( )
00
0
R ( )+2 R ( )+
R( )
2
R( )
(#;') S
=
R00 ( ) + 2 R0 ( ) +
R( )
2
R ( ) S (#; ') = 0
(#;') S (#; ')
S (#; ')
da cui ricaviamo che per qualche costante
2
(#; ') +
2
R( )
si ha
=
=
(#;') S
(#; ')
:
S (#; ')
Ora il problema agli autovalori
(#;') S
(#; ') + S (#; ') = 0
è già stato risolto e porta alle armoniche sferiche; precisamente si ha (v. §8.3.1)
= n (n + 1)
Sn;m (#; ') = Pnm (cos #) (a cos m' + b sin m')
269
per n = 0; :::; 1, m = 0; :::; n: L’equazione radiale diventa allora
R00 ( ) + 2 R0 ( ) +
R (1) = 0;
2
2
n (n + 1) R ( ) = 0
equazione che assomiglia all’equazione di Bessel (v. §8.4.3)
2
R00 + R0 +
2
n2 R = 0
ma non lo è per via del termine 2R0 anziche R0 .
Per riportarla a un’equazione di Bessel si esegue il cambio di variabile
1=2
R( ) =
S ( ):
I soliti calcoli noiosi portano in de…nitiva all’equazione
(
2
2 00
2
S ( ) + S0 ( ) +
n + 21
S( )=0
S (1) = 0
che è un’equazione di Bessel di ordine n + 12 , cioè non intero ma semiintero (il
doppio di n + 21 è un intero, dispari). O meglio, come nel caso dell’equazione di
p
Bessel studiata nel §8.4.3, ponendo
= x si trasforma nell’equazione
8
2
< x2 S 00 (x) + xS 0 (x) + x2
S (x) = 0
n + 12
p
: S
=0
Apriamo allora una parentesi su quest’equazione.
6.9.1
Equazione e funzioni di Bessel di ordine semiintero
Consideriamo l’equazione di¤erenziale
x2 y 00 (x) + xy 0 (x) + x2
2
y (x) = 0 per x > 0
e
> 0 assegnato. Si dice equazione di Bessel di ordine : Se
= n + 12 ,
l’unica soluzione dell’equazione che sia limitata in x = 0 è (a meno di costante
moltiplicativa) la funzione di Bessel di ordine semiintero (detta anche funzione
di Bessel sferica):
x
2
Jn+ 12 (x) =
dove
(t) =
R +1
0
tx
1
1
n+ 12 X
k=0
k
k!
( 1)
n+k+1+
1
2
x
2
2k
;
e t dt è la funzione Gamma di Eulero e
1
2
(2 (n + k) + 1)!!
p
; con
2n+k
(2r + 1)!! = (2r + 1) (2r 1) (2r 3) (2r
n+k+1+
=
270
5) :::5 3
L’autovalore
corrispondente è uno della successione
n;h
2
= kn+
1
;h ;
2
dove kn+ 21 ;h è l’h-esimo zero della funzione Jn+ 21 (x) e la successione kn+ 12 ;h
tende a in…nito.
Vale anche la seguente formula
Jn+ 21
n+ 12
(2x)
p
(x) = ( 1)
n
dn
n
d (x2 )
sin x
x
n
dove la bizzarra scrittura d(xd 2 )n sinx x ha il seguente signi…cato. Dopo aver
scritto (in base allo sviluppo di Taylor di sin x)
1
sin x X
x2k
k
=
( 1)
x
(2k + 1)!
k=0
si deriva formalmente questa serie rispetto alla variabile x2 , cioè si deriva n volte
rispetto a t la serie
1
X
tk
k
( 1)
(2k + 1)!
k=0
2
e si pone t = x nel risultato.
Esempio 6.25 Si ha:
J1=2 (x) =
J3=2 (x) =
r
2
sin x
x
r
2
cos x
x
sin x
x
:
Si dimostra che per ogni n = 0; 1; 2; ::: le funzioni
n
o1
Jn+ 12 kn+ 12 ;m
m=1
(opportunamente normalizzate) sono un s.o.n.c. in
L2 ((0; 1) ; d ) :
Per il calcolo dei coe¢ cienti di normalizzazione, vale ancora la formula:
Z 1
2
1 2
Jn+ 12 kn+ 12 ;m
d = Jn+1+
kn+ 12 ;m :
1
2
2
0
Riportiamo qualche informazione quantitativa sulle prime funzioni di Bessel
di ordine semiintero.
271
r
2
sin x
x
r
2
sin x
J3=2 (x) =
cos x
x
x
r
2
cos x
3 sin x
J5=2 (x) =
3
sin x +
x
x
x2
r
2
15 cos x 15 sin x
sin x
J7=2 (x) =
cos x
+
6
x
x2
x3
x
r
105 cos x 10 cos x
105 sin x
2
+
+ sin x +
J9=2 (x) =
x
x3
x
x4
J1=2 (x) =
kn+1=2;h
n=0
n=1
n=2
n=3
n=4
h=1
3:14159
4:49341
5:76346
6:98793
8:18256
h=2
6:28319
7:72525
9:09501
10:4171
11:7049
h=3
9:42478
10:9041
12:3229
13:698
15:0397
h=4
12:5664
14:0662
15:5146
16:9236
18:3013
h=5
15:708
17:2208
18:689
20:1218
21:5254
Zeri delle funzioni di Bessel di ordine semiintero
Gra…ci delle funzioni di Bessel Jn+ 21 (x) per n = 0; 1; 2; 3; 4:
272
45 sin x
x2
273
5
Gra…ci delle funzioni J 12 k 12 ;h
Gra…ci delle funzioni J 32 k 32 ;h
per h = 1; 2; 3; 4; 5
per h = 1; 2; 3; 4; 5
Tornando alla nostra equazione radiale, la soluzione è quindi
R( ) =
con
1=2
S( )=
1=2
Jn+ 12 kn+ 12 ;h
2
= kn+
1
;h ; h = 1; 2; 3::::
2
n+1=2
n
Poiché per ! 0 è Jn+ 12 ( )
si ha R ( )
: In de…nitiva, le soluzioni
a variabili separate dell’equazione di Helmholz sulla sfera sono
un;m;h ( ; #; ') =
1=2
Jn+ 12 kn+ 12 ;h
Pnm (cos #) cos m'
u0n;m;h ( ; #; ') =
1=2
Jn+ 12 kn+ 12 ;h
Pnm (cos #) sin m';
274
con autovalori
n;h
2
= kn+
1
;h
2
dove n = 0; 1; 2; :::; h = 1; 2; :::; m = 0; 1; :::; n:
Per un ragionamento già visto più volte, il sistema a tre indici
un;m;h ( ; #; ') ; u0n;m;h ( ; #; ')
n=0;1;2;:::;h=1;2;:::;m=0;1;:::;n
è ortogonale e, se normalizzato, ortonormale completo, nello spazio L2 prodotto.
Precisamante, poiché sappiamo già che il sistema
fPnm (cos #) cos m'; Pnm (cos #) sin m'gn=0;1;2;:::;m=0;1;:::;n
è ortogonale completo in
L2 ((0; )
(0; 2 ) ; sin #d#d')
e per ogni n = 0; 1; 2; :: il sistema
n
Jn+ 12 kn+ 12 ;h
o
h=1;2;:::
è ortogonale completo in
L2 ((0; 1) ; d ) ;
ne segue che il sistema
un;m;h ( ; #; ') ; u0n;m;h ( ; #; ')
n=0;1;2;:::;h=1;2;:::;m=0;1;:::;n
è ortogonale completo in
L2 (0; 1)
(0; )
(0; 2 ) ;
2
sin #d d#d' :
Si faccia attenzione al termine 2 anziché , che compare grazie alla presenza dei
termini 1=2 nella de…nizione di un;m;h . D’altro canto, con cambio di variabili
sferiche, si vede che la misura 2 sin #d d#d' non è altro che la misura di volume
dxdydz in coordinate cartesiane. Quindi le soluzioni a variabili separate sono
un s.o.n.c. in L2 della sfera.
6.10
L’equazione di Schrödinger per l’atomo di idrogeno
e i polinomi di Laguerre
Consideriamo un atomo di idrogeno, costituito da un elettrone di massa me
e carica elettrica e che ruota attorno al nucleo di carica e che supponiamo
posto nell’origine. Vogliamo studiare il modello con cui la meccanica quantistica prevede dove si troverà l’elettrone. L’energia potenziale elettrostatica
dell’elettrone è data da
e2
V ( )=
;
4 "0
275
dove "0 è la costante di permettività del vuoto38 , e l’equazione di Schrödinger
per la funzione d’onda (x; y; z; t) dell’elettrone è
i}
@
=
@t
~2
2me
+V
:
Cercando soluzioni a variabili separate in spazio e tempo come abbiamo fatto
per l’equazione delle onde o del calore nell §8.5.1 (e come abbiamo già fatto per
l’equazione di Schrödinger nel caso unidimensionale studiato nel §8.4.2)
(x; y; z; t) =
troviamo
(x; y; z) T (t)
~2
2me
T0
i} (t) =
T
+V
(x; y; z)
da cui ogni membro dev’essere costante, chiamiamo E questa costante (che
dimensionalmente è un’energia). L’equazione in T (t) è allora banale,
T 0 (t) =
i
E
T (t)
}
iE
}t
T (t) = ce
mentre l’equazione signi…cativa è
~2
2me
+V
=E ;
che a¤rontiamo ancora per separazione di variabili, dopo averla riscritta in coordinate sferiche. Utilizzando le notazioni introdotte nello studio del laplaciano
in coordinate sferiche (§ 8.4.1, le conclusioni di quella discussione ci saranno
utili), conviene porre, in coordinate sferiche
8
< x = sin # cos '
y = sin # sin '
:
z = cos #;
così che l’equazione diventa
~2
2m
@ 2 u 2 @u
1
+
+ 2
@ 2
@
(#;')
+V ( )
=E
e cercando
( ; '; #) = R ( ) Y ('; #)
si ha
2
3 8 In
e
R00 + 2 R0 + 2m
~2
R
2
(V ( )
E) R
altre parole, k = 1=4 "0 è la costante di Coulomb.
276
( )=
(#;') Y
Y
('; #)
da cui ogni membro è costante, uguale a
(#;') Y
. L’equazione in Y;
('; #) =
Y ('; #)
è la stessa che abbiamo incontrato risolvendo per separazione di variabili il
laplaciano in coordinate sferiche, quindi possiamo trarre le stesse conclusioni.
Si avrà39
= l (l + 1) , per l = 0; 1; 2:::
Y ('; #) = fYl;m ('; #)gl=0;:::;1
m=0;:::;l
Yl;0 ('; #) = Pl (cos #)
Yl;m ('; #) = Plm (cos #) (a cos m' + b sin m')
cioè la parte angolare della soluzione è costituita dalle armoniche sferiche.
Consideriamo ora l’equazione radiale:
2
R00 + 2 R0 +
2me
~2
2
e2
+ E R = l (l + 1) R, per
4 "0
> 0:
Per sempli…carla si fanno vari passi, che qui mostriamo schematicamente. I
calcoli dettagliati si trovano in fondo al paragrafo.
1. Eseguiamo anzitutto il cambio di variabili
u( ) = R( )
che trasforma l’equazione in
u00 ( ) =
l (l + 1)
e2
+E
4 "0
2me
~2
2
u:
2. Quindi si de…niscono le costanti
2
e2
4 "0 ~
4 "0 ~2
a0 =
= raggio di Bohr
me e2
E
W =
Eh
Eh = me
e si esegue la sostituzione sulla variabile indipendente:
y=
a0
3 9 Per adeguarci alle notazioni standard sull’argomento cambiamo le lettere con cui
denotavamo gli indici interi.
277
Questo dà:
1 00
u (y) +
2
1 l (l + 1)
2 y2
1
y
u (y) = W u (y) :
3. Ora bisogna distinguere il segno di W . Nel seguito trattiamo solo il caso
W < 0; che dà soluzioni L2 . Supponendo W < 0; de…niamo
p
=2
2W
e riscaliamo la soluzione, ponendo
x = y:
Si trova:
d2 u
l (l + 1)
2
1
(x) +
+
u (x) = 0:
2
2
dx
x
x 4
4. Ora si vuole fare una sostituzione opportuna che trasformi l’equazione in
una integrabile. Si ragiona così.
Per x ! 1 l’equazione è approssimata da
d2 u
(x)
dx2
1
u (x) = 0;
4
la cui soluzione esatta è
u (x) = c1 e
x=2
+ c2 ex=2 ;
di cui la soluzione accettabile è
u (x) = c1 e
x=2
:
Per x ! 0 l’equazione è approssimata da
l (l + 1)
d2 u
(x)
u (x) = 0;
2
dx
x2
equazione di Eulero, il cui integrale generale è
u (x) = c1 xl+1 + c2 x l ;
di cui la soluzione accettabile è
u (x) = c1 xl+1 :
Si fa allora una sostituzione suggerita da queste due soluzioni approssimate
per x piccolo e x grande:
u (x) = xl+1 e
x=2
f (x) :
Con ciò l’equazione diventa
xf 00 + (2l + 2
x) f 0 + (
l
1) f = 0 con
=p
1
:
2W
5. Quest’equazione assomiglia all’equazione di Laguerre:
xy 00 + (1
x) y 0 + y = 0 per x 2 (0; +1) ;
è in e¤etti un’equazione di Laguerre associata. Apriamo una parentesi.
278
6.10.1
Equazione e polinomi di Laguerre associati
Sappiamo che l’equazione di Laguerre
xy 00 + (1
x) y 0 + y = 0 per x 2 (0; +1)
si può riscrivere nella forma
xe
x 0 0
y
+ e
x
y = 0 per x 2 (0; +1) :
E’un problema di Sturm-Liouville singolare, che ha come autovalori = k (k + 1)
e autofunzioni, L2 ((0; +1) ; e x dx) i polinomi di Laguerre Lk (x).
Si dice equazione di Laguerre associata l’equazione (per qualche > 0)
xy 00 + ( + 1
x) y 0 + y = 0 per x 2 (0; +1)
che si può riscrivere nella forma
x
+1
e
x 0 0
y
+ x e
x
y = 0 per x 2 (0; +1) :
E’un problema di Sturm-Liouville singolare, le autofunzioni sono ortogonali in
L2 ((0; +1) ; x e x dx) :
Si dimostra il seguente:
Teorema 6.26 Gli autovalori dell’equazione di Laguerre associata sono gli stessi che per l’equazione di Laguerre, = n con n = 0; 1; 2; ::: Per ogni n, se Ln (x)
è il polinomio di Laguerre che soddisfa l’equazione
xy 00 + (1
x) y 0 + ny = 0 per x 2 (0; +1) ;
allora
ex dn
x
n! dxn
soddisfa l’equazione di Laguerre associata
L(n ) (x) =
xy 00 + ( + 1
x
+n
e
x
x) y 0 + ny = 0 per x 2 (0; +1) .
( )
Le funzioni Ln (x) sono polinomi
diogrado n, detti polinomi di Legendre asson
1
( )
ciati, e per ogni il sistema Ln (x)
costituisce un s.o.n.c. in L2 ((0; +1) ; x e
n=0
Inoltre, per ogni n = 1; 2; 3::: il polinomio
in (0; +1).
( )
Ln
(x) ha esattamente n zeri distinti
( )
Nel seguito ci serviranno i polinomi di Legendre associati Ln (x) con
intero dispari; facciamo perciò qualche esempio di questo tipo.
n
o1
( )
Esempio 6.27 I primi polinomi Ln (x)
sono
n=0
L(n ) (x) =
x
ex dn
x
n! dxn
279
+n
e
x
x
dx).
cioè:
( )
L0 (x) = x
ex x e
x
=1
ex d
( )
L1 (x) =
x +1 e x = x + a + 1
1 dx
x ex d2
1 2
( )
L2 (x) =
x +2 e x =
x
2x (2 + ) + 2 + 3 + 2
2 dx2
2
x ex d3
x3
( + 3) x2
( + 2) ( + 3) x ( + 1) ( + 2) ( + 3)
( )
+3
x
L3 (x) =
x
e
=
+
+
3
2 dx
6
2
2
6
x
Ad esempio, per
=1
(1)
L0 (x) = 1
(1)
L1 (x) =
x+2
1 2
x
3x + 3
2
x3
(1)
L3 (x) =
+ 2x2 6x + 4
6
5 3
x4
(1)
L4 (x) =
x + 5x2 10x + 5
24 6
(1)
L2 (x) =
Per
=3
(3)
L0 (x) = 1
(3)
L1 (x) = 4
(3)
L2 (x) =
(3)
L3 (x) =
x
2
x
2
5x + 10
3
x
+ 3x2
6
280
15x + 20
6. Tiriamo allora le conclusioni sull’equazione radiale che proviene dall’equazione di Schrödinger per l’elettrone dell’atomo di idrogeno.
L’equazione
xf 00 + (2l + 2
x) f 0 + (
l
è un’equazione di Laguerre associata con
(
l
=p
1) f = 0 con
1
2W
= 2l + 1; ha autovalori
1) = k
e autofunzioni
(2l+1)
Lk
(x) =
x2l+1 ex dk
x
k! dxk
(2l+1)+k
e
x
La prima relazione signi…ca che
=p
W =
1
=l+1+k
2W
1
2
2 (l + k + 1)
E = W Eh =
1
2 me
2 (l + k + 1)
e2
4 "0 ~
2
:
Invece di usare come indici interi l; k = 0; 1; 2; :::: è comodo, per sempli…care
certe formule, porre ora
n = l + 1 + k;
quindi ora i due indici che usiamo sono
l = 0; 1; 2; ::::
n = l + 1; l + 2; ::::
281
o viceversa
n = 1; 2; 3; :::
l = 0; 1; :::; n
1:
Con queste notazioni i livelli energetici possibili sono:
2
e2
4 "0 ~
1
me
2n2
En =
Il livello minimo è
2
1
e2
me
:
2
4 "0 ~
Per scrivere le soluzioni radiali ora procediamo a ritroso; poiché
E1 =
u( ) = R( )
y=
a0
4 "0 ~ 2
a0 =
me e2
x= y
p
=2
2W
u (x) = xl+1 e
f (x) =
x=2
(2l+1)
Ln l 1
f (x)
(x)
si ha:
R( ) =
u( )
u (x) = xl+1 e
x= y=
Rn;l ( ) =
x=2
(2l+1)
l 1
Ln
(x)
p
=2
2W
a0
a0
l
2
na0
e
na0
(2l+1)
l 1
Ln
con n = 1; 2; 3; :::; l = 0; 1; :::; n
=
2
na0
2
na0
1
2
a0 =
4 "0 ~
:
me e2
In…ne, funzioni d’onda stazionarie sono
( ; '; #) = Rn;l ( ) Pl (cos #)
m
n;l;m ( ; '; #) = Rn;l ( ) Pl (cos #) cos (m')
m
n;l;m ( ; '; #) = Rn;l ( ) Pl (cos #) sin (m')
con n = 1; 2; 3; :::; l = 0; 1; :::; n 1; m = 0; 1; 2; :::; l
n;l;0
che vanno poi normalizzate.
282
6.10.2
Orbitali atomici
Le funzioni d’onda che abbiamo scritto si dicono orbitali atomici. Ricordiamo
che l’integrale del loro modulo al quadrato su una regione dello spazio rappresenta la probabilità che l’elettrone si trovi in quella regione dello spazio. Gli
indici b; l; m hanno il seguente signi…cato …sico.
Il numero n si dice numero quantico principale. De…nisce l’energia dell’elettrone, che vale
2
e2
1
m
:
En =
e
2n2
4 "0 ~
Il numero l si dice p
numero quantico del momento angolare, e il momento
angolare orbitale vale l (l + 1)~, in particolare è nullo se l = 0, e in questo
caso la funzione d’onda ha simmetria radiale (è indipendente da #; ').
Il numero m si dice numero quantico magnetico.
Gli orbitali vengono indicati con il primo numero quantico seguito da una
lettera che indica il secondo numero quantico, secondo lo schema:
l=
0
s
1
p
2
d
3
f
4
g
5
h
:::
:::
Ad esempio orbitale 2p signi…ca che n = 2 e l = 1:
Esaminiamo prima il signi…cato della componente radiale degli orbitali.
Esempio 6.28 Scriviamo esplicitamente le prime funzioni radiali.
R1;0 ( ) = e
a0
R2;0 ( ) = e
2a0
R2;1 ( ) =
R3;0 ( ) = e
2
a0
(1)
L0
a0
3a0
R3;1 ( ) =
2
3a0
R3;2 ( ) =
2
3a0
=e
(1)
L1
=e
a0
e
2a0
(1)
L2
e
2a0
(3)
L0
2
3a0
3a0
=e
(3)
L1
3a0
=
a0
2
e
a0
(5)
L0
a0
a0
1
2
3a0
2
3a0
2
3a0
e
=
=
+2
2a0
2
2
3a0
2
3a0
2
3a0
2
3a0
3
e
3a0
4
!
+3
2
3a0
2
e
3a0
La densità di probabilità che l’elettrone si trovi a distanza dal nucleo (in2
dipendentemente dalla direzione) è proporzionale a 2 Rn;l ( ) . Perciò può essere signi…cativo visualizzare i gra…ci di queste funzioni. Rappresentiamole,
283
ponendo per semplicità a0 = 1
2
2
e
2
2
e
2
4
e
2
2
e
2
R1;0 ( ) =
2
R2;0 ( ) =
2
R2;1 ( ) =
2
R3;0 ( ) =
2
2
R3;1 ( ) =
2
R3;2 ( ) =
4
9
2
+ 2)
2
3
e
2
2
9
2
3
4
2
3
2
(
4
4
6
2
e
2 +3
2
3
2
2
3
Gra…co della densità di probabilità di trovare l’elettrone a distanza
nucleo nei primi orbitali:
1s
3s
2s
dal
2p
3p
3d
Esaminiamo ora il signi…cato della componente angolare degli orbitali.
Esempio 6.29 Scriviamo esplicitamente le prime funzioni angolari. Si tratta
in realtà delle armoniche sferiche che già conosciamo.
Per n = 1, cioè l’orbitale 1s, la funzione angolare è costante: funzione
d’onda a simmetria sferica.
Per n = 2 si può avere:
l = 0; m = 0 (orbitale 2s), che ha ancora funzione angolare costante, oppure
284
l = 1; m = 0; l = 1; m = 1 (orbitali 2p):
r
3
cos #
2
r
3
P11 (cos #) cos ' =
sin # cos '
2
r
3
P11 (cos #) sin ' =
sin # sin '
2
P1 (cos #) =
(quindi gli orbitali 2p sono di tre tipi). Gli orbitali 2p sono perciò i più semplici
ad avere una parte angolare signi…cativa. Il quadrato di questa funzione è proporzionale alla densità di probabilità di trovare l’elettrone (non importa a quale
distanza dal nucleo ma) nella direzione individuata dagli angoli (#; '). Una
visualizzazione di una funzione f (#; ') può essere ottenuta con un diagramma
sferico, che cioè rappresenta la super…cie = f (#; ') ; ossia la super…cie di
equazioni parametriche
8
< x = f (#; ') sin # cos '
y = f (#; ') sin # sin '
:
z = f (#; ') cos #:
Si tratta di un concetto analogo a quello di curva in forma polare nel piano. La
super…cie visualizza la funzione nel senso che i punti della super…cie più o meno
lontani dall’origine rappresentano le direzioni in cui la funzione è maggiore o
minore.
I diagrammi sferici degli orbitali 2p sono perciò:
(e simili gli altri due, orientati ciascuno secondo un asse).
Per n = 3 si può avere:
285
l = 0; m = 0 (orbitale 3s), che ha ancora funzione angolare costante, oppure
l = 1; m = 0; m = 1 (orbitali 3p);
l = 2; m = 0; m = 1; m = 2 (orbitali 3d):
r
1 5
P2 (cos #) =
3 cos2 # 1
2 2
r
5
1
P2 (cos #) cos ' = 3
cos # sin # cos '
2
r
5
P21 (cos #) sin ' = 3
cos # sin # sin '
2
r
5
sin2 # cos 2'
P22 (cos #) cos 2' = 3
2
r
3
2
P2 (cos #) sin 2' =
sin2 # sin 2'
2
I gra…ci sferici degli orbitali 3d sono i seguenti
e gli altri 3 sono simili al secondo, diversamente orientati.
286
Orbitali f si hanno ad esempio per n = 4; l = 3; m = 0; 1; 2; 3:
r
7
3
5
0
P3 (cos #) =
cos # + cos3 #
2
2
2
r
7
3 15
P31 (cos #) cos ' =
sin #
+
cos2 # cos '
2
2
2
r
7
3 15
P31 (cos #) sin ' =
sin #
+
cos2 # sin '
2
2
2
r
7
2
P3 (cos #) cos 2' = 15
sin2 # cos # cos 2'
2
r
7
2
P3 (cos #) sin 2' = 15
sin2 # cos # sin 2'
2
r
7
3
P3 (cos #) cos 3' =
15 sin3 # cos 3'
2
r
7
3
P3 (cos #) sin 3' =
15 sin3 # sin 3'
2
Il gra…co sferico della prima di queste funzioni è il seguente
Di seguito raccogliamo le espressioni esplicite dei primi orbitali, comprensive
287
della corretta costante di normalizzazione.
6.10.3
Soluzioni dell’equazione di Schrödinger
Ricordiamo anche che le soluzione a variabili separate dell’equazione di Schrödinger
si ottengono moltiplicando le precedenti per il fattore
e
i E}n t
con En energia corrispondente al livello n corrispondente.
Ad esempio, la soluzione dell’equazione di Schrödinger a variabili separate
corrispondente al livello energetico minimo n = 1 è (trascurando la costante di
normalizzazione):
i
(t; ; '; #) = e 2~
6.10.4
me
e2
4 "0 ~
2
t
e
a0
:
Calcoli dettagliati per la risoluzione dell’equazione radiale
Riportiamo i passaggi di calcolo che giusti…cano le conclusioni citate in precedenza nella deduzione delle soluzioni dell’equazione radiale.
288
Passo 1. Calcoli:
R( ) =
R0 =
R00 =
u( )
u0 ( )
u( )
2
00
2u0 ( )
u ( )
2
+
2u ( )
3
che sostituendo danno
u00 ( )
2
2u0 ( )
2
+
2me
~2
2
u00 ( )
+
2u ( )
+2
3
u0 ( )
u( )
2
2
e
u( )
u( )
+E
= l (l + 1)
4 "0
u( )
2u ( )
2u0 ( ) +
+ 2u0 ( ) 2
e2
u( )
+ E u ( ) = l (l + 1)
4 "0
2m
e2
u( )
e
+ E u ( ) = l (l + 1) 2 :
u00 ( ) + 2
~
4 "0
+
2me
~2
u00 ( ) =
l (l + 1)
2
2me
~2
e2
+E
4 "0
u:
Passo 2. Calcoli:
u00 ( ) =
l (l + 1)
u00 ( ) =
l (l + 1)
00
u ( )=
00
u ( )=
2
2
l (l + 1)
2
l (l + 1)
2
2me
e2
+E
u
~2
4 "0
2 me e2
2me
E u
2
4 "0 ~
~2
2 1
a0
2 1
a0
2
2
289
e2
4 "0 ~
me e2
4 "0 ~ 2
2 1
2
W u
a0
a20
du
du
dy
du
1
( )=
(a0 y)
=
(a0 y)
d
dy
d
dy
a0
d2 u
d2 u
1
( ) = 2 (a0 y) 2
d 2
dy
a0
u00 ( ) =
l (l + 1)
2me
me
~2
2
W
2
W
!
u
!
u
1 00
u (a0 y) =
a20
l (l + 1)
2 1
2
W
a0
a20
a20 l (l + 1) 2a0
2W
2
2
u00 (a0 y) =
l (l + 1) 2
y2
y
1 l (l + 1)
2
y2
u00 (a0 y) =
1 00
u (a0 y) =
2
1 00
u
e (y) +
2
1 l (l + 1)
2 y2
1
y
d
=
dy
d
dx
Passo 3. Calcoli:
2W
2
y
u (a0 y)
u (a0 y)
u (a0 y)
2W
u (a0 y)
u
e (y) = W u
e (y) :
1 l (l + 1) 1
1 00
u (y) +
u (y) = W u (y)
2
2 y2
y
1 2 d2 u
1 2 l (l + 1)
(x) +
u (x) = W u (x)
2 dx2
2
y2
y
d2 u
l (l + 1)
2
2W
(x) +
+
u (x) =
u (x)
2
dx2
x2
x
d2 u
l (l + 1)
2
1
u (x) = 0
(x) +
+
dx2
x2
x 4
Passo 4. Calcoli:
u (x) = xl+1 e
x=2
f (x)
x=2
xl+1 f 0 + (l + 1) xl f
u00 (x) = e
x=2
xl+1 f 00 + 2 (l + 1) xl f 0 + (l + 1) lxl
1
(l + 1) xl f
2
d2 u
(x) +
dx2
e
x=2
1 l+1
x f
2
u0 (x) = e
xl+1 f 00 + 2 (l + 1) xl
1
2
1
4
290
1 l+1 0
x f
2
u (x) = 0
1
(l + 1) xl + xl+1 f
4
l (l + 1)
2
1
+
xl+1 e x=2 f (x) = 0
x2
x 4
xl+1 f 0 + (l + 1) lxl
+
f
1 l+1
x f
2
xl+1 f 0 + (l + 1) xl f
l (l + 1)
2
+
x2
x
1
1
xl
+
1
x2 f 00 + 2 (l + 1) x
x2 f 0 + [(l + 1) l
l (l + 1)
2
+
x2
x
x2 f
x2 f 00 + 2 (l + 1) x
+ (l + 1) l
=0
x2 f 0
1
(l + 1) x + x2
4
x2 f 00 + 2 (l + 1) x
xf 00 + (2l + 2
1
4
1
(l + 1) x + x2
4
l (l + 1) +
x2 f 0 +
x) f 0 +
ma
=2
p
2
(l + 1) x +
l
2W ;
2x
2x
1 2
x f =0
4
f =0
1 f =0
=p
1
2
=
2W
perciò
xf 00 + (2l + 2
x) f 0 + (
291
l
1) f = 0:
Bibliogra…a
[BN] A. Boggess, F. J. Narcowich: A First Course in Wavelets with Fourier
Analysis. Jouhn Wiley & Sons, 2009.
[B] Bramanti: Dispensa del corso di Metodi matematici per l’ingegneria, a.a.
2013/2104.
[EsAn2] Bramanti: Esercitazioni di Analisi 2. Esculapio. 2012.
[B3] Bramanti: Esercitazioni di Analisi 3. Cusl, 2001.
[An2] Bramanti, Pagani, Salsa: Analisi matematica 2. Zanichelli, 2009.
[F] Farlow. Partial Di¤erential Equations for scientists and engineers. Dover,
1993.
[Fo] Folland: Real Analysis. Modern applications and techniques. Wiley,
1984.
[HN] J. H. Hunter, B. Nachtergaele: Applied Analysis. World Scienti…c,
2001.
[OY] R. Onyshczak, A.Youssef: Fingerprint Image Compression and the
Wavelet Scalar Quantization Speci…cation, Chap. 19 in N. Ratha, R. Bolle,
Editors: Automatic Fingerprint Recognition System, Springer 2004.
[PS2]. Pagani, Salsa. Analisi Matematica 2. Masson 1993.
[Pe] Persico. Introduzione alla …sica matematica. Zanichelli.
[Saxe] Saxe. Beginning functional analysis. Springer 2010
[SVZZ] Salsa, Vegni, Zaretti, Zunino: Invito alle equazioni a derivate parziali.
Springer 2009.
[W] Weinberger: A …rst course in PDEs. Dover, 1965.
292