1. L`integrale di Lebesgue - Dipartimento di Matematica

Transcript

1. L`integrale di Lebesgue - Dipartimento di Matematica
1. L’integrale di Lebesgue
Henri Lebesgue (1875-1941)
Introduzione
In questa lezione cerchiamo di raccogliere (nel modo più veloce ed indolore...)
alcuni dei risultati più importanti ed utili della teoria dell’integrazione di Lebesgue. Poiché non abbiamo né il tempo, né la pazienza per sviluppare e
giustificare tutti i punti della teoria, seguiremo una via, diciamo cosı̀, descrittivo/assiomatica, accontentandoci di precisare con cura solo alcune definizioni
e i corrispondenti enunciati.
R
A prima vista, la nozione di integrale u(x) dx secondo Cauchy-Riemann
sviluppata nei precedenti corsi di Analisi Matematica sembra essere già sufficiente, poiché si applica ad una classe abbastanza ampia di funzioni e riesce
a trattare quasi tuttgli esempi che solitamente si incontrano nei primi anni
di studio. D’altra parte, questa nozione di integrabilità presenta almeno tre
inconvenienti:
– L’insieme di definizione di u deve essere limitato.
– u deve essere anch’essa limitata.
– La proprietà di essere misurabile non è stabile per la convergenza puntuale: in altre parole, può accadere che una successione di funzioni uniformemente limitate converga puntualmente ad una funzione limitata ma non
misurabile, i cui punti di discontinuità, cioè, siano “troppo numerosi”
per poter parlare di integrale.
1-1
L’integrale di Lebesgue
Queste difficoltà sono aggirate dalla nuova nozione di integrabilità che andiamo ad esporre.
I punti cardine della nuova teoria saranno
1. una definizione più generale di insieme di misura nulla;
2. la possibilità di integrare “praticamente” ogni funzione positiva
su ogni insieme, limitato o no: per questo si ammette anche +1 tra i
possibili valori che può assumere l’integrale;
3. la possibilità di scambiare l’ordine di serie e integrali per le funzioni positive;
4. l’integrabilità delle funzioni di segno qualunque si riconduce all’integrabilità del modulo della funzione;
5. nuovi teoremi di passaggio al limite sotto il segno di integrale.
1-2
L’integrale di Lebesgue
L’integrale delle funzioni positive
Definizione 1.1 (Funzioni positive, reali e complesse) Diremo che una funzione u definita in un insieme E ⇢ RN è positiva se il suo codominio è l’intervallo
esteso [0, +1]: ammettiamo pertanto che vi siano punti (anche tutti!) di E in cui
la funzione vale +1. u sarà invece reale (risp. complessa) se il suo codominio è R
(risp. C): in tal caso non ammettiamo valori infiniti. Osserviamo che le funzioni
reali sono un caso particolare di funzioni complesse.
L’algebra in [0, +1].
In [0, +1] non vi sono difficoltà a definire la somma e la relazione
d’ordine, come ciascuno può facilmente immaginare. Più arbitrario il prodotto 0 · (+1):
quando tratteremo di integrali e di funzioni positive, converremo che
Convenzione.
0 · (+1) := 0.
(1.1)
Questa definizione, che può sembrare arbitraria ed in contrasto con tutte le cautele imparate
negli anni precedenti, non è invece cosı̀ bizzarra, e nasce dall’esigenza di integrare funzioni
che valgono +1 su un insieme di misura nulla, o funzioni che valgono 0 su un insieme
di misura +1 (come tutto R, per esempio). I entrambi i casi, se si vuole preservare la
proprietà di monotonia che introdurremo tra un momento, si è costretti alla definizione
(1.1).
Teorema 1.2 (Integrale di Lebesgue per le funzioni positive) Ad ogni insieme E ⇢ RN e ad ogni funzione positiva u : E ! [0, +1] è possibile associare
univocamente un numero
Z
u(x) dx 2 [0, +1]
(1.2)
E
in modo che siano soddisfatte le seguenti proprietà fondamentali:
• (Estensione) Se E è misurabile e u è integrabile secondo Cauchy-Riemann
(anche in senso generalizzato) allora l’integrale di Lebesgue
Z
u(x) dx coincide con l’integrale di Cauchy-Riemann.
(1.3)
E
•
(Monotonia) Per ogni u, v : E ! [0, +1]
Z
Z
uv )
u(x) dx 
v(x) dx
E
(1.4)
E
• (Continuità: lemma di Fatou) Se un : E ! [0, +1] è una successione di funzioni
convergente puntualmente a u, cioè
9 lim un (x) =: u(x)
n"+1
8 x 2 E,
tali che per un opportuna costante M
Z
un (x) dx  M < +1
E
allora anche
Commento.
Z
E
u(x) dx  M.
8 n 2 N,
(1.5a)
(1.5b)
(1.5c)
Il senso del primo punto (Estensione) del precedente teorema è quello di garantire che
passando dall’integrale di Riemann a quello di Lebesgue operativamente non si è costretti
a cambiare alcunchè di ciò che si è appreso. Gli altri due, invece, servono per identificare
univocamente la nuova nozione introdotta e “tranquillizzare” il lettore più esigente: in
altri termini, tra tutte le possibili estensioni del concetto di integrale ne esiste solo una,
quella proposta appunto da Lebesgue, che soddisfa i due ulteriori requisiti di monotonia e
di continuità. Può sembrare strano come è stata formulata quest’ultima nozione (Lemma
di Fatou); riprenderemo meglio questo discorso dopo aver brevemente ricordato alcune
proprietà più familiari.
1-3
L’integrale di Lebesgue
Convenzione.
Misurabilità addio.
La teoria dell’integrazione di Lebesgue è strettamente legata ad un
nuovo concetto di misurabilità di insiemi e funzioni, cui accenneremo più avanti. Poichè
l’esistenza di funzioni non misurabili è strettamente legata a sottili questioni di logica e
teoria degli insiemi, e tutte le funzioni che ammettono una definizione costruttiva risultano,
di fatto, misurabili, per semplificare la trattazione noi assumeremo sempre che le funzioni
di cui stiamo parlando siano misurabili: d’ora in avanti, quindi, non ci preoccuperemo più
di ricordarlo esplicitamente. Spero che Lebegue possa perdonarmi...
Proprietà elementari
Proposizione 1.3 Se E ⇢ RN , u, v sono funzioni positive definite in E e
uno scalare positivo si ha
• (Additività rispetto a u)
Z
Z
Z
(u(x) + v(x)) dx =
u(x) dx +
v(x) dx,
E
E
E
Z
Z
u(x) dx =
u(x) dx.
E
0 è
(1.6)
(1.7)
E
• (Funzioni caratteristiche) Per ogni A ⇢ RN la funzione caratteristica di
A è definita da
(
1 se x 2 A;
1 A (x) :=
0 se x 62 A.
Per ogni A ⇢ E si ha
Z
u(x) dx =
A
Z
u(x)11A (x) dx.
(1.8)
E
• (Additività rispetto a E) Se E è l’unione disgiunta di due insiemi A, B
(cioè E = A [ B, A \ B = ?) allora
Z
Z
Z
u(x) dx.
(1.9)
u(x) dx =
u(x) dx +
E
Osservazione
Se A ⇢ E e u è positiva, allora
A
Z
A
B
u(x) dx 
Z
u(x) dx.
(1.10)
E
Definizione 1.4 (Misura di Lebesgue di un insieme) Se E ⇢ RN , indichiamo con |E| la sua misura di Lebesgue N -dimensionale (lunghezza sulla retta, area
nel piano, volume nello spazio!), definita da
Z
Z
|E| :=
1 dx =
1 E (x) dx.
(1.11)
RN
E
Nota
Per la proprietà di estensione dell’integrale di Lebesgue, questa definizione coincide con
quella di Peano-Jordan, quando l’insieme E è misurabile in questo senso più restrittivo.
1-4
L’integrale di Lebesgue
Scambio di operatori-I
Teorema 1.5 (Beppo Levi, convergenza monotona)
• Se un è una successione crescente di funzioni positive definite in E ⇢ RN ,
tali cioè che
n  m ) un (x)  um (x) 8 x 2 E,
allora
Z
lim un (x) dx = lim
E n"+1
•
n"+1
Z
un (x) dx.
(1.12)
E
Se un è una successione decrescente di funzioni positive definite in E ⇢ RN , tali cioè
che
n  m ) un (x) um (x) 8 x 2 E,
(1.13)
se almeno una di esse ha integrale finito allora
Z
Z
lim un (x) dx = lim
un (x) dx.
E n"+1
n"+1
(1.14)
E
Corollario 1.6 (Integrazione per serie) Se un è una successione di funzioni
positive definite in E ⇢ RN , allora
!
Z
+1
+1 Z
X
X
un (x) dx =
un (x) dx.
(1.15)
E
Nota
n=0
n=0
E
L’ipotesi essenziale del Teorema di Beppo Levi è la monotonia della successione u n (x)
rispetto a n (1.5): questa assicura sempre l’esistenza del limite puntuale
u1 (x) := lim un (x)
n"+1
e l’esistenza del limite degli integrali
i1 := lim
n"+1
Z
8 x 2 E,
un (x) dx.
E
Dunque, il contenuto veramente significativo del teorema sta nell’a↵ermare che i 1 è l’integrale di u1 su E.
Dimostrazione
Il teorema di Beppo Levi è una conseguenza immediata del lemma di Fatou (1.5a,b,c): basta
osservare che per monotonia
Z
Z
un (x)  u1 (x) e quindi
un (x) dx 
u1 (x) dx,
E
da cui
i1 := lim
n"+1
Z
E
un (x) dx 
E
Z
E
u1 (x) dx;
d’altra parte, sempre per la monotonia della successione degli integrali,
Z
un (x) dx  i1 8 n 2 N,
E
e il Lemma di Fatou stabilisce che
Z
E
u1 (x) dx  i1 .
Il teorema di integrazione per serie è una conseguenza diretta del precedente, applicato alla
successione delle somme parziali.
Richiami
Famiglie numerabili.
Una collezione (o famiglia) di oggetti A si dice numerabile se
può essere messa in corrispondenza biunivoca con l’insieme N dei numeri naturali; in altre
parole, tutti gli elementi di A si possono “etichettare” con un numero intero che li individua
univocamente e si possono conseguentemente “elencare” in una successione
A := {A0 , A1 , A2 , . . . , An , . . .}.
1-5
L’integrale di Lebesgue
Quando gli elementi An sono a loro volta insiemi, si parla di collezione o famiglia numerabile
di insiemi. Capiterà sovente di considerarne l’unione, cioè un nuovo insieme
A=
+1
[
An
n=0
i cui elementi sono tutti e soli quelli che apparengono a qualcuno delgli insiemi A n . Chiaramente
+1
[
An , 8 b 2 B 9 n 2 N : b 2 A n .
B⇢
n=0
Diremo che A è al più numerabile, quando è numerabile oppure A è costituita da un
numero finito di elementi.
Richiami
Famiglie monotone di insiemi, unioni disgiunte.
sottoinsiemi di qualche insieme E si dice crescente se
Se A :=
S +1
n=0
nm
)
Una famiglia A 1 , A2 , . . . , An , . . . di
A n ⇢ Am .
An in questo caso scriviamo più espressivamente che An " A.
Una famiglia A1 , A2 , . . . , An , . . . di insiemi si dice decrescente se
nm
T +1
)
An
Am .
Se A := n=0 An in questo caso scriviamo più espressivamente che An # A. In entrambi i
casi diciamo che An tende ad A quando n " +1.
Una famiglia A1 , A2 , . . . , An , . . . di sottoinsiemi di qualche insieme E si dice disgiunta se
n 6= m ) An \ Am = ?.
S
In questo caso diciamo che A := +1
n=0 An è l’unione disgiunta della famiglia o che la
famiglia forma una partizione di A.
Corollario 1.7 (Approssimazione e decomposizione degli integrali)
• Se E1 , E2 , . . . , En , . . . è una famiglia crescente convergente a E, cioè En " E
quando n " +1, allora
Z
Z
u(x) dx = lim
u(x) dx.
(1.16)
n"+1
E
En
• Se E1 , E2 , . . . , En , . . . è una famiglia decrescente convergente a E, cioè En #
E quando n " +1, e
Z
9m 2 N :
u(x) dx < +1,
Em
allora
Z
u(x) dx = lim
E
n"+1
Z
u(x) dx.
(1.17)
En
• Se E1 , E2 , . . . , En , . . . è una partizione di E, cioè E è l’unione disgiunta
della famiglia, allora
Z
u(x) dx =
E
Nota
+1 Z
X
n=0
u(x) dx.
(1.18)
En
Questo risultato è estremamente utile quando si deve calcolare esplicitamente un integrale:
si cerca di approssimare o di decomporre l’insieme E in insiemi più piccoli E n in modo che
u sia integrabile secondo Cauchy-Riemann su En (in particolare, gli En dovranno essere
limitati e anche u dovrà essere limitata su questi). Dopo di che si ottiene l’integrale di u
1-6
L’integrale di Lebesgue
su tutto E come limite o come serie, a seconda che si sia scelto una famiglia crescente e
approssimante E o una partizione di E.
La potenza del teorema sta nel fatto che siamo completamente liberi nella scelta della decomposizione: in altre parole, l’integrale non dipende da come si approssima o si decompone
l’insieme E.
Corollario 1.8
• Se E1 , E2 , . . . , En , . . . è una famiglia crescente convergente a E, cioè En "
E quando n " +1, allora
|E| = lim |En |.
(1.19)
n"+1
• Se E1 , E2 , . . . , En , . . . è una famiglia decrescente convergente a E, cioè En # E quando
n " +1, e almeno uno di essi ha misura finita allora
|E| = lim |En |.
(1.20)
n"+1
• Se E1 , E2 , . . . , En , . . . è una partizione di E, cioè E è l’unione disgiunta della famiglia,
allora
+1
X
|E| =
|En |.
(1.21)
n=0
Più in generale, se E è l’unione non necessariamente disgiunta della famiglia E n si ha
|E| 
+1
X
n=0
|En |.
(1.22)
Teorema 1.9 (Fubini) Se E = (a, b) ⇥ (c, d) è un insieme rettangolare (anche
illimitato) di R2 e u è una funzione positiva definita in E, allora
!
!
ZZ
Z b Z d
Z d Z b
u(x, y) dx dy =
u(x, y) dy dx =
u(x, y) dx dy. (1.23)
E
a
c
c
1-7
a
L’integrale di Lebesgue
Integrale delle funzioni reali o complesse
Definizione 1.10 (Integrale di Lebesgue) Se u è una funzione reale o complessa definita in E ⇢ RN , diciamo che u è integrabile secondo Lebesgue
se
Z
|u(x)| dx < +1.
(1.24)
E
Se u è reale poniamo quindi per definizione
Z
Z
u(x) dx :=
u+ (x) dx
E
E
Z
u (x) dx.
Analogamente, se u è complessa, definiamo
Z
Z
Z
u(x) dx :=
Re u(x) dx + i
Im u(x) dx.
E
E
(1.25)
E
(1.26)
E
Proposizione 1.11 (Validità delle proprietà elementari)
• La proprietà di monotonia (1.4) vale anche se le funzioni son reali e integrabili
su E.
• La proprietà di estensione, la proposizione 1.3 e il corollario 1.7 valgono anche in ambito complesso (con scalari complessi) purchè le funzioni f, g siano
integrabili su E.
Proposizione 1.12 (Disuguaglianza del modulo) Se u è una funzione complessa integrabile in E ⇢ RN , allora
Z
Z
u(x) dx 
u(x) dx.
(1.27)
E
E
1-8
L’integrale di Lebesgue
Scambio di operatori-II
Teorema 1.13 (Convergenza dominata, Lebesgue) Supponiamo che una
successione di funzioni complesse un , definite nell’insieme E ⇢ RN , converga
puntualmente ad una funzione u. Se è possibile trovare una funzione positiva e
integrabile g che domina tutte le un , cioè
Z
|un (x)|  v(x) 8 n 2 N, 8 x 2 E,
v(x) dx < +1,
(1.28)
E
allora
lim
Z
|un (x)
Z
un (x) dx =
n"+1
In particolare
lim
n"+1
E
u(x)| dx = 0.
E
Z
u(x) dx.
(1.29)
(1.30)
E
Corollario 1.14 (Continuità degli integrali dipendenti da un parametro)
Sia u una funzione complessa definita nel rettangolo E := (a, b)⇥(c, d) e supponiamo
che la funzione integrale rispetto alla variabile y
U (x) :=
Z
d
u(x, y) dy
c
sia ben definita in (a, b), cioè che la funzione y 7! u(x, y) sia integrabile rispetto a
y in (c, d). Supponiamo che per quasi ogni y 2 (c, d) la funzione
x 7! u(x, y)
sia continua in (a, b)
ed esista una funzione v dipendente solo da y tale che
Z
|u(x, y)|  v(y),
c
Allora la funzione U è continua in (a, b).
1-9
d
v(y) dy < +1.
L’integrale di Lebesgue
Insiemi trascurabili e funzioni definite q.o.
Definizione 1.15 (Insiemi trascurabili) Diciamo che N ⇢ RN è trascurabile
quando la sua misura di Lebesgue |N | è nulla.
Nota
Per la proprietà di estensione, se un insieme è misurabile secondo PeanoJordan e ha misura nulla, esso è trascurabile: in particolare un numero
finito di punti sulla retta, una famiglia di curve nel piano o un
numero finito di superfici nello spazio sono insiemi trascurabili. La
proposizione che segue mostra però che la classe degli insiemi trascurabili è
notevolmente più ampia.
Proposizione 1.16 Se N1 , N2 , . . . , Nn , . . . sono insiemi di misura nulla secondo la
definizione 1.15, anche la loro unione
N :=
Approfondimento
1
[
n=1
ha misura nulla.
Caratterizzazione degli insiemi trascurabili.
È posibile fornire una caratterizzazione
più intrinseca degli insiemi trascurabili, che non fa uso della teoria dell’integrazione: infatti,
si può dimostrare che un insieme N ⇢ RN è trascurabile se e solo se, comunque sia fissato
" > 0, è possibile ricoprire N con una famiglia al più numerabile di rettangoli (cf. la nota
seguente) R1 , R2 , . . . , Rn , . . . tali che
N ⇢
Richiami
Nn
Rettangoli N -dimensionali.
1
[
Rn ,
n=1
1
X
n=1
|Rn |  "
(1.31)
Un rettangolo N -dimensionale R (cioè un intervallo in R 1 , un “vero” rettangolo in R2 ,
un parallelepipedo in R3 ...) è il prodotto di N intervalli (a1 , b1 )⇥(a2 , b2 )⇥. . .⇥(aN , bN ) che supporremo indifferentemente aperti, chiusi o semiaperti, limitati o no, eventualmente degeneri (se capita che a j = bj per qualche
indice; in particolare un punto è sempre un N -rettangolo degenere, cosı̀ come un segmento è un 2-rettangolo ed
un rettangolo è un 3-rettangolo: ai matematici piacciono tanto queste situazioni un po’ maniacali...che poi però
si rivelano comode per non trascinarsi la necessità di esaminare tanti casi particolari!) La misura di R (cioè la
lunghezza per un intervallo, l’area per un rettangolo, il volume per un parallelepipedo) sarà ovviamente
|R| := (b1
Nota
a1 )(b2
a2 ) . . . (bN
aN ).
(1.32)
La novità, rispetto all’usuale definizione della misura di Peano-Jordan, è la possibilità di
usare infiniti rettangoli, anziché solo un numero finito. Naturalmente, gli insiemi di misura
nulla della precedente definizione continuano ad essere tali: in particolare le curve nel piano
o le superfici nello spazio.
Un insieme numerabile (per esempio l’insieme dei numeri razionali sulla retta reale)
è sempre di misura nulla: è infatti l’unione numerabile di punti, che sono particolari N rettangoli, ciascuno di misura nulla, sicché la (1.31) è banalmente verificata.
Un teorema molto bello, dovuto a Lebesgue, dice che una funzione reale e limitata u definita
ad esempio in un intervallo [a, b] ⇢ R è integrabile secondo Cauchy-Riemann (e dunque
possiamo parlare dell’integrale di u ad esempio secondo la definizione vista nel corso di
Analisi 1) se e solo se essa è continua salvo al più un insieme trascurabile N ⇢ [a, b], se
cioè l’insieme dei suoi punti di discontinuità ha misura nulla secondo la definizione appena
introdotta.
Curiosità
Misurabilità secondo Lebesgue.
Avendo come riferimento il concetto di insieme trascurabile (che, come abbiamo visto, può essere introdotto indipendentemente dalla resto della
teoria dell’integrazione) è possibile comprendere e definire in modo preciso il concetto di
misurabilità secondo Lebesgue: una funzione u definita in RN e a valori reali (o complessi)
si dice misurabile secondo Lebesgue se, per ogni " > 0 possiamo “buttare via” un insieme
R := R1 [ R2 [ . . . [ Rn [ . . . di rettangoli in modo che
1
X
n=1
|Rn |  "
e u sia continua in RN \ R;
1-10
(1.33)
L’integrale di Lebesgue
Non sembrerebbe, questa, una condizione molto più generale della misurabilità secondo
Peano-Jordan (si veda la nota precedente), eppure si verifica che praticamente tutte le
funzioni sono misurabili secondo questa nuova condizione, tanto che i controesempi che si
conoscono richiedono tutti l’uso di delicati argomenti di teoria degli insiemi e dell’assioma
della scelta; in particolare la classe delle funzioni misurabili secondo Lebesgue è chiusa
rispetto alle varie operazioni di somma, prodotto, composizione, passaggio al limite, etc...
Si osservi che la di↵erenza fondamentale con la definizione di misurabilità secondo PeanoJordan è che in quest’ultima prima si vanno a cercare i punti di discontinuità di una
funzione e poi si richiede che questi siano trascurabili; nella misurabilità secondo Lebesgue,
invece, prima ci è concesso di buttare via molti punti e poi di controllare che la funzione
che “rimane” è continua. Ad esempio, la famigerata funzione di Dirichlet, che vale 1 se
il punto è razionale e 0 se è irrazionale, è discontinua in tutti i punti, e quindi non è
misurabile secondo Peano-Jordan. D’altra parte, se noi possiamo prima di controllarne la
discontinuità, tracurare un insieme di misura nulla, si vede subito che eliminando l’insieme
dei razionali la funzione è continua sull’insieme rimanente, assumendo identicamente il
valore 0: ecco giustificata la misurabilità di Lebesgue per questa funzione.
Definizione 1.17 (Proprietà valide quasi ovunque) Diremo che una certa proprietà P vale per quasi ogni elemento di un certo insieme E ⇢ RN o, più semplicemente, che P vale quasi ovunque in E (abbreviato in q.o. in E) se se P è
verificata da tutti gli elementi di E salvo al più un sottoinsieme trascurabile.
Motivazioni.
Alla base delle precedenti definizioni sta l’idea che il termine “trascurabile” significhi effettivamente che un tale insieme non conti “nulla” agli e↵etti della teoria dell’integrazione;
questo fatto è messo in luce dai due risultati che seguono.
La proprietà
u è continua q.o. in R
ha misura nulla.
Esempi
significa che l’insieme delle discontinuità di u
La proprietà
sin x 6= 0
è vera q.o. in R, perchè l’insieme dei punti {x 2 R : sin x = 0}
è numerabile e quindi trascurabile in R.
La proprietà
x2 x
0 q.o.
]0, 1[, che ha misura 1 > 0.
è falsa, perchè non è verificata nell’intervallo aperto
Teorema 1.18 (Insiemi trascurabili e integrali)
• Se u è positiva in E, allora
Z
u(x) dx = 0
E
,
u(x) = 0
per quasi ogni x 2 E;
(1.34)
in altri termini, l’integrale di una funzione positiva è nullo se e solo se u è
nulla salvo al più in un sottoinsieme trascurabile. In particolare, l’integrale
su un’insieme trascurabile è sempre nullo.
• Se u è positiva
Z
E
u(x) dx < +1
)
u(x) < +1
per quasi ogni x 2 E;
(1.35)
in altri termini, se l’integrale di una funzione positiva u è finito, allora u
può assumere il valore +1 solo in un insieme trascurabile.
Corollario 1.19 Se u, g sono due funzioni complesse definite in E ⇢ RN allora
Z
Z
Z
|u(x) v(x)| dx = 0 ) u(x) = v(x) q.o. in E )
u(x) dx =
v(x) dx.
E
E
1-11
E
(1.36)
L’integrale di Lebesgue
Dimostrazione
Supponiamo di sapere che una funzione u definita su un insieme E ⇢ R N sia nulla ecccetto
che in un sottoinsieme A ⇢ E di misura |A| = 0. Con la convenzione algebrica che abbiamo
adottato la scorsa lezione, si vede formalmente che deve essere
Z
Z
|u(x)| dx =
|u(x)| dx  +1 · |A| = +1 · 0 = 0.
E
Motivazione
A
Il fatto che l’integrale di una funzione u che vale identicamente +1 su un insieme di
misura nulla e 0 altrove debba essere 0 si giustifica con il teorema della convergenza
monotona: basta infatti scegliere la successione
un (x) := n1
1A (x)
che ha per limite proprio u(x); per il teorema di Beppo Levi e la linearità dell’integrale
si ha
Z
Z
u(x) dx = lim
n dx = lim n|A| = 0.
n"+1
A
n"+1
A
Per dimostrare l’implicazione opposta della (9.35) basta considerare la famiglia crescente
An := {x 2 E : u(x)
1/n}
Chiaramente |An | = 0, altrimenti per la proprietà di monotonia u avrebbe integrale strettamente positivo. D’altra parte si verifica subito che
An " A := {x 2 E : u(x) > 0}
e quindi |A| = 0
per il corollario 1.8.
Con un ragionamento analogo si vede che se una funzione positiva u ha integrale finito,
allora l’insieme dove u vale +1 deve essere di misura nulla. Detto I tale insieme, per la
proprietà di monotonia si ha
Z
Z
u(x) dx
u(x) dx = +1 · |I|;
E
I
se il primo membro è finito, questa disuguaglianza implica banalmente |I| = 0.
Definizione 1.20 (Funzioni definite q.o., dominio) Diremo che una funzione
u è definita q.o. in un certo insieme E ⇢ RN se per quasi ogni x 2 E ha senso
parlare del valore u(x) (cioè u(x) è appunto definito); in altri termini, l’insieme
dove u non è definita è trascurabile, nel senso della definizione 1.15. Chiameremo
dominio di u il sottinsieme D(u) di E dove u è e↵ettivamente definita. Per ipotesi,
il complementare die D(u) in E è trascurabile, cioè
|E \ D(u)| = 0.
Il corollario 1.19 permette di definire l’integrale di una funzione u su un insieme E
anche se questa non è definita su tutto E: basta che l’insieme dove u non è definita
sia trascurabile.
Precisazione
Se si vuole essere un po’ pedanti, la definizione potrebbe essere questa:
se u è una funzione positiva o complessa q.o. definita su E ⇢ RN , chiamiamo integrale di
u su E il numero
Z
Z
u(x) dx :=
ũ(x) dx
E
E
dove ũ è un’arbitraria estensione di u a tutto E, cioè una funzione definita su E che
coicnide con u su D(u).
Per esempio, un estensione standard è
(
u(x) se x 2 D(u);
⇤
u (x) :=
0
altrimenti.
Approfondimento
Insiemi definiti q.o..
Si potrebbe ripetete un discorso analogo anche per gli insiemi di
integrazione. Diciamo che due insiemi E1 , E2 sono q.o. uguali, o di↵eriscono per un insieme
trascurabile, quando la loro di↵erenza ha misura nulla, cioè
E1 4E2 = (E1 \ E2 ) \ (E2 \ E1 )
1-12
è trascurabile.
L’integrale di Lebesgue
Si vede facilmente che in tal caso le rispettive funzioni caratteristiche 1 E1 e 1 E2 sono q.o.
uguali. Allora, per ogni funzione f positiva, o complessa e integrabile su uno dei due,
Z
Z
u(x) dx =
u(x) dx.
E1
E2
Definizione 1.21 (Convergenza quasi ovunque) Diremo che la successione di
funzioni reali (o complesse) un definite (anche solo quasi ovunque!) in un insieme
E ⇢ RN converge quasi ovunque alla funzione u (anch’essa definita q.o.) se
lim un (x) = u(x)
n"+1
per quasi ogni x 2 E;
in altri termini, l’insieme dei punti x 2 E dove il limite non esiste o è di↵erente
da u(x) è trascurabile.
Poichè l’integrale è invariante rispetto a modifiche delle funzioni in insiemi trascurabili, non sarebbe difficile (ma un po’ noioso...) verificare che
la teoria precedentemente sviluppata vale anche se tutte le
funzioni in gioco sono definite solo quasi ovunque.
Osservazione 1.22 (Dalla convergenza degli integrali alla convergenza q.o.)
La proprietà (1.35), benchè banale, ha importanti applicazioni, come vedremo anche
in seguito. Consideriamo, ad esempio, il teorema di integrazione per serie (1.15):
noi sappiamo che l’uguaglianza vale sempre, ma in generale potrebbe capitare che
la serie delle funzioni valga +1 in un insieme molto grande, addirittura tutto l’insieme E; in tal caso l’uguaglianza si ridurrebbe a +1 = +1 e perderebbe parte
del suo interesse. Se però noi sappiamo che la serie degli integrali è convergente,
allora la serie
+1
X
un (x) avendo integrale finito, converge q.o.
n=0
Quindi dalla conoscenza del comprtamento di una serie numerica (la serie degli
integrali, appunto) è possibile dedurre un’informazione sul comportamento globale
di una serie di funzioni, che in generale è un oggetto molto più complesso da studiare.
1-13
L’integrale di Lebesgue
Scambio di operatori - III
Teorema 1.23 (Integrazione per serie) Se un è una successione di funzioni
complesse definite in E ⇢ RN tale che
+1 Z
X
u(x) dx < +1,
E
n=0
P+1
allora la serie di
n=0 un (x) converge assolutamente per quasi ogni x 2 E e
definisce q.o. una funzione che è integrabile in E. Si ha
Z
+1
X
E
un (x)
n=0
!
dx =
+1 Z
X
n=0
un (x) dx.
(1.37)
E
P+1
Inoltre la successione degli integrali dei resti Rn (x) := k=n uk (x) è infinitesima,
cioè
Z X
+1
+1 Z
X
lim
uk (x) dx  lim
|uk (x)| dx = 0.
(1.38)
n"+1
Dimostrazione
n"+1
E k=n
E
k=n
Ci limitiamo a controllare che la serie delle funzioni convege quasi ovunque: si tratta di un
semplice esercizio di applicazione del corollario 1.6. Consideriamo infatti la serie dei moduli
S(x) :=
+1
X
n=0
|un (x)|.
(1.39)
Essendo una serie a termini positivi, possiamo applicare il citato corollario e ottenere che
Z
+1
XZ
|un (x)| dx < +1 per ipotesi del teorema.
S(x) dx =
E
n=0
E
Ma allora, applicando (1.35) (cf. anche la nota 1.22) si deduce che
S(x) < +1
q.o. in E, cioè la serie (1.39) converge al di fuori di un insieme trascurabile N .
Se per x 2 E \ N converge la serie dei moduli, possiamo concludere che anche la serie delle
funzioni converge (convergenza assoluta ) convergenza semplice).
Formule di calcolo degli integrali multipli
Teorema 1.24 (Fubini) Se E = (a, b) ⇥ (c, d) è un insieme rettangolare (anche
illimitato) di R2 e u è una funzione complessa integrabile su E, cioè se
!
!
ZZ
Z
Z
Z
Z
b
u(x, y) dx dy =
E
d
u(x, y) dy
a
d
dx =
b
u(x, y) dx
c
c
dy < +1,
a
allora
ZZ
u(x, y) dx dy =
E
Z
a
b
Z
c
d
u(x, y) dy
!
dx =
Z
c
d
Z
a
b
u(x, y) dx
!
dy.
(1.40)
Nella formula precedente si intende che per q.o. x 2 (a, b) la funzione y 7! u(x, y)
è integrabile in (c, d) e che il suo integrale è a sua volta integrabile in (a, b) rispetto
a x. Analogo discorso vale scambiando il ruolo delle due variabili.
Esercizio
Seguendo la traccia della precedente dimostrazione e applicando il Teorema di Tonelli (1.23),
dimostrare l’ultima parte del Teorema di Fubini (le ultime tre righe!).
1-14
L’integrale di Lebesgue
Richiami
Trasformazioni e matrice derivata.
Se T : E ⇢ RN ! RN è una trasformazione
di↵erenziabile, denotiamo con DT (x) la sua matrice derivata nel punto x 2 E e con JT (x)
il suo Jacobiano, cioè
⇥
⇤
JT (x) := det DT (x)
8 x 2 E.
T (E) è l’immagine di E, cioè l’insieme dei punti di RN che sono e↵ettivamente assunti dalla
trasformazione T in qualche punto di E. Se y 2 T (E) definiamo la molteplicità di y come
il numero delle sue controimmagini tramite T , cioè il numero di volte in cui y viene assunto
in E dalla trasformazione T , e la indichiamo con il simbolo
#{x : T (x) = y}.
Tale numero può anche essere +1; osserviamo che se T è iniettiva allora #{x : T (x) = y}
vale identicamente 1 su T (E).
Teorema 1.25 (Formula di cambiamento di variabili) Sia T : E ⇢ RN !
RN una trasformazione di↵erenziabile e u una funzione positiva q.o. definita su
T (E). Allora
Z
Z
u(T (x)) JT (x) dx.
u(y) #{x : T (x) = y} dy =
(1.41)
T (E)
E
La formula precedente vale anche se u è reale o complessa, purchè
Z
Z
|u(y)| #{x : T (x) = y} dy =
|u(T (x))| JT (x) dx < +1.
T (E)
E
In particolare, se T è iniettiva al di fuori di un insieme trascurabile vale la formula
Z
T (E)
u(y) dy =
Z
u(T (x)) JT (x) dx,
E
T (E) =
Z
E
1-15
JT (x) dx.
L’integrale di Lebesgue
Derivate e integrali
Teorema 1.26 (Fondamentale del calcolo, Lebesgue) Sia u una funzione
complessa integrabile sull’intervallo limitato (a, b). Allora la funzione integrale
Z x
U (x) :=
u(t) dt
a
è uniformemente continua in [a, b] ed è derivabile in quasi tutti i punti
dell’intervallo, con
Z x
d
U 0 (x) =
u(t) dt = u(x) per q.o. x 2 (a, b).
(1.42)
dx a
Nota
Il problema di trovare condizioni sufficienti per cui una data funzione U definita su un
intervallo (a, b) si può ricostruire per integrazione dalla sua derivata è molto più delicato.
Dal Teorema precedente si deducono facilmente tre condizioni necessarie: U dev’essere
continua, derivabile in quasi tutti i punti dell’intervallo (a, b) e la sua derivata deve eseere
integrabile. Purtroppo vi sono esempi (particolarmente complicati) che mostrano come
queste tre condizioni non sono sufficienti. Noi ci limitiamo a definire con precisione questa
proprietà (assoluta continuità) che risulta assai importante in molte situazioni e a presentare
una classe sufficientemente ampia di funzioni che la verificano.
Definizione 1.27 (Funzioni assolutamente continue) Una funzione complessa U definita su un intervallo [a, b] di R si dice assolutamente continua quando
è continua, è derivabile in quasi tutti i punti dell’intervallo, la sua derivata U 0 è
integrabile in [a, b] e vale la formula
Z x
U (y) U (x) =
U 0 (t) dt per ogni scelta di a  x  y  b.
(1.43)
a
Esercizio
Dimostrare che se una funzione U verifica la (1.43) per la particolare scelta x = a (e y
arbitrario nell’intervallo) allora la verifica per tutti gli x.
Definizione 1.28 Diciamo che una funzione u definita su un intervallo (anche
illimitato) (a, b) è regolare a tratti, se l’intervallo (a, b) si può decomporre in un
unione finita o numerabile di intervalli In := (an , bn ) che abbiano in comune al più
gli estremi, in modo che u sia derivabile all’interno di ogni In e la derivata u0 (che
risulta pertanto definita q.o. in (a, b)) sia integrabile su (a, b).
Teorema 1.29 Se la funzione complessa u, definita su (a, b), è continua e regolare
a tratti sull’intervallo [a, b] allora essa è assolutamente continua e quindi per ogni
coppia di punti x  y 2 (a, b) vale
Z y
u(y) u(x) =
u0 (t) dt.
x
Teorema 1.30 (Integrazione per parti) Se u, v sono funzioni assolutamente continue sull’intervallo [a, b], allora vale la formula
Z
a
b
h
u (x)v(x) dx = u(x)v(x)
0
1-16
ix=b
x=a
Z
a
b
u(x)v 0 (x) dx.
(1.44)
L’integrale di Lebesgue
Teorema 1.31 (Derivazione sotto il segno di integrale) Sia u una funzione complessa definita nel rettangolo E := (a, b) ⇥ (c, d) e supponiamo che la
funzione integrale rispetto alla variabile y
U (x) :=
Z
d
u(x, y) dy
c
sia ben definita in (a, b), cioè che la funzione y 7! u(x, y) sia integrabile rispetto
a y in (c, d). Supponiamo che per quasi ogni y 2 (c, d) la funzione
x 7! u(x, y)
sia derivabile in (a, b)
con
@
u(x, y)  g(y),
@x
Z
d
g(y) dy < +1.
c
Allora la funzione U è derivabile in (a, b) e si ha
U (x) =
0
Z
c
d
@
u(x, y) dy
@x
1-17
8 x 2 (a, b).
2. Spazi di funzioni
Stefan Banach (1892-1945)
Definizione 2.1 (Spazi funzionali) Consideriamo un sottoinsieme E dello spazio euclideo Rd . Indichiamo con F(E) l’insieme di tutte le funzioni definite in E
a valori complessi. F(E) è uno spazio vettoriale sul campo complesso. Diciamo che V è uno spazio funzionale (su E) se V è un sottospazio vettoriale di
F(E).
Nota
Tutto quello che diremo in generale in questa lezione per uno spazio funzionale V vale
generalmente per un qualsiasi spazio vettoriale sul corpo complesso. Noi adotteremo frequentemente il termine più restrittivo di spazio funzionale, perchè vogliamo sottolineare
che il nostro obiettivo è quello di descrivere spazi di questo tipo. Quando penseremo agli
elementi dello spazio V solo come vettori useremo le lettere in grassetto u, v, w, . . .; quando
vorremo sottolineare che si tratta anche di funzioni definite in E torneremo ad usare le
lettere in corpo normale u, v, w, . . ..
2-1
2-2
2. SPAZI DI FUNZIONI
Richiami
Operazioni in uno spazio vettoriale.
Se u, v sono due funzioni di F(E) allora la funzione
somma w := u + v è quella ovviamente definita da
w(x) := u(x) + v(x)
Analogamente, se
per ogni x 2 E.
2 C è uno scalare complesso, la funzione l := u è definita da
l(x) := u(x)
per ogni x 2 E.
Dire che V è un sottospazio di F(E) significa che queste operazioni, fatte a partire da
elementi u, v in V non fanno uscire da V .
E.1 Quando E := ( 1, +1) e la variabile in E è pensata come tempo, F( 1, +1) è lo
spazio di tutti i possibili segnali temporali.
Esempi
E.2 Se consideriamo solo segnali temporali nulli prima dell’istante t = 0 (i segnali causali)
otteniamo un sottospazio di F( 1, +1),
V = F+ ( 1, +1) := u 2 F( 1, +1) : u(t) ⌘ 0
per t < 0 .
È facile convicersi che si tratta ancora di uno spazio vettoriale.
E.3 Fissato un periodo di tempo T > 0, si può considerare un altro sottospazio importante
di F( 1, +1), precisamente quello formato da tutti i segnali T -periodici; in formule
V = FT ( 1, +1) := u 2 F( 1, +1) : u(t + T ) = u(t)
8 t 2 ( 1, +1) .
E.4 E := Z rappresenta la scelta più semplice per rappresentare un segnale discreto, cioè
una funzione che dipende solo dai valori interi della variabile; in questo caso il segnale
u 2 F(Z) è determinato dai valori un := u(n), n 2 Z.
E.5 Se E := {nh : n 2 Z}, con h > 0 fissato, F(E) può essere adatto a rappresentare
il campionamente a passo h di un segnale temporale. Si possono ripetere anche in
questo caso le medesime osservazioni circa i segnali causali e periodici.
E.6 Fissato un intero N , sia E := {0, h, 2h, 3h, . . . , (N 1)h}. In questo caso un elemento
u di F(E) è determinato da N numeri complessi un := u(nh), n = 0, . . . , N
1, e
può quindi essere rappresentato da un vettore di CN (RN nel caso di segnali reali).
Questa rappresentazione è utile per trattare segnali discreti finiti (segnali digitali).
E.7 La distribuzione di potenziale elettrostatico in una sfera E è un elemento di F(E); se
tale potenziale varia nel tempo, il segnale spazio-temporale associato è un elemento
di F(E ⇥ R).
E.8 Un immagine rettangolare composta da N ⇥ M pixel può essere rappresentata associando al pixel di coordinate (n, m) un valore reale un,m = u(n, m) (0 o 1 se
si considera un’immagine in bianco e nero; da 0 a k 1 se si hanno a disposizione k toni di grigio) corrispondente allo stato di quel pixel: in questo caso E :=
{0, 1, . . . , N 1} ⇥ {0, 1, . . . , M 1} ⇢ R2 . In certi casi può essere utile pensare che
u sia definito per tutti i valori interi, ad esempio in modo periodico oppure esteso a
0 al di fuori della griglia iniziale.
Definizione 2.2 (Trasformazioni lineari) Una trasformazione T : V ! W tra
due spazi funzionali si dice lineare se
T (↵u + v) = ↵T (u) + T (v)
Approfondimento
8 u, v 2 V,
↵,
2 C.
Ci si può chiedere la ragione dell’insistenza sul concetto di linearità: esso permette di
esprimere un segnale per sovrapposizione di segnali più semplici; lo studio e la realizzazone
e↵ettiva di queste decomposizioni costituisce uno dei problemi più importanti che a↵ronteremo. Schematicamente lo si può riassumere nel modo seguente: dato una successione (finita
o numerabile) di segnali “elementari” e1 , . . . , en , . . . in uno spazio funzionale V , esprimere
ogni altro segnale u di V come combinazione lineare
u = ↵1 e1 + ↵2 e2 + . . . + ↵n en + . . .
mediante opportuni coefficienti ↵1 , ↵2 , . . . da determinarsi.
Lo sviluppo (2.1) dovrebbe possedere i seguenti requisiti:
– Il calcolo del coefficiente ↵n+1 non comporta la modifica dei precedenti.
– L’aggiunta di un nuovo termine dovrebbe migliorare l’approssimazione di u.
(2.1)
2-3
2. SPAZI DI FUNZIONI
– Si vorrebbe “misurare” in qualche modo l’errore che si commette se si tronca la
somma dopo un numero finito di termini, riducendo l’errore al di sotto di una fissata
tolleranza, pur di sommare un numero sufficiente di elementi.
– Si vorrebbe poter rappresentare “esattamente” u come serie infinita (se è necessario),
senza più alcun errore, trattando poi formalmente la serie come una somma ordinaria.
Il problema di precisare le nozioni di errore, approssimazione, convergenza delle serie infinite
viene risolto in modo elegante e generale dai concetti che introduciamo qui di seguito.
Definizione 2.3 ((Semi)norme in uno spazio funzionale) Una (semi)norma k · k per lo spazio funzionale V è un’applicazione definita in V a valori reali
non negativi che soddifsfa le seguenti proprietà:
(M1 ) Per ogni u, v 2 V
(M2 ) Per ogni u 2 V e
ku + vk  kuk + kvk.
2C
k uk = | | kuk.
In particolare (M2 ) implica che la (semi)norma della funzione nulla è 0. Chiameremo trascurabili le funzioni u 2 V tali che kuk = 0. k · k è una norma se l’unica
funzione trascurabile è lquella nulla, cioè
(M3 ) kuk = 0
)
u = 0.
Uno spazio V dotato di una (semi)norma k · k si dice spazio (semi)normato.
Chiamiamo (semi)distanza tra due funzioni u, v in V il numero
d(u, v) := ku
vk.
Diremo indistinguibili (rispetto alla norma k · k) due funzioni u, v che di↵eriscono
per una funzione trascurabile, cioè tali che d(u, v) = 0.
Convenzione.
Norme e seminorme.
Come appare chiaro dalla precedente definizione, l’unica differenza tra norme e seminorme consiste nella proprietà M3 : questa proprietà risulta poi
fondamentale per garantire l’unicità del limite, secondo la successiva definizione 2.4, e costituisce per questo il punto di vista privilegiato nelle usuali trattazioni di analisi funzionale.
D’altra parte gli esempi più importanti di seminorme di tipo integrale (cf. (2.9)) non verificano la M3 , a meno di non ricorrere al linguaggio delle classi di equivalenza. Noi useremo
ambedue i concetti e talvolta, per non appesantire l’esposizione, parleremo di norme, spazi
di Banach o di Hilbert anche quando si abbia a che fare in realtà solo con una seminorma.
Approfondimento
Proprietà della distanza.
Una (semi)distanza d(·, ·) in uno spazio funzionale V è una
applicazione reale definita in V ⇥ V caratterizzata dalle seguenti proprietà: (qui di seguito
u, v, w, h sono arbitrari elementi di V )
( 1 ) Positività: d(u, v) 2 [0, +1).
( 2 ) Simmetria: d(u, v) = d(v, u).
( 3 ) Disuguaglianza triangolare: d(u, w)  d(u, v) + d(v, w).
( 4 ) Invarianza per traslazioni: d(u, v) = d(u + h, v + h).
( 5 ) Omogeneità:
d( u, v) = | |d(u, v)
8
2 C.
( 6 ) Se poi d è e↵ettivamente una distanza allora due funzioni indistinguibili sono uguali,
cioè
u = v , d(u, v) = 0.
2-4
2. SPAZI DI FUNZIONI
Definizione 2.4 (Convergenza in uno spazio funzionale (semi)normato)
Diciamo che una successione un 2 V converge a u rispetto alla norma k · k, se
lim d(un , u) = lim kun
n"+1
uk = 0.
n"+1
Analogamente diremo che la serie
+1
X
un
converge in V a S se
n=1
lim kS
N "+1
N
X
n=1
un k = 0.
Dimostrare che se un converge a u rispetto alla (semi)norma k · k, allora
Esercizio
lim kun k = kuk.
n"+1
Attenzione!
Unicità del limite.
Il limite di una successione in uno spazio funzionale V è unico se e
solo se lo spazio è dotato di una norma; nel caso di una seminorma, se la successione un
converge a u, essa converge anche a tutte le funzioni ũ con kũ uk = 0. Infatti,
⇣
⌘
lim kun ũk = lim kun u + u ũk  lim kun uk + ku ũk = 0.
n"+1
n"+1
n"+1
Il concetto di somma di una serie è molto importante e potremmo rileggerlo cosı̀:
fissato un margine d’errore (tolleranza) " > 0, siamo in grado, pur di sommare un numero N
N̄ = N̄ (") sufficientemente grande di termini della serie, di
approssimare la somma S commettendo un errore inferiore a ", cioè
S
N
X
n=1
un  "
8N
N̄ (").
(2.2)
Per controllare questa proprietà però occorre conoscere a priori l’esistenza e il valore
di S, mentre spesso si dispone solo dei valori di un . In questo caso risulta naturale
sostituire la condizione (2.2) con la seguente nozione.
Completezza
Definizione 2.5 (Serie di Cauchy) Una successione un in V forma una serie di
Cauchy se, fissata una tolleranza " > 0 è possibile trovare un intero N̄ = N̄ (") tale
che i contributi alla serie formati con un numero arbitrario di addendi successivi a
N̄ sono comunque inferiori a "; in formule:
8" > 0
9N̄ (") 2 N : 8 N
M
N̄" ,
N
X
n=M
un  ".
(2.3)
Definizione 2.6 (Spazi completi) Uno spazio funzionale (semi)normato V si
dice completo se ogni serie di Cauchy è convergente in V . Uno spazio di Banach
è uno spazio normato completo.
Un esempio particolarmente importante di serie di Cauchy è fornito dal seguente
lemma:
Lemma 2.7 Supponiamo che la successione un in V soddisfi la
+1
X
n=1
kun k < +1.
Allora un forma una serie di Cauchy.
(2.4)
2-5
2. SPAZI DI FUNZIONI
Resto di una serie numerica convergente..
Se an è una successione di numeri reali
P +1
tali che la serie
a
è
convergente
alla
somma
s, allora si chiama resto N -esimo la
n
n=1
quantità
+1
N
X
X
an =
an .
rN := s
Richiami
n=1
n=N +1
Per definizione stessa di convergenza della serie, si ha
lim rN =
lim
N "+1
Dimostrazione
N "+1
+1
X
an = 0
n=N
Basta osservare che se
+1
X
n=1
kun k < +1
e si fissa " > 0, allora esiste N̄ = N̄ (") tale che
+1
X
kun k  ".
n=N̄
In particolare la condizione (2.3) è soddisfatta, poichè se N
N
X
n=M
Nota
un 
N
X
n=M
kun k 
+1
X
n=N̄
M
N̄ si ha
kun k  ".
Ogni serie convergente è di Cauchy ma in generale non soddisfa la (4.19). totalmente
convergente; d’altra parte la (4.19) costituisce spesso il metodo più comodo per controllare
che una serie sia di Cauchy. Verdemo che un altro caso particolarmente importante di serie
di Cauchy è costituito da alcune serie di vettori ortogonali in uno spazio di Hilbert.
Teorema 2.8 (Criterio di Weierstrass “generalizzato”) V è uno spazio
funzionale completo rispetto alla (semi)norma k·k se e solo se per ogni successione
un in V
+1
+1
X
X
kun k < +1 )
un converge in V .
n=1
Dimostrazione
n=1
Ogni serie totalmente convergente è di Cauchy, quindi se lo spazio è completo essa converge.
Supponiamo ora che ogni serie totalmente convergente sia convergente e mostriamo che
ogni serie di Cauchy converge. Partendo dalla (2.3) scegliamo una successione di valori di
", precisamente "k := 2 k , k 1; corrispondentemente troveremo interi N̄k := N̄ ("k ) per i
quali, posto N0 := 0,
N̄k+1
X
un
kSk k 
+1
X
Sk :=
si ha
n=N̄k
kSk k  "k = 2
k
k
1.
Evidentemente
+1
X
k=1
2
k
< +1
sicché
k=1
9 S :=
+1
X
Sk .
k=0
È facile vedere che pure la serie iniziale converge a S: fissato infatti " > 0 e scelto k in
modo che "k < "/2, si ha per N
N̄k
S
N
X
n=0
un  S
N̄k
X
n=0
un +
N
X
n=N̄k
un  2"k  ".
2-6
2. SPAZI DI FUNZIONI
Lo spazio delle funzioni integrabili
Consideriamo un insieme E ⇢ Rd di misura positiva. Un modo per valutare quanto
di↵eriscono due funzioni u, v di F(E) è quello di misurare l’area compresa tra i
rispettivi grafici, cioè l’insieme
{(x, y) : x 2 E,
u(x)  y  v(x) o v(x)  y  u(x)}.
Un semplice grafico mostra che questa area può essere calcolata mediante l’integrale
Z
|u(x) v(x)| dx
E
che prenderemo dunque come definizione di distanza integrale tra le due funzioni.
Non è difficile controllare che tale distanza soddisfa le proprietà ( 1 , . . . , 5 ) e che
Z
|u(x)| dx
kuk := d(u, 0) =
E
si comporta come una (semi)norma. Poiché vogliamo evitare il caso kuk = +1, è
naturale restringere lo spazio F(E) al sottospazio delle funzioni integrabili. Questo
nuovo spazio è cosı̀ importante, che lo introduciamo con la definizione che segue.
Definizione 2.9 Se E è un insieme di Rd con misura positiva, indichiamo con
L 1 (E) il sottospazio di F(E) formato dalle funzioni u che sono integrabili, cioè
Z
u 2 L 1 (E) , u 2 F(E),
|u(x)| dx < +1.
E
L 1 (E) è naturalmente dotato della (semi)norma
Z
kukL 1 (E) :=
|u(x)| dx.
E
Attenzione!
Per il Corollario 1.19,
d(u, v) = ku
vkL 1 (E) = 0
,
u=v
q.o. in E.
Ecco perchè abbiamo chiamato seminorma la funzione k · kL 1 (E) : essa non è in grado di
distinguere due funzioni, se esse coincidono q.o.
Convenzione.
Per evitare di usare le seminorme, quando si considera lo spazio L 1 (E) generalmente si
adotta la convenzione di identificare due funzioni integrabili, quando queste coincidono
q.o. I matematici usano per questo procedimento la nozione di classe di equivalenza, che
raggruppa gli elementi che sono indistinguibili dal punto di vista della norma dello spazio.
In questo caso si parla dello spazio L1 (E) e i “veri” elementi di L1 (E) sono classi di
equivalenza di funzioni, anziché le singole funzioni. Nel linguaggio corrente, però, si lascia
sempre sottointesa questa convenzione, finendo per parlare di L1 (E) come spazio di funzioni
e non di classi di equivalenza di funzioni.
Dunque noi non ricorreremo al linguaggio delle classi di equivalenza, ma semplicemente
dovremo tener presente che la (semi)norma di L 1 (E) non distingue due funzioni uguali
q.o., e il limite nel senso di L 1 (E) risulta quindi determinato solo a meno di insiemi di
misura nulla. Quando vorremo sottolineare che la funzione u è determinata a meno di
insiemi trascurabili, scriveremo u 2 L1 (E).
In particolare, la nozione di valore puntuale di una funzione di L 1 (E) deve essere usata
con molta cautela: è chiaro che quando noi definiamo una funzione in E, assegnamo (e
quindi conosciamo) il suo valore in ogni punto di E. Ma quando la definizione o l’esistenza
di una funzione f passa per qualche procedimento di limite in L1 (E) e vogliamo che il
nostro discorso sia indipendente dalla scelta arbitraria di un altro candidato limite ũ che
coincide con u q.o. in E, non siamo più autorizzati a sfruttare il particolare valore di u in un
determinato punto, ma solo proprietà puntuali che sono invarianti rispetto al cambiamento
di u in un insieme di misura nulla.
2-7
2. SPAZI DI FUNZIONI
Supponiamo che una successione di funzioni positive un converga a u in L 1 (0, 1): ebbene,
possiamo ancora dire che u è positiva quasi ovunque nell’intervallo (0, 1), ma non possiamo
dire che u(1/2)
0, in quanto il particolare valore di u in 1/2 non può essere identificato
dalla convergenza integrale.
Esempio
Teorema 2.10 (Completezza di L 1 (E)) Se una successione un 2 L 1 (E)
soddisfa la
+1 Z
+1
X
X
|un (x)| dx =
kun k < +1
n=1
E
n=1
P+1
1
allora la serie
n=1 un (x) converge puntualmente q.o. ed in L (E) ad una
funzione S integrabile in E:
lim
N "+1
N
X
un (x) = S(x)
q.o. in E,
con
n=0
lim
N "+1
Z
E
|S(x)
N
X
un (x)| dx = 0.
n=0
In particolare, L 1 (E) è completo.
Dimostrazione
(2.5)
Basta ricordare il Teorema di integrazione per serie.
Proposizione 2.11 (Convergenza degli integrali) Se la successione {u n }n2N
converge a u in L 1 (E), allora per ogni sottoinsieme A ⇢ E
Z
Z
lim
un (x) dx =
u(x) dx.
(2.6)
n"+1
Dimostrazione
A
Basta semplicemente osservare che, per la (1.27),
Z
un (x) dx
A
Z
u(x) dx =
A
Z
un (x)
A
Approfondimento
A
Z ⇣
⌘
u(x) dx 
A
Z
u(x)) dx 
un (x) u(x)) dx = kun
un (x)
E
ukL 1 (E)
Convergenza L 1 (E) e convergenza q.o..
Supponiamo di sapere che una successione di
funzioni complesse un definite in E converga q.o., cioè
lim un (x) = u(x)
n"+1
per q.o. x 2 E.
Cosa si può dire della convergenza di un in L 1 (E)?
– Occorre innanzitutto controllare che un , u appartengano a L 1 (E), altrimenti non ha
senso parlare di convergenza in L 1 (E).
– In caso a↵ermativo, l’unico (a meno di insiemi trascurabili...) limite possibile per la
successione un in L 1 (E) è la funzione u (anche se è intuitivo, si tratta di un Teorema
di non banale dimostrazione!)
– Per controllare che la convergenza sia anche in L 1 (E) vi sono sostanzialmente tre
possibilità:
1. applicare direttamente la definizione e stimare in modo opportuno (per es. calcolandoli esplicitamente...) gli integrali
Z
|un (x) u(x)| dx ed il relativo limite per n " +1;
E
2. controllare se le ipotesi del teorema di Beppo Levi sono soddisfatte (convergenza
monotona) e controllare che il limite degli integrali sia finito (che in tal caso è
una condizione necessaria e sufficiente per la convergenza)
2-8
2. SPAZI DI FUNZIONI
3. controllare se le ipotesi del teorema di Lebesgue sono verificate (convergenza
dominata): queste forniscono una condizione sufficiente per la convergenza in
L 1 (E).
– Nel caso di una serie di funzioni si applica il teorema di integrazione per serie (nel
caso di funzioni positive) o il teorema 2.10.
Viceversa, se si conosce a priori la convergenza in L 1 (E), l’unico caso in cui si può dedurre
la convergenza q.o. è quello delle serie che soddisfano l’ipotesi del teorema 2.10. In generale
se una successione un converge a u in L 1 (E) si può solo concludere che una esiste una
sottosuccessione unk che converge q.o. a u.
Lo spazio delle funzioni (essenzialmente) limitate.
Definizione 2.12 Chiamiamo B(E) lo spazio vettoriale delle funzioni complesse e
limitate definite in E; B(E) è uno spazio normato grazie a
kukB(E) := sup |u(x)|.
x2E
Richiami
– Dire che una successione un converge a u in B(E) è equivalente a dire che un converge
uniformemente a u.
– L’usuale Criterio di Weierstrass per la convergenza uniforme si può riformulare in
questo modo: se
+1
+1
X
X
kun kB(E) =
sup |un (x)| < +1,
n=1 x2E
n=1
allora la serie di funzioni
P +1
n=1
un (x) converge uniformemente (e cioè in B(E)).
– Per il teorema 2.8, B(E) è uno spazio completo.
Quando si considerano funzioni definite solo quasi ovunque, ad esempio perchè si è
interessati solo a quantità integrali, il naturale sostituto di B(E) si chiama L 1 (E):
sostanzialmente si concede alla funzione u di “comportarsi male” purcheè questo
avvenga su di un insieme trascurabile; in altri termini, ridefinendo la funzione (per
es. a 0) su un insieme trascurabile, siamo in grado di renderla limitata.
Definizione 2.13 (Funzioni essenzialmente limitate e L 1 (E)) Una funzione complessa u definita in E si dice essenzialmente limitata se esiste una costante
M > 0 tale che
|u(x)|  M per q.o. x in E.
(2.7)
L’insieme delle funzioni essenzialmente limitate definite in E è uno spazio vettoriale
che si indica con L 1 (E). Se u 2 L 1 (E), si indica con kukL 1 (E) la più piccola
delle costanti M che verificano la (2.7).
Attenzione!
Dire che una funzione è essenzialmente limitata è molto più restrittivo che limitata q.o.:
ad esempio, la funzione u(x) := 1/x q.o. definita su R è limitata (=finita) q.o. ma non
appartiene a L 1 (R), perchè anche se la ridefiniamo 0 per x = 0 essa rimane illimitata su
R.
Teorema 2.14 L’applicazione u 7! kukL 1 (E) è una (semi)norma in L 1 (E),
rispetto alla quale tale spazio risulta completo: L 1 (E) è quindi uno spazio di
Banach.
Osservazione 2.15 Se u è una funzione regolare a tratti (cf. la precedente lezione)
definita in un intervallo [a, b], allora si controlla facilmente che
kukL 1 (a,b) = sup |u(x)| = kukB(a,b) .
x2[a,b]
2-9
2. SPAZI DI FUNZIONI
Dunque sulle funzioni regolari a tratti la norma L 1 coincide con la norma (del
“sup”) di B(a, b); in particolare si verifica che se {un }n2N è una successione di
funzioni regolari a tratti, essa converge in L 1 (a, b) se e solo se essa converge
uniformemente ad una funzione u limitata in [a, b]. Ogni funzione ũ quasi ovunque
uguale ad u è allora il limite della successione in L 1 (a, b).
Lemma 2.16 Se u 2 L 1 (E) e v 2 L 1 (E), allora il prodotto uv è integrabile e
Z
kuvkL 1 (E) =
|u(x)v(x)| dx  kukL 1 (E) kvkL 1 (E) .
E
Analogamente, se {un }n2N e {vn }n2N sono due successioni convergenti a u e v in
L 1 (E) e in L 1 (E) rispettivamente, allora
Z
Z
1
u(x)v(x) dx.
lim un vn = uv in L (E),
lim
un (x)vn (x) dx =
n"+1
n"+1
E
E
L’integrale del prodotto di due funzioni, lo spazio L 2 (E) e la
nozione di prodotto scalare.
Il lemma 2.16 fornisce un primo elementare criterio di integrabilità del prodotto
di due funzioni u, v; ci si può chiedere se non è possibile trovare una condizione
sufficiente che faccia intervenire simmetricamente le due funzioni.
La risposta sta nella seguente disuguaglianza elementare
1
(|a|2 + |b|2 ), 8 a, b 2 C,
2
la cui dimostrazione segue facilmente dall’identità
(2.8)
|ab| 
1
(|a|2 + |b|2
2
2|ab|) =
1
(|a|
2
|b|)2
0,
8 a, b 2 C.
Corollario 2.17 Se u, v sono funzioni complesse definite in E tali che
Z
Z
2
|u(x)| dx < +1,
|v(x)|2 dx < +1,
E
E
allora la funzione u · v è integrabile in E e
Z
Z
Z
⌘
1⇣
|u(x) · v(x)| dx 
|u(x)|2 dx +
|v(x)|2 dx < +1.
2 E
E
E
(2.9)
Definizione 2.18 Se E è un insieme di Rd con misura positiva, indichiamo con
L 2 (E) il sottospazio di F(E) formato dalle funzioni u che sono integrabili, cioè
Z
u 2 L 2 (E) , u 2 F(E),
|u(x)|2 dx < +1.
E
L 2 (E) è naturalmente dotato della (semi)norma
sZ
kukL 2 (E) :=
|u(x)|2 dx,
(2.10)
u(x) · v(x) dx.
(2.11)
E
indotta dal prodotto scalare
(u, v)
L 2 (E)
:=
Z
E
2-10
2. SPAZI DI FUNZIONI
Osserviamo che (2.11) è ben definito grazie al precedente corollario; a di↵erenza
di L 1 (E), controllare che (2.10) è e↵ettivamente una (semi)norma (in particolare
la proprietà (M2 )) non è del tutto immediato, ma è una facile conseguenza del
fatto che (2.11) è e↵ettivamente un prodotto scalare. Ricordiamo qui di seguito
la definizione generale di questa nozione fondamentale, lasciando come esercizio la
verifica che (2.11) ne soddisfa tutte le proprietà formali.
Definizione 2.19 (Prodotto scalare e norma indotta) Si chiama prodotto scalare in uno spazio funzionale V una applicazione che associa ad ogni coppia di vettori
u, v di V un numero complesso (u, v) con queste proprietà:
hermitianità
sesquilinearità
(v, u) = (u, v);
(
(↵u + v, h) = ↵(u, h) + (v, h),
(h, ↵u + v) = ↵(h, u) + (h, v),
(2.12)
(2.13)
positività
(u, u) 0 u = 0 ) (u, u) = 0.
(2.14)
p
Si verifica che la funzione u 7! (u, u) è una (semi)norma su V , che si chiama
(semi)norma indotta dal prodotto scalare.
Chiameremo trascurabile un elemento u tale che kuk = (u, u) = 0.
Se è soddisfatta anche la proprietà
(u, u) = 0
)
u = 0,
(2.15)
cioè il solo elemento trascurabile è lo 0, allora la (semi)norma indotta è una norma
in senso stretto.
Prodotti scalari a valori reali.
Nel caso (·, ·) sia un prodotto scalare reale (ad esempio
quando V è uno spazio vettoriale sul campo dei numeri reali) si parla di simmetria (al posto
della hermitianità) e di bilinearità (al posto della sesquilinearità): in pratica basta omettere
da tutte le formule il segno della coniugazione complessa.
Nota
Se (·, ·) è un prodotto scalare complesso, si verifica facilmente (Esercizio!) che Re(·, ·) è un
prodotto scalare reale.
Approfondiremo nella lezione successiva alcune applicazioni importanti del prodotto
scalare; per ora ricordiamo una disuguaglianza fondamentale che applichiamo subito
al problema dell’integrazione del prodotto di due funzioni, raffinando la (2.9)
Proposizione 2.20 (Disuguaglianza di Schwartz) Se (·, ·) è un prodotto scalare definito nello spazio funzionale V , allora per ogni coppia di vettori u, v di V si
ha
p
p
|(u, v)|  (u, u) (v, v) = kuk kvk.
Inoltre,
| | = 1,
(u, v) = kuk kvk
,
9⇢
0:
u = ⇢v
Corollario 2.21 (Continuità del prodotto scalare) Se un ! u e v n ! v in
V , allora
lim (un , v n ) = (u, v).
(2.16)
n"+1
Dimostrazione
|(un , vn )
(u, v)| = |(un , vn )
|(un , vn )
(u, vn ) + (u, vn )
(u, vn )| + |(u, vn )
(u, v)| = |(un
(u, v)| 
u, vn )| + |(u, vn
kun
v)| 
uk kvn k + kuk kvn
vk
Passando al limite per n " +1 e osservando che la norma di vn si mantiene limitata (di
fatto converge alla norma di v) si conclude.
2-11
2. SPAZI DI FUNZIONI
Corollario 2.22 Se u, v 2 L 2 (E) allora
sZ
sZ
Z
|u(x) · v(x)| dx 
|u(x)|2 dx
|v(x)|2 dx = kukL 2 (E) kvkL 2 (E)
E
E
E
Inoltre, se {un }n2N , {vn }n2N sono due successioni convergenti rispettivamente a u, v
in L 2 (E) si ha
Z
Z
lim
un (x) · vn (x) dx =
u(x) · v(x) dx.
n"+1
E
E
Applichiamo ora la disuguaglianza di Schwartz per dimostrare che L 2 (E) è uno
spazio completo.
Teorema 2.23 (Completezza di L 2 (E)) Se una successione un 2 L 2 (E)
soddisfa la
sZ
+1
+1
X
X
|un (x)|2 dx =
kun kL 2 (E) < +1
E
n=1
n=1
P+1
2
allora la serie
n=1 un (x) converge puntualmente q.o. ed in L (E) ad una
funzione S integrabile in E:
lim
N "+1
N
X
un (x) = S(x)
q.o. in E,
con
n=1
lim
N "+1
Z
N
X
S(x)
E
2
un (x) dx = 0.
n=1
(2.17)
In particolare, L 2 (E) è completo.
Dimostrazione
Per dimostrare il primo limite di (2.17) basterà mostrare che
S̃(x) :=
+1
X
n=1
|un (x)| < +1
per q.o. x 2 E;
quest’ultima disuguaglianza è certamente verificata se
Z
|S̃(x)|2 dx < +1.
E
posto
S̃N (x) :=
N
X
n=1
|un (x)|
2 (x)) è una successione non negativa e monotona
evidentemente S̃N (x) (e quindi anche S̃N
non decrescente rispetto a N ; per il teorema di Beppo Levi
Z
Z
|S̃(x)|2 dx = lim
|S̃N (x)|2 dx.
N "+1
E
Se noi mostriamo che
Z
abbiamo concluso.
E
|S̃N (x)|2 dx 
⇣
E
+1
X
n=1
kun kL 2 (E)
⌘
Ricordiamo una semplice identità: se a1 , a2 , . . . , aN sono numeri reali
N
N
N
N
⇣X
⌘2 ⇣ X
⌘ ⇣X
⌘
X
an
=
an ·
an =
am an ;
n=1
n=1
(2.18)
m,n=1
n=1
applicando questa identità alla somma che definisce S̃N e applicando la disuguaglianza di
Schwartz otteniamo
Z
Z
Z
N
N
X
X
|S̃N (x)|2 dx =
|um (x)| |un (x)| dx =
|um (x)| |un (x)| dx
E

E m,n=1
N
X
m,n=1
kum kL 2 (E) kun kL 2 (E) =
m,n=1
N
⇣X
n=1
kun kL 2 (E)
⌘2
E

⇣ +1
X
n=1
kun kL 2 (E)
Il secondo limite in (2.17) segue dal teorema della convergenza dominata.
⌘2
.
(2.19)
2-12
2. SPAZI DI FUNZIONI
Approfondimento
Convergenza L 2 (E) e convergenza q.o..
Possiamo ripetere anche nel caso di L 2 (E)
considerazioni analoghe a quelle precedentemente presentate per L 1 (E). Supponiamo dunque di sapere che una successione di funzioni complesse un definite in E converga q.o. a u.
Per poter concludere che vi è convergenza anche in L 2 (E)
– Occorre innanzitutto controllare che un , u appartengano a L 2 (E).
– In caso a↵ermativo, l’unico (a meno di insiemi trascurabili...) limite possibile per la
successione un in L 1 (E) è la funzione u
– Si hanno quindi tre possibilità:
1. applicare direttamente la definizione e stimare in modo opportuno (per es. calcolandoli esplicitamente...) gli integrali
Z
|un (x) u(x)|2 dx ed il relativo limite per n " +1;
E
2. controllare se le ipotesi del teorema di Beppo Levi sono soddisfatte (convergenza
monotona) e controllare che il limite degli integrali
Z
Z
lim
|un (x)|2 dx =
|u(x)|2 dx
n"+1
E
E
sia finito (che in tal caso è una condizione necessaria e sufficiente per la convergenza)
3. controllare se le ipotesi del teorema di Lebesgue sono verificate (convergenza
dominata) per i quadrati delle funzioni un :
Z
9 v : |un (x)|2  v(x) per q.o. x 2 E, 8 n 2 N;
v(x) dx < +1.
E
Queste forniscono una condizione sufficiente per la convergenza in L 2 (E).
– Nel caso di una serie di funzioni si applica il teorema 2.23 a meno che non si tratti
di una serie di funzioni ortogonali, che tratteremo nella prossima lezione.
Concludiamo con un risultato che illustra la relazione tra gli spazi fin qui introdotti
nel caso che la misura |E| di E sia finita.
Proposizione 2.24 Supponiamo che |E| < +1; allora
L 1 (E) ⇢ L 2 (E) ⇢ L 1 (E);
inoltre
e
u 2 L 1 (E)
)
kukL 2 (E) 
u 2 L 1 (E)
)
kukL 1 (E) 
(2.20)
p
|E| kukL 1 (E)
p
|E| kukL 2 (E) .
Infine, se un è una successione di funzioni definite in E si ha
un ! u in L 1 (E)
Attenzione!
)
un ! u in L 2 (E)
)
un ! u in L 1 (E).
Il caso |E| = +1.
Quando la misura di E non è finita (ad esempio E := R o E :=
(0, +1)) nessuna delle inclusioni (2.20) è più vera: basta considerare la famiglia di funzioni
1/(x + 1)↵ , ↵ 0, per E := (0, +1).
3. Spazi di Hilbert
Wir müssen wissen. Wir werden wissen.
(Noi abbiamo il dovere di conoscere.
Alla fine conosceremo.)
David Hilbert (1862-1943)
Il problema della migliore approssimazione
Problema 3.1 (Migliore approssimazione) Sia V uno spazio funzionale, munito di una norma ! · ! e siano e1 , . . . , eN assegnati elementi di V . Dato u ∈ V ci
chiediamo se è possibile trovare coefficienti complessi u1 , . . . , uN in modo da rendere
minimo l’errore di approssimazione
!u −
N
!
k=1
uk ek ! = d(u,
N
!
uk ek ).
k=1
Teorema 3.2 Il problema 3.1 ammette sempre almeno una soluzione.
Purtroppo il teorema precedente non indica alcun preocedimento costruttivo per
determinare i coefficienti u1 , . . . , uN , e in generale il problema può essere molto
complicato. C’è però un caso in cui è possibile risolvere esplicitamente il problema:
quello in cui la norma può essere espressa per mezzo di un prodotto scalare.
3-1
3-2
3. SPAZI DI HILBERT
Abbiamo già ricordato nella lezione precedente la definizione di prodotto scalare:
ora richiamiamo alcune formule che ci saranno utili; prima però introduciamo la
nozione fondamentale di ortogonalità.
Definizione 3.3 (Vettori e sistemi ortogonali) Diciamo che due vettori
u, v ∈ V sono ortogonali se (u, v) = 0. Analogamente, un insieme (finito o
infinito) di vettori {en }N
n=1 forma un sistema ortogonale se
(en , en ) > 0;
n "= m
⇒
(en , em ) = 0.
(3.1)
{en }N
n=1 si dice inoltre ortonormale se oltre alla (3.1) ogni elemento en è un
versore, cioè $en $ = (en , en ) = 1.
Se un vettore u è ortogonale a ciascun elemento di un insieme {en }N
n=1 , allora è ortogonale
!N
v
e
.
n=1 n n
Nota
anche a tutte le combinazioni lineari
Lemma 3.4 (Distanza tra due vettori) Per ogni u, v ∈ V la distanza d(u, v)
si può esprimere per mezzo del prodotto scalare attraverso la formula
d(u, v)2 = $u − v$2 = $u$2 + $v$2 − 2 Re(u, v).
In particolare, se u è ortogonale a v si ha la formula (di “Pitagora”)
d(u, v)2 = $u − v$2 = $u$2 + $v$2 .
Consideriamo ora la situazione un po’ più generale della combinazione lineare di N
vettori.
Lemma 3.5 Per ogni scelta di N vettori v 1 , v 2 , . . . , v N in V si ha
N
"
$v 1 + v 2 + . . . + v N $2 = $
n=1
v n $2 =
N
"
(v m , v n ).
(3.2)
m,n=1
Se poi il sistema {v n }N
n=1 è ortogonale allora la precedente espressione si semplifica
$v 1 + v 2 + . . . + v N $2 = $v 1 $2 + $v 2 $2 + . . . + $v N $2 =
N
"
n=1
$v n $2 .
(3.3)
L’idea geometrica che permette di risolvere il problema di migliore approssimazione
3.1 è molto semplice: supponiamo di conoscere già la soluzione, data dai coefficienti
û1 , . . . , ûN , e formiamo il vettore “errore”
δ := u −
N
"
ûn en ;
(3.4)
n=1
si può intuire che δ sia ortogonale a tutti i vettori generati dagli en . Noi mostreremo che se i vettori {en }N
n=1 sono linearmente indipendenti, questa condizione
di ortogonalità è sufficiente per determinare û1 , . . . , ûN e che effettivamente questi
coefficienti risolvono il problema 3.1.
Richiami
Vettori linearmente indipendenti.
Un insieme di vettori {en }N
n=1 si dice linearmente
indipendente se ogni relazione di dipendenza lineare a coefficienti complessi
N
"
n=1
vn en = 0
3-3
3. SPAZI DI HILBERT
è possibile solo se i coefficienti vn sono identicamente nulli. Quando si lavora con una
seminorma, è utile talvolta richiedere la proprietà più forte
N
!"
!
!
!
vn en ! = 0
!
⇒
n=1
vn = 0,
n = 1, . . . , N.
(3.5)
In particolare, si osservi che in questo caso nessun elemento en può essere trascurabile, cioè
"en " > 0. È facile dedurre dalla (3.3) che un sistema ortogonale secondo la definizione 3.3
è sempre linearmente indipendente secondo la (3.5).
Proposizione 3.6 Se {en }N
n=1 è un insieme finito linearmente indipendente secondo la (3.5), per ogni vettore u ∈ V esiste un’unica scelta dei coefficienti û1 , . . . , ûN
in modo che il vettore δ definito da (3.4) risulti ortogonale a ciascun em :
(δ, em ) = (u −
N
"
ûn en , em ) = 0
∀ m = 1, 2, . . . , N.
n=1
(3.6)
I coefficienti û1 , . . . , ûN possono essere calcolati risolvendo un sistema lineare, come
indicato nel punto seguente.
Approfondimento
Il sistema lineare.
Per scrivere il sistema lineare che permette di calcolare i coefficienti
û1 , . . . , ûN , basta sviluppare la condizione (3.6):
#
u−
N
"
n=1
N
$ #
$ "
#
$
ûn en , em = u, em −
ûn en , em = 0
n=1
e quindi
N
"
(en , em )ûn = (u, em ),
n=1
∀ m = 1, 2, . . . , N.
(3.7)
Essendo (en , em ), (u, em ) dati conosciuti, abbiamo quindi N equazioni lineari nelle incognite (complesse) û1 , . . . , ûN . Introduciamo la matrice hermitiana N × N a coefficienti
complessi
E := {em,n }N
em,n := (en , em ), en,m = em,n
m,n=1 ,
e i vettori colonna complessi in CN
û := {û1 , û2 , . . . , ûN },
u := {(u, e1 ), . . . , (u, eN )}.
Allora la soluzione û risolve il sistema in forma matriciale
E · û = u.
(3.8)
Osserviamo che nel caso reale, la matrice E è simmetrica, i vettori û, u sono reali.
Dimostrazione
Naturalmente rimane da dimostrare che il sistema (3.8) è effettivamente risolubile, cioè che
la matrice E è invertibile. Noi mostriamo una proprietà più interessante: la matrice E è
definita positiva. Ciò significa che per ogni vettore colonna non nullo v ∈ CN si ha
vT · E · v > 0.
(3.9)
Naturalmente (3.9) implica l’invertibilità di E, in quanto da (3.9) segue che
v '= 0
⇒
E · v '= 0.
A sua volta la (3.9) è una conseguenza della seguente identità
se vT := (v1 , v2 , . . . , vN ),
vT · E · v = "v1 e1 + v2 e2 + . . . + vN eN "2
(3.10)
e della (3.5). La (3.10) si ottiene applicando (3.2):
"v1 e1 + v2 e2 + . . . + vN eN "2 =
=
N
"
N
"
(vm em , vn en ) =
m,n=1
m,n=1
vm vn (em , en ) =
N
"
vm vn (em , en )
m,n=1
N
"
n=1
vn
N
% "
m=1
&
em,n vn = vT · E · v.
3-4
3. SPAZI DI HILBERT
Proposizione 3.7 Sia u ∈ V e {en }N
n=1 un insieme finito linearmente indipendente secondo la (3.5); i coefficienti û1 , . . . , ûN calcolati secondo la precedente proposizione risolvono il Problema 3.1; infatti per ogni altra scelta di coefficienti u1 , u2 , . . . , uN
si ha
"u −
N
!
n=1
un en "2 = "u −
≥ "u −
Dimostrazione
N
!
n=1
N
!
n=1
ûn en "2 + "
N
!
n=1
(un − ûn )en "2
ûn en "2 = "δ"2 .
(3.11)
Decomponiamo il primo termine di (3.11):
!u −
N
!
n=1
un en !2 = !(u −
N
!
ûn en ) +
n=1
N
!
n=1
(un − ûn )en !2 = !δ +
N
!
n=1
(un − ûn )en !2 .
Poiché δ è ortogonale a ciascun en , esso è ortogonale anche alla combinazione linerare
"
N
n=1 (un − ûn )en . Applicando la “formula di Pitagora” si conclude.
Riassumiamo il risultato fondamentale che abbiamo ottenuto nel seguente Teorema:
Teorema 3.8 Sia V uno spazio dotato di prodotto scalare e {en }N
n=1 un insieme
finito linearmente indipendente secondo la (3.5). Allora per ogni u ∈ V il Problema di migliore approssimazione 3.1 ammette una sola soluzione û1 , . . . , ûN che è
individuata dalla condizione
δ := u −
N
!
ûn en
n=1
è ortogonale a tutti i vettori generati dal sistema {en }N
n=1 ,
(3.12)
e può essere calcolata risolvendo il sistema lineare (3.7). Vale poi la relazione
N
N
N
%2 % %2 % !
%2
$2 %
# !
!
%
% %
%
%
%
d u,
ûn en = %u −
ûn en % = %u% − %
ûn en % .
n=1
Dimostrazione
n=1
(3.13)
n=1
L’unica proprietà che ci resta da dimostrare è la (3.13). Basta decomporre u nella somma
u = u−
N
!
n=1
ûn en +
N
!
n=1
ûn en = δ +
N
!
ûn en
n=1
e"applicare cancora una volta la “formula di Pitagora”, ricordando che δ è ortogonale a
N
n=1 ûn en .
3-5
3. SPAZI DI HILBERT
Corollario 3.9 Quando il sistema {en }N
n=1 è ortogonale, la soluzione û1 , . . . , ûN
del problema di migliore approssimazione assume la forma
ûn =
(u, en )
!en !2
(3.14)
e la relazione (3.13) diventa
N
N
N
$2
! "
#2 $
"
"
$
$
d u,
ûn en = $u −
ûn en $ = !u!2 −
|ûn |2 !en !2 .
n=1
n=1
(3.15)
n=1
Se infine il sistema {en }N
n=1 è anche ortonormale, le formule precedenti si
semplificano ulteriormente
ûn = (u, en ),
N
N
N
$2 $ $2 "
! "
#2 $
"
$
$
$ $
d u,
ûn en = $u −
ûn en $ = $u$ −
|ûn |2 . (3.16)
n=1
Dimostrazione
n=1
n=1
Nel caso di un sistema ortogonale, la matrice E è diagonale e il sistema di riduce a
!em !2 ûm = (u, em ),
m = 1, 2, . . . , N,
da cui la (3.14). (3.15) segue da (3.13) e da (3.3).
Applicazione
Minimi quadrati.
Supponiamo di essere interessati a rappresentare i risultati di un
certo esperimento u tramite una combinazione lineare di “funzioni di forma” assegnate
φ1 , φ2 , . . . , φN ; possiamo pensare u e φn definite su un certo insieme E e di conoscere i
risultati dell’esperimento in un numero finito di punti {x1 , x2 , . . . , xJ } di E, cioè di conoscere
i valori uj := u(xj ), j = 1, . . . , J; vorremmo determinare i coefficienti û1 , . . . , ûN in modo
%
da rappresentare u mediante la combinazione lineare N
n=1 ûn φn . In pratica succede che gli
esperimenti x1 , x2 , . . . , xJ sono molti di più delle funzioni di forma e se volessimo scrivere
un sistema lineare
N
"
uj =
ûn φn (xj ), j = 1, 2, . . . , J
n=1
questo risulterebbe sovradeterminato (J >> N ). L’approccio a questo problema mediante
il metodo dei minimi quadrati consiste nello scegliere dei pesi σj > 0 da assegnare a ciascun
esperimento (quando nessuno sia privilegiato rispetto agli altri si ha σj ≡ 1) e di cercare i
coefficienti ûn in modo che risulti minimo l’errore
J
"
j=1
N
&2
&
"
&
&
σj−2 &uj −
ûn φn (xj )&
(3.17)
n=1
Stiamo dunque risolvendo il problema di migliore approssimazione 3.1 nello spazio F(E)
rispetto alla seminorma
J
"
!v!2 :=
σj−2 |v(xj )|2
j=1
%
Infatti quando si sceglie v := u − N
n=1 ûn φn si ottiene proprio l’espressione (3.17) da
minimizzare rispetto alla scelta dei coefficienti ûn .
È facile vedere che la seminorma introdotta discende dal prodotto scalare reale
(v, w) :=
J
"
j=1
σj−2 v(xj )w(xj ),
in modo che !g!2 = (g, g).
Se supponiamo che le funzioni φn formino un sistema linearmente indipendente sui punti
scelti xj (in modo cioè che nessuna delle φ possa essere scritta come combinazione lineare
delle altre: si tratta di un ipotesi ragionevole poichè abbiamo già osservato che i punti xj
sono molti di più delle funzioni di forma) si può applicare il Teorema 3.8, ottenendo per il
vettore dei coefficienti û il sistema lineare
E · û = u,
3-6
3. SPAZI DI HILBERT
dove la matrice reale simmetrica e definita positiva E = {em,n }N
m,n=1 è definita da
em,n := (φn , φm ) =
J
!
σj−2 φn (xj )φm (xj )
j=1
mentre il vettore dei dati u = {u1 , . . . , uN } è costruito mediante le formule
un := (u, φn ) =
J
!
σj−2 u(xj )φn (xj ).
j=1
Decomposizione rispetto ad un sistema ortogonale
completo
Consideriamo ora uno spazio funzionale V di dimensione infinita dotato di prodotto
scalare (·, ·) e supponiamo di conoscere un sistema ortogonale di vettori {en }∞
n=1
secondo la definizione 3.3.
Problema 3.10 (Decomposizione ortogonale) Dato un elemento u di V ci
chiediamo se è possibile determinare una successione di coefficienti complessi {ûn }n∈N
tali che
+∞
N
"
"
!
!
"
"
u=
ûn en cioè
lim "u −
ûn en " = 0.
N ↑+∞
n=1
n=1
Proposizione 3.11 La soluzione del problema 3.10, se esiste, è necessariamente
data dai coefficienti trovati in (3.14)
ûn :=
Dimostrazione
(u, en )
.
"en "2
(3.18)
Basta osservare che, per la (2.21), si può scambiare l’ordine tra serie e prodotto scalare, cioè
u=
+∞
!
un
in V
n=1
⇒
(u, v) = (
+∞
!
un , v) =
n=1
+∞
!
(un , v).
(3.19)
n=1
In particolare
(u, em ) =
+∞
!
(ûn en , em ) = ûm (em , em ).
n=1
Definizione 3.12 (Coefficienti di Fourier) I coefficienti ûn definiti dalla (3.18)
si chiamano coefficienti di Fourier di u rispetto al sistema ortogonale {en }∞
n=1 .
A questo punto il Problema 3.10 si riduce ai due seguenti:
1. Trovare condizioni per cui la serie
+∞
!
ûn en
converge in V ;
n=1
2. Trovare condizioni per cui la somma della serie coincide con u.
Cominciamo dal primo:
3-7
3. SPAZI DI HILBERT
Convergenza di serie di vettori ortogonali
!+∞
Proposizione 3.13 Se u = n=1 un è una serie convergente formata da vettori
ortogonali in V , vale l’identità fondamentale
!u!2 =
Dimostrazione
+∞
"
n=1
(3.20)
!un !2 .
Si sfruttano la continuità della norma la (3.3)
!u!2 = ! lim
N ↑+∞
N
"
n=1
un !2 =
lim !
N ↑+∞
N
"
n=1
un !2 =
lim
N ↑+∞
N
"
n=1
!un !2 =
+∞
"
n=1
!un !2 .
La
(3.20) fornisce una condizione necessaria perché una serie di vettori ortogonali
!+∞
n=1 un converga in V , cioè che
+∞
"
n=1
!un !2 < +∞.
(3.21)
Quando gli un sono costruiti a partire dai coefficienti di Fourier di un elemento u,
questa condizione è sempre verificata grazie alla disuguaglianza di Bessel (3.15), che
ci fornisce un’informazione fondamentale circa il loro andamento asintotico:
Teorema 3.14 (Disuguaglianza di Bessel) Se ûn sono i coefficienti di Fourier
di u rispetto al sistema ortogonale {en }∞
n=1 , si ha
+∞
"
n=1
|ûn |2 !en !2 ≤ !u!2 < +∞.
Nella formula precedente l’uguaglianza vale se e solo se il problema 3.10 ha soluzione.
Dimostrazione
Basta passare al limite per N ↑ +∞ in (3.15); l’ultima osservazione segue dalla formula
(3.20).
Se lo spazio V è completo, la condizione (3.21) è anche sufficiente e quindi la
disuguaglianza di Bessel assicura automaticamente la convergenza delle serie di
Fourier in V .
Teorema 3.15 Supponiamo che {un }+∞
n=1 sia un insieme di vettori ortogonali. Se
V è completo, allora
la serie
+∞
"
un converge in V
n=1
⇔
+∞
"
n=1
|un |2 < +∞.
Definizione 3.16 (Spazi di Hilbert) Uno spazio funzionale V
prodotto scalare e completo si dice spazio di Hilbert.
Dimostrazione
La necessità della condizione
+∞
"
n=1
segue dalla (3.20).
|vn |2 < +∞
dotato di
3-8
3. SPAZI DI HILBERT
Per la sufficienza, basta controllare che la successione delle somme parziali
sN :=
N
!
fn en
n=1
è una successione di Cauchy. Fissato ε > 0, poichè la serie
+∞
!
n=1
|fn |2
converge
è possibile trovare N̄ in modo che
+∞
!
n=N̄
|fn |2 ≤ ε2 .
Dico che se N̄ ≤ N < M allora
"sN − sM " ≤ ε;
ciò mostra appunto che sN è di Cauchy.
Per controllare quest’ultima affermazione, notiamo che
sN − s M =
M
!
fn en ;
n=N +1
Per il Teorema di Pitagora, essendo i vettori fn en mutuamente ortogonali, si ha
M
!
"sN − sM "2 =
n=N +1
|fn |2 ≤
+∞
!
n=N̄
|fn |2 ≤ ε2 .
Corollario 3.17 Se ûn sono i coefficienti di Fourier di u rispetto al sistema ortogonale {en }∞
n=1 nello spazio di Hilbert V , la serie di Fourier
+∞
!
ûn en
è convergente e
n=1
!u −
+∞
!
n=1
ûn en !2 = !u!2 −
+∞
!
n=1
|ûn |2 !en !2 .
Sistemi ortogonali completi.
Definizione 3.18 (Sistemi ortogonali completi) Un sistema ortogonale {en }∞
n=1
si dice completo in V se ogni elemento u di V che è ortogonale a ciascun en è
trascurabile, cioè altri termini
(u, en ) = 0
∀n ∈ N
⇒
!u! = 0.
Teorema 3.19 (Decomposizione e identità di Parseval) Se V è uno spazio
di Hilbert e il sistema ortogonale {en }∞
n=1 è completo allora il problema di decomposizione ortogonale 3.10 si può sempre risolvere. In particolare, per ogni u ∈ V
si ha
+∞
+∞
!
!
u=
ûn en in V, !u!2 =
|ûn |2 !en !2 ,
n=1
n=1
dove ûn sono i coefficienti di Fourier di u dati dalla (3.18).
Dimostrazione
Sappiamo già che la serie di Fourier converge; basta mostrare che la differenza
δ := u −
Osserviamo che
(δ, em ) = (u, em ) −
+∞
!
ûn en
è trascurabile.
n=1
+∞
!
n=1
ûn (en , em ) = (u, em ) − ûm "em "2 = 0.
Siccome il sistema {en }∞
n=1 è completo, si conclude che δ è trascurabile.
3-9
3. SPAZI DI HILBERT
Proposizione 3.20 (Calcolo del prodotto scalare) Nelle ipotesi del Teorema
precedente, se {ûn , v̂n }+∞
n=1 sono i coefficienti di Fourier di due vettori u, v rispettivamente, si ha
+∞
!
ûn v̂n
(3.22)
(u, v) =
n=1
Proposizione 3.21 (Stima dell’errore) Nelle ipotesi del teorema precedente, l’errore tra u e la somma dei primi N termini della serie di Fourier si può stimare nel
modo seguente:
N
+∞
!
!
!u −
ûn en !2 =
|ûn |2 !en !2 .
(3.23)
n=1
n=N +1