1. L`integrale di Lebesgue - Dipartimento di Matematica
Transcript
1. L`integrale di Lebesgue - Dipartimento di Matematica
1. L’integrale di Lebesgue Henri Lebesgue (1875-1941) Introduzione In questa lezione cerchiamo di raccogliere (nel modo più veloce ed indolore...) alcuni dei risultati più importanti ed utili della teoria dell’integrazione di Lebesgue. Poiché non abbiamo né il tempo, né la pazienza per sviluppare e giustificare tutti i punti della teoria, seguiremo una via, diciamo cosı̀, descrittivo/assiomatica, accontentandoci di precisare con cura solo alcune definizioni e i corrispondenti enunciati. R A prima vista, la nozione di integrale u(x) dx secondo Cauchy-Riemann sviluppata nei precedenti corsi di Analisi Matematica sembra essere già sufficiente, poiché si applica ad una classe abbastanza ampia di funzioni e riesce a trattare quasi tuttgli esempi che solitamente si incontrano nei primi anni di studio. D’altra parte, questa nozione di integrabilità presenta almeno tre inconvenienti: – L’insieme di definizione di u deve essere limitato. – u deve essere anch’essa limitata. – La proprietà di essere misurabile non è stabile per la convergenza puntuale: in altre parole, può accadere che una successione di funzioni uniformemente limitate converga puntualmente ad una funzione limitata ma non misurabile, i cui punti di discontinuità, cioè, siano “troppo numerosi” per poter parlare di integrale. 1-1 L’integrale di Lebesgue Queste difficoltà sono aggirate dalla nuova nozione di integrabilità che andiamo ad esporre. I punti cardine della nuova teoria saranno 1. una definizione più generale di insieme di misura nulla; 2. la possibilità di integrare “praticamente” ogni funzione positiva su ogni insieme, limitato o no: per questo si ammette anche +1 tra i possibili valori che può assumere l’integrale; 3. la possibilità di scambiare l’ordine di serie e integrali per le funzioni positive; 4. l’integrabilità delle funzioni di segno qualunque si riconduce all’integrabilità del modulo della funzione; 5. nuovi teoremi di passaggio al limite sotto il segno di integrale. 1-2 L’integrale di Lebesgue L’integrale delle funzioni positive Definizione 1.1 (Funzioni positive, reali e complesse) Diremo che una funzione u definita in un insieme E ⇢ RN è positiva se il suo codominio è l’intervallo esteso [0, +1]: ammettiamo pertanto che vi siano punti (anche tutti!) di E in cui la funzione vale +1. u sarà invece reale (risp. complessa) se il suo codominio è R (risp. C): in tal caso non ammettiamo valori infiniti. Osserviamo che le funzioni reali sono un caso particolare di funzioni complesse. L’algebra in [0, +1]. In [0, +1] non vi sono difficoltà a definire la somma e la relazione d’ordine, come ciascuno può facilmente immaginare. Più arbitrario il prodotto 0 · (+1): quando tratteremo di integrali e di funzioni positive, converremo che Convenzione. 0 · (+1) := 0. (1.1) Questa definizione, che può sembrare arbitraria ed in contrasto con tutte le cautele imparate negli anni precedenti, non è invece cosı̀ bizzarra, e nasce dall’esigenza di integrare funzioni che valgono +1 su un insieme di misura nulla, o funzioni che valgono 0 su un insieme di misura +1 (come tutto R, per esempio). I entrambi i casi, se si vuole preservare la proprietà di monotonia che introdurremo tra un momento, si è costretti alla definizione (1.1). Teorema 1.2 (Integrale di Lebesgue per le funzioni positive) Ad ogni insieme E ⇢ RN e ad ogni funzione positiva u : E ! [0, +1] è possibile associare univocamente un numero Z u(x) dx 2 [0, +1] (1.2) E in modo che siano soddisfatte le seguenti proprietà fondamentali: • (Estensione) Se E è misurabile e u è integrabile secondo Cauchy-Riemann (anche in senso generalizzato) allora l’integrale di Lebesgue Z u(x) dx coincide con l’integrale di Cauchy-Riemann. (1.3) E • (Monotonia) Per ogni u, v : E ! [0, +1] Z Z uv ) u(x) dx v(x) dx E (1.4) E • (Continuità: lemma di Fatou) Se un : E ! [0, +1] è una successione di funzioni convergente puntualmente a u, cioè 9 lim un (x) =: u(x) n"+1 8 x 2 E, tali che per un opportuna costante M Z un (x) dx M < +1 E allora anche Commento. Z E u(x) dx M. 8 n 2 N, (1.5a) (1.5b) (1.5c) Il senso del primo punto (Estensione) del precedente teorema è quello di garantire che passando dall’integrale di Riemann a quello di Lebesgue operativamente non si è costretti a cambiare alcunchè di ciò che si è appreso. Gli altri due, invece, servono per identificare univocamente la nuova nozione introdotta e “tranquillizzare” il lettore più esigente: in altri termini, tra tutte le possibili estensioni del concetto di integrale ne esiste solo una, quella proposta appunto da Lebesgue, che soddisfa i due ulteriori requisiti di monotonia e di continuità. Può sembrare strano come è stata formulata quest’ultima nozione (Lemma di Fatou); riprenderemo meglio questo discorso dopo aver brevemente ricordato alcune proprietà più familiari. 1-3 L’integrale di Lebesgue Convenzione. Misurabilità addio. La teoria dell’integrazione di Lebesgue è strettamente legata ad un nuovo concetto di misurabilità di insiemi e funzioni, cui accenneremo più avanti. Poichè l’esistenza di funzioni non misurabili è strettamente legata a sottili questioni di logica e teoria degli insiemi, e tutte le funzioni che ammettono una definizione costruttiva risultano, di fatto, misurabili, per semplificare la trattazione noi assumeremo sempre che le funzioni di cui stiamo parlando siano misurabili: d’ora in avanti, quindi, non ci preoccuperemo più di ricordarlo esplicitamente. Spero che Lebegue possa perdonarmi... Proprietà elementari Proposizione 1.3 Se E ⇢ RN , u, v sono funzioni positive definite in E e uno scalare positivo si ha • (Additività rispetto a u) Z Z Z (u(x) + v(x)) dx = u(x) dx + v(x) dx, E E E Z Z u(x) dx = u(x) dx. E 0 è (1.6) (1.7) E • (Funzioni caratteristiche) Per ogni A ⇢ RN la funzione caratteristica di A è definita da ( 1 se x 2 A; 1 A (x) := 0 se x 62 A. Per ogni A ⇢ E si ha Z u(x) dx = A Z u(x)11A (x) dx. (1.8) E • (Additività rispetto a E) Se E è l’unione disgiunta di due insiemi A, B (cioè E = A [ B, A \ B = ?) allora Z Z Z u(x) dx. (1.9) u(x) dx = u(x) dx + E Osservazione Se A ⇢ E e u è positiva, allora A Z A B u(x) dx Z u(x) dx. (1.10) E Definizione 1.4 (Misura di Lebesgue di un insieme) Se E ⇢ RN , indichiamo con |E| la sua misura di Lebesgue N -dimensionale (lunghezza sulla retta, area nel piano, volume nello spazio!), definita da Z Z |E| := 1 dx = 1 E (x) dx. (1.11) RN E Nota Per la proprietà di estensione dell’integrale di Lebesgue, questa definizione coincide con quella di Peano-Jordan, quando l’insieme E è misurabile in questo senso più restrittivo. 1-4 L’integrale di Lebesgue Scambio di operatori-I Teorema 1.5 (Beppo Levi, convergenza monotona) • Se un è una successione crescente di funzioni positive definite in E ⇢ RN , tali cioè che n m ) un (x) um (x) 8 x 2 E, allora Z lim un (x) dx = lim E n"+1 • n"+1 Z un (x) dx. (1.12) E Se un è una successione decrescente di funzioni positive definite in E ⇢ RN , tali cioè che n m ) un (x) um (x) 8 x 2 E, (1.13) se almeno una di esse ha integrale finito allora Z Z lim un (x) dx = lim un (x) dx. E n"+1 n"+1 (1.14) E Corollario 1.6 (Integrazione per serie) Se un è una successione di funzioni positive definite in E ⇢ RN , allora ! Z +1 +1 Z X X un (x) dx = un (x) dx. (1.15) E Nota n=0 n=0 E L’ipotesi essenziale del Teorema di Beppo Levi è la monotonia della successione u n (x) rispetto a n (1.5): questa assicura sempre l’esistenza del limite puntuale u1 (x) := lim un (x) n"+1 e l’esistenza del limite degli integrali i1 := lim n"+1 Z 8 x 2 E, un (x) dx. E Dunque, il contenuto veramente significativo del teorema sta nell’a↵ermare che i 1 è l’integrale di u1 su E. Dimostrazione Il teorema di Beppo Levi è una conseguenza immediata del lemma di Fatou (1.5a,b,c): basta osservare che per monotonia Z Z un (x) u1 (x) e quindi un (x) dx u1 (x) dx, E da cui i1 := lim n"+1 Z E un (x) dx E Z E u1 (x) dx; d’altra parte, sempre per la monotonia della successione degli integrali, Z un (x) dx i1 8 n 2 N, E e il Lemma di Fatou stabilisce che Z E u1 (x) dx i1 . Il teorema di integrazione per serie è una conseguenza diretta del precedente, applicato alla successione delle somme parziali. Richiami Famiglie numerabili. Una collezione (o famiglia) di oggetti A si dice numerabile se può essere messa in corrispondenza biunivoca con l’insieme N dei numeri naturali; in altre parole, tutti gli elementi di A si possono “etichettare” con un numero intero che li individua univocamente e si possono conseguentemente “elencare” in una successione A := {A0 , A1 , A2 , . . . , An , . . .}. 1-5 L’integrale di Lebesgue Quando gli elementi An sono a loro volta insiemi, si parla di collezione o famiglia numerabile di insiemi. Capiterà sovente di considerarne l’unione, cioè un nuovo insieme A= +1 [ An n=0 i cui elementi sono tutti e soli quelli che apparengono a qualcuno delgli insiemi A n . Chiaramente +1 [ An , 8 b 2 B 9 n 2 N : b 2 A n . B⇢ n=0 Diremo che A è al più numerabile, quando è numerabile oppure A è costituita da un numero finito di elementi. Richiami Famiglie monotone di insiemi, unioni disgiunte. sottoinsiemi di qualche insieme E si dice crescente se Se A := S +1 n=0 nm ) Una famiglia A 1 , A2 , . . . , An , . . . di A n ⇢ Am . An in questo caso scriviamo più espressivamente che An " A. Una famiglia A1 , A2 , . . . , An , . . . di insiemi si dice decrescente se nm T +1 ) An Am . Se A := n=0 An in questo caso scriviamo più espressivamente che An # A. In entrambi i casi diciamo che An tende ad A quando n " +1. Una famiglia A1 , A2 , . . . , An , . . . di sottoinsiemi di qualche insieme E si dice disgiunta se n 6= m ) An \ Am = ?. S In questo caso diciamo che A := +1 n=0 An è l’unione disgiunta della famiglia o che la famiglia forma una partizione di A. Corollario 1.7 (Approssimazione e decomposizione degli integrali) • Se E1 , E2 , . . . , En , . . . è una famiglia crescente convergente a E, cioè En " E quando n " +1, allora Z Z u(x) dx = lim u(x) dx. (1.16) n"+1 E En • Se E1 , E2 , . . . , En , . . . è una famiglia decrescente convergente a E, cioè En # E quando n " +1, e Z 9m 2 N : u(x) dx < +1, Em allora Z u(x) dx = lim E n"+1 Z u(x) dx. (1.17) En • Se E1 , E2 , . . . , En , . . . è una partizione di E, cioè E è l’unione disgiunta della famiglia, allora Z u(x) dx = E Nota +1 Z X n=0 u(x) dx. (1.18) En Questo risultato è estremamente utile quando si deve calcolare esplicitamente un integrale: si cerca di approssimare o di decomporre l’insieme E in insiemi più piccoli E n in modo che u sia integrabile secondo Cauchy-Riemann su En (in particolare, gli En dovranno essere limitati e anche u dovrà essere limitata su questi). Dopo di che si ottiene l’integrale di u 1-6 L’integrale di Lebesgue su tutto E come limite o come serie, a seconda che si sia scelto una famiglia crescente e approssimante E o una partizione di E. La potenza del teorema sta nel fatto che siamo completamente liberi nella scelta della decomposizione: in altre parole, l’integrale non dipende da come si approssima o si decompone l’insieme E. Corollario 1.8 • Se E1 , E2 , . . . , En , . . . è una famiglia crescente convergente a E, cioè En " E quando n " +1, allora |E| = lim |En |. (1.19) n"+1 • Se E1 , E2 , . . . , En , . . . è una famiglia decrescente convergente a E, cioè En # E quando n " +1, e almeno uno di essi ha misura finita allora |E| = lim |En |. (1.20) n"+1 • Se E1 , E2 , . . . , En , . . . è una partizione di E, cioè E è l’unione disgiunta della famiglia, allora +1 X |E| = |En |. (1.21) n=0 Più in generale, se E è l’unione non necessariamente disgiunta della famiglia E n si ha |E| +1 X n=0 |En |. (1.22) Teorema 1.9 (Fubini) Se E = (a, b) ⇥ (c, d) è un insieme rettangolare (anche illimitato) di R2 e u è una funzione positiva definita in E, allora ! ! ZZ Z b Z d Z d Z b u(x, y) dx dy = u(x, y) dy dx = u(x, y) dx dy. (1.23) E a c c 1-7 a L’integrale di Lebesgue Integrale delle funzioni reali o complesse Definizione 1.10 (Integrale di Lebesgue) Se u è una funzione reale o complessa definita in E ⇢ RN , diciamo che u è integrabile secondo Lebesgue se Z |u(x)| dx < +1. (1.24) E Se u è reale poniamo quindi per definizione Z Z u(x) dx := u+ (x) dx E E Z u (x) dx. Analogamente, se u è complessa, definiamo Z Z Z u(x) dx := Re u(x) dx + i Im u(x) dx. E E (1.25) E (1.26) E Proposizione 1.11 (Validità delle proprietà elementari) • La proprietà di monotonia (1.4) vale anche se le funzioni son reali e integrabili su E. • La proprietà di estensione, la proposizione 1.3 e il corollario 1.7 valgono anche in ambito complesso (con scalari complessi) purchè le funzioni f, g siano integrabili su E. Proposizione 1.12 (Disuguaglianza del modulo) Se u è una funzione complessa integrabile in E ⇢ RN , allora Z Z u(x) dx u(x) dx. (1.27) E E 1-8 L’integrale di Lebesgue Scambio di operatori-II Teorema 1.13 (Convergenza dominata, Lebesgue) Supponiamo che una successione di funzioni complesse un , definite nell’insieme E ⇢ RN , converga puntualmente ad una funzione u. Se è possibile trovare una funzione positiva e integrabile g che domina tutte le un , cioè Z |un (x)| v(x) 8 n 2 N, 8 x 2 E, v(x) dx < +1, (1.28) E allora lim Z |un (x) Z un (x) dx = n"+1 In particolare lim n"+1 E u(x)| dx = 0. E Z u(x) dx. (1.29) (1.30) E Corollario 1.14 (Continuità degli integrali dipendenti da un parametro) Sia u una funzione complessa definita nel rettangolo E := (a, b)⇥(c, d) e supponiamo che la funzione integrale rispetto alla variabile y U (x) := Z d u(x, y) dy c sia ben definita in (a, b), cioè che la funzione y 7! u(x, y) sia integrabile rispetto a y in (c, d). Supponiamo che per quasi ogni y 2 (c, d) la funzione x 7! u(x, y) sia continua in (a, b) ed esista una funzione v dipendente solo da y tale che Z |u(x, y)| v(y), c Allora la funzione U è continua in (a, b). 1-9 d v(y) dy < +1. L’integrale di Lebesgue Insiemi trascurabili e funzioni definite q.o. Definizione 1.15 (Insiemi trascurabili) Diciamo che N ⇢ RN è trascurabile quando la sua misura di Lebesgue |N | è nulla. Nota Per la proprietà di estensione, se un insieme è misurabile secondo PeanoJordan e ha misura nulla, esso è trascurabile: in particolare un numero finito di punti sulla retta, una famiglia di curve nel piano o un numero finito di superfici nello spazio sono insiemi trascurabili. La proposizione che segue mostra però che la classe degli insiemi trascurabili è notevolmente più ampia. Proposizione 1.16 Se N1 , N2 , . . . , Nn , . . . sono insiemi di misura nulla secondo la definizione 1.15, anche la loro unione N := Approfondimento 1 [ n=1 ha misura nulla. Caratterizzazione degli insiemi trascurabili. È posibile fornire una caratterizzazione più intrinseca degli insiemi trascurabili, che non fa uso della teoria dell’integrazione: infatti, si può dimostrare che un insieme N ⇢ RN è trascurabile se e solo se, comunque sia fissato " > 0, è possibile ricoprire N con una famiglia al più numerabile di rettangoli (cf. la nota seguente) R1 , R2 , . . . , Rn , . . . tali che N ⇢ Richiami Nn Rettangoli N -dimensionali. 1 [ Rn , n=1 1 X n=1 |Rn | " (1.31) Un rettangolo N -dimensionale R (cioè un intervallo in R 1 , un “vero” rettangolo in R2 , un parallelepipedo in R3 ...) è il prodotto di N intervalli (a1 , b1 )⇥(a2 , b2 )⇥. . .⇥(aN , bN ) che supporremo indifferentemente aperti, chiusi o semiaperti, limitati o no, eventualmente degeneri (se capita che a j = bj per qualche indice; in particolare un punto è sempre un N -rettangolo degenere, cosı̀ come un segmento è un 2-rettangolo ed un rettangolo è un 3-rettangolo: ai matematici piacciono tanto queste situazioni un po’ maniacali...che poi però si rivelano comode per non trascinarsi la necessità di esaminare tanti casi particolari!) La misura di R (cioè la lunghezza per un intervallo, l’area per un rettangolo, il volume per un parallelepipedo) sarà ovviamente |R| := (b1 Nota a1 )(b2 a2 ) . . . (bN aN ). (1.32) La novità, rispetto all’usuale definizione della misura di Peano-Jordan, è la possibilità di usare infiniti rettangoli, anziché solo un numero finito. Naturalmente, gli insiemi di misura nulla della precedente definizione continuano ad essere tali: in particolare le curve nel piano o le superfici nello spazio. Un insieme numerabile (per esempio l’insieme dei numeri razionali sulla retta reale) è sempre di misura nulla: è infatti l’unione numerabile di punti, che sono particolari N rettangoli, ciascuno di misura nulla, sicché la (1.31) è banalmente verificata. Un teorema molto bello, dovuto a Lebesgue, dice che una funzione reale e limitata u definita ad esempio in un intervallo [a, b] ⇢ R è integrabile secondo Cauchy-Riemann (e dunque possiamo parlare dell’integrale di u ad esempio secondo la definizione vista nel corso di Analisi 1) se e solo se essa è continua salvo al più un insieme trascurabile N ⇢ [a, b], se cioè l’insieme dei suoi punti di discontinuità ha misura nulla secondo la definizione appena introdotta. Curiosità Misurabilità secondo Lebesgue. Avendo come riferimento il concetto di insieme trascurabile (che, come abbiamo visto, può essere introdotto indipendentemente dalla resto della teoria dell’integrazione) è possibile comprendere e definire in modo preciso il concetto di misurabilità secondo Lebesgue: una funzione u definita in RN e a valori reali (o complessi) si dice misurabile secondo Lebesgue se, per ogni " > 0 possiamo “buttare via” un insieme R := R1 [ R2 [ . . . [ Rn [ . . . di rettangoli in modo che 1 X n=1 |Rn | " e u sia continua in RN \ R; 1-10 (1.33) L’integrale di Lebesgue Non sembrerebbe, questa, una condizione molto più generale della misurabilità secondo Peano-Jordan (si veda la nota precedente), eppure si verifica che praticamente tutte le funzioni sono misurabili secondo questa nuova condizione, tanto che i controesempi che si conoscono richiedono tutti l’uso di delicati argomenti di teoria degli insiemi e dell’assioma della scelta; in particolare la classe delle funzioni misurabili secondo Lebesgue è chiusa rispetto alle varie operazioni di somma, prodotto, composizione, passaggio al limite, etc... Si osservi che la di↵erenza fondamentale con la definizione di misurabilità secondo PeanoJordan è che in quest’ultima prima si vanno a cercare i punti di discontinuità di una funzione e poi si richiede che questi siano trascurabili; nella misurabilità secondo Lebesgue, invece, prima ci è concesso di buttare via molti punti e poi di controllare che la funzione che “rimane” è continua. Ad esempio, la famigerata funzione di Dirichlet, che vale 1 se il punto è razionale e 0 se è irrazionale, è discontinua in tutti i punti, e quindi non è misurabile secondo Peano-Jordan. D’altra parte, se noi possiamo prima di controllarne la discontinuità, tracurare un insieme di misura nulla, si vede subito che eliminando l’insieme dei razionali la funzione è continua sull’insieme rimanente, assumendo identicamente il valore 0: ecco giustificata la misurabilità di Lebesgue per questa funzione. Definizione 1.17 (Proprietà valide quasi ovunque) Diremo che una certa proprietà P vale per quasi ogni elemento di un certo insieme E ⇢ RN o, più semplicemente, che P vale quasi ovunque in E (abbreviato in q.o. in E) se se P è verificata da tutti gli elementi di E salvo al più un sottoinsieme trascurabile. Motivazioni. Alla base delle precedenti definizioni sta l’idea che il termine “trascurabile” significhi effettivamente che un tale insieme non conti “nulla” agli e↵etti della teoria dell’integrazione; questo fatto è messo in luce dai due risultati che seguono. La proprietà u è continua q.o. in R ha misura nulla. Esempi significa che l’insieme delle discontinuità di u La proprietà sin x 6= 0 è vera q.o. in R, perchè l’insieme dei punti {x 2 R : sin x = 0} è numerabile e quindi trascurabile in R. La proprietà x2 x 0 q.o. ]0, 1[, che ha misura 1 > 0. è falsa, perchè non è verificata nell’intervallo aperto Teorema 1.18 (Insiemi trascurabili e integrali) • Se u è positiva in E, allora Z u(x) dx = 0 E , u(x) = 0 per quasi ogni x 2 E; (1.34) in altri termini, l’integrale di una funzione positiva è nullo se e solo se u è nulla salvo al più in un sottoinsieme trascurabile. In particolare, l’integrale su un’insieme trascurabile è sempre nullo. • Se u è positiva Z E u(x) dx < +1 ) u(x) < +1 per quasi ogni x 2 E; (1.35) in altri termini, se l’integrale di una funzione positiva u è finito, allora u può assumere il valore +1 solo in un insieme trascurabile. Corollario 1.19 Se u, g sono due funzioni complesse definite in E ⇢ RN allora Z Z Z |u(x) v(x)| dx = 0 ) u(x) = v(x) q.o. in E ) u(x) dx = v(x) dx. E E 1-11 E (1.36) L’integrale di Lebesgue Dimostrazione Supponiamo di sapere che una funzione u definita su un insieme E ⇢ R N sia nulla ecccetto che in un sottoinsieme A ⇢ E di misura |A| = 0. Con la convenzione algebrica che abbiamo adottato la scorsa lezione, si vede formalmente che deve essere Z Z |u(x)| dx = |u(x)| dx +1 · |A| = +1 · 0 = 0. E Motivazione A Il fatto che l’integrale di una funzione u che vale identicamente +1 su un insieme di misura nulla e 0 altrove debba essere 0 si giustifica con il teorema della convergenza monotona: basta infatti scegliere la successione un (x) := n1 1A (x) che ha per limite proprio u(x); per il teorema di Beppo Levi e la linearità dell’integrale si ha Z Z u(x) dx = lim n dx = lim n|A| = 0. n"+1 A n"+1 A Per dimostrare l’implicazione opposta della (9.35) basta considerare la famiglia crescente An := {x 2 E : u(x) 1/n} Chiaramente |An | = 0, altrimenti per la proprietà di monotonia u avrebbe integrale strettamente positivo. D’altra parte si verifica subito che An " A := {x 2 E : u(x) > 0} e quindi |A| = 0 per il corollario 1.8. Con un ragionamento analogo si vede che se una funzione positiva u ha integrale finito, allora l’insieme dove u vale +1 deve essere di misura nulla. Detto I tale insieme, per la proprietà di monotonia si ha Z Z u(x) dx u(x) dx = +1 · |I|; E I se il primo membro è finito, questa disuguaglianza implica banalmente |I| = 0. Definizione 1.20 (Funzioni definite q.o., dominio) Diremo che una funzione u è definita q.o. in un certo insieme E ⇢ RN se per quasi ogni x 2 E ha senso parlare del valore u(x) (cioè u(x) è appunto definito); in altri termini, l’insieme dove u non è definita è trascurabile, nel senso della definizione 1.15. Chiameremo dominio di u il sottinsieme D(u) di E dove u è e↵ettivamente definita. Per ipotesi, il complementare die D(u) in E è trascurabile, cioè |E \ D(u)| = 0. Il corollario 1.19 permette di definire l’integrale di una funzione u su un insieme E anche se questa non è definita su tutto E: basta che l’insieme dove u non è definita sia trascurabile. Precisazione Se si vuole essere un po’ pedanti, la definizione potrebbe essere questa: se u è una funzione positiva o complessa q.o. definita su E ⇢ RN , chiamiamo integrale di u su E il numero Z Z u(x) dx := ũ(x) dx E E dove ũ è un’arbitraria estensione di u a tutto E, cioè una funzione definita su E che coicnide con u su D(u). Per esempio, un estensione standard è ( u(x) se x 2 D(u); ⇤ u (x) := 0 altrimenti. Approfondimento Insiemi definiti q.o.. Si potrebbe ripetete un discorso analogo anche per gli insiemi di integrazione. Diciamo che due insiemi E1 , E2 sono q.o. uguali, o di↵eriscono per un insieme trascurabile, quando la loro di↵erenza ha misura nulla, cioè E1 4E2 = (E1 \ E2 ) \ (E2 \ E1 ) 1-12 è trascurabile. L’integrale di Lebesgue Si vede facilmente che in tal caso le rispettive funzioni caratteristiche 1 E1 e 1 E2 sono q.o. uguali. Allora, per ogni funzione f positiva, o complessa e integrabile su uno dei due, Z Z u(x) dx = u(x) dx. E1 E2 Definizione 1.21 (Convergenza quasi ovunque) Diremo che la successione di funzioni reali (o complesse) un definite (anche solo quasi ovunque!) in un insieme E ⇢ RN converge quasi ovunque alla funzione u (anch’essa definita q.o.) se lim un (x) = u(x) n"+1 per quasi ogni x 2 E; in altri termini, l’insieme dei punti x 2 E dove il limite non esiste o è di↵erente da u(x) è trascurabile. Poichè l’integrale è invariante rispetto a modifiche delle funzioni in insiemi trascurabili, non sarebbe difficile (ma un po’ noioso...) verificare che la teoria precedentemente sviluppata vale anche se tutte le funzioni in gioco sono definite solo quasi ovunque. Osservazione 1.22 (Dalla convergenza degli integrali alla convergenza q.o.) La proprietà (1.35), benchè banale, ha importanti applicazioni, come vedremo anche in seguito. Consideriamo, ad esempio, il teorema di integrazione per serie (1.15): noi sappiamo che l’uguaglianza vale sempre, ma in generale potrebbe capitare che la serie delle funzioni valga +1 in un insieme molto grande, addirittura tutto l’insieme E; in tal caso l’uguaglianza si ridurrebbe a +1 = +1 e perderebbe parte del suo interesse. Se però noi sappiamo che la serie degli integrali è convergente, allora la serie +1 X un (x) avendo integrale finito, converge q.o. n=0 Quindi dalla conoscenza del comprtamento di una serie numerica (la serie degli integrali, appunto) è possibile dedurre un’informazione sul comportamento globale di una serie di funzioni, che in generale è un oggetto molto più complesso da studiare. 1-13 L’integrale di Lebesgue Scambio di operatori - III Teorema 1.23 (Integrazione per serie) Se un è una successione di funzioni complesse definite in E ⇢ RN tale che +1 Z X u(x) dx < +1, E n=0 P+1 allora la serie di n=0 un (x) converge assolutamente per quasi ogni x 2 E e definisce q.o. una funzione che è integrabile in E. Si ha Z +1 X E un (x) n=0 ! dx = +1 Z X n=0 un (x) dx. (1.37) E P+1 Inoltre la successione degli integrali dei resti Rn (x) := k=n uk (x) è infinitesima, cioè Z X +1 +1 Z X lim uk (x) dx lim |uk (x)| dx = 0. (1.38) n"+1 Dimostrazione n"+1 E k=n E k=n Ci limitiamo a controllare che la serie delle funzioni convege quasi ovunque: si tratta di un semplice esercizio di applicazione del corollario 1.6. Consideriamo infatti la serie dei moduli S(x) := +1 X n=0 |un (x)|. (1.39) Essendo una serie a termini positivi, possiamo applicare il citato corollario e ottenere che Z +1 XZ |un (x)| dx < +1 per ipotesi del teorema. S(x) dx = E n=0 E Ma allora, applicando (1.35) (cf. anche la nota 1.22) si deduce che S(x) < +1 q.o. in E, cioè la serie (1.39) converge al di fuori di un insieme trascurabile N . Se per x 2 E \ N converge la serie dei moduli, possiamo concludere che anche la serie delle funzioni converge (convergenza assoluta ) convergenza semplice). Formule di calcolo degli integrali multipli Teorema 1.24 (Fubini) Se E = (a, b) ⇥ (c, d) è un insieme rettangolare (anche illimitato) di R2 e u è una funzione complessa integrabile su E, cioè se ! ! ZZ Z Z Z Z b u(x, y) dx dy = E d u(x, y) dy a d dx = b u(x, y) dx c c dy < +1, a allora ZZ u(x, y) dx dy = E Z a b Z c d u(x, y) dy ! dx = Z c d Z a b u(x, y) dx ! dy. (1.40) Nella formula precedente si intende che per q.o. x 2 (a, b) la funzione y 7! u(x, y) è integrabile in (c, d) e che il suo integrale è a sua volta integrabile in (a, b) rispetto a x. Analogo discorso vale scambiando il ruolo delle due variabili. Esercizio Seguendo la traccia della precedente dimostrazione e applicando il Teorema di Tonelli (1.23), dimostrare l’ultima parte del Teorema di Fubini (le ultime tre righe!). 1-14 L’integrale di Lebesgue Richiami Trasformazioni e matrice derivata. Se T : E ⇢ RN ! RN è una trasformazione di↵erenziabile, denotiamo con DT (x) la sua matrice derivata nel punto x 2 E e con JT (x) il suo Jacobiano, cioè ⇥ ⇤ JT (x) := det DT (x) 8 x 2 E. T (E) è l’immagine di E, cioè l’insieme dei punti di RN che sono e↵ettivamente assunti dalla trasformazione T in qualche punto di E. Se y 2 T (E) definiamo la molteplicità di y come il numero delle sue controimmagini tramite T , cioè il numero di volte in cui y viene assunto in E dalla trasformazione T , e la indichiamo con il simbolo #{x : T (x) = y}. Tale numero può anche essere +1; osserviamo che se T è iniettiva allora #{x : T (x) = y} vale identicamente 1 su T (E). Teorema 1.25 (Formula di cambiamento di variabili) Sia T : E ⇢ RN ! RN una trasformazione di↵erenziabile e u una funzione positiva q.o. definita su T (E). Allora Z Z u(T (x)) JT (x) dx. u(y) #{x : T (x) = y} dy = (1.41) T (E) E La formula precedente vale anche se u è reale o complessa, purchè Z Z |u(y)| #{x : T (x) = y} dy = |u(T (x))| JT (x) dx < +1. T (E) E In particolare, se T è iniettiva al di fuori di un insieme trascurabile vale la formula Z T (E) u(y) dy = Z u(T (x)) JT (x) dx, E T (E) = Z E 1-15 JT (x) dx. L’integrale di Lebesgue Derivate e integrali Teorema 1.26 (Fondamentale del calcolo, Lebesgue) Sia u una funzione complessa integrabile sull’intervallo limitato (a, b). Allora la funzione integrale Z x U (x) := u(t) dt a è uniformemente continua in [a, b] ed è derivabile in quasi tutti i punti dell’intervallo, con Z x d U 0 (x) = u(t) dt = u(x) per q.o. x 2 (a, b). (1.42) dx a Nota Il problema di trovare condizioni sufficienti per cui una data funzione U definita su un intervallo (a, b) si può ricostruire per integrazione dalla sua derivata è molto più delicato. Dal Teorema precedente si deducono facilmente tre condizioni necessarie: U dev’essere continua, derivabile in quasi tutti i punti dell’intervallo (a, b) e la sua derivata deve eseere integrabile. Purtroppo vi sono esempi (particolarmente complicati) che mostrano come queste tre condizioni non sono sufficienti. Noi ci limitiamo a definire con precisione questa proprietà (assoluta continuità) che risulta assai importante in molte situazioni e a presentare una classe sufficientemente ampia di funzioni che la verificano. Definizione 1.27 (Funzioni assolutamente continue) Una funzione complessa U definita su un intervallo [a, b] di R si dice assolutamente continua quando è continua, è derivabile in quasi tutti i punti dell’intervallo, la sua derivata U 0 è integrabile in [a, b] e vale la formula Z x U (y) U (x) = U 0 (t) dt per ogni scelta di a x y b. (1.43) a Esercizio Dimostrare che se una funzione U verifica la (1.43) per la particolare scelta x = a (e y arbitrario nell’intervallo) allora la verifica per tutti gli x. Definizione 1.28 Diciamo che una funzione u definita su un intervallo (anche illimitato) (a, b) è regolare a tratti, se l’intervallo (a, b) si può decomporre in un unione finita o numerabile di intervalli In := (an , bn ) che abbiano in comune al più gli estremi, in modo che u sia derivabile all’interno di ogni In e la derivata u0 (che risulta pertanto definita q.o. in (a, b)) sia integrabile su (a, b). Teorema 1.29 Se la funzione complessa u, definita su (a, b), è continua e regolare a tratti sull’intervallo [a, b] allora essa è assolutamente continua e quindi per ogni coppia di punti x y 2 (a, b) vale Z y u(y) u(x) = u0 (t) dt. x Teorema 1.30 (Integrazione per parti) Se u, v sono funzioni assolutamente continue sull’intervallo [a, b], allora vale la formula Z a b h u (x)v(x) dx = u(x)v(x) 0 1-16 ix=b x=a Z a b u(x)v 0 (x) dx. (1.44) L’integrale di Lebesgue Teorema 1.31 (Derivazione sotto il segno di integrale) Sia u una funzione complessa definita nel rettangolo E := (a, b) ⇥ (c, d) e supponiamo che la funzione integrale rispetto alla variabile y U (x) := Z d u(x, y) dy c sia ben definita in (a, b), cioè che la funzione y 7! u(x, y) sia integrabile rispetto a y in (c, d). Supponiamo che per quasi ogni y 2 (c, d) la funzione x 7! u(x, y) sia derivabile in (a, b) con @ u(x, y) g(y), @x Z d g(y) dy < +1. c Allora la funzione U è derivabile in (a, b) e si ha U (x) = 0 Z c d @ u(x, y) dy @x 1-17 8 x 2 (a, b). 2. Spazi di funzioni Stefan Banach (1892-1945) Definizione 2.1 (Spazi funzionali) Consideriamo un sottoinsieme E dello spazio euclideo Rd . Indichiamo con F(E) l’insieme di tutte le funzioni definite in E a valori complessi. F(E) è uno spazio vettoriale sul campo complesso. Diciamo che V è uno spazio funzionale (su E) se V è un sottospazio vettoriale di F(E). Nota Tutto quello che diremo in generale in questa lezione per uno spazio funzionale V vale generalmente per un qualsiasi spazio vettoriale sul corpo complesso. Noi adotteremo frequentemente il termine più restrittivo di spazio funzionale, perchè vogliamo sottolineare che il nostro obiettivo è quello di descrivere spazi di questo tipo. Quando penseremo agli elementi dello spazio V solo come vettori useremo le lettere in grassetto u, v, w, . . .; quando vorremo sottolineare che si tratta anche di funzioni definite in E torneremo ad usare le lettere in corpo normale u, v, w, . . .. 2-1 2-2 2. SPAZI DI FUNZIONI Richiami Operazioni in uno spazio vettoriale. Se u, v sono due funzioni di F(E) allora la funzione somma w := u + v è quella ovviamente definita da w(x) := u(x) + v(x) Analogamente, se per ogni x 2 E. 2 C è uno scalare complesso, la funzione l := u è definita da l(x) := u(x) per ogni x 2 E. Dire che V è un sottospazio di F(E) significa che queste operazioni, fatte a partire da elementi u, v in V non fanno uscire da V . E.1 Quando E := ( 1, +1) e la variabile in E è pensata come tempo, F( 1, +1) è lo spazio di tutti i possibili segnali temporali. Esempi E.2 Se consideriamo solo segnali temporali nulli prima dell’istante t = 0 (i segnali causali) otteniamo un sottospazio di F( 1, +1), V = F+ ( 1, +1) := u 2 F( 1, +1) : u(t) ⌘ 0 per t < 0 . È facile convicersi che si tratta ancora di uno spazio vettoriale. E.3 Fissato un periodo di tempo T > 0, si può considerare un altro sottospazio importante di F( 1, +1), precisamente quello formato da tutti i segnali T -periodici; in formule V = FT ( 1, +1) := u 2 F( 1, +1) : u(t + T ) = u(t) 8 t 2 ( 1, +1) . E.4 E := Z rappresenta la scelta più semplice per rappresentare un segnale discreto, cioè una funzione che dipende solo dai valori interi della variabile; in questo caso il segnale u 2 F(Z) è determinato dai valori un := u(n), n 2 Z. E.5 Se E := {nh : n 2 Z}, con h > 0 fissato, F(E) può essere adatto a rappresentare il campionamente a passo h di un segnale temporale. Si possono ripetere anche in questo caso le medesime osservazioni circa i segnali causali e periodici. E.6 Fissato un intero N , sia E := {0, h, 2h, 3h, . . . , (N 1)h}. In questo caso un elemento u di F(E) è determinato da N numeri complessi un := u(nh), n = 0, . . . , N 1, e può quindi essere rappresentato da un vettore di CN (RN nel caso di segnali reali). Questa rappresentazione è utile per trattare segnali discreti finiti (segnali digitali). E.7 La distribuzione di potenziale elettrostatico in una sfera E è un elemento di F(E); se tale potenziale varia nel tempo, il segnale spazio-temporale associato è un elemento di F(E ⇥ R). E.8 Un immagine rettangolare composta da N ⇥ M pixel può essere rappresentata associando al pixel di coordinate (n, m) un valore reale un,m = u(n, m) (0 o 1 se si considera un’immagine in bianco e nero; da 0 a k 1 se si hanno a disposizione k toni di grigio) corrispondente allo stato di quel pixel: in questo caso E := {0, 1, . . . , N 1} ⇥ {0, 1, . . . , M 1} ⇢ R2 . In certi casi può essere utile pensare che u sia definito per tutti i valori interi, ad esempio in modo periodico oppure esteso a 0 al di fuori della griglia iniziale. Definizione 2.2 (Trasformazioni lineari) Una trasformazione T : V ! W tra due spazi funzionali si dice lineare se T (↵u + v) = ↵T (u) + T (v) Approfondimento 8 u, v 2 V, ↵, 2 C. Ci si può chiedere la ragione dell’insistenza sul concetto di linearità: esso permette di esprimere un segnale per sovrapposizione di segnali più semplici; lo studio e la realizzazone e↵ettiva di queste decomposizioni costituisce uno dei problemi più importanti che a↵ronteremo. Schematicamente lo si può riassumere nel modo seguente: dato una successione (finita o numerabile) di segnali “elementari” e1 , . . . , en , . . . in uno spazio funzionale V , esprimere ogni altro segnale u di V come combinazione lineare u = ↵1 e1 + ↵2 e2 + . . . + ↵n en + . . . mediante opportuni coefficienti ↵1 , ↵2 , . . . da determinarsi. Lo sviluppo (2.1) dovrebbe possedere i seguenti requisiti: – Il calcolo del coefficiente ↵n+1 non comporta la modifica dei precedenti. – L’aggiunta di un nuovo termine dovrebbe migliorare l’approssimazione di u. (2.1) 2-3 2. SPAZI DI FUNZIONI – Si vorrebbe “misurare” in qualche modo l’errore che si commette se si tronca la somma dopo un numero finito di termini, riducendo l’errore al di sotto di una fissata tolleranza, pur di sommare un numero sufficiente di elementi. – Si vorrebbe poter rappresentare “esattamente” u come serie infinita (se è necessario), senza più alcun errore, trattando poi formalmente la serie come una somma ordinaria. Il problema di precisare le nozioni di errore, approssimazione, convergenza delle serie infinite viene risolto in modo elegante e generale dai concetti che introduciamo qui di seguito. Definizione 2.3 ((Semi)norme in uno spazio funzionale) Una (semi)norma k · k per lo spazio funzionale V è un’applicazione definita in V a valori reali non negativi che soddifsfa le seguenti proprietà: (M1 ) Per ogni u, v 2 V (M2 ) Per ogni u 2 V e ku + vk kuk + kvk. 2C k uk = | | kuk. In particolare (M2 ) implica che la (semi)norma della funzione nulla è 0. Chiameremo trascurabili le funzioni u 2 V tali che kuk = 0. k · k è una norma se l’unica funzione trascurabile è lquella nulla, cioè (M3 ) kuk = 0 ) u = 0. Uno spazio V dotato di una (semi)norma k · k si dice spazio (semi)normato. Chiamiamo (semi)distanza tra due funzioni u, v in V il numero d(u, v) := ku vk. Diremo indistinguibili (rispetto alla norma k · k) due funzioni u, v che di↵eriscono per una funzione trascurabile, cioè tali che d(u, v) = 0. Convenzione. Norme e seminorme. Come appare chiaro dalla precedente definizione, l’unica differenza tra norme e seminorme consiste nella proprietà M3 : questa proprietà risulta poi fondamentale per garantire l’unicità del limite, secondo la successiva definizione 2.4, e costituisce per questo il punto di vista privilegiato nelle usuali trattazioni di analisi funzionale. D’altra parte gli esempi più importanti di seminorme di tipo integrale (cf. (2.9)) non verificano la M3 , a meno di non ricorrere al linguaggio delle classi di equivalenza. Noi useremo ambedue i concetti e talvolta, per non appesantire l’esposizione, parleremo di norme, spazi di Banach o di Hilbert anche quando si abbia a che fare in realtà solo con una seminorma. Approfondimento Proprietà della distanza. Una (semi)distanza d(·, ·) in uno spazio funzionale V è una applicazione reale definita in V ⇥ V caratterizzata dalle seguenti proprietà: (qui di seguito u, v, w, h sono arbitrari elementi di V ) ( 1 ) Positività: d(u, v) 2 [0, +1). ( 2 ) Simmetria: d(u, v) = d(v, u). ( 3 ) Disuguaglianza triangolare: d(u, w) d(u, v) + d(v, w). ( 4 ) Invarianza per traslazioni: d(u, v) = d(u + h, v + h). ( 5 ) Omogeneità: d( u, v) = | |d(u, v) 8 2 C. ( 6 ) Se poi d è e↵ettivamente una distanza allora due funzioni indistinguibili sono uguali, cioè u = v , d(u, v) = 0. 2-4 2. SPAZI DI FUNZIONI Definizione 2.4 (Convergenza in uno spazio funzionale (semi)normato) Diciamo che una successione un 2 V converge a u rispetto alla norma k · k, se lim d(un , u) = lim kun n"+1 uk = 0. n"+1 Analogamente diremo che la serie +1 X un converge in V a S se n=1 lim kS N "+1 N X n=1 un k = 0. Dimostrare che se un converge a u rispetto alla (semi)norma k · k, allora Esercizio lim kun k = kuk. n"+1 Attenzione! Unicità del limite. Il limite di una successione in uno spazio funzionale V è unico se e solo se lo spazio è dotato di una norma; nel caso di una seminorma, se la successione un converge a u, essa converge anche a tutte le funzioni ũ con kũ uk = 0. Infatti, ⇣ ⌘ lim kun ũk = lim kun u + u ũk lim kun uk + ku ũk = 0. n"+1 n"+1 n"+1 Il concetto di somma di una serie è molto importante e potremmo rileggerlo cosı̀: fissato un margine d’errore (tolleranza) " > 0, siamo in grado, pur di sommare un numero N N̄ = N̄ (") sufficientemente grande di termini della serie, di approssimare la somma S commettendo un errore inferiore a ", cioè S N X n=1 un " 8N N̄ ("). (2.2) Per controllare questa proprietà però occorre conoscere a priori l’esistenza e il valore di S, mentre spesso si dispone solo dei valori di un . In questo caso risulta naturale sostituire la condizione (2.2) con la seguente nozione. Completezza Definizione 2.5 (Serie di Cauchy) Una successione un in V forma una serie di Cauchy se, fissata una tolleranza " > 0 è possibile trovare un intero N̄ = N̄ (") tale che i contributi alla serie formati con un numero arbitrario di addendi successivi a N̄ sono comunque inferiori a "; in formule: 8" > 0 9N̄ (") 2 N : 8 N M N̄" , N X n=M un ". (2.3) Definizione 2.6 (Spazi completi) Uno spazio funzionale (semi)normato V si dice completo se ogni serie di Cauchy è convergente in V . Uno spazio di Banach è uno spazio normato completo. Un esempio particolarmente importante di serie di Cauchy è fornito dal seguente lemma: Lemma 2.7 Supponiamo che la successione un in V soddisfi la +1 X n=1 kun k < +1. Allora un forma una serie di Cauchy. (2.4) 2-5 2. SPAZI DI FUNZIONI Resto di una serie numerica convergente.. Se an è una successione di numeri reali P +1 tali che la serie a è convergente alla somma s, allora si chiama resto N -esimo la n n=1 quantità +1 N X X an = an . rN := s Richiami n=1 n=N +1 Per definizione stessa di convergenza della serie, si ha lim rN = lim N "+1 Dimostrazione N "+1 +1 X an = 0 n=N Basta osservare che se +1 X n=1 kun k < +1 e si fissa " > 0, allora esiste N̄ = N̄ (") tale che +1 X kun k ". n=N̄ In particolare la condizione (2.3) è soddisfatta, poichè se N N X n=M Nota un N X n=M kun k +1 X n=N̄ M N̄ si ha kun k ". Ogni serie convergente è di Cauchy ma in generale non soddisfa la (4.19). totalmente convergente; d’altra parte la (4.19) costituisce spesso il metodo più comodo per controllare che una serie sia di Cauchy. Verdemo che un altro caso particolarmente importante di serie di Cauchy è costituito da alcune serie di vettori ortogonali in uno spazio di Hilbert. Teorema 2.8 (Criterio di Weierstrass “generalizzato”) V è uno spazio funzionale completo rispetto alla (semi)norma k·k se e solo se per ogni successione un in V +1 +1 X X kun k < +1 ) un converge in V . n=1 Dimostrazione n=1 Ogni serie totalmente convergente è di Cauchy, quindi se lo spazio è completo essa converge. Supponiamo ora che ogni serie totalmente convergente sia convergente e mostriamo che ogni serie di Cauchy converge. Partendo dalla (2.3) scegliamo una successione di valori di ", precisamente "k := 2 k , k 1; corrispondentemente troveremo interi N̄k := N̄ ("k ) per i quali, posto N0 := 0, N̄k+1 X un kSk k +1 X Sk := si ha n=N̄k kSk k "k = 2 k k 1. Evidentemente +1 X k=1 2 k < +1 sicché k=1 9 S := +1 X Sk . k=0 È facile vedere che pure la serie iniziale converge a S: fissato infatti " > 0 e scelto k in modo che "k < "/2, si ha per N N̄k S N X n=0 un S N̄k X n=0 un + N X n=N̄k un 2"k ". 2-6 2. SPAZI DI FUNZIONI Lo spazio delle funzioni integrabili Consideriamo un insieme E ⇢ Rd di misura positiva. Un modo per valutare quanto di↵eriscono due funzioni u, v di F(E) è quello di misurare l’area compresa tra i rispettivi grafici, cioè l’insieme {(x, y) : x 2 E, u(x) y v(x) o v(x) y u(x)}. Un semplice grafico mostra che questa area può essere calcolata mediante l’integrale Z |u(x) v(x)| dx E che prenderemo dunque come definizione di distanza integrale tra le due funzioni. Non è difficile controllare che tale distanza soddisfa le proprietà ( 1 , . . . , 5 ) e che Z |u(x)| dx kuk := d(u, 0) = E si comporta come una (semi)norma. Poiché vogliamo evitare il caso kuk = +1, è naturale restringere lo spazio F(E) al sottospazio delle funzioni integrabili. Questo nuovo spazio è cosı̀ importante, che lo introduciamo con la definizione che segue. Definizione 2.9 Se E è un insieme di Rd con misura positiva, indichiamo con L 1 (E) il sottospazio di F(E) formato dalle funzioni u che sono integrabili, cioè Z u 2 L 1 (E) , u 2 F(E), |u(x)| dx < +1. E L 1 (E) è naturalmente dotato della (semi)norma Z kukL 1 (E) := |u(x)| dx. E Attenzione! Per il Corollario 1.19, d(u, v) = ku vkL 1 (E) = 0 , u=v q.o. in E. Ecco perchè abbiamo chiamato seminorma la funzione k · kL 1 (E) : essa non è in grado di distinguere due funzioni, se esse coincidono q.o. Convenzione. Per evitare di usare le seminorme, quando si considera lo spazio L 1 (E) generalmente si adotta la convenzione di identificare due funzioni integrabili, quando queste coincidono q.o. I matematici usano per questo procedimento la nozione di classe di equivalenza, che raggruppa gli elementi che sono indistinguibili dal punto di vista della norma dello spazio. In questo caso si parla dello spazio L1 (E) e i “veri” elementi di L1 (E) sono classi di equivalenza di funzioni, anziché le singole funzioni. Nel linguaggio corrente, però, si lascia sempre sottointesa questa convenzione, finendo per parlare di L1 (E) come spazio di funzioni e non di classi di equivalenza di funzioni. Dunque noi non ricorreremo al linguaggio delle classi di equivalenza, ma semplicemente dovremo tener presente che la (semi)norma di L 1 (E) non distingue due funzioni uguali q.o., e il limite nel senso di L 1 (E) risulta quindi determinato solo a meno di insiemi di misura nulla. Quando vorremo sottolineare che la funzione u è determinata a meno di insiemi trascurabili, scriveremo u 2 L1 (E). In particolare, la nozione di valore puntuale di una funzione di L 1 (E) deve essere usata con molta cautela: è chiaro che quando noi definiamo una funzione in E, assegnamo (e quindi conosciamo) il suo valore in ogni punto di E. Ma quando la definizione o l’esistenza di una funzione f passa per qualche procedimento di limite in L1 (E) e vogliamo che il nostro discorso sia indipendente dalla scelta arbitraria di un altro candidato limite ũ che coincide con u q.o. in E, non siamo più autorizzati a sfruttare il particolare valore di u in un determinato punto, ma solo proprietà puntuali che sono invarianti rispetto al cambiamento di u in un insieme di misura nulla. 2-7 2. SPAZI DI FUNZIONI Supponiamo che una successione di funzioni positive un converga a u in L 1 (0, 1): ebbene, possiamo ancora dire che u è positiva quasi ovunque nell’intervallo (0, 1), ma non possiamo dire che u(1/2) 0, in quanto il particolare valore di u in 1/2 non può essere identificato dalla convergenza integrale. Esempio Teorema 2.10 (Completezza di L 1 (E)) Se una successione un 2 L 1 (E) soddisfa la +1 Z +1 X X |un (x)| dx = kun k < +1 n=1 E n=1 P+1 1 allora la serie n=1 un (x) converge puntualmente q.o. ed in L (E) ad una funzione S integrabile in E: lim N "+1 N X un (x) = S(x) q.o. in E, con n=0 lim N "+1 Z E |S(x) N X un (x)| dx = 0. n=0 In particolare, L 1 (E) è completo. Dimostrazione (2.5) Basta ricordare il Teorema di integrazione per serie. Proposizione 2.11 (Convergenza degli integrali) Se la successione {u n }n2N converge a u in L 1 (E), allora per ogni sottoinsieme A ⇢ E Z Z lim un (x) dx = u(x) dx. (2.6) n"+1 Dimostrazione A Basta semplicemente osservare che, per la (1.27), Z un (x) dx A Z u(x) dx = A Z un (x) A Approfondimento A Z ⇣ ⌘ u(x) dx A Z u(x)) dx un (x) u(x)) dx = kun un (x) E ukL 1 (E) Convergenza L 1 (E) e convergenza q.o.. Supponiamo di sapere che una successione di funzioni complesse un definite in E converga q.o., cioè lim un (x) = u(x) n"+1 per q.o. x 2 E. Cosa si può dire della convergenza di un in L 1 (E)? – Occorre innanzitutto controllare che un , u appartengano a L 1 (E), altrimenti non ha senso parlare di convergenza in L 1 (E). – In caso a↵ermativo, l’unico (a meno di insiemi trascurabili...) limite possibile per la successione un in L 1 (E) è la funzione u (anche se è intuitivo, si tratta di un Teorema di non banale dimostrazione!) – Per controllare che la convergenza sia anche in L 1 (E) vi sono sostanzialmente tre possibilità: 1. applicare direttamente la definizione e stimare in modo opportuno (per es. calcolandoli esplicitamente...) gli integrali Z |un (x) u(x)| dx ed il relativo limite per n " +1; E 2. controllare se le ipotesi del teorema di Beppo Levi sono soddisfatte (convergenza monotona) e controllare che il limite degli integrali sia finito (che in tal caso è una condizione necessaria e sufficiente per la convergenza) 2-8 2. SPAZI DI FUNZIONI 3. controllare se le ipotesi del teorema di Lebesgue sono verificate (convergenza dominata): queste forniscono una condizione sufficiente per la convergenza in L 1 (E). – Nel caso di una serie di funzioni si applica il teorema di integrazione per serie (nel caso di funzioni positive) o il teorema 2.10. Viceversa, se si conosce a priori la convergenza in L 1 (E), l’unico caso in cui si può dedurre la convergenza q.o. è quello delle serie che soddisfano l’ipotesi del teorema 2.10. In generale se una successione un converge a u in L 1 (E) si può solo concludere che una esiste una sottosuccessione unk che converge q.o. a u. Lo spazio delle funzioni (essenzialmente) limitate. Definizione 2.12 Chiamiamo B(E) lo spazio vettoriale delle funzioni complesse e limitate definite in E; B(E) è uno spazio normato grazie a kukB(E) := sup |u(x)|. x2E Richiami – Dire che una successione un converge a u in B(E) è equivalente a dire che un converge uniformemente a u. – L’usuale Criterio di Weierstrass per la convergenza uniforme si può riformulare in questo modo: se +1 +1 X X kun kB(E) = sup |un (x)| < +1, n=1 x2E n=1 allora la serie di funzioni P +1 n=1 un (x) converge uniformemente (e cioè in B(E)). – Per il teorema 2.8, B(E) è uno spazio completo. Quando si considerano funzioni definite solo quasi ovunque, ad esempio perchè si è interessati solo a quantità integrali, il naturale sostituto di B(E) si chiama L 1 (E): sostanzialmente si concede alla funzione u di “comportarsi male” purcheè questo avvenga su di un insieme trascurabile; in altri termini, ridefinendo la funzione (per es. a 0) su un insieme trascurabile, siamo in grado di renderla limitata. Definizione 2.13 (Funzioni essenzialmente limitate e L 1 (E)) Una funzione complessa u definita in E si dice essenzialmente limitata se esiste una costante M > 0 tale che |u(x)| M per q.o. x in E. (2.7) L’insieme delle funzioni essenzialmente limitate definite in E è uno spazio vettoriale che si indica con L 1 (E). Se u 2 L 1 (E), si indica con kukL 1 (E) la più piccola delle costanti M che verificano la (2.7). Attenzione! Dire che una funzione è essenzialmente limitata è molto più restrittivo che limitata q.o.: ad esempio, la funzione u(x) := 1/x q.o. definita su R è limitata (=finita) q.o. ma non appartiene a L 1 (R), perchè anche se la ridefiniamo 0 per x = 0 essa rimane illimitata su R. Teorema 2.14 L’applicazione u 7! kukL 1 (E) è una (semi)norma in L 1 (E), rispetto alla quale tale spazio risulta completo: L 1 (E) è quindi uno spazio di Banach. Osservazione 2.15 Se u è una funzione regolare a tratti (cf. la precedente lezione) definita in un intervallo [a, b], allora si controlla facilmente che kukL 1 (a,b) = sup |u(x)| = kukB(a,b) . x2[a,b] 2-9 2. SPAZI DI FUNZIONI Dunque sulle funzioni regolari a tratti la norma L 1 coincide con la norma (del “sup”) di B(a, b); in particolare si verifica che se {un }n2N è una successione di funzioni regolari a tratti, essa converge in L 1 (a, b) se e solo se essa converge uniformemente ad una funzione u limitata in [a, b]. Ogni funzione ũ quasi ovunque uguale ad u è allora il limite della successione in L 1 (a, b). Lemma 2.16 Se u 2 L 1 (E) e v 2 L 1 (E), allora il prodotto uv è integrabile e Z kuvkL 1 (E) = |u(x)v(x)| dx kukL 1 (E) kvkL 1 (E) . E Analogamente, se {un }n2N e {vn }n2N sono due successioni convergenti a u e v in L 1 (E) e in L 1 (E) rispettivamente, allora Z Z 1 u(x)v(x) dx. lim un vn = uv in L (E), lim un (x)vn (x) dx = n"+1 n"+1 E E L’integrale del prodotto di due funzioni, lo spazio L 2 (E) e la nozione di prodotto scalare. Il lemma 2.16 fornisce un primo elementare criterio di integrabilità del prodotto di due funzioni u, v; ci si può chiedere se non è possibile trovare una condizione sufficiente che faccia intervenire simmetricamente le due funzioni. La risposta sta nella seguente disuguaglianza elementare 1 (|a|2 + |b|2 ), 8 a, b 2 C, 2 la cui dimostrazione segue facilmente dall’identità (2.8) |ab| 1 (|a|2 + |b|2 2 2|ab|) = 1 (|a| 2 |b|)2 0, 8 a, b 2 C. Corollario 2.17 Se u, v sono funzioni complesse definite in E tali che Z Z 2 |u(x)| dx < +1, |v(x)|2 dx < +1, E E allora la funzione u · v è integrabile in E e Z Z Z ⌘ 1⇣ |u(x) · v(x)| dx |u(x)|2 dx + |v(x)|2 dx < +1. 2 E E E (2.9) Definizione 2.18 Se E è un insieme di Rd con misura positiva, indichiamo con L 2 (E) il sottospazio di F(E) formato dalle funzioni u che sono integrabili, cioè Z u 2 L 2 (E) , u 2 F(E), |u(x)|2 dx < +1. E L 2 (E) è naturalmente dotato della (semi)norma sZ kukL 2 (E) := |u(x)|2 dx, (2.10) u(x) · v(x) dx. (2.11) E indotta dal prodotto scalare (u, v) L 2 (E) := Z E 2-10 2. SPAZI DI FUNZIONI Osserviamo che (2.11) è ben definito grazie al precedente corollario; a di↵erenza di L 1 (E), controllare che (2.10) è e↵ettivamente una (semi)norma (in particolare la proprietà (M2 )) non è del tutto immediato, ma è una facile conseguenza del fatto che (2.11) è e↵ettivamente un prodotto scalare. Ricordiamo qui di seguito la definizione generale di questa nozione fondamentale, lasciando come esercizio la verifica che (2.11) ne soddisfa tutte le proprietà formali. Definizione 2.19 (Prodotto scalare e norma indotta) Si chiama prodotto scalare in uno spazio funzionale V una applicazione che associa ad ogni coppia di vettori u, v di V un numero complesso (u, v) con queste proprietà: hermitianità sesquilinearità (v, u) = (u, v); ( (↵u + v, h) = ↵(u, h) + (v, h), (h, ↵u + v) = ↵(h, u) + (h, v), (2.12) (2.13) positività (u, u) 0 u = 0 ) (u, u) = 0. (2.14) p Si verifica che la funzione u 7! (u, u) è una (semi)norma su V , che si chiama (semi)norma indotta dal prodotto scalare. Chiameremo trascurabile un elemento u tale che kuk = (u, u) = 0. Se è soddisfatta anche la proprietà (u, u) = 0 ) u = 0, (2.15) cioè il solo elemento trascurabile è lo 0, allora la (semi)norma indotta è una norma in senso stretto. Prodotti scalari a valori reali. Nel caso (·, ·) sia un prodotto scalare reale (ad esempio quando V è uno spazio vettoriale sul campo dei numeri reali) si parla di simmetria (al posto della hermitianità) e di bilinearità (al posto della sesquilinearità): in pratica basta omettere da tutte le formule il segno della coniugazione complessa. Nota Se (·, ·) è un prodotto scalare complesso, si verifica facilmente (Esercizio!) che Re(·, ·) è un prodotto scalare reale. Approfondiremo nella lezione successiva alcune applicazioni importanti del prodotto scalare; per ora ricordiamo una disuguaglianza fondamentale che applichiamo subito al problema dell’integrazione del prodotto di due funzioni, raffinando la (2.9) Proposizione 2.20 (Disuguaglianza di Schwartz) Se (·, ·) è un prodotto scalare definito nello spazio funzionale V , allora per ogni coppia di vettori u, v di V si ha p p |(u, v)| (u, u) (v, v) = kuk kvk. Inoltre, | | = 1, (u, v) = kuk kvk , 9⇢ 0: u = ⇢v Corollario 2.21 (Continuità del prodotto scalare) Se un ! u e v n ! v in V , allora lim (un , v n ) = (u, v). (2.16) n"+1 Dimostrazione |(un , vn ) (u, v)| = |(un , vn ) |(un , vn ) (u, vn ) + (u, vn ) (u, vn )| + |(u, vn ) (u, v)| = |(un (u, v)| u, vn )| + |(u, vn kun v)| uk kvn k + kuk kvn vk Passando al limite per n " +1 e osservando che la norma di vn si mantiene limitata (di fatto converge alla norma di v) si conclude. 2-11 2. SPAZI DI FUNZIONI Corollario 2.22 Se u, v 2 L 2 (E) allora sZ sZ Z |u(x) · v(x)| dx |u(x)|2 dx |v(x)|2 dx = kukL 2 (E) kvkL 2 (E) E E E Inoltre, se {un }n2N , {vn }n2N sono due successioni convergenti rispettivamente a u, v in L 2 (E) si ha Z Z lim un (x) · vn (x) dx = u(x) · v(x) dx. n"+1 E E Applichiamo ora la disuguaglianza di Schwartz per dimostrare che L 2 (E) è uno spazio completo. Teorema 2.23 (Completezza di L 2 (E)) Se una successione un 2 L 2 (E) soddisfa la sZ +1 +1 X X |un (x)|2 dx = kun kL 2 (E) < +1 E n=1 n=1 P+1 2 allora la serie n=1 un (x) converge puntualmente q.o. ed in L (E) ad una funzione S integrabile in E: lim N "+1 N X un (x) = S(x) q.o. in E, con n=1 lim N "+1 Z N X S(x) E 2 un (x) dx = 0. n=1 (2.17) In particolare, L 2 (E) è completo. Dimostrazione Per dimostrare il primo limite di (2.17) basterà mostrare che S̃(x) := +1 X n=1 |un (x)| < +1 per q.o. x 2 E; quest’ultima disuguaglianza è certamente verificata se Z |S̃(x)|2 dx < +1. E posto S̃N (x) := N X n=1 |un (x)| 2 (x)) è una successione non negativa e monotona evidentemente S̃N (x) (e quindi anche S̃N non decrescente rispetto a N ; per il teorema di Beppo Levi Z Z |S̃(x)|2 dx = lim |S̃N (x)|2 dx. N "+1 E Se noi mostriamo che Z abbiamo concluso. E |S̃N (x)|2 dx ⇣ E +1 X n=1 kun kL 2 (E) ⌘ Ricordiamo una semplice identità: se a1 , a2 , . . . , aN sono numeri reali N N N N ⇣X ⌘2 ⇣ X ⌘ ⇣X ⌘ X an = an · an = am an ; n=1 n=1 (2.18) m,n=1 n=1 applicando questa identità alla somma che definisce S̃N e applicando la disuguaglianza di Schwartz otteniamo Z Z Z N N X X |S̃N (x)|2 dx = |um (x)| |un (x)| dx = |um (x)| |un (x)| dx E E m,n=1 N X m,n=1 kum kL 2 (E) kun kL 2 (E) = m,n=1 N ⇣X n=1 kun kL 2 (E) ⌘2 E ⇣ +1 X n=1 kun kL 2 (E) Il secondo limite in (2.17) segue dal teorema della convergenza dominata. ⌘2 . (2.19) 2-12 2. SPAZI DI FUNZIONI Approfondimento Convergenza L 2 (E) e convergenza q.o.. Possiamo ripetere anche nel caso di L 2 (E) considerazioni analoghe a quelle precedentemente presentate per L 1 (E). Supponiamo dunque di sapere che una successione di funzioni complesse un definite in E converga q.o. a u. Per poter concludere che vi è convergenza anche in L 2 (E) – Occorre innanzitutto controllare che un , u appartengano a L 2 (E). – In caso a↵ermativo, l’unico (a meno di insiemi trascurabili...) limite possibile per la successione un in L 1 (E) è la funzione u – Si hanno quindi tre possibilità: 1. applicare direttamente la definizione e stimare in modo opportuno (per es. calcolandoli esplicitamente...) gli integrali Z |un (x) u(x)|2 dx ed il relativo limite per n " +1; E 2. controllare se le ipotesi del teorema di Beppo Levi sono soddisfatte (convergenza monotona) e controllare che il limite degli integrali Z Z lim |un (x)|2 dx = |u(x)|2 dx n"+1 E E sia finito (che in tal caso è una condizione necessaria e sufficiente per la convergenza) 3. controllare se le ipotesi del teorema di Lebesgue sono verificate (convergenza dominata) per i quadrati delle funzioni un : Z 9 v : |un (x)|2 v(x) per q.o. x 2 E, 8 n 2 N; v(x) dx < +1. E Queste forniscono una condizione sufficiente per la convergenza in L 2 (E). – Nel caso di una serie di funzioni si applica il teorema 2.23 a meno che non si tratti di una serie di funzioni ortogonali, che tratteremo nella prossima lezione. Concludiamo con un risultato che illustra la relazione tra gli spazi fin qui introdotti nel caso che la misura |E| di E sia finita. Proposizione 2.24 Supponiamo che |E| < +1; allora L 1 (E) ⇢ L 2 (E) ⇢ L 1 (E); inoltre e u 2 L 1 (E) ) kukL 2 (E) u 2 L 1 (E) ) kukL 1 (E) (2.20) p |E| kukL 1 (E) p |E| kukL 2 (E) . Infine, se un è una successione di funzioni definite in E si ha un ! u in L 1 (E) Attenzione! ) un ! u in L 2 (E) ) un ! u in L 1 (E). Il caso |E| = +1. Quando la misura di E non è finita (ad esempio E := R o E := (0, +1)) nessuna delle inclusioni (2.20) è più vera: basta considerare la famiglia di funzioni 1/(x + 1)↵ , ↵ 0, per E := (0, +1). 3. Spazi di Hilbert Wir müssen wissen. Wir werden wissen. (Noi abbiamo il dovere di conoscere. Alla fine conosceremo.) David Hilbert (1862-1943) Il problema della migliore approssimazione Problema 3.1 (Migliore approssimazione) Sia V uno spazio funzionale, munito di una norma ! · ! e siano e1 , . . . , eN assegnati elementi di V . Dato u ∈ V ci chiediamo se è possibile trovare coefficienti complessi u1 , . . . , uN in modo da rendere minimo l’errore di approssimazione !u − N ! k=1 uk ek ! = d(u, N ! uk ek ). k=1 Teorema 3.2 Il problema 3.1 ammette sempre almeno una soluzione. Purtroppo il teorema precedente non indica alcun preocedimento costruttivo per determinare i coefficienti u1 , . . . , uN , e in generale il problema può essere molto complicato. C’è però un caso in cui è possibile risolvere esplicitamente il problema: quello in cui la norma può essere espressa per mezzo di un prodotto scalare. 3-1 3-2 3. SPAZI DI HILBERT Abbiamo già ricordato nella lezione precedente la definizione di prodotto scalare: ora richiamiamo alcune formule che ci saranno utili; prima però introduciamo la nozione fondamentale di ortogonalità. Definizione 3.3 (Vettori e sistemi ortogonali) Diciamo che due vettori u, v ∈ V sono ortogonali se (u, v) = 0. Analogamente, un insieme (finito o infinito) di vettori {en }N n=1 forma un sistema ortogonale se (en , en ) > 0; n "= m ⇒ (en , em ) = 0. (3.1) {en }N n=1 si dice inoltre ortonormale se oltre alla (3.1) ogni elemento en è un versore, cioè $en $ = (en , en ) = 1. Se un vettore u è ortogonale a ciascun elemento di un insieme {en }N n=1 , allora è ortogonale !N v e . n=1 n n Nota anche a tutte le combinazioni lineari Lemma 3.4 (Distanza tra due vettori) Per ogni u, v ∈ V la distanza d(u, v) si può esprimere per mezzo del prodotto scalare attraverso la formula d(u, v)2 = $u − v$2 = $u$2 + $v$2 − 2 Re(u, v). In particolare, se u è ortogonale a v si ha la formula (di “Pitagora”) d(u, v)2 = $u − v$2 = $u$2 + $v$2 . Consideriamo ora la situazione un po’ più generale della combinazione lineare di N vettori. Lemma 3.5 Per ogni scelta di N vettori v 1 , v 2 , . . . , v N in V si ha N " $v 1 + v 2 + . . . + v N $2 = $ n=1 v n $2 = N " (v m , v n ). (3.2) m,n=1 Se poi il sistema {v n }N n=1 è ortogonale allora la precedente espressione si semplifica $v 1 + v 2 + . . . + v N $2 = $v 1 $2 + $v 2 $2 + . . . + $v N $2 = N " n=1 $v n $2 . (3.3) L’idea geometrica che permette di risolvere il problema di migliore approssimazione 3.1 è molto semplice: supponiamo di conoscere già la soluzione, data dai coefficienti û1 , . . . , ûN , e formiamo il vettore “errore” δ := u − N " ûn en ; (3.4) n=1 si può intuire che δ sia ortogonale a tutti i vettori generati dagli en . Noi mostreremo che se i vettori {en }N n=1 sono linearmente indipendenti, questa condizione di ortogonalità è sufficiente per determinare û1 , . . . , ûN e che effettivamente questi coefficienti risolvono il problema 3.1. Richiami Vettori linearmente indipendenti. Un insieme di vettori {en }N n=1 si dice linearmente indipendente se ogni relazione di dipendenza lineare a coefficienti complessi N " n=1 vn en = 0 3-3 3. SPAZI DI HILBERT è possibile solo se i coefficienti vn sono identicamente nulli. Quando si lavora con una seminorma, è utile talvolta richiedere la proprietà più forte N !" ! ! ! vn en ! = 0 ! ⇒ n=1 vn = 0, n = 1, . . . , N. (3.5) In particolare, si osservi che in questo caso nessun elemento en può essere trascurabile, cioè "en " > 0. È facile dedurre dalla (3.3) che un sistema ortogonale secondo la definizione 3.3 è sempre linearmente indipendente secondo la (3.5). Proposizione 3.6 Se {en }N n=1 è un insieme finito linearmente indipendente secondo la (3.5), per ogni vettore u ∈ V esiste un’unica scelta dei coefficienti û1 , . . . , ûN in modo che il vettore δ definito da (3.4) risulti ortogonale a ciascun em : (δ, em ) = (u − N " ûn en , em ) = 0 ∀ m = 1, 2, . . . , N. n=1 (3.6) I coefficienti û1 , . . . , ûN possono essere calcolati risolvendo un sistema lineare, come indicato nel punto seguente. Approfondimento Il sistema lineare. Per scrivere il sistema lineare che permette di calcolare i coefficienti û1 , . . . , ûN , basta sviluppare la condizione (3.6): # u− N " n=1 N $ # $ " # $ ûn en , em = u, em − ûn en , em = 0 n=1 e quindi N " (en , em )ûn = (u, em ), n=1 ∀ m = 1, 2, . . . , N. (3.7) Essendo (en , em ), (u, em ) dati conosciuti, abbiamo quindi N equazioni lineari nelle incognite (complesse) û1 , . . . , ûN . Introduciamo la matrice hermitiana N × N a coefficienti complessi E := {em,n }N em,n := (en , em ), en,m = em,n m,n=1 , e i vettori colonna complessi in CN û := {û1 , û2 , . . . , ûN }, u := {(u, e1 ), . . . , (u, eN )}. Allora la soluzione û risolve il sistema in forma matriciale E · û = u. (3.8) Osserviamo che nel caso reale, la matrice E è simmetrica, i vettori û, u sono reali. Dimostrazione Naturalmente rimane da dimostrare che il sistema (3.8) è effettivamente risolubile, cioè che la matrice E è invertibile. Noi mostriamo una proprietà più interessante: la matrice E è definita positiva. Ciò significa che per ogni vettore colonna non nullo v ∈ CN si ha vT · E · v > 0. (3.9) Naturalmente (3.9) implica l’invertibilità di E, in quanto da (3.9) segue che v '= 0 ⇒ E · v '= 0. A sua volta la (3.9) è una conseguenza della seguente identità se vT := (v1 , v2 , . . . , vN ), vT · E · v = "v1 e1 + v2 e2 + . . . + vN eN "2 (3.10) e della (3.5). La (3.10) si ottiene applicando (3.2): "v1 e1 + v2 e2 + . . . + vN eN "2 = = N " N " (vm em , vn en ) = m,n=1 m,n=1 vm vn (em , en ) = N " vm vn (em , en ) m,n=1 N " n=1 vn N % " m=1 & em,n vn = vT · E · v. 3-4 3. SPAZI DI HILBERT Proposizione 3.7 Sia u ∈ V e {en }N n=1 un insieme finito linearmente indipendente secondo la (3.5); i coefficienti û1 , . . . , ûN calcolati secondo la precedente proposizione risolvono il Problema 3.1; infatti per ogni altra scelta di coefficienti u1 , u2 , . . . , uN si ha "u − N ! n=1 un en "2 = "u − ≥ "u − Dimostrazione N ! n=1 N ! n=1 ûn en "2 + " N ! n=1 (un − ûn )en "2 ûn en "2 = "δ"2 . (3.11) Decomponiamo il primo termine di (3.11): !u − N ! n=1 un en !2 = !(u − N ! ûn en ) + n=1 N ! n=1 (un − ûn )en !2 = !δ + N ! n=1 (un − ûn )en !2 . Poiché δ è ortogonale a ciascun en , esso è ortogonale anche alla combinazione linerare " N n=1 (un − ûn )en . Applicando la “formula di Pitagora” si conclude. Riassumiamo il risultato fondamentale che abbiamo ottenuto nel seguente Teorema: Teorema 3.8 Sia V uno spazio dotato di prodotto scalare e {en }N n=1 un insieme finito linearmente indipendente secondo la (3.5). Allora per ogni u ∈ V il Problema di migliore approssimazione 3.1 ammette una sola soluzione û1 , . . . , ûN che è individuata dalla condizione δ := u − N ! ûn en n=1 è ortogonale a tutti i vettori generati dal sistema {en }N n=1 , (3.12) e può essere calcolata risolvendo il sistema lineare (3.7). Vale poi la relazione N N N %2 % %2 % ! %2 $2 % # ! ! % % % % % % d u, ûn en = %u − ûn en % = %u% − % ûn en % . n=1 Dimostrazione n=1 (3.13) n=1 L’unica proprietà che ci resta da dimostrare è la (3.13). Basta decomporre u nella somma u = u− N ! n=1 ûn en + N ! n=1 ûn en = δ + N ! ûn en n=1 e"applicare cancora una volta la “formula di Pitagora”, ricordando che δ è ortogonale a N n=1 ûn en . 3-5 3. SPAZI DI HILBERT Corollario 3.9 Quando il sistema {en }N n=1 è ortogonale, la soluzione û1 , . . . , ûN del problema di migliore approssimazione assume la forma ûn = (u, en ) !en !2 (3.14) e la relazione (3.13) diventa N N N $2 ! " #2 $ " " $ $ d u, ûn en = $u − ûn en $ = !u!2 − |ûn |2 !en !2 . n=1 n=1 (3.15) n=1 Se infine il sistema {en }N n=1 è anche ortonormale, le formule precedenti si semplificano ulteriormente ûn = (u, en ), N N N $2 $ $2 " ! " #2 $ " $ $ $ $ d u, ûn en = $u − ûn en $ = $u$ − |ûn |2 . (3.16) n=1 Dimostrazione n=1 n=1 Nel caso di un sistema ortogonale, la matrice E è diagonale e il sistema di riduce a !em !2 ûm = (u, em ), m = 1, 2, . . . , N, da cui la (3.14). (3.15) segue da (3.13) e da (3.3). Applicazione Minimi quadrati. Supponiamo di essere interessati a rappresentare i risultati di un certo esperimento u tramite una combinazione lineare di “funzioni di forma” assegnate φ1 , φ2 , . . . , φN ; possiamo pensare u e φn definite su un certo insieme E e di conoscere i risultati dell’esperimento in un numero finito di punti {x1 , x2 , . . . , xJ } di E, cioè di conoscere i valori uj := u(xj ), j = 1, . . . , J; vorremmo determinare i coefficienti û1 , . . . , ûN in modo % da rappresentare u mediante la combinazione lineare N n=1 ûn φn . In pratica succede che gli esperimenti x1 , x2 , . . . , xJ sono molti di più delle funzioni di forma e se volessimo scrivere un sistema lineare N " uj = ûn φn (xj ), j = 1, 2, . . . , J n=1 questo risulterebbe sovradeterminato (J >> N ). L’approccio a questo problema mediante il metodo dei minimi quadrati consiste nello scegliere dei pesi σj > 0 da assegnare a ciascun esperimento (quando nessuno sia privilegiato rispetto agli altri si ha σj ≡ 1) e di cercare i coefficienti ûn in modo che risulti minimo l’errore J " j=1 N &2 & " & & σj−2 &uj − ûn φn (xj )& (3.17) n=1 Stiamo dunque risolvendo il problema di migliore approssimazione 3.1 nello spazio F(E) rispetto alla seminorma J " !v!2 := σj−2 |v(xj )|2 j=1 % Infatti quando si sceglie v := u − N n=1 ûn φn si ottiene proprio l’espressione (3.17) da minimizzare rispetto alla scelta dei coefficienti ûn . È facile vedere che la seminorma introdotta discende dal prodotto scalare reale (v, w) := J " j=1 σj−2 v(xj )w(xj ), in modo che !g!2 = (g, g). Se supponiamo che le funzioni φn formino un sistema linearmente indipendente sui punti scelti xj (in modo cioè che nessuna delle φ possa essere scritta come combinazione lineare delle altre: si tratta di un ipotesi ragionevole poichè abbiamo già osservato che i punti xj sono molti di più delle funzioni di forma) si può applicare il Teorema 3.8, ottenendo per il vettore dei coefficienti û il sistema lineare E · û = u, 3-6 3. SPAZI DI HILBERT dove la matrice reale simmetrica e definita positiva E = {em,n }N m,n=1 è definita da em,n := (φn , φm ) = J ! σj−2 φn (xj )φm (xj ) j=1 mentre il vettore dei dati u = {u1 , . . . , uN } è costruito mediante le formule un := (u, φn ) = J ! σj−2 u(xj )φn (xj ). j=1 Decomposizione rispetto ad un sistema ortogonale completo Consideriamo ora uno spazio funzionale V di dimensione infinita dotato di prodotto scalare (·, ·) e supponiamo di conoscere un sistema ortogonale di vettori {en }∞ n=1 secondo la definizione 3.3. Problema 3.10 (Decomposizione ortogonale) Dato un elemento u di V ci chiediamo se è possibile determinare una successione di coefficienti complessi {ûn }n∈N tali che +∞ N " " ! ! " " u= ûn en cioè lim "u − ûn en " = 0. N ↑+∞ n=1 n=1 Proposizione 3.11 La soluzione del problema 3.10, se esiste, è necessariamente data dai coefficienti trovati in (3.14) ûn := Dimostrazione (u, en ) . "en "2 (3.18) Basta osservare che, per la (2.21), si può scambiare l’ordine tra serie e prodotto scalare, cioè u= +∞ ! un in V n=1 ⇒ (u, v) = ( +∞ ! un , v) = n=1 +∞ ! (un , v). (3.19) n=1 In particolare (u, em ) = +∞ ! (ûn en , em ) = ûm (em , em ). n=1 Definizione 3.12 (Coefficienti di Fourier) I coefficienti ûn definiti dalla (3.18) si chiamano coefficienti di Fourier di u rispetto al sistema ortogonale {en }∞ n=1 . A questo punto il Problema 3.10 si riduce ai due seguenti: 1. Trovare condizioni per cui la serie +∞ ! ûn en converge in V ; n=1 2. Trovare condizioni per cui la somma della serie coincide con u. Cominciamo dal primo: 3-7 3. SPAZI DI HILBERT Convergenza di serie di vettori ortogonali !+∞ Proposizione 3.13 Se u = n=1 un è una serie convergente formata da vettori ortogonali in V , vale l’identità fondamentale !u!2 = Dimostrazione +∞ " n=1 (3.20) !un !2 . Si sfruttano la continuità della norma la (3.3) !u!2 = ! lim N ↑+∞ N " n=1 un !2 = lim ! N ↑+∞ N " n=1 un !2 = lim N ↑+∞ N " n=1 !un !2 = +∞ " n=1 !un !2 . La (3.20) fornisce una condizione necessaria perché una serie di vettori ortogonali !+∞ n=1 un converga in V , cioè che +∞ " n=1 !un !2 < +∞. (3.21) Quando gli un sono costruiti a partire dai coefficienti di Fourier di un elemento u, questa condizione è sempre verificata grazie alla disuguaglianza di Bessel (3.15), che ci fornisce un’informazione fondamentale circa il loro andamento asintotico: Teorema 3.14 (Disuguaglianza di Bessel) Se ûn sono i coefficienti di Fourier di u rispetto al sistema ortogonale {en }∞ n=1 , si ha +∞ " n=1 |ûn |2 !en !2 ≤ !u!2 < +∞. Nella formula precedente l’uguaglianza vale se e solo se il problema 3.10 ha soluzione. Dimostrazione Basta passare al limite per N ↑ +∞ in (3.15); l’ultima osservazione segue dalla formula (3.20). Se lo spazio V è completo, la condizione (3.21) è anche sufficiente e quindi la disuguaglianza di Bessel assicura automaticamente la convergenza delle serie di Fourier in V . Teorema 3.15 Supponiamo che {un }+∞ n=1 sia un insieme di vettori ortogonali. Se V è completo, allora la serie +∞ " un converge in V n=1 ⇔ +∞ " n=1 |un |2 < +∞. Definizione 3.16 (Spazi di Hilbert) Uno spazio funzionale V prodotto scalare e completo si dice spazio di Hilbert. Dimostrazione La necessità della condizione +∞ " n=1 segue dalla (3.20). |vn |2 < +∞ dotato di 3-8 3. SPAZI DI HILBERT Per la sufficienza, basta controllare che la successione delle somme parziali sN := N ! fn en n=1 è una successione di Cauchy. Fissato ε > 0, poichè la serie +∞ ! n=1 |fn |2 converge è possibile trovare N̄ in modo che +∞ ! n=N̄ |fn |2 ≤ ε2 . Dico che se N̄ ≤ N < M allora "sN − sM " ≤ ε; ciò mostra appunto che sN è di Cauchy. Per controllare quest’ultima affermazione, notiamo che sN − s M = M ! fn en ; n=N +1 Per il Teorema di Pitagora, essendo i vettori fn en mutuamente ortogonali, si ha M ! "sN − sM "2 = n=N +1 |fn |2 ≤ +∞ ! n=N̄ |fn |2 ≤ ε2 . Corollario 3.17 Se ûn sono i coefficienti di Fourier di u rispetto al sistema ortogonale {en }∞ n=1 nello spazio di Hilbert V , la serie di Fourier +∞ ! ûn en è convergente e n=1 !u − +∞ ! n=1 ûn en !2 = !u!2 − +∞ ! n=1 |ûn |2 !en !2 . Sistemi ortogonali completi. Definizione 3.18 (Sistemi ortogonali completi) Un sistema ortogonale {en }∞ n=1 si dice completo in V se ogni elemento u di V che è ortogonale a ciascun en è trascurabile, cioè altri termini (u, en ) = 0 ∀n ∈ N ⇒ !u! = 0. Teorema 3.19 (Decomposizione e identità di Parseval) Se V è uno spazio di Hilbert e il sistema ortogonale {en }∞ n=1 è completo allora il problema di decomposizione ortogonale 3.10 si può sempre risolvere. In particolare, per ogni u ∈ V si ha +∞ +∞ ! ! u= ûn en in V, !u!2 = |ûn |2 !en !2 , n=1 n=1 dove ûn sono i coefficienti di Fourier di u dati dalla (3.18). Dimostrazione Sappiamo già che la serie di Fourier converge; basta mostrare che la differenza δ := u − Osserviamo che (δ, em ) = (u, em ) − +∞ ! ûn en è trascurabile. n=1 +∞ ! n=1 ûn (en , em ) = (u, em ) − ûm "em "2 = 0. Siccome il sistema {en }∞ n=1 è completo, si conclude che δ è trascurabile. 3-9 3. SPAZI DI HILBERT Proposizione 3.20 (Calcolo del prodotto scalare) Nelle ipotesi del Teorema precedente, se {ûn , v̂n }+∞ n=1 sono i coefficienti di Fourier di due vettori u, v rispettivamente, si ha +∞ ! ûn v̂n (3.22) (u, v) = n=1 Proposizione 3.21 (Stima dell’errore) Nelle ipotesi del teorema precedente, l’errore tra u e la somma dei primi N termini della serie di Fourier si può stimare nel modo seguente: N +∞ ! ! !u − ûn en !2 = |ûn |2 !en !2 . (3.23) n=1 n=N +1